主  题

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

主  题

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
引用
筛选:
文献类型 文献类型
学科分类 学科分类
发表年度 发表年度
作者 作者
机构 机构
基金 基金
研究层次 研究层次
排序:
显示:
CNKI为你找到相关结果

基于词频比的改进Jaccard系数文本相似度计算  CNKI文献

基于词频比的改进Jaccard系数文本相似度计算,交集中词的权重不是相同的,而是按照词频比确定权重。通过短文本实验和长文本实验,基于词频比的改进Jaccard相似度比传统Jaccard相似度更加...

谢红 《内江科技》 2021年08期 期刊

关键词: 文本相似度计算 / 系数计算 / 短文本 / Jaccard

下载(75)| 被引(0)

基于中文分词与文本相似度的主观题评分系统研究与实...  CNKI文献

近年来,随着人工智能技术的发展,越来越多人开始关注智能阅卷方面的研究。现阶段的自动评分系统对于客观题如判断题、选择题以及填空题等固定答案的题型能够做出精准的评分,但对于主观题来说,目前主要是以人工评阅为主...

郭振鹏 导师:张起贵 太原理工大学 2021-06-01 硕士论文

关键词: 主观题评分 / 中文分词 / 句法相似度 / Jaccard相似系数

下载(48)| 被引(0)

基于BiLSTM和注意力机制的短文本相似度算法研究  CNKI文献

随着大数据技术和互联网的发展,信息飞速增长,文本作为信息的主要载体传递了多种多样的内容,故对短文本相似度进行研究。短文本相似度计算,指的是给定两个文本,通过某种方法或模型算出它们的...

伍树书 导师:张凯 武汉科技大学 2021-05-24 硕士论文

关键词: 词向量 / LSTM / 注意力机制 / 语义相似度

下载(48)| 被引(0)

基于编辑距离的词序敏感相似度度量方法  CNKI文献

为改善余弦相似度不能反映词袋模型中词项间顺序差异的缺点,提出了一种基于编辑距离的文档相似度度量方法.首先分析了基于tf-idf的词袋模型和余弦相似度计算方法所存在的问题;其次利用Jaccard系

张雷 崔荣一 《延边大学学报(自然科学版)》 2020年02期 期刊

关键词: 文本相似度 / 词袋模型 / 编辑距离 / 词序

下载(153)| 被引(2)

基于Word2Vec的中文地址匹配  CNKI文献

互联网时代下的地址数据质量参差,存在错误或不完整信息,地址文本本身难以直接参与计算机模型的数值计算,传统地址匹配方法仅从文本字面解析地址,计算效率低且匹配准确性较差,非标准地址数据的匹配问题亟...

钟艾妮 导师:亢孟军 武汉大学 2020-05-01 硕士论文

关键词: 自然语言处理 / 地址向量化 / 文本相似度 / 无监督地址匹配

下载(124)| 被引(1)

跨领域模式下语料库信息智能筛选仿真研究  CNKI文献

对跨领域模式下语料库信息进行筛选,能够提高语料库信息提取的完整性。针对当前跨领域模式下语料库信息智能筛选方法存在的筛选质量差,筛选执行时间较长,占用计算机内存较大问题,提出一种基于多层向量空间模型的跨领域...

官小龙 《计算机仿真》 2018年09期 期刊

关键词: 跨领域模式 / 语料库信息 / 智能筛选

下载(38)| 被引(1)

一种基于改进相似度计算的文本聚类方法  CNKI文献

针对文本在聚类或分类时,由于数据高维稀疏导致相似度值低的问题,提出一种基于改进文本相似度计算的聚类方法.首先,利用向量空间模型VSM表示文本,采用余弦函数计算文本之间的相似度

李征 李斌 《河南大学学报(自然科学版)》 2018年04期 期刊

关键词: 文本相似度 / Jaccard系数 / 文本集合 / 谱聚类算法

下载(315)| 被引(6)

基于改进的Jaccard系数文档相似度计算方法  CNKI文献

文本相似度主要应用于学术论文查重检测、搜索引擎去重等领域,而传统的文本相似度计算方法中的特征项提取与分词环节过于冗杂,而且元素的随机挑选也会产生权重的不确定性.为了解决传统方法的不足,提出一种...

俞婷婷 徐彭娜... 《计算机系统应用》 2017年12期 期刊

关键词: 文本相似度 / Jaccard系数 / 文本分析 / 文本查重

下载(522)| 被引(62)

相似度算法分析与比较研究  CNKI文献

针对RSS阅读器中冗余信息带来的不便,在采用中文分词和TF.IDF算法计算相似度进行预处理后,选取Levenshtein、余弦夹角法、Jaccard这三种相似度算法进行冗余信息鉴别。详细讨论这些方法的特征,并从实...

陈天 刘文浩 《现代计算机(专业版)》 2012年18期 期刊

关键词: 计算机应用技术 / TP·IDF / 相似度计算 / ICTCLAS

下载(362)| 被引(19)

基于输出误差曲线差异度计算的神经网络集成  CNKI文献

神经网络集成通过训练多个神经网络并将其结论进行结合,从而达到大幅提升网络泛化能力的效果。然而神经网络具有“黑箱子”特性,绝大多数的研究从网络结构上寻找差异度,具有一定盲目性,并在一定程度上限制了神经网络集...

杨阳 导师:朱群雄 北京化工大学 2011-05-30 硕士论文

关键词: 神经网络集成 / 差异度 / 聚类 / 文本匹配

下载(86)| 被引(4)

中文WEB文本倾向性分类研究  CNKI文献

21世纪是信息爆炸的时代,随着Internet的高速发展,越来越多的信息表现为电子文档的形式,而绝大多数的电子文档都是无序的。文档自动分类技术可以解决信息杂乱现象的问题,并有效地组织和管理这些信息,从而快速、准确、...

单大力 导师:刘云 北京交通大学 2007-12-26 硕士论文

关键词: 文本倾向性 / 文档模型 / 分词辞典 / 中文分词机制

下载(312)| 被引(0)

学术研究指数分析(近十年)详情>>

  • 发文趋势
时间的形状