主  题

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

主  题

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
引用
筛选:
文献类型 文献类型
学科分类 学科分类
发表年度 发表年度
作者 作者
机构 机构
基金 基金
研究层次 研究层次
排序:
显示:
CNKI为你找到相关结果

在线新闻子话题发现方法及其在金融舆情中的应用研究  CNKI文献

互联网的高速发展使得人们获取新闻信息更加快捷方便,因此产生的在线新闻数据呈爆炸式增长。其中蕴含了大量丰富有效的舆情事件相关信息,从中挖掘描述事件各侧面内容的子话题可以从多角度了解掌握舆情事件全貌,获取公...

李想 导师:倪丽萍 合肥工业大学 2020-05-01 硕士论文

关键词: 子话题发现 / 在线新闻 / LDA主题模型 / LDA-FW

下载(53)| 被引(0)

中文问答系统关键技术研究  CNKI文献

随着互联网的迅速普及,信息搜索成为人们的迫切需求,以百度搜狐为代表的搜索引擎虽然便利,但专业性不足。为更快捷、准确地获取信息,特别是专业性较强的信息,问答系统作为一种新的信息检索方式被提出,尤其是问答系统可...

舒永红 导师:唐文胜 湖南师范大学 2020-05-01 硕士论文

关键词: 集成学习 / 维特比算法 / HMM / 词性标注

下载(52)| 被引(0)

基于动态词库构建的概率模型分词研究  CNKI文献

中文分词是根据特定的规范将文本中连续的字序列切分成有实际意义的词语序列。作为自然语言处理领域的底层研究,中文分词已经广泛用于搜索引擎、机器翻译、语音识别等应用中。因此,对中文分词算法的...

李康康 导师:龙华 昆明理工大学 2019-04-01 硕士论文

关键词: 动态词库 / 朴素贝叶斯 / 隐马尔可夫模型 / 中文分词系统

下载(44)| 被引(0)

基于古汉语语料的新词发现方法  CNKI文献

新词发现,作为自然语言处理的基本任务,是用计算方法研究中国古代文学必不可少的一步。该文提出一种基于古汉语料的新词识别方法,称为AP-LSTM-CRF算法。该算法分为三个步骤。第一步,基于Apache Spark分布式并行计算框...

刘昱彤 吴斌... 中文信息学报》 2019年01期 期刊

关键词: Apriori的改进算法 / 长短时记忆网络 / 条件随机场 / 过滤规则

下载(306)| 被引(12)

基于多维度特征评论分类的研究  CNKI文献

电子商务交易规模日益上升,用户和商品交互数据激增,用户和商家则通过评论得到商品的反馈信息并进行买卖决策。传统的评论分类基于词袋或者TF-IDF特征,没有考虑词语的语义、语法以及词语顺序等信息,同时没有考虑用户和...

包友军 导师:姜晓红 浙江大学 2017-06-01 硕士论文

关键词: 评论分类 / fasttext / SVM / 文本特征

下载(506)| 被引(7)

基于Aho-Corasick自动机算法的概率模型中文分词CPAC...  CNKI文献

Aho-Corasick自动机算法是著名的多模式串匹配算法,它在模式串失配时,通过fail指针转移至有效的后续状态,存在一个或多个有效的后续状态可能。据此特性,该文提出了一种适应于中文分词的自动机算法。该算法使用动...

徐懿彬 《电子科技大学学报》 2017年02期 期刊

关键词: AC自动机 / 中文分词 / 动态规划 / Trie树

下载(205)| 被引(16)

基于全覆盖粒计算模型的文本表示和特征提取研究  CNKI文献

随着大数据时代的到来产生海量的文本数据资源,文本挖掘面临从按秒激增的文本中探求有价值信息的艰巨任务。文本表示模型和文本特征提取是文本挖掘领域的重要研究方向,能够智能地挖掘文本中的信息是文本挖掘领域...

许慧芳 导师:谢珺 太原理工大学 2016-06-01 硕士论文

关键词: 文本表示模型 / 粒计算 / 全覆盖 / 重要关键词提取

下载(167)| 被引(2)

基于主题模型的微博话题挖掘  CNKI文献

随着微博用户的不断增长,国外的Twitter和国内的新浪微博已经成为媒体和个人发布信息的重要平台。对于微博这种特殊的文本,通常小于140字,包含了丰富的社会化信息,且微博内容不仅包含话题文本,也包含其他无话题表征能...

汪进祥 导师:李丽香 北京邮电大学 2015-01-19 硕士论文

关键词: 主题模型 / 话题检测 / 词性标注 / 短文本

下载(1617)| 被引(32)

网络质量探测应用的研究  CNKI文献

随着网络技术的飞跃发展以及网络用户规模的显著增加,网络结构变得越来越复杂,导致流量数据急剧上升,对于流量异常数据的出现不仅浪费无关使用的资源,而且降低网络的利用率,网络的可用性和安全性是网络正常使用的重要...

张忠琳 导师:蒋砚军 北京邮电大学 2015-01-05 硕士论文

关键词: 网络探测 / 流量特征 / 流量异常 / 流量数据分析

下载(57)| 被引(2)

基于SVM的微博话题跟踪方法及其应用  CNKI文献

话题跟踪作为信息处理领域中的一项重要问题,自提出以来就受到了广泛的关注,被应用于数字图书馆、舆情分析等领域。目前,大多数的话题跟踪系统研究都是针对新闻信息、博客信息等长文本,关于微博等社交网络短文本信...

罗杰 导师:王庆林 北京理工大学 2015-01-01 硕士论文

关键词: 话题跟踪 / 特征选择 / SVM / 话题演变

下载(796)| 被引(20)

基于认知的非结构化信息抽取关键技术与算法研究  CNKI文献

近年来,随着计算机技术的迅猛发展,信息抽取技术已经成为自然语言处理领域的热点研究问题之一,并且机器学习、文本挖掘和图算法等多个方面的技术也在信息抽取中得到了应用,然而信息抽取算法的性能仍然不能达到用户...

穆一夫 导师:钱旭 中国矿业大学(北京) 2013-04-01 博士论文

关键词: 信息抽取 / 条件随机场 / 命名实体识别 / 实体关系识别

下载(1389)| 被引(10)

基于条件随机场的中文短文本分类算法研究  CNKI文献

随着互联网的迅速发展,网上生活已经成为了人们必生活中不可少的一部分。互联网上的人们使用的信息很多是以短文本的形式存在的。短文本就是内容较短的文本(一般长度不超过140字符),通常的新闻标题、微博、手机短...

曾佳妮 导师:刘功申 上海交通大学 2012-12-01 硕士论文

关键词: 短文本 / 文本分类 / 条件随机场 / SVM

下载(672)| 被引(6)

基于统计语言模型中文网页信息检索研究  CNKI文献

互联网飞速发展,信息呈指数增长,信息获取途径更为多样化,但是信息搜索却变得更为复杂了。人们迫切需要高层次的信息处理技术来处理海量信息,快速检索到所需信息,从而帮助更好的进行决策和研究。然而,信息处理技术的普...

李贞 导师:李进华 华中师范大学 2012-05-01 硕士论文

关键词: 统计语言模型 / 中文网页信息检索 / 数据平滑技术 / 中文分词

下载(415)| 被引(8)

垂直搜索引擎的研究与实现  CNKI文献

伴随着因特网上的信息急剧增长,通用搜索引擎已经难以达到用户“专、精、深”的查询需求了,垂直搜索引擎在这种情况下应运而生。所谓的垂直搜索引擎是指在某一个领域或者在某一个特定的行业中进行更加专业的检索,垂直...

白玉昭 导师:梁久祯 江南大学 2012-03-01 硕士论文

关键词: 垂直搜索 / 主题爬虫 / 概率模型 / 查询扩展

下载(187)| 被引(0)

基于Hadoop的机械故障诊断资源分布式信息检索系统的设计与...  CNKI文献

信息检索是从文档集合中返回满足用户需求的相关信息的过程。而搜索引擎是信息检索的一项成功应用,为用户提供快速、准确、全面、时新的海量Web信息导航服务。随着人们对信息在精度、深度和广度上的需求提高,搜索引擎...

谢照莉 导师:张会福 湖南科技大学 2011-06-05 硕士论文

关键词: 机械故障诊断 / 分布式信息检索 / 搜索引擎 / Hadoop

下载(306)| 被引(2)

基于朴素贝叶斯的中文文本情感倾向分类研究  CNKI文献

人们对事物的情感倾向是两面性的,例如正面和负面,褒义和贬义等。因此通常认为文本的情感倾向分类是一个两分类问题,也就是把文本的情感分成正面或者反面。文本情感倾向分类是文本分类领域一个比较新颖的研究方向,具有...

杨鼎 导师:阳爱民 湖南工业大学 2010-06-17 硕士论文

关键词: 中文情感分类 / 语料采集 / 特征选择 / 朴素贝叶斯

下载(910)| 被引(10)

基于语义分析的产品评论挖掘技术研究  CNKI文献

近几年来,随着Web2.0技术的迅猛发展,人们已经逐渐习惯了写博客、泡论坛以及留言评论等生活方式。在产品的评论方面,研究数据表明,大部分的网络购物用户倾向于在购物前参阅其他用户的评论,从而为自己的决策提供依据。...

郝阳 导师:杨兆选 天津大学 2010-06-01 硕士论文

关键词: 产品评论挖掘 / 主题聚类 / 感情色彩提取 / 特征观点对

下载(536)| 被引(2)

基于Web的智能信息检索机制研究  CNKI文献

随着互联网技术的不断发展,网络日益成为人们工作和生活中获取信息的重要来源。但是,由于网络自身存在的开放性和异构性,使得用户很难从纷繁复杂的海量信息中快速找到对自己有价值的信息。而对于WEB上的信息,人们传统...

杨冬黎 导师:李春生 大庆石油学院 2010-03-31 硕士论文

关键词: WEB / 信息检索 / 文本分类 / 阈值

下载(119)| 被引(2)

基于CRFs的中文分词算法研究与实现  CNKI文献

中文分词是汉语自然语言处理的基础性任务,分词的准确度直接影响到后续处理任务,分词的速度影响一些系统的实际应用。 条件随机场(CRFs)是用于序列标记和数据分割以及组块分析的条件概率模

韩雪冬 导师:周彩根 北京邮电大学 2010-01-10 硕士论文

关键词: 自然语言处理 / 中文分词 / 条件随机场 / 双数组

下载(896)| 被引(28)

中文新词识别研究  CNKI文献

随着互联网技术的飞速发展,越来越多的新词出现在人们的日常生活中,新词虽然丰富了人们的日常表达,却给中文信息处理带来了挑战。由于新词的存在,词法分析器在分词时常常出现过多的“词碎片”,这在很大程...

徐亮 导师:黄德根 大连理工大学 2009-11-01 硕士论文

关键词: 自然语言处理 / 新词识别 / 左右信息熵 / 内部词概率

下载(528)| 被引(11)

学术研究指数分析(近十年)详情>>

  • 发文趋势
时间的形状