基于关联规则挖掘和极性分析的商品评论情感词典构建 CNKI文献
作为情感倾向性分析的基础性工作,情感词典构建包括情感词的识别与极性判断两大任务。本文以亚马逊网站上的音乐商品评论信息作为数据源,力图构建该领域的情感词典。首先利用关联规则挖掘算法充分挖掘领域主题词和情感...
无标度特性下的有界信任交互网络伪舆情演化建模及仿真研究 CNKI文献
了解和掌握网络伪舆情事件的观点倾向及其演化规律,是互联网舆情监控的一项重要内容,对于及时引导和化解舆情危机具有十分重要的意义.本文提出基于BA网络和有界信任交互的二阶段舆论演化动力学模型.该模型从观点形成与...
随着XML应用的不断扩展,XML已经成为互联网上信息描述和信息交换的事实标准。XML数据是一种半结构化数据,它的特点是拥有不规则、可变的结构。作为一种新兴的数据格式,如何对它进行有效查询和检索,近几年来一直是数据...
本文提出一种基于分类和关键词组抽取的信息检索算法。该算法利用文本分类和信息抽取技术辅助检索,避免了向量空间模型算法中时间复杂度过大,查准率不高的缺点。针对传统的信息检索性能指标无法有效地衡量检索结果的排...
针对训练数据来源的多样化,提出了基于多模板隐马尔可夫模型的文本信息抽取算法。该算法利用形式的聚类方法将训练数据聚成几个类,每个类代表一个模板,在聚类的基础上利用隐马尔可夫模型进行文本的信息抽取。实验结果...
随着新课改的不断推进和深化,为了全面提升小学生的综合素质,语文教学的作用越来越显著。同时,德育教育作为素质教育的重要组成部分,应该与小学语文课堂进行融合,通过德育渗透提高德育教育的效果,进而全面提升学生的综...
在 HITS超链接主题查找算法的基础上提出了一种检索改进算法 .该算法首先通过网页之间的链接关系计算出每一网页的出度值和入度值 ,并将查询条件与超链接上的标记文本或网页全文内容进行相似度匹配 ,得出每一网页的权...
随着互联网技术的迅速发展,网上文本数量成指数级增长,如何有效检索这些海量信息成为当前重要的研究课题。文本信息检索(Information Retrieval)是指从大量文档集合中找到与给定的查询请求相关的、恰当数目的文档子...
伪反馈(pseudo relevance feedback,PRF)一直以来都被认为是一种有效的查询扩展技术。然而传统的伪反馈容易带来主题漂移,从而影响检索性能。如何确定高质量的相关文档集,以及如何从相关文档集中挑选有用的扩展词项,是...
基于较高质量扩展源和局部词共现模型的XML查询词扩展 CNKI文献
查询词扩展要解决两个方面的问题:一是扩展词的来源,二是如何在来源集合里挑选扩展词项。对此,首先利用检索结果聚类和排序模型获取了较高质量的相关文档集合,并以此作为扩展源;然后结合XML文档的特点,通过词项间的局...
在供电系统中,电力变压器是其中最为常见的电气设备之一,它能够直接影响到供电系统的发电、供电等各个方面,对电网运行的稳定性具有至关重要的作用。探讨电力变压器的高压试验技术,并且对于其中可能存在的故障进行分析...
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方...
有效避免伪反馈的"查询主题漂移"主要需要解决两大问题,一是如何确定相关文档,形成较高质量的伪相关文档集,另一个是在伪相关文档集里如何挑选扩展信息。本文主要研究在获取了高质量伪相关文档集合的基础上...
介绍了一个面向领域的智能搜索引擎CDSE(Computer Document Search Engine)的设计和实现。CDSE结合文本分类和关键词组抽取检索用户需要的信息。利用了多个算法,综合运用了统计学方法、数据挖掘技术和Agent技术,较好地...
【目的】筛选出具有高效产酶活性和一定耐药性的芽孢杆菌,为开发本土高效的水产养殖益生菌提供参考依据。【方法】从广东湛江市海滨公园红树林采集淤泥样品,通过菌株富集和功能筛选,采用形态特征和生理生化特征、16S ...
情感或情绪分析在舆情分析、商品评论分析、商品推荐等领域应用广泛,而文本中的情感或情绪分析通常以情感词典为基础.人工情感词典虽然准确但构建代价大、难以及时更新,很难适应微博这类新情感词快速更迭的数据.微博平...
互联网的开放性使得当前互联网上的用户生成内容没有质量控制机制,产品评论中存在大量垃圾评论,如何识别这些垃圾评论信息成为重要问题。本文对产品评论信息中垃圾评论的识别方法进行了综述,先将产品垃圾评论和互联网...
基于词性标注和依存句法的Web金融信息情感计算 CNKI文献
基于词袋模型的文本情感倾向性分析没有考虑句子的句法结构对句子语义的理解,基于依存句法分析的方法试图解决这一问题.目前基于依存句法分析的方法对影响文本情感的依存关系的选择多根据人为观察,带有随意性.根据影响...
当用户向XML检索引擎提交查询后,返回的结果通常远远多于用户的期望,返回结果中难免有一些不相关的文档或结点.对于以文档为中心的XML文档集合,XML片段检索是根据用户的查询,从XML检索引擎返回的XML文档或结点中抽取出...