面向产品评论的多文档观点文摘研究 CNKI文献
观点文摘,又称情感文摘,是对含有情感信息的主观性文本集合进行文本分析、内容归纳和文摘生成的技术。随着互联网主观性评论文本数量的不断增加,观点文摘的应用需求也随之增加,这些需求为观点文摘的发展带来了动...
王巍
导师:赵铁军
哈尔滨工业大学
2015-10-01
博士论文
基于条件随机域的Web信息抽取研究 CNKI文献
随着互联网资源的迅速增长,仅仅依靠浏览器以及基于关键字检索查询的搜索引擎,已远不能满足互联网用户的信息需求,Web信息抽取应运而生。本文以条件随机域模型为主要研究内容,研究了结构新颖的条
朱道辉
导师:肖基毅
南华大学
2010-05-01
硕士论文
基于CRF的中文命名实体识别研究 CNKI文献
命名实体识别就是把文本中出现的命名实体包括人名、地名、组织机构名、日期、时间、和其他实体识别出来并加以归类。命名实体识别是自然语言处理中的一项基础性工作,同时也是很多应用中的关键技术,如信息检索、...
史海峰
导师:姚建民
苏州大学
2010-04-01
硕士论文
时间表达式识别与归一化研究 CNKI文献
在自然语言中,时间是一种重要的语义载体。人们通过了解一个事件的开始、发展和结束的时间信息,把握事件发展的全过程。时间信息识别在信息抽取、问答系统、摘要生成、话题跟踪和检测等领域中有着广...
潘越群
导师:秦兵
哈尔滨工业大学
2008-06-01
硕士论文
面向生物医学领域的文本挖掘技术研究 CNKI文献
当前,出版的生物医学文献呈指数级增长,成为一座巨大的知识宝库。由于生物医学文献绝大多数都是以文本方式存在,从这座宝库快速有效地进行文本挖掘,提取生物医学知识的需求变得非常迫切。生物医学文本挖掘主要依赖于自...
杨志豪
导师:林鸿飞
大连理工大学
2008-03-01
博士论文
中文信息抽取中的若干问题研究 CNKI文献
本文对中文信息抽取的三个方面进行了研究。
本文提出了一种效率较高的中文分词机制,在基于词典形成有向无环词图后加入基于碎片合并的未登录词的推测算法,使词图的节点减少,从而提高基于N-最短路径...
徐中一
导师:刘磊
吉林大学
2007-04-20
硕士论文
基于条件随机域的中文命名实体识别研究 CNKI文献
命名实体识别(NER)是信息抽取的基础模块,在信息检索、机器翻译、数据挖掘、自动文摘等领域发挥着重要作用。本文以条件随机域模型(Conditional Random Field)为基础重点研究中文命名实体中的人名...
王志强
导师:黄河燕
南京理工大学
2006-08-01
硕士论文
中文命名实体识别方法研究 CNKI文献
中文命名实体(Named Entity,NE)识别是指识别出文本中特定的实体。它是信息抽取、机器翻译、自动问答等多种自然语言处理技术的基础。但是,由于受中文自身特点的限制,中文命名实体识别一直相当困难。为了促进其...
廖先桃
导师:秦兵
哈尔滨工业大学
2006-06-01
硕士论文