文本过滤关键技术研究 CNKI文献
随着互联网的发展和存贮技术的提高,计算机可读的文本信息也越来越多。而对于特定的用户而言,所需要的信息往往只占其中极小的一部分。大规模的可用网络资源和特定用户对特定的信息的需求使得大规模文本信息处理软件...
夏迎炬
导师:吴立德
复旦大学
2003-04-18
博士论文
产品属性归类技术研究 CNKI文献
近年来倾向性分析在信息处理领域深受关注。针对产品评论信息中的产品属性过于繁多,本文提出了一种自动归类方法,以语素和评价词作为衡量产品属性之间关联程度的特征,采用K-Means方法进行产品属性归类。以中文评论信息...
张姝
贾文杰...
第六届全国信息检索学术会议论文集
2010-08-12
中国会议
基于向量空间模型的文本过滤系统 CNKI文献
文本过滤指的是从大量的文本数据流中寻找满足特定用户需求的文本的过程.本文首先从任务、测试主题、语料库和评测指标等方面介绍了文本检索领域最权威的国际评测会议——文本检索会议(TREC)及其中的文本过滤项目;然后...
黄萱菁
夏迎炬...
辉煌二十年——中国中文信息学会二十周年学术会议论文集
2001-11-01
中国会议
基于Winnow算法的文本过滤 CNKI文献
本文提出了一种在自适应文本过滤中将Winnow分类器和基于向量空间模型(VSM)的分类器相结合的算法。在处理文本流时,只有被两个分类器都过滤出的文本才被判定为相关文本。文中详细描述了在我们的过滤系统中所使用的Win...
赵林
夏迎炬...
语言计算与基于内容的文本处理——全国第七届计算语言学联合...
2003-08-01
中国会议
基于规则和非规则方法的WEB信息提取 CNKI文献
互联网上的各个信息源是相互独立的.如果一个系统能够把关于某个主题的来自各个信息源的信息集成到一个完全的信息源中,用户就能方便地获得这个主题他(她)所需的最想要的或者全部的信息.该系统中最重要的一个部分就是...
黄晓宏
连理...
自然语言理解与机器翻译——全国第六届计算语言学联合学术会...
2001-08-01
中国会议
面向商务信息抽取的产品命名实体识别研究 CNKI文献
市场信息化使得商务信息抽取、市场内容管理日益成为信息科学领域的一个研究热点。产品命名实体识别作为其中非常重要的关键技术之一也逐渐受到人们的关注。本文面向商务信息抽取对产品命名实体进行了定义,提出了一种...
刘非凡
赵军...
全国第八届计算语言学联合学术会议(JSCL-2005)论文集
2005-08-01
中国会议