作  者

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
引用
筛选:
文献类型 文献类型
学科分类 学科分类
发表年度 发表年度
作者 作者
机构 机构
基金 基金
研究层次 研究层次
排序:
显示:
CNKI为你找到相关结果

文本情感倾向分析  CNKI文献

近年来,文本情感倾向研究受到研究界和企业界越来越多的关注,成为了自然语言处理、信息检索、数据挖掘等领域的研究热点之一。随着研究的不断深入,大量情感倾向分析的新方法、新问题也不断涌现。该文重点对文本情感倾...

黄萱菁 张奇... 《中文信息学报》 2011年06期 期刊

关键词: 倾向性分析 / 评价挖掘 / 倾向性分类 / 综述

下载(2177)| 被引(112)

基于向量空间模型的文本过滤系统  CNKI文献

文本过滤是指从大量的文本数据流中寻找满足特定用户需求的文本的过程.首先从任务、测试主题、语料库和评测指标等方面介绍了文本检索领域最权威的国际评测会议——文本检索会议(TREC)及其中的文本过滤项目,然后详细地...

黄萱菁 夏迎炬... 《软件学报》 2003年03期 期刊

关键词: 文本检索 / 文本过滤 / 文本分类 / 机器学习

下载(1464)| 被引(307)

独立于语种的文本分类方法  CNKI文献

文本分类是指在给定分类体系下 ,根据文本的内容自动确定文本类别的过程。本文提出了一个基于机器学习的、独立于语种的文本分类模型 ,并对模型中的特征抽取、分类器和评价方法进行了详细的介绍。该模型已经在中文和日...

黄萱菁 吴立德... 《中文信息学报》 2000年06期 期刊

关键词: 文本分类 / 特征抽取 / 机器学习

下载(555)| 被引(244)

基于机器学习的无需人工编制词典的切词系统  CNKI文献

本文介绍了一个基于自学习的无需人工编制词典的切词系统.首先用统计方法建立起附有相关度的切词词典.然后,提出将切词问题转化为一个有向图中求解最大加权路径问题,并提出利用词典中的相关度信息切分文本的一个新算法...

黄萱菁 吴立德... 《模式识别与人工智能》 1996年04期 期刊

关键词: 贝努里概型 / 相关度 / 广义似然比 / 查全率

下载(259)| 被引(60)

基于向量空间模型的文档分类系统  CNKI文献

本文介绍了一个建立在向量空间模型上的文档分类系统.该系统着重解决向量维数压缩和中文专有词汇获取等问题.在特征项的选取上,我们并不采用文档中出现的全部词汇,而是利用语料库统计信息生成的关键词汇.实验结果表明...

黄萱菁 吴立德 《模式识别与人工智能》 1998年02期 期刊

关键词: 向量空间模型 / 文档分类 / 信息检索

下载(212)| 被引(82)

现代汉语熵的计算及语言模型中稀疏事件的概率估计  CNKI文献

文本文在大规模语料的基础上 ,利用语言模型中稀疏事件的概率估计方法对汉语的熵进行计算 ,并讨论了语料规模等因素对熵的影响 .在 4年的人民日报的语料规模下 ,所求得的零阶熵、一阶熵、二阶熵分别为 9 6 2 ,6 18和...

黄萱菁 吴立德... 《电子学报》 2000年08期 期刊

关键词: / 困惑度 / 统计语言模型

下载(237)| 被引(13)

一种新的句子相似度度量及其在文本自动摘要中的应用  CNKI文献

本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中。其创新处在于相似度计算不仅考虑句子中的uni gram ,还考虑了bi gram和tri gram ,通过回归方法将这几种相似度结果综合起来。实验证明这种相似度计算...

张奇 黄萱菁... 《中文信息学报》 2005年02期 期刊

关键词: 计算机应用 / 中文信息处理 / 文本自动摘要 / 向量模型

下载(989)| 被引(93)

基于超文本的概念词典管理系统  CNKI文献

本文介绍了自然语言处理系统的一个重要知识源——概念词典,以及基于超文本的概念词典管理系统——概念浏览器。我们的概念词典以框架结构为知识表示单元,框架的内容由结构信息和语义信息组成,所有框架通过结构槽形成...

黄萱菁 吴立德... 《计算机应用与软件》 1998年04期 期刊

关键词: 自然语言处理(NLP) / 概念词典(CL) / 结构映射规则(SMR) / 超文本

下载(79)| 被引(0)

初始化K-means的谱方法  CNKI文献

众所周知,K-means(以下简称KM)对初始点十分敏感.本文提出了一种新的初始化KM的方法,它先估计出k个类的特征中心的位置,然后用估计出的特征中心来初始化KM.在人工数据集和真实数据集上的实验表明,本文的方法所得到的...

钱线 黄萱菁... 《自动化学报》 2007年04期 期刊

关键词: 聚类 / K-means算法 / 特征中心

下载(378)| 被引(70)

基于错误驱动算法组合分类器及其在问题分类中的应用  CNKI文献

开放领域问答系统(QA)能够给用户提供相对简洁、准确的结果,越来越受到人们的关注.问题分类把问题分成若干语义类型,是QA系统的一个重要的模块,它的准确性直接影响到QA系统的性能.为提高分类器性能,在问题分类任务中使...

李鑫 黄萱菁... 《计算机研究与发展》 2008年03期 期刊

关键词: 问题分类 / 问题回答系统 / 支持向量机 / 基于转换的错误驱动学习

下载(306)| 被引(37)

文本自动综述系统的研究与实现  CNKI文献

文本自动综述是自动文摘在多文档上的推广.提出了一种基于统计的文本自动综述方法,并描述了它的实现过程.该方法利用文档内和文档之间段落的语义相关性,实现多文档的自动综述.首先对文本进行分段实现信息分割;再对文本...

郑义 黄萱菁... 《计算机研究与发展》 2003年11期 期刊

关键词: 文本自动综述 / 文本分段 / 文本聚类 / 向量空间模型

下载(556)| 被引(48)

中国古诗统计建模与宏观分析  CNKI文献

利用自然语言处理技术处理文学文本是计算语言学领域近年来的热门话题.该文结合点态互信息量与频率阈值,自动发现中国古诗词汇.基于构建的诗歌词典,利用启发式的正向最大匹配算法,对中国古诗作分词处理.采用主题模型对...

钱鹏 黄萱菁 《江西师范大学学报(自然科学版)》 2015年02期 期刊

关键词: 中国古诗 / 统计建模 / 分词 / 主题模型

下载(203)| 被引(5)

利用关联规则挖掘文本主题词的方法  CNKI文献

主题词抽取是目前信息检索领域研究的热点,与一系列数据挖掘相关的任务密切相关。该文提出一种新的利用关联规则挖掘中文文本主题词的方法,该方法抽取的主题词包括关键词和相关检索词两部分。在关键词抽取的基础上,采...

刘菲 黄萱菁... 《计算机工程》 2008年07期 期刊

关键词: 关键词抽取 / 关联规则挖掘 / 文本挖掘

下载(589)| 被引(19)

使用深度长短时记忆模型对于评价词和评价对象的联合抽取  CNKI文献

评价词和评价对象抽取在意见挖掘中是一个重要的任务,我们在句子级评价词和评价对象联合抽取任务上研究了长短时记忆(long short-term memory)神经网络模型的几种变种应用。长短时记忆神经网络模型是一种循环神经网络...

沈亚田 黄萱菁... 《中文信息学报》 2018年02期 期刊

基于主题和态度分类的文本过滤系统  CNKI文献

文本过滤是指从大量的文本数据流中寻找满足特定用户需求的文本的过程。该文介绍了一种文本过滤算法,该算法把基于空间向量模型的主题分类算法与基于支持向量机文本态度分类结合起来。实验结果表明该方法具有较高的精...

闵锦 黄萱菁 《计算机工程》 2007年02期 期刊

关键词: 文本过滤 / 文本分类 / 态度分类 / 支持向量机

下载(389)| 被引(22)

结合语言学特征和自编码器的英语作文自动评分  CNKI文献

近年来,越来越多的大规模英语考试采用了自动评分系统.因此,对英语作文自动评分的研究有着非常重要的价值.我们先依据英语作文写作技巧提取了大量语言学特征,再分别使用自编码器,特征值离散化方法对特征进行重构,最后...

魏扬威 黄萱菁 《计算机系统应用》 2017年01期 期刊

关键词: 自动评分 / 自编码器 / 离散化 / 文本特征提取

下载(242)| 被引(9)

基于语义分析的作者身份识别方法研究  CNKI文献

作者身份识别是一项应用广泛的研究,身份识别的关键问题是从作品中提取出代表语体风格的识别特征,并根据这些风格特征,评估作品与作品之间的风格相似度。传统的身份识别方法,主要考察作者遣词造句、段落组织等各种代表...

武晓春 黄萱菁... 《中文信息学报》 2006年06期 期刊

关键词: 计算机应用 / 中文信息处理 / 身份识别 / 语义分析

下载(830)| 被引(39)

基于统计方法的中文姓名识别  CNKI文献

本文介绍一个中文姓名的自动识别系统 ,该系统使用从姓名样本库和真实文本语料库中得到的大量统计数据 ,以提高系统识别性能。我们从 1 994年人民日报中随机抽取 1 0 0篇文章作为测试样本 ,实验结果表明 ,准确率和召回...

刘秉伟 黄萱菁... 《中文信息学报》 2000年03期 期刊

关键词: 自动分词 / 未登录词 / 中文姓名识别

下载(473)| 被引(136)

模式学习在QA系统中的有效实现  CNKI文献

开放领域的问题回答(question answering)是自然语言处理领域中具有挑战性的研究方向.提出了一种基于模式学习实现问题回答的方法,核心思想是利用机器学习方法得到的答案模式获取问题答案.该方法优势在于①模式学习完...

杜永萍 黄萱菁... 《计算机研究与发展》 2006年03期 期刊

关键词: 问题回答 / 模式学习 / 答案抽取

下载(246)| 被引(15)

基于统计方法的汉语自动文摘系统研究  CNKI文献

本文简要介绍了文本的向量空间模型表示,并提出了用该模型进行非受限真实文本的自动文摘方法。其基本思想是对输入文本进行项(本文为词和概念)的统计,根据不同项在文本中的分布评估其重要性,据此和其它信息形成句子的...

王文欣 黄萱菁... 《计算机应用与软件》 2000年09期 期刊

关键词: 自然语言处理 / 文本摘要 / 信息检索 / 向量空间模型

下载(252)| 被引(35)

学术研究指数分析(近十年)详情>>

  • 发文趋势

热门学者(按发文篇数排行)

相关机构

时间的形状