作  者

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
引用
筛选:
文献类型 文献类型
学科分类 学科分类
发表年度 发表年度
作者 作者
机构 机构
基金 基金
研究层次 研究层次
排序:
显示:
CNKI为你找到相关结果

基于语块和条件随机场(CRFs)的韵律短语识别  CNKI文献

该文提出一种基于汉语语块这一浅层句法信息,并利用条件随机场模型的中文文本韵律短语边界预测方法。首先介绍语块的定义和标注算法,然后在进行了语块结构标注以及归并处理的语料上,利用CRFs算法生成相应模型对韵律短...

钱揖丽 冯志茹 《中文信息学报》 2014年05期 期刊

关键词: 韵律短语 / 边界预测 / 语块结构 / 条件随机场

下载(208)| 被引(11)

基于句法依存和条件随机场的韵律短语识别  CNKI文献

正确划分句子的韵律结构对于提高合成语音的质量具有重要的意义。特征的选择是韵律结构预测的关键因素之一。在中文信息处理中,文本特征可以分为浅层文本特征与深层文本特征。浅层特征包括词、词性、词长等;深层特征包...

钱揖丽 张二萌 《清华大学学报(自然科学版)》 2019年07期 期刊

关键词: 韵律短语预测 / 句法依存 / 文本特征 / 条件随机场

下载(169)| 被引(1)

利用AdaBoost-SVM集成算法和语块信息的韵律短语识别  CNKI文献

提出一种基于汉语语块结构并利用AdaBoost-SVM集成学习算法的汉语韵律短语识别方法。首先,对语料进行自动分词、词性标注和初语块标注,然后基于结合紧密度获取语块归并规则并利用规则对初语块进行归并,得到最终的语块...

钱揖丽 冯志茹 《计算机工程与科学》 2015年12期 期刊

关键词: 汉语语块 / AdaBoost-SVM / 韵律短语 / 识别

下载(114)| 被引(4)

汉语语料词性标注自动校对方法的研究  CNKI文献

兼类词的词类排歧是汉语语料词性标注中的难点问题 ,它严重影响语料的词性标注质量。针对这一难点问题 ,本文提出了一种兼类词词性标注的自动校对方法。它利用数据挖掘的方法从正确标注的训练语料中挖掘获取有效信息 ...

钱揖丽 郑家恒 《中文信息学报》 2004年02期 期刊

关键词: 计算机应用 / 中文信息处理 / 兼类词 / 汉语词性标注

下载(313)| 被引(22)

基于标点信息和统计语言模型的语音停顿预测  CNKI文献

语音停顿被认为是有声语言的标点符号.在语言交流中,说话人会在韵律短语的边界处插入长短不同的停顿.利用这一性质,在调查标点符号停顿作用的基础上,提出基于标点信息预测语音停顿的思想,阐述基于标点和统计模型的训练...

钱揖丽 荀恩东 《模式识别与人工智能》 2008年04期 期刊

关键词: 标点符号 / 语音停顿 / 统计语言模型 / 语料获取

下载(228)| 被引(17)

中文文本分词及词性标注自动校对方法研究  CNKI文献

语料库建设是中文信息处理研究的基础性工程。汉语语料的基本加工过程,包括自动分词和词性标注两个阶段。自动分词和词性标注在很多现实应用(中文文本的自动检索、过滤、分类及摘要,中文文本的自动校对,汉外机器翻...

钱揖丽 导师:郑家恒 山西大学 2003-06-01 硕士论文

关键词: 分词自动校对 / 词性标注自动校对 / 粗糙集 / 中文信息处理

下载(701)| 被引(6)

采用无标注语料和词“粘连”剔除策略的韵律短语识别  CNKI文献

针对人工标注韵律结构获取大规模语料的困难和问题,利用标点符号能够表示停顿的性质,提出一种采用无标注语料和词"粘连"剔除策略的韵律短语识别方法。对标点符号划分等级,并在利用其模拟韵律边界时对其赋予...

钱揖丽 蔡滢滢 《计算机科学》 2016年02期 期刊

关键词: 无标注语料 / 韵律短语边界 / 最大熵(ME) / 互信息

下载(67)| 被引(2)

基于分类回归树CART的汉语韵律短语边界识别  CNKI文献

提出了一种基于分类回归树(Classification And Regression Tree,CART)的汉语韵律短语识别方法。该方法从语音流中提取与韵律短语边界有关的声学特征,从文本中提取短语边界的语言学特征,并将两类特征有机结合构成CART...

钱揖丽 荀恩东 《计算机工程与应用》 2008年06期 期刊

关键词: 分类回归树 / 决策树 / 韵律短语 / 边界

下载(346)| 被引(10)

文本切分知识获取及其应用  CNKI文献

文章描述了一种从熟语料中自动获取文本切分知识的机器学习的方法。该方法从已切分标注加工的熟语料中自动获取错误的文本切分形式及其相应的上下文信息,以及正确的切分形式,形成知识库,并将获取的知识再应用到新语料...

钱揖丽 郑家恒 《计算机工程与应用》 2003年02期 期刊

关键词: 分词 / 知识获取 / 语料库 / 质量保证

下载(179)| 被引(25)

基于SLM的二叉树在语音停顿预测中的应用  CNKI文献

讨论基于统计语言模型SLM(Statistic Language Model)的二叉树在语音停顿预测中的应用。基于大规模语料,利用三元模型Trigram,建立统计语言模型;基于SLM为待处理句子生成相应的二叉树;将生成的二叉树所包含的信息,从不...

钱揖丽 荀恩东... 《计算机工程》 2006年19期 期刊

关键词: 统计语言模型 / 二叉树 / 语音停顿 / 预测

下载(137)| 被引(2)

基于最大熵模型的汉语短语间停顿识别  CNKI文献

正确标记短语间的停顿,对提高文语转换系统合成语音的自然度起着重要作用。介绍一种采用最大熵模型从真实自然的语音流中自动识别汉语短语间停顿的方法。模型的特征集包含语音和词法两类特征,采用半自动的方式获得。首...

钱揖丽 荀恩东 《计算机工程与应用》 2008年17期 期刊

关键词: 最大熵 / 语音停顿 / 短语边界

下载(123)| 被引(2)

中文文本词性自动校对系统的实现  CNKI文献

提出了一种从正确标注的训练语料中自动获取兼类词词性较对规则的方法 ,并设计和实现了相应的词性自动校对系统。通过对中文文本进行自动校对 ,进一步提高其词性标注质量

钱揖丽 郑家恒 《电脑开发与应用》 2004年01期 期刊

关键词: 中文文本 / 词性 / 自动校对 / 词性标注

下载(184)| 被引(1)

应用二叉树剪枝识别韵律短语边界  CNKI文献

句子的韵律短语识别是语音合成的重要研究内容。本文提出了应用统计语言模型生成的二叉树,结合最大熵方法识别待合成汉语句子的语音停顿点。文中给出了二叉树相关的模型训练和生成算法;二叉树与语音停顿点之间的关系;...

荀恩东 钱揖丽... 《中文信息学报》 2006年03期 期刊

关键词: 人工智能 / 自然语言处理 / 统计语言模型 / 二叉树

下载(285)| 被引(16)

二字词词义组合推理方法的研究  CNKI文献

汉字是表义文字 ,具有丰富的语义内容 ,汉字是一个有限的封闭集 ,它的数目是有限的 ,而汉语的词是一个开放系统 ,它是无限的。本文以“字义基元化、词义组合化”为基本思想 ,从字义着手 ,研究二字词词义组合。首先以经...

郑家恒 钱揖丽... 《中文信息学报》 2001年06期 期刊

关键词: 词义 / 语义相关度 / 二字词词义组合 / 词汇学

下载(197)| 被引(16)

基于框架语义的高考语文阅读理解答案句抽取  CNKI文献

高考语文阅读理解问答相对普通阅读理解问答难度更大,问句抽象表述的理解需要更深层的语言分析技术,答案候选句抽取更注重与问句的关联分析,答案候选句排序更注重答案句之间的语义相关性。为此,该文提出借助框架语义匹...

李国臣 刘姝林... 《中文信息学报》 2016年06期 期刊

关键词: 高考语文 / 阅读理解 / 框架语义 / 答案句抽取

下载(263)| 被引(7)

面向高考阅读理解的句子语义相关度  CNKI文献

高考阅读理解选择题是基于背景材料,通过对材料的"理解"从多个选项中选出最佳选项。由于提供的背景材料相对较短且关键信息极具隐藏性,答案可能无法在背景材料中直接找到,因此从背景材料中挖掘信息并与选项...

郭少茹 张虎... 《清华大学学报(自然科学版)》 2017年06期 期刊

关键词: 高考语文 / 文意理解 / 选择题 / 多维度投票算法

下载(197)| 被引(8)

基于组合欧拉向量与边缘方向直方图的图像检索方法  CNKI文献

在图像数据库中,如何有效检索和查询图像是一个重要的研究内容.文中提出一种结合组合欧拉向量与边缘方向直方图(EOH)的图像检索方法.首先,从边缘图像中提取组合欧拉向量特征进行图像检索(EEXO算法),其次,为更好地区分...

杨红菊 菅小艳... 《模式识别与人工智能》 2012年03期 期刊

关键词: 边缘图像 / 组合欧拉向量 / 边缘方向直方图 / 图像检索

下载(252)| 被引(7)

基于最大熵的句内时间关系识别  CNKI文献

分别对句内事件-时间对关系以及事件对之间的时间关系识别进行研究。分析影响时间关系识别的语言特征,如时间关系对之间的依存关系序列、间隔词数、信号词及其位置等,并使用基于最大熵的方法进行识别。实验结果表明,运...

王风娥 谭红叶... 《计算机工程》 2012年04期 期刊

关键词: 时间关系 / 句内时间关系 / 最大熵 / 依存分析

下载(135)| 被引(25)

汉语分词及词性标注自动校验方法研究  CNKI文献

大规模的标注语料库是语料库语言学发展的重要基础。随着许多科学研究的进一步开展,我们对语料的加工质量提出了更高的要求。本文采用基于上下文搭配的规则和统计相结合的自动校验方法,对机器切分标注语料进行处理,并...

钱揖丽 张虎 第一届学生计算语言学研讨会论文集 2002-08-01 中国会议

关键词: 自动分词 / 词性标注 / 自动校验 / 语料库

下载(61)| 被引(2)

学术研究指数分析(近十年)详情>>

  • 发文趋势
时间的形状