《蒙古语语法信息词典构形附加成分分库》的设计与实现 CNKI文献
《蒙古语语法信息词典》是面向计算机的,为实现自动分析和自动生成蒙古语语句而研制的一部电子词典,是蒙古文信息处理领域重要基础工程之一。《蒙古语语法信息词典构形附加成分分库》是根据蒙古语自身语法特点和规律的...
为了探讨蒙古文自动词切分及词性标注的问题,可以首先对20万词级蒙古文语料的词切分和词性标注情况进行统计和分析,并对其切分和标注错误进行二次修正,然后再采用条件随机场模型(CRF),进行自动"分词"、&quo...
据统计,蒙古文同形词在静态环境中占词典词条总数的18%,动态环境中占语料总词数的55%。全面、系统、形式化地研究同形词,不仅对蒙古语文教学、词典编纂有重要意义,而且对语料的读音识别、词法分析、词性标注、语义标注...
语言文字规范化、标准化研究,尤其是面向信息处理的蒙古语言文字规范化、标准化研究是社会对语言学提出的迫切要求,也是每一个语言文字工作者所面临的亟待解决的重大问题。蒙古文信息处理工作在制定各种规范、标准方面...
"同音同形同类词"是蒙古文词汇的重要组成部分。据统计,"蒙古文同音同形同类词"在静态环境中占词典词条总数的5.1%,动态环境中占语料总词数的11.6%。"蒙古文同音同形同类词"知识库包括...
笔者基于条件随机场(Conditional Random Field,CRF)和支持向量机(Support Vector Machine,SVM)模型,通过增加上下文、附加成分和蒙古文字母等特征,对蒙古文句长为8到25的将近4万个句子进行了词性标注的研究。研究表明...
本文主要是对26万多词的蒙古文拉丁转写语料中的蒙古文名义字符进行信息熵的计算,并给出蒙古文名义字符的信息熵和蒙古文语料中使用拉丁转写存在的问题。
词法形态分析是蒙古文信息处理诸多应用系统的一个不可或缺的模块。传统蒙古语语法学在这方面取得了一定的成果。然而,面向计算机的语言知识颗粒度极细、颗粒数量极大,在本质上不同于面向人的语言知识。本文根据“100...