从短语到构式:构式知识库建设的若干理论问题探析 CNKI文献
构式语法(construction grammar)在汉语语法学界已引起持续关注,但在自然语言处理领域,将构式语法理论应用到计算机自动句法语义分析中的研究还很少见。该文提出构建现代汉语构式知识库的语言工程任务,讨论了构式与传...
本文利用互联网搜索引擎,调研了中国大陆和港台地区,以及北美、欧洲等多地的中文语言知识资源,包括语料库、知识库及相应的检索系统的现状。得益于经验主义研究范式在自然语言信息处理以及其他语言应用研究领域近30年...
借助互联网的迅猛发展,当今社会已经进入"大数据"时代。文章通过回顾计算机科学与语言学的交叉学科——计算语言学的发展历程,从一个侧面揭示了大数据处理对科学研究的冲击和影响,并在此基础上探讨汉语语言...
计算机句法结构分析需要什么样的词类知识——兼评近年来汉... CNKI文献
本文从计算机自动句法分析的角度来审视汉语词类问题,主要观点是:(一)过分强调"分布"与"分类"的严格对应关系,并不是正确的词类观,其负面作用是造成汉语词类的"不可承受之重"。(二)计算...
本文从句式变换的角度来审视动词的论元、论旨角色等语义概念,旨在说明:(一)"X元"动词跟"及物"动词与"不及物"动词等概念一样,是对动词的下位分类,不同类别的动词有不同的句式变换特征...
本文针对计算机处理的需要,从实际语料出发,较全面地考察了副词“都”的义项区分及其判定;分析了表“总括”义的“都”的语义指向的逻辑意义;“都”能指向哪些句法成分,不能指向哪些成分,以及判定“都”的语义指向的一...
本文面向中文信息处理的实际需要,尝试以形式化的方式对现代汉语短语结构的组合规则进行全面的描写,并探讨解决短语结构歧义问题的途径。全文共七章。 第一章对中文信息处理技术的发展状况以及目前现代汉语...
Having discussed the principles to establish a semantic categorical system in Chinese, the author identifies the following three principles: 1) Coal-driven or pragmatic principle; 2) The Principle o...
80年代以来汉语信息处理研究述评──作为现代汉语语法研究... CNKI文献
本文对80年代以来汉语信息处理研究进行了简要的总体评述。目的是探讨如何围绕信息处理开展现代汉语的语法研究。通过评述80年代以来信息处理领域的三大块研究工作,包括对国外理论方法的引介及结合汉语处理进行的宏观...
沈家煊先生近年来提出汉语词类包含模式,主要立论依据是传统的汉语词类体系中关于名、动、形等的处理方式有一个困境:要么违背语言学理论中的"中心扩展条件"、"并列条件",要么违背理论构建时应该...
本文对汉语短语结构的定界歧义做了全面考察,从歧义格式的组成成分,歧义对外造成的影响,模式歧义和实例歧义的对应关系三方面考察了短语结构定界歧义的不同类型,并对汉语短语结构定界歧义的不同类型进行了初步统计...
关于“NP+的+VP”偏正结构詹卫东一、引言关于“NP十的+VP”偏正结构①,汉语语法学界曾有过不少研讨和争论。不过主要是争论这一格式中VP的词类性质②。本文试从另一个角度讨论这一格式。具体地说,是考...
本文对“NP+的+VP”偏正结构的使用情况作了一番考察,概括了它的句法语义语用特点。在此基础上分析了两个跟“NP+的+VP”偏正结构相关的歧义格式,给出了排歧办法。
本文介绍一个主要是基于配价理论开发的汉语语义词典 (Valency_basedChi neseSemanticDictionary ,文中简称VCSD) ,分为四个方面 :第一节简要交代这个研究工作的背景 ;第二节具体阐述一个汉语语义知识的表达框架 ;第三...
自然语言的自动分析(理解)和生成构成了自然语言处理研究的全部内容。但这两个直觉上对称的任务在实际中却并没有平等的地位,前者受到更多的关注和讨论,后者的研究则相对薄弱。本文对自然语言自动分析和生成各自的目标...
本文认为并非只有作为“实体”的“语法单位”才能充当“本位”,从“计算”的角度看,汉语语法研究真正需要解决的问题是如何从功能角度对各种语法成分进行分类,以及如何构建语法成分之间的组合规则系统,而不是选择哪一...
本文从机器翻译的一般模式谈起,讨论了服务于机器翻译的语言研究应该注意的问题,包括:应更加重视形式与意义之间对应关系的系统研究;应重视以机器为“标准”来扩大关注的语言现象的范围;应重视在形式化的知识表示框架...
本文从计算机处理自然语言的角度审视现代汉语语法的理论建设问题,较为全面地讨论了现代汉语词组本位语法体系的思想原则和分析方法,及其在自然语言处理应用方面的表现。词组本位体系以它已有的丰富研究成果为依托,...
关键词: 现代汉语词组 / 现代汉语语法信息词典 / 变换分析法 / 歧义格式
下载(934)| 被引(20)
PP〈被〉+VP_1+VP_2格式歧义的自动消解 CNKI文献
PP〈被〉指"被"加宾语成分形成的介词短语,本文也称之为"被"字结构(用符号称说时,下文一般用 PP 代指 PP〈被〉);VP_1、VP_2指动词性短语。对计算机而言,PP+VP_1+VP_2是一个歧义格式。因为这个三...