作  者

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
引用
筛选:
文献类型 文献类型
学科分类 学科分类
发表年度 发表年度
作者 作者
机构 机构
基金 基金
研究层次 研究层次
排序:
显示:
CNKI为你找到相关结果

基于语料库的字母词语自动提取研究  CNKI文献

目前 ,很多最新的术语和专有名词 ,首先以字母词语的形式出现在汉语中 ,并日益广泛应用。而字母词语多数是汉语自动分词中的未登录词 ,其正确识别 ,将有助于提高中文分词、信息检索、搜索引擎、机器翻译等应用软件的质...

郑泽之 张普... 《中文信息学报》 2005年02期 期刊

关键词: 人工智能 / 自然语言处理 / 字母词语 / 自动提取

下载(484)| 被引(24)

字母词语自动提取的几点分析  CNKI文献

字母词语大多是术语和专名,也是汉语自动分词中的未登录词,其正确识别与否不仅关系到大规模中文文本自动分词和标注,也关系到信息检索、搜索引擎、机器翻译等应用软件的质量。本文对大规模真实文本中的字母词语的使用...

郑泽之 张普 《语言文字应用》 2005年01期 期刊

关键词: 字母词语 / 自动提取 / 词汇

下载(433)| 被引(25)

汉语真实文本字母词语考察  CNKI文献

借助计算机自动提取,本文对2002年《人民日报》(网络版)全年真实文本中外文字母的使用情况进行了统计考察,给出了作者对字母词语中几个问题的分析讨论,包括对外文字母在该报纸语料中使用情况的分类、字母词语的工程界...

郑泽之 张普 《语言科学》 2005年06期 期刊

关键词: ELWP / 字母词语 / 单字母ELWP / 含数字ELWP

下载(289)| 被引(19)

一个基于ASP的流行语投票系统  CNKI文献

利用ASP可以直接在HTML文件中嵌入用JavaScript或VBScript脚本语言编写的脚本命令和ADO组件,对任何与ODBC兼容的数据库或OLE DB数据源的高性能连接的优点,结合数据库结构化查询语言(SQL),构建了一个动态交互的投...

郑泽之 张普 《计算机工程》 2003年17期 期刊

关键词: ASP / ADO / 投票系统 / Web服务器

下载(329)| 被引(8)

汉语文本中字母词语的使用与规范探讨  CNKI文献

本文基于2002年《人民日报》的语料,对计算机自动提取出的字母词语块进行了考察分析;文章重点考察了字母词语和对应汉字词语或汉字词语和对应字母词语在专名中同现的情形,并就如何规范字母词语提出了两点思考。

杨建国 郑泽之 《语言文字应用》 2005年01期 期刊

关键词: 字母词语 / 汉字词语 / 规范 / 专名

下载(696)| 被引(58)

数学教材语言与语料库建设  CNKI文献

数学是一门重要的基础学科,对数学语言的研究不仅有助于教材的编写,更有助于数学教学质量的提高。文章首先对数学教材语言系统进行了层次划分,对数学语言的特色从字、词、语法等角度分别进行了分析,以此作为数学教材语...

郑泽之 卞成德 第二届全国教育教材语言专题学术研讨会论文集 2008-11-01 中国会议

关键词: 数学教材语言 / 数学语言 / 语料库

下载(129)| 被引(5)

流通度—字词使用情况测定的新方法  CNKI文献

流通度理论是由张普教授提出的,是对字词的使用情况进行多层次信息分析加工的一种动态的方法。我们使用流通度的方法对北京语言文化大学网络教育学院DCC博士研究室的大规模动态流通语料库的汉字使用情况进行了统计,在...

郑泽之 王强军... 语言计算与基于内容的文本处理——全国第七届计算语言学联合... 2003-08-01 中国会议

关键词: 频度 / 使用度 / 通用度 / 流通度

下载(134)| 被引(2)

关于字母词语的几点思考  CNKI文献

本文基于《人民日报》2002年(网络版)全年真实文本语料,借助计算机自动提取,对文本中外文字母的使用情况进行了统计考察,给出了作者对字母词语的几点思考,包括对外文字母在该报纸语料中使用情况的分类、字母词语的工程...

郑泽之 张普 第六届汉语词汇语义学研讨会论文集 2005-04-01 中国会议

关键词: ELWP / 字母词语 / 单字母ELWP / 含数字ELWP

下载(133)| 被引(1)

基于大规模DCC语料库的《现代汉语常用字表》、《现代汉语通...  CNKI文献

本文介绍了利用北京语言大学应用语言学研究所大规模动态流通语料库(DCC)2001~2002年部分语料(含有效汉字3亿1千6百多万)对有效汉字做的一系列统计工作,包括对汉字出现次数、出现频率、累计频率、通用率、流通度等的...

郑泽之 王强军... Advances in Computation of Oriental Languages--Proceedi... 2003-08-01 国际会议

关键词: DCC语料库 / 《现代汉语常用字表》 / 《现代汉语通用字表》 / 字频

下载(224)| 被引(0)

中文自动分词的一些问题  CNKI文献

自动分词是中文信息处理系统的基础,有着极其广泛的实际应用。为了了解自动分词在当前实际应用中的情况,作者使用第三代智能分词系统3GWS 对2006年3月《人民日报》的300个新闻文本进行了分词词性标注加人工校对,并对分...

郑泽之 内容计算的研究与应用前沿——第九届全国计算语言学学术会议... 2007-08-01 中国会议

关键词: 自动分词 / 词性标记 / 错误分析

下载(126)| 被引(0)

基于语料库的字母词语自动提取研究  CNKI文献

本文分析了字母词语的组成情况的复杂特征和自动识别的难点,结合字母词语的各种统计特征,提出了规则加统计辅助的字母词语自动提取的算法。算法简单,但有效。召回率为100%,准确率在80%以上。

郑泽之 张普... NCIRCS2004第一届全国信息检索与内容安全学术会议论文集 2004-11-01 中国会议

关键词: 字母词语 / 识别与提取 / 自然语言处理

下载(86)| 被引(1)

学术研究指数分析(近十年)详情>>

  • 发文趋势
时间的形状