作  者

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
引用
筛选:
文献类型 文献类型
学科分类 学科分类
发表年度 发表年度
作者 作者
机构 机构
基金 基金
研究层次 研究层次
排序:
显示:
CNKI为你找到相关结果

短文本语言计算的关键技术研究  CNKI文献

伴随着信息时代的到来,我国互联网事业和通讯事业发生了翻天覆地的变化,导致以电子形式存储和处理的数据爆炸性增长,存储成本的降低进一步使海量数据的存储和处理成为可能。这些数据中有很大一部分是长度很短的文本数...

龚才春 导师:白硕 中国科学院研究生院(计算技术研究所) 2008-04-01 博士论文

关键词: 短文本 / 语言计算 / 冗余检测 / 频繁模式

下载(2298)| 被引(58)

大规模语料的频繁模式快速发现算法  CNKI文献

提出了一种大规模语料频繁模式快速发现算法,通过采用合适的策略将语料划分为若干子语料,对每个子语料单独进行处理,即可获得原始语料的频繁模式;同时该算法能够避免处理频次在设定阈值以下的模式,进一步减少了内存占...

龚才春 贺敏... 《通信学报》 2007年12期 期刊

关键词: 频繁模式 / 语料划分 / 重复串

下载(204)| 被引(21)

基于整体特征的快速手写体数字字符识别  CNKI文献

该文通过模拟人眼识别数字字符的过程,提出了一种基于字符整体特征(凹凸特征)的快速手写体数字字符识别方法。该方法不需要对字符图像做复杂的细化处理,减少了细化形变可能带来的误识和拒识;也不需要进行复杂的笔道特...

龚才春 刘荣兴 《计算机工程与应用》 2004年19期 期刊

关键词: 凹凸分析 / 手写体数字字符识别 / 整体特征 / 快速算法

下载(405)| 被引(35)

基于多重索引模型的大规模词典近似匹配算法  CNKI文献

编辑器的拼写校正、搜索引擎的查询纠正、光学字符识别的结果检查等领域都用到词典近似匹配算法.传统单索引模式很难在高性能的前提下保证高召回率.词典越大问题越严重.提出了大规模词典近似匹配的多重索引模型,首先将...

龚才春 黄玉兰... 《计算机研究与发展》 2008年10期 期刊

关键词: 模式匹配 / 近似匹配 / 多重索引模型 / 大规模词典

下载(232)| 被引(11)

脱机手写体汉字字符的笔顺信息恢复  CNKI文献

给出了一种从脱机手写体汉字字符中识别笔顺的法则———统一笔顺法则 ,将脱机识别问题转变为联机识别问题 ,利用人们熟悉的图论知识加以解决 ,大大提高了识别率和识别速度 ,也简化了识别过程 .

龚才春 刘荣兴 《山东大学学报(理学版)》 2004年01期 期刊

关键词: 脱机手写体汉字字符识别 / 笔顺恢复 / 笔划

下载(89)| 被引(13)

面向字符识别的快速小形变细化算法  CNKI文献

本文描述了现有字符细化算法的思想及其缺陷 ,并且在分析细化形变根源的基础上给出了一种面向字符识别的快速细化算法。该算法不仅速度非常快 ,而且不会产生毛刺和伪分支点 ,细化后字符骨架形变很小。

龚才春 刘荣兴 《计算机应用与软件》 2005年02期 期刊

关键词: 字符识别 / 细化 / 骨架 / 形变

下载(281)| 被引(1)

一种基于大规模语料的新词识别方法  CNKI文献

提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词。通过在不同规模的语...

贺敏 龚才春... 《计算机工程与应用》 2007年21期 期刊

关键词: 新词 / 邻接类别 / 单字成词概率 / 双字耦合度

下载(755)| 被引(74)

Kad网络节点资源探测分析  CNKI文献

Kad网络中存在数以亿计的共享资源,而其中有相当一部分可被评定为敏感资源。为深入了解Kad网络上资源尤其是敏感资源的特征,运用Kad网络采集器:Rainbow对节点拥有的文件资源进行探测分析。该文发现:1)文件流行度和文件...

刘祥涛 龚才春... 《中文信息学报》 2010年06期 期刊

关键词: 对等网络 / Kad网络 / 探测分析 / 敏感资源

下载(158)| 被引(8)

基于伪相关反馈模型的领域词典生成算法  CNKI文献

本文提出了一种基于伪相关反馈模型的领域词典自动生成算法。将领域词典生成过程视为领域术语的检索过程:假设初始检索出来的前若干个字符串与领域相关,将这些字符串加到领域词典中,重新检索,如此迭代,直到生成的领域...

黄玉兰 龚才春... 《中文信息学报》 2008年01期 期刊

关键词: 计算机应用 / 中文信息处理 / 有意串 / 领域词典

下载(307)| 被引(9)

中文短文本流的快速编码识别算法  CNKI文献

提出了一种面向中文短文本流的快速编码识别算法——CodeFinder。CodeFinder 构造一个编码识别专用词典,并对每个词语关联一个编码可信度。扫描待识别文本并计算文本在各种可能编码形式下的编码可信度,即可确定文本的...

龚才春 张华平... 中国计算技术与语言问题研究——第七届中文信息处理国际会议... 2007-10-01 国际会议

关键词: 编码识别 / 短文本流 / 编码可信度

下载(110)| 被引(3)

大规模语料的频繁模式快速发现算法  CNKI文献

已有基于内存的频繁模式发现算法需要的物理内存是语料规模的几倍甚至几十倍,本文提出一种大规模语料频繁模式快速发现算法,通过采用合适的策略将语料划分为若干子语料,对每个子语料单独进行处理,即可获得原始语料的频...

龚才春 贺敏... 全国网络与信息安全技术研讨会论文集(上册) 2007-07-01 中国会议

关键词: 频繁模式 / 语料划分 / 重复串

下载(56)| 被引(3)

基于局部性原理的有意义串提取方法  CNKI文献

本文提出基于局部性原理的有意义串提取算法。本文发现有意义串遵循空间局部性原理和时间局部性原理,并用LE值量化字符串的局部性。在此基础上,利用LE值和其他统计量共同提取有意义串。实验证明局部性原理能够提高查找...

黄玉兰 龚才春... 第四届全国信息检索与内容安全学术会议论文集(上) 2008-11-01 中国会议

关键词: 有意义串 / 局部性原理 / 准确率

下载(90)| 被引(1)

基于多重索引模型的大规模词典近似匹配算法  CNKI文献

编辑器的拼写校正、搜索引擎的查询纠正、光学字符识别的结果检查等领域都用到词典近似匹配算法。本文提出了大规模词典近似匹配的多重索引模型,首先将背景词典根据单词长度划分为若干子词典,对各子词典按照一定策略建...

龚才春 黄玉兰... 第三届全国信息检索与内容安全学术会议论文集 2007-11-01 中国会议

关键词: 模式匹配 / 近似匹配 / 多重索引模型 / 大规模词典

下载(41)| 被引(2)

Kad网络节点共享资源探测分析  CNKI文献

Kad网络中存在数百万的共享资源,而其中有相当一部分可被评定为敏感资源。首先用我们的Kad网络采集器:Rainbow对节点拥有的文件资源进行探测;然后对节点资源和敏感资源进行相关统计分析。我们发现:1)只有3.09%的节点拥...

刘祥涛 龚才春... 第五届全国信息检索学术会议论文集 2009-11-14 中国会议

关键词: 对等网络 / Kad网络 / 探测分析 / 敏感资源

下载(66)| 被引(0)

基于伪相关反馈模型的领域词典生成算法  CNKI文献

本文提出了一种基于伪相关反馈模型的领域访词典自动生成算泫。将领域词典生成过程视为领域术语的检索过程:对于绘定的领域语料 C,对于发现的有意思 S,如果 S 是 C 的领域术语, 则称 S 与 C 相关。假设初始检索出来的...

黄玉兰 龚才春... 第三届全国信息检索与内容安全学术会议论文集 2007-11-01 中国会议

关键词: 有意串 / 领域词典 / 大规模语料 / 伪相关反馈

下载(32)| 被引(0)

学术研究指数分析(近十年)详情>>

  • 发文趋势
时间的形状