计算机专业大学生眼中的企业研究院实习——以微软亚洲研究... CNKI文献
随着企业实习在本科以及研究生教育中的日益普及,企业和企业研究院正逐渐成为"第二校园"。为总结评价学生在IT企业的实习效果,文章以哈尔滨工业大学接受"双导师"制培养的计算机专业学生为对象,通...
Improvement of Machine Translation Evaluation by Simpl... CNKI文献
Adopting the regression SVM framework,this paper proposes a linguistically motivated feature engineering strategy to develop an MT evaluation metric with a better correlation with human assessments.I...
杨沐昀 孙叔琦... 《Journal of Computer Science & Technology》 2011年01期 期刊
关键词: machine / translation / automatic / evaluation
下载(180)| 被引(1)
A Research on Bilingual Dictionary Based Sentence Alig... CNKI文献
Parallel corpus is of great importance to machine translation, and automatic sentence alignment is the first step towards its processing. This paper puts forward a bilingual dictionary based sentence...
标注集是任何自然语言处理研究中的知识表达基础。本文结合汉英双向机器翻译开发和双语语料库加工的实践 ,提出了建立标准的汉英双语标注集的必要性 ,探讨了该标注集设计过程中遇到的几个关键问题并给出了一个比较完备...
该文提出了一种面向微博检索的基于词汇时间分布的查询扩展方法.该方法利用扩展词与查询词的时间分布的相似性来度量扩展词与查询词之间的相关度,建立了基于词汇时间分布的查询模型.具体而言,该文在提出词汇时间分布的...
计算机辅助外语学习的一个新热点——电子化作业及其实现 CNKI文献
电子化作业是指通过计算机实现作业的上交和反馈。从技术角度来说,电子作业对于任何一个具体教学环境来说都是胜任的,只是许多主观因素限制了它的发展。近年来由于外语测试转向计算机化,如何使学生尽快适应计算机的特...
对问答系统中的信息检索模块进行自动评价是开发问答系统中不可或缺的一环。采用传统的检索评价指标,就需要为每个问题标注正确的候选答案。为了避免这种代价,本文提出一种问答系统中的信息检索模块进行自动评价方法。...
一、计算机辅助语言教学的现状 教育机构是最早应用电脑技术的单位之一,但是目前甚至都赶不上PC个人用户的水平了。近25年来,人们一直在探索计算机在教育上的优势,许多人甚至确信在未来的一年半到两年内计算机会为教学...
Research and Implementation of Client-server Based E-m... CNKI文献
The design and implementation of EATS, a machine translation system for e-mail, are presented. It first puts forward the notion of “instant machine translation service" and illustrates how it i...
杨沐昀 《High Technology Letters》 2001年01期 期刊
关键词: Machine / translation / E-mail / translator
下载(14)| 被引(2)
本文提出了一种基于DOM树的正文提取方法。该方法是在基于DOM树的文本密度的正文提取算法的框架上改进而来的。基于对文言文翻译网站的观察,本方法使用标点符号密度取代原方法的文本密度。通过随机选取50篇文言文翻译...
杨钦 杨沐昀 《智能计算机与应用》 2015年04期 期刊
独立的词义消歧模型性能已经获得很大提高,但是对于独立消歧模型布机器翻译系统中应用的必要性和作用一直存在着不同的观点.为了从更为一般性的角度评价这个问题,本文突破了具体模型的限制,通过在不同类型汉英机器翻译...
智慧检务是进一步发展检察信息化的重要步骤,它的实施和普及能更好地提升检察院工作质量和工作效率。实际上,检察官在办公流程中往往会处理大量的检察院法律文书,若不能有效地组织和利用这些文书中的信息,会降低其工作...
本文提出了一种面向特定领域的汉语句法主干分析方法。该方法中包括浅层句法分析、模板匹配两个关键环节 ,形成用模板表示的句法主干。在浅层句法分析中 ,本文使用了级联的隐马尔可夫模型进行了短语的归并 ;而后以已有...
在微博情感倾向性分析中,一种典型分析方法是先对微博进行主客观分类,再对判定为主观的微博进行褒贬分类,但其问题在于主客观分类错误将直接传导到褒贬分类。针对这一问题,本文提出了一个主客观分类和褒贬分类融合的评...
研究了信息检索结果多样化的方法。首先实现了经典的检索结果重排序最大边缘相关(MMR)算法,进而设计了三种基于查询日志的子查询构造方法:单字向后扩展,双字向后扩展和双向子串扩展,并最终探讨了将这三种子查询构造方...
张语晨 杨沐昀 《智能计算机与应用》 2012年01期 期刊
为了有效翻译体育领域文本,特别是文本中的长句,本文提出了一种面向体育领域的句子主干翻译方法。该方法采用模板来表示句子主干,主要包括句法主干分析、模板转换和句子主干译文生成三个步骤。本文研究中特别针对体育...
在数字化智能信息处理领域,词汇级语言对象在语义上的相关关系可以为多种研究问题提供有效的特征线索。语义相关度计算是语义相关关系的量化手段,而基于分布相似度的计算方法是一类最典型的方法。这类方法将语言对象被...
孙叔琦 杨沐昀 《智能计算机与应用》 2014年05期 期刊
个性化信息检索通过挖掘用户兴趣来准确理解用户信息需求,提供高质量的检索结果。然而,用户历史是否与用户信息需求有关系这一问题缺少明确回答。本文基于真实搜索日志对用户历史与用户信息需求的关系进行了分析。当前...
针对情感分类问题中长句和短句具有不同的建模特点,提出了一种基于联合深度学习模型的情感分类方法。该方法融合长短期记忆(long-short term memory,LSTM)模型与卷积神经网络(convolutional neural network,CNN)对影视...
实用化的机器翻译系统一般采取基于规则的方法,而长久以来手工调试是翻译系统的主要知识源。为了解决手工汉英翻译规则获取这一瓶颈问题,提出了一种基于翻译等价对的自动获取方法,应用到汉英之间比较典型的“数-量-名...