当前的司法智能化建设者,肩负着保持全球司法信息化领跑姿态,抢占智能化战略制高点的重大历史使命。这就要求我们应当厘清信息化与智能化在产业发展阶段和技术原理属性方面的根本差异,充分认识到司法信息化与司法智能...
用户满意度评估一直是互联网搜索领域的研究热点,并具有3方面的挑战:1)传统的搜索性能评估方法大多基于对检索结果相关性的标注,但大多数基于相关性标注的评价指标并非针对互联网搜索环境而设计,其结果与搜索用户主观...
TikTok是全球最具吸引力、增长最快的社交媒体平台之一。截至目前,TikTok在全球范围内已超过26亿次下载量,在美国拥有1亿用户。TikTok发现和提供内容的独特方式是其具有吸引力的"秘密武器"。TikTok将网红博...
基于用户行为分析的思路,提出了一种自动进行搜索引擎性能评价的方法.此方法能够基于对用户的查询和点击行为的分析自动生成导航类查询测试集合,并对查询对应的标准答案实现自动标注.基于中文商业搜索引擎日志的实验结...
关键资源页面是网络信息环境中一种重要的高质量页面,是用户进行网络信息检索的主要目标.决策树算法是机器学习中应用最广的归纳推理算法之一,适用于关键资源页面的判定.然而由于Web数据均一采样的困难性,算法缺乏有足...
中国中文信息学会2020年“钱伟长中文信息处理科学技术奖”... CNKI文献
随着互联网信息爆炸增长,搜索引擎已成为最重要的互联网应用之一,关系到社会信息处理水平与利用效率;当前绝大部分国家的搜索服务被跨国巨头垄断,拥有自主可控的搜索技术对国家信息安全意义重大。2006年至今,清华大学...
W eb数据中的质量参差不齐、可信度不高以及冗余现象造成了网络信息检索工具存储和运算资源的极大浪费,并直接影响着检索性能的提高。现有的网络数据清理方式并非专门针对网络信息检索的需要,因而存在着较大不足。本文...
开放领域新词发现研究对于中文自然语言处理的性能提升有着重要的意义.利用条件随机场(condition random field,简称CRF)可对序列输入标注的特点,将新词发现问题转化为预测已分词词语边界是否为新词边界的问题.在对海...
关键词: 新词发现 / condition / random / field(CRF)
下载(1398)| 被引(97)
网络信息的爆炸式增长,使得当前任何搜索引擎都只可能索引到Web上一小部分数据,而其中又充斥着大量的低质量信息.如何在用户查询无关的条件下找到Web上高质量的关键资源,是Web信息检索面临的挑战.基于大规模网页统计的...
社会影响力分析是当前在线社会网络研究中的热点方向.随着微博成为了一种至关重要的大众媒体,更好的分析和衡量微博用户的社会影响力引起越来越广泛的关注.基于从新浪微博收集的大规模数据集,作者结合社会影响力在微博...
信息检索的效果很大程度上取决于用户能否输入恰当的查询来描述自身信息需求。很多查询通常简短而模糊,甚至包含噪音。查询推荐技术可以帮助用户提炼查询、准确描述信息需求。为了获得高质量的查询推荐,在大规模"...
用户满意度是以用户为中心的搜索引擎性能评价的一个重要分支,区别于传统基于查询与文档相关性的评价方法,基于用户满意度的性能评价能够更加全面、客观地对搜索引擎性能进行评价。该文通过设计搜索实验平台,在尽量不...
青年教师是高校教师队伍的中坚力量。加强高校青年教师党员发展工作,对于坚持党对高校的全面领导、优化党员队伍结构、加强基层党组织建设、建设高素质教师队伍、培养业务型后备干部具有重要的现实意义。当前,高校青年...
Web2.0环境下辅导员党建工作方式的调研与思考 CNKI文献
Web2.0网络环境下,大学生获取信息和交流学习的渠道日益多样化。青年学生思想具有可塑性、易变性、创新性等特点,对新鲜事物的兴趣和接受力更强,传统的辅导员党建工作方式对同学的思想引导凸显滞后。利用用户浏览日志...
关键词: Web2.0网络平台 / 党建工作 / 时事政治 / 社会热点
下载(193)| 被引(0)
虚拟组织是网格体系结构中的基本组织单元 ,借鉴网格研究中对虚拟组织的特性分析 ,可以在网络信息检索研究中定义虚拟站点的概念。实验发现 ,虚拟站点入口页面是网络信息环境中具有较高质量的一个网页集合 :实验表明 ...
多样化检索结果的评测通常假设一个查询词包含多个权重各不相同的用户子意图,并在此假设的基础上对检索结果进行评测.虽然大多数已经存在的多样化检索评测方法利用了这些特性对检索结果进行评测,但在评测过程中,它们都...
领域术语是反映领域特征的词语.领域术语自动抽取是自然语言处理中的一项重要任务,可以应用在领域本体抽取、专业搜索、文本分类、类语言建模等诸多研究领域,利用互联网上大规模的特定领域语料来构建领域词典成为一项...
搜索引擎用户在与搜索引擎的交互过程中反映出的隐性反馈信息(主要是点击行为信息)是搜索引擎用来改进结果排序的重要影响因素。然而,由于结果位置、展现形式等各种因素的影响,将反馈信息直接应用于搜索排序任务往往难...
描述了生成式模型的概念及它在文本情感分类领域的发展,分析了生成式情感模型的分类,着重研究了不同生成式情感模型之间的关联性,并对生成式模型中最有代表性的三类模型进行了介绍,最后对生成式情感模型发展以及未来趋...