提出了纳伪(false positive)和拒真(false negative)两种聚类特征指数直方图分别来支持纳伪误差和拒真误差窗口的聚类分析;然后,提出一种基于滑动窗口的数据流聚类方法.该方法在占用窗口大小的次线性内存空间前提下,及...
随着电子商务的迅速崛起,基于Web的应用模式迅速发展,Web应用从局部化发展到全球化,从B2C(business-to-customer)发展到B2B(business-to-business),从集中式发展到分布式,Web服务成为电子商务的有效解决方案.Web服务是...
在互联网技术快速发展、网络信息爆炸的今天,通过计算机自动分析大规模文本中的态度倾向信息的技术,在企业商业智能系统、政府舆情分析等诸多领域有着广阔的应用空间和发展前景。同时,语义褒贬倾向研究也为文本分类、...
无线传感器网络集感知、计算和无线通信为一体,是以数据为中心的网络,因此数据存储与访问是无线传感器网络研究中的重要问题.本文围绕无线传感器网络以数据为中心这一条主线,对其中数据存储与访问的国内外研究进展进行...
在数据流环境下,聚类算法不仅需要有较高的聚类质量,同时需要有实时处理速度.因而,提出了一类基于图形处理器(graphics processing unit,简称GPU)的快速聚类方法,包括基于K-means的基本聚类方法、基于GPU的数据流聚类...
介绍了数字音频水印技术的发展背景以及在音频水印系统中广泛应用的音频掩蔽现象和MPEG心理声学模型 I。综述了典型的顽健性和脆弱性音频水印技术,顽健性算法进一步在时间域、频域、压缩域上分别阐述。分析了对数字音...
最大熵模型能有效整合多种约束信息,对于汉语命名实体识别具有很好的适用性.因此,将其作为基本框架,提出一种融合多特征的最大熵汉语命名实体识别模型.该模型集成局部与全局多种特征,同时为降低搜索空间并提高处理效率...
对数据质量,尤其是数据清洗的研究进行了综述.首先说明数据质量的重要性和衡量指标,定义了数据清洗问题.然后对数据清洗问题进行分类,并分析了解决这些问题的途径.最后说明数据清洗研究与其他技术的结合情况,分析了几...
流形学习是一种新的非监督学习方法,可以有效地发现高维非线性数据集的内在维数和进行维数约简,近年来越来越受到机器学习和认知科学领域研究者的重视.虽然目前已经出现了很多有效的流形学习算法,如等度规映射(ISOMAP...
数字图像拼接技术在现实生活中有广泛的应用.本文阐述了图像拼接技术的要点,图像拼接技术大致可以分为图像预处理、图像配准和图像缝合三个基本步骤,我们对各步骤中所需要的各类经典算法进行了详细论述.根据实验经验,...
王伟 陆佩忠 《小型微型计算机系统》 2006年07期 期刊
当今万维网的规模已经快速发展到包含大约80亿个网页和560亿个超链接.此外,对万维网的创建进行全局规划显然是不可能的.这些都对万维网的相关研究提出了挑战.另一方面,互联网环境下通过超链连接起来的网页,为人们的日...
文本过滤是指从大量的文本数据流中寻找满足特定用户需求的文本的过程.首先从任务、测试主题、语料库和评测指标等方面介绍了文本检索领域最权威的国际评测会议——文本检索会议(TREC)及其中的文本过滤项目,然后详细地...
数据流上的突变检测技术由于其在风险分析、网络监测、趋势分析等领域广阔的应用前景而受到学术界和工业界越来越多的关注.为了在数据流上检测多个滑动窗口上的单调聚集函数值和非单调聚集函数值的突变,提出了基于分形...
近年来,无线传感器网络作为国内外一个新兴的研究方向,吸引了许多研究者和机构的注意力。无线传感器网络的特性决定了其最主要的一个设计目标是有效使用片上受限资源(能量、内存和处理能力)以保持最长的生命周期。为此...
该文提出了一种基于检查点的多跳确认方案来检测选择传递攻击所导致的异常丢包.在这个方案中,能够随机地选取传递路径中的部分节点为检查点,负责包的确认.这种随机检查点选择技术能够避免部分节点成为敌方俘获的目标,...
一种新的句子相似度度量及其在文本自动摘要中的应用 CNKI文献
本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中。其创新处在于相似度计算不仅考虑句子中的uni gram ,还考虑了bi gram和tri gram ,通过回归方法将这几种相似度结果综合起来。实验证明这种相似度计算...
使用了基于最大熵的方法识别中文基本名词短语 在开放语料ChineseTreeBank上 ,只使用词性标注 ,达到了平均 87 4 3% / 88 0 9%的查全率 /准确率 由于 ,关于中文的基本名词短语识别的结果没有很好的可比性 ,又使用相同...
传感器被越来越多地布置到实际的网络环境中,用于实现某些应用。无线传感器网络已经成为了科学研究领域最前沿的课题之一,引起了工业界和学术界众多研究者的关注。通过总结相关方面的工作,综述在不同领域中无线传感器...
近年来,互联网上出现了海量音乐信息,手工选取某首歌曲很多时候已经变得不可能.这直接促使产生了能够进行音乐自动识别的数字音频指纹技术,并成为研究界和工业界一个非常活跃的研究开发领域.数字音频指纹是指可以代表...