随着数据挖掘和数据发布等数据库应用的出现与发展,如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战.隐私保护技术需要在保护数据隐私的同时不影响数据应用.根据采用技术的不同,出现了数据失真、数据加密、...
数据聚类在数据挖掘、模式识别、图像处理和数据压缩等领域有着广泛的应用 .DBSCAN是一种基于密度的空间聚类算法 ,在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点 .但由于直接对数据库进行操作...
聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBS...
FDBSCAN:一种快速 DBSCAN算法(英文) CNKI文献
聚类分析是一门重要的技术 ,在数据挖掘、统计数据分析、模式匹配和图象处理等领域具有广泛的应用前景 .目前 ,人们已经提出了许多聚类算法 .其中 ,DBSCAN是一种性能优越的基于密度的空间聚类算法 .利用基于密度的聚类...
关键词: 大规模数据库 / 数据挖掘 / 聚类 / 快速DBSCAN算法
下载(1150)| 被引(156)
传统文档分类系统都是基于文档的词属性 ,分类过程需要庞大的词典支持和复杂的切词处理。本文研究基于N gram信息的中文文档分类 ,使中文文档分类系统摆脱对词典和切词处理的依赖 ,从而实现中文文档分类的领域无关性和...
聚类是数据挖掘领域中的一个重要研究课题 .聚类技术在许多领域有着广泛的应用 .基于密度的聚类算法DBSCAN是一种有效的空间聚类算法 ,它能够发现任意形状的类并且有效地处理噪声 ,用户只需输入一个参数就可以进行聚类...
信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量投影到一个低维空间 ,消减了词和文档之间的...
报道了一个无需词典支持和切词处理的中文文档分类系统 .其特点是利用 N - gram信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现了中文文档分类的领域无关性和时间无关性 ;采用开放的体系结...
文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引模型,用于改善信息检索系统的查询效率.通过使用有向图表示文本串,引出关于文本串的邻...
利用中文文本的N gram信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖。实验结果表明 ,该方法能够取得令人满意的分类效果
本文首次提出利用相邻字对信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现中文文档分类的领域无关性和时间无关性 .分别利用 Naive Bayes和 k NN分类方法建立了基于相邻字对信息的中文文档...
分析了国外几个主要反辐射导弹研制与生产国的典型反辐射导弹的技术战术性能和指标的现状;对反辐射导弹技术,特别是被动寻的导引头技术的未来发展进行了评述。
传统的信息检索系统基于关键词建立索引并进行信息检索.这些系统存在查询返回文档集大、准确率低和普通用户不便于构造查询等不足.为此,该文提出基于文档实例的信息检索,即以已有文档作为样本,在文档库中检索与样本文...
提出了使用诱杀弹(DKM)拦截反辐射导弹(ARM)的设计方案;通过建立数学模型,对诱杀弹拦截反辐射导弹的物理过程进行了数学仿真。仿真结果表明:该方案在原理上是可行的。
本文提出了一种处理多端口耦合问题的有效方法。在该问题中,各端口波导分别通过一耦合孔与耦合区进行耦合。利用矩量法,首先导出了多端口耦合问题的关于传输模和截止模的等效导纳矩阵的计算公式。在此基础上,考虑到截...
各种网络的广泛应用产生了大量的网络数据,对网络数据进行分类是数据挖掘的一个重要问题.文中对网络数据分类的国内外研究进展进行评述.首先概述网络数据分类的基本概念,然后详细分析各种网络数据分类算法,重点讨论在...
基于P2P信息检索系统的特性,提出了一种完全分布式的查询结果排序与合并策略.首先分析当前P2P信息检索系统查询结果排序和合并问题的根源;接着提出一种完全分布式的查询结果排序与合并策略,包括元数据管理策略、查询结...
在海湾战争中,盟军首次使用了圆形箔片干扰.为了弄清这种箔片的特性,我们对由圆形箔片形成的箔片云的双站散射特性进行研究,建立了这种箔片云的双站散射截面模型.在研究中,假定单个箔片分布于铅垂面内,其取向为水平面...
给出了电磁导弹的基本模型,阐明了其物理机理,介绍了电磁导弹的基本特性及其对未来电子战的影响。