作为解决信息过载问题的有效方式,推荐系统能够根据用户偏好对海量信息进行过滤,为用户提供个性化的推荐.但在推荐过程中,性能表现优异的协同过滤模型并没有充分利用上下文信息,这在一定程度上使系统面临性能瓶颈.为了...
针对传统事件因果关系识别覆盖范围小和人工标注代价高等不足,提出了一种基于双层模型的维吾尔语突发事件因果关系抽取方法.该方法采用分治思想,将因果关系抽取问题转化为对事件序列的两次模式识别标注.采用Bootstrap...
关键词: 因果关系 / 维吾尔语 / 突发事件 / Bootstrapping
下载(343)| 被引(24)
Storm作为流式计算模式下最具代表性的平台之一,其默认轮询的调度机制未考虑到异构环境下不同工作节点的自身性能和负载差异,以及工作节点之间的网络传输开销和节点内部的进程与线程通信开销,无法充分发挥集群的性能....
为解决传统基于TF-IDF的K最近邻(KNN)分类算法在短文本分类时,出现特征维度过高和数据稀疏的问题,基于卷积神经网络和KNN,提出一种新的短文本分类算法。通过采用神经网络语言模型word2vec对短文本进行词向量的训练,并...
道路交通事故是道路交通安全水平的具体体现,为使预测数据更科学地为交通管理系统提供决策。提出建立基于LSTM(Long Short-Term Memory)神经网络的交通事故模型,训练交通事故相关的数据,对交通安全水平的指标进行预测...
张志豪 杨文忠... 《计算机工程与应用》 2019年14期 期刊
关键词: 交通事故 / 神经网络 / 长短期记忆(LSTM) / 预测
下载(1613)| 被引(17)
遥感图像具有整体亮度偏暗、对比度较低和目标与背景区分不明显的特点,遥感图像增强技术对于改善图像的对比度、突出某些局部细节等起着积极的作用,图像的多尺度系统已经成功应用在图像处理中。经典的多尺度系统曲波(...
杨波 贾振红... 《光电子.激光》 2013年11期 期刊
关键词: 遥感图像 / Shearlet变换 / 稀疏表示 / 模糊增强
下载(610)| 被引(38)
命名实体识别(Named entity recognition,NER)是自然语言处理(Natural language processing,NLP)中重要的任务,其中人名实体是主要的识别对象之一.本文从维吾尔语黏着性特点出发,从词干、音节、字符串三个角度对维吾尔...
基于剪切波域改进Gamma校正的医学图像增强算法 CNKI文献
为了解决医学图像在采集和传输过程中引入噪声和干扰导致图像质量恶化从而严重影响医学诊断的问题,提出一种基于剪切波(shearlet)域改进Gamma校正的图像增强方法。首先,通过剪切波变换,把图像分解成高频部分和低频部分...
虽然大数据技术在社交网络、金融、公共安全、医疗卫生等领域的应用不断成熟,但在竞技体育方面的应用还处于探索阶段.常规篮球统计中缺乏对传球数据的记录,更缺乏对传球数据的统计分析、价值挖掘及应用等方面的研究.1...
张陶 于炯... 《计算机研究与发展》 2016年12期 期刊
关键词: 大数据应用 / 传球网络 / GraphX框架 / PlayerRank算法
下载(871)| 被引(8)
维吾尔语是典型的黏着性语言,其派生能力很强,具有丰富的形态变化,同时遵循语音和谐规律,生成过程中会出现弱化、增音、脱落等音变现象.这些特性决定了维吾尔语词法分析的难点,包括词干提取、发生音变字母的还原以及标...
并行计算框架Spark缺乏有效缓存选择机制,不能自动识别并缓存高重用度数据;缓存替换算法采用LRU,度量方法不够细致,影响任务的执行效率.本文提出一种Spark框架自适应缓存管理策略(Self-Adaptive Cache Management,SAC...
针对传统VSM(vector space model)在短文本分类中维数高、语义特征不明显的问题,提出基于LDA(latent Dirichlet allocation)模型主题分布相似度分类方法;针对短文本内容少、长度短、特征稀疏的问题,提出基于LDA模型主...
杨萌萌 黄浩... 《计算机工程与设计》 2016年12期 期刊
关键词: 潜在狄利克雷分布(LDA) / 向量空间模型(VSM) / 短文本分类 / K近邻(K-nearest
下载(960)| 被引(39)
基于BiLSTM-CNN-CRF模型的维吾尔文命名实体识别 CNKI文献
为在缺乏资源和不依赖人工特征的情况下提高维吾尔文命名实体的识别性能,构建基于BiLSTM-CNNCRF的神经网络模型。采用卷积神经网络训练具有维吾尔文单词的后缀、前缀等形态特征的字符向量,利用skipgram模型对大规模语...
为解决基于TF-IDF的KNN算法在文本分类时没有考虑文本特征值的多峰分布和文本相似度的计算量导致分类性能差的问题,提出一种基于搜索改进的KNN文本分类算法SIKNN(KNN text classification algorithm based on search ...
群智能算法优化的结合熵的最大类间方差法与脉冲耦合神经网... CNKI文献
针对最大类间方差准则下的图像分割结果携带原图信息量不足、实时性差和脉冲耦合神经网络(PCNN)模型中循环迭代次数难以确定的问题,提出了群智能算法优化的结合熵的最大类间方差法(OTSU-H)与PCNN融合的自动图像分割算...
针对传统隐私保护模型对个性化匿名缺乏考虑的问题,对现有的两种个性化匿名机制进行了分析。在k-匿名和l-多样性匿名模型的基础上,提出一种个性化(α,l)-多样性k-匿名模型来解决存在的问题。在该模型中,依据敏感程度的...
基于NSCT域图像融合改进算法的SAR图像无监督变化检测 CNKI文献
为了降低合成孔径雷达(SAR)遥感图像变化检测总误差数以及获取更好的变化检测结果,提出了一种基于非下采样轮廓变换(NSCT)域图像融合改进算法的SAR图像无监督变化检测方法。首先用两时相遥感图像构造得到对数比值和均...
张一晨 贾振红... 《光电子·激光》 2015年10期 期刊
关键词: 变化检测 / 图像融合 / 非下采样轮廓变换(NSCT) / 模糊局部信息C均值聚类(FLICMC)
下载(242)| 被引(13)
对文字检测和识别技术进行了全面的介绍。介绍了自然场景文字识别技术的研究背景、应用领域、技术难点等;介绍了场景文字识别的预处理技术及流程,介绍了近年来出现的基于深度学习的通用检测网络、维吾尔文和中英文的深...
基于最小生成树的图像分割算法是一种全局最优的算法,然而会出现图像细节的处理不甚理想的问题,即分割结果出现不同程度的过分割和欠分割的现象。针对这一现象,根据图像全局和区域间的最大类间方差(Ostu),将Ostu阈值法...