大数据集正在以前所未有的速度产生,研制大数据集的实用压缩全文自索引是目前的挑战问题之一.该文提出了一种高阶熵压缩的全文自索引.对于长为n的文本T以及任意k≤clog_σn-1和c<1,该压缩索引占用2nH_k(T)+n+o(n)位...
转录因子结合位点识别在基因表达调控过程中起着重要的作用.文中提出了一种贝叶斯模型驱动的模体识别的遗传优化算法GOBMD(Genetic Optimization with Bayesian Model for Motif Discovery).GOBMD首先使用一个基于位置...
针对生物序列分析中的多序列比对问题,当输入数据量比较大时,人们提出了很多启发式的算法来改善计算速度和比对结果.提出了用于进行全局DNA多序列比对的一种方法:MWPAlign(maximum weighted path alignment).该算法把...
排序是计算机科学中最重要的研究问题之一。2000年被列为20世纪对科学和工程计算的研究与实践影响最大的10大问题之一。文章介绍了基本的快速排序算法及三种枢轴元素的选取方法,全面深入地分析了快速排序算法最坏情况...
霍红卫 许进 《微电子学与计算机》 2002年06期 期刊
现有的在DNA序列中识别重复体的算法多数是基于比对的,对识别速度和吞吐量有很大的限制.针对这个问题文中根据一个平衡重复体的长度和频率的定义,提出了一种基于Ukkonen后缀树的快速识别重复体的RepSeeker算法.算法采...
关键词: 重复体识别 / 适应性后缀树 / Ukkonen算法 / RepSeeker算法
下载(241)| 被引(9)
文中在连续空间统一的随机过程框架下 ,分析了遗传算法群体的概率密度序列的演化过程 ,给出并证明了群体概率密度的递归公式 .分析了标准遗传算法中选择算子和变异算子的基本性质 .导出了选择和变异条件下平均适应度单...
图论和优化中的许多问题是NP-完全问题,也是科学和工程计算中重要和基本的 问题。将遗传算法与启发式算法、邻近搜索方法结合解决这类问题,是遗传算法的主 要研究领域之一。本文对遗传算法的基...
利用遗传算法提出了解决0/1背包问题的3种算法.这3种算法分别是基于罚函数修正方法和译码方法的算法.理论分析表明,修正方法可以获得问题的最优解.在不同测试数据集上对这3种算法的性能进行了比较,结果与理...
模体发现对于基因发现和理解基因调控关系有着重要的意义,它是生物信息学中最具挑战性的问题之一。提出了针对PMSP算法的3种数据划分方法,并在此基础上提出了基于MapReduce的模体发现算法(PMSPMR)。针对不同难度的问题...
图的着色算法是一种典型的NP 完全问题 在系统地讨论了图的正常顶点着色、边着色以及全着色的有关理论的基础上 ,提出了基于分组遗传算法和启发式搜索的图的正常 k 点着色 ,正常k 边着色以及正常k 全着色的新型混合算...
当前大部分重复体识别算法不是依靠于已经标识的重复体数据库就是定义重复体为两个最大长度的相似序列,而没有一个严格的定义来平衡重复体的长度和频率.针对这些问题文中提出了一种基于局部序列比对算法BLAST变型且支...
本文提出了一个划分具有决定性的、实时性能的二级存储系统的最优算法.此算法在多项式时间内就能找出这一问题的最优解,并支持存储器资源的在线重新配置.
量子质因子分解算法是一种利用波的特性在量子环境下进行整数质因子分解的新方法。本文首先介绍了量子质因子分解的基本思想及其相关概念,然后分析并给出了大数质因子分解的量子算法,最后对量子算法的发展前景进行了展...
霍红卫 潘征 《计算机工程与科学》 2003年01期 期刊
超立方体上所有点对之间的最短路径霍红卫,庄心谷(西安电子科技大学计算机科学系西安710071)ALLPAIRSSHORTESTPATHSONAHYPERCUBEMULTIPROCESSOR¥HuoHo...
模体发现是生物信息学和计算机科学中最具挑战性的问题之一,对未经比对的DNA序列中定位转录因子结合位点起着重要的作用。将模体发现问题转化为无向图中求解最大团的问题,并提出了一种结合最大团求精的随机投影模体发...
随着计算机管理信息系统(Management Information System,简称MIS)的飞速发展和广泛应用,企业生产经营的自动化水平不断提高,它把人们从繁琐的事务处理中解脱出来,由原来的人工处理变成了计算机的科学管理,极大提高了...
改革开放之后,市场竞争变得十分激烈,建筑业如何在这种环境中生存并发展就成了急需解决的问题。建筑业只有做好全面预算管理,提升内部控制水平,才能不断提升企业竞争力,在激烈市场竞争中占据一席之地。主要对基于全面...
文中分析了遗传算子的作用机理 ,指出了随机性的标准遗传算法的不足之处 从遗传算法角度来看 ,虽然随机交叉方式增强了开辟新的、可能是有用的搜索空间的能力 ,但由于缺乏对可能的交叉效果 (子代质量 )方面的考虑 ,也...
文中提出了在超立方体计算机上解0/1背包问题的并行算法。如果P表示超立方体上处理器的数目,T是在一个处理器上解决给定问题所需要的时间,那么这一算法的时间特性为O(T/P)。
文中讨论了将含有循环的算法映射到脉动阵列的一般方法.这一映射方法是建立在下标集和数据相关向量的数学变换基础上,并给出了带有常数据相关的算法中存在有效变换的充要条件.最后给出计算所有点对之间最短路径问题...
霍红卫 庄心谷 《计算机研究与发展》 1997年11期 期刊