基于连续r位匹配规则的并行串匹配研究

来源 :太原理工大学 | 被引量 : 4次 | 上传用户:by_huang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展和普及,海量信息的处理和新的应用需求,对于串匹配这个计算机领域中一个基本的而又是重要的问题,提出了新的挑战。串匹配问题在Internet网络信息搜索、信息过滤、生物信息学、网络入侵检测、网络远程教育、电子商务等领域具有广泛的应用。关于串匹配的问题很早就有相关的研究,提出了许多单模式匹配算法和多模式匹配算法。人们逐渐发现在实际应用中根据实际需要进行串匹配的研究具有重要的应用价值。因此,研究高效、快速的字符串匹配算法具有重要的理论价值和实际意义。应该说,本文所提出的连续厂位匹配规则是从精确串匹配规则中演变和发展而来的。这种演变思想的来源是,作者通过查阅医学领域以及计算机领域中关于免疫学、人工免疫系统和免疫算法的相关资料,从中了解到免疫系统已经应用到计算机领域来解决许多难题,并得到了满意的效果。但在这其中将免疫系统中的连续r位匹配规则应用到字符串匹配这个问题上的先例并不多。然而,作者却发现该免疫匹配规则有很多良好特性,如果能够将其应用到我们所讨论的串匹配问题上,那么将会得到比较好的效果。例如,其分布性、并行性的特点,如果应用到串匹配的问题上,那么当数据量剧增的时候,运行时间急剧下降的问题将会得到解决。在人类的免疫系统中,抗体的种类大概有106个,然而到目前为止,人们所发现的病毒性抗原的种类大概有1016个,那么我们的肌体为什么能够在如此庞大的病毒性抗原面前还能安然无恙呢?这里面,抗原与抗体的不完全匹配起着非常重要的作用。连续r位匹配规则正是从免疫系统中抗原与抗体不完全匹配性引出的,所以应用其特点来解决串匹配问题也是值得研究的。作者正是基于以上的一些想法,开始了本论文的撰写工作。首先,本文简单的介绍了一下免疫学的一些基本知识以及免疫匹配规则,给出了本文所应用的生物学基础。其次,通过对KMP算法的分析,向其中引入了连续r位匹配规则因子,这样就可以通过预先控制匹配阈值r的大小来满足我们所需要的模式串与文本串相匹配的程度,从而得到我们满意的答案。最后,作者通过实际搭建机群的经验,给出了搭建Cluster机群环境的详细步骤,并且在该系统下运行了并行串匹配程序。通过实验结果分析,达到了预先设计的效果。在本文的总结部分作者提出了一些有待解决的问题,例如,如何再进一步的改善并行机群的通讯时间问题,以及通过与医学领域专家合作,设计出类似于免疫系统能够同一时间应对来自外界不同种的病毒性抗原的侵扰,而每个问题又可以并行来执行。这些都值得我们在今后的工作中进行研究。
其他文献
复杂网络不同于以前的网络系统,它们是动态开放的,不断成长演化而且具有生命的特点。复杂网络在局部层次上杂乱无序,而在整体层次上都呈现出小世界、高聚类度和scale-free的
随着无线局域网的广泛应用,随之而来的安全问题也越来越多地受到人们的重视。身份认证是网络实现其安全的第一步。由于无线传输媒介的空间开放性,不能通过网络的物理边界来限制
解决三维虚拟试衣的真实感、个性化、实时性等问题是当今服装CAD相关研究领域的一个核心问题,也是突破服装电子商务发展瓶颈的一个关键问题。本文首次提出基于实例驱动的虚拟
随着联网设备特别是嵌入式联网设备数量的增加,能提供几乎无穷尽IP地址的IPv6协议的优势越来越显著。但目前应用于嵌入式设备的IPv6协议栈很少,所以,在嵌入式设备中实现IPv6协议
随着网络技术的普及和教育信息化程度的提高,教育领域的知识管理已经成为网络教学中研究的热点,它通过发展知识交流的技术和知识组织的内部结构,帮助学习者获取知识,并促进他们之
随着Internet的快速发展,基于Internet的分布式计算也迅速地发展,出现了许多新的、大规模的、开放的分布式系统。多Agent系统(MAS),为分布开放系统的分析、设计和实现提供了
Web系统是一种特殊的C/S应用软件系统,随着因特网的飞速发展,Web系统的应用越来越普及和深入,而保证系统能在预期工作负载下正常工作的性能测试也越发显现其重要性来。本文在
随着Internet的迅速发展和普及,电子邮件以其方便、快捷、成本低等特点而成为人们生活中重要的通信手段之一。但随之而生的垃圾邮件,则占用了大量网络资源,浪费了网民的宝贵时间
随着大数据、物联网等技术的发展,大量的数据以“流”的形式快速产生,从而形成了数据流。数据流中常常隐含着概念漂移。在概念漂移刚刚发生时,仅能获取到少量属于新到概念的样本
曲线曲面造型是计算机辅助几何设计和计算机图形学的重要内容,其中曲线造型技术是曲面造型技术的基础。代数B-样条曲线是一种分段定义的隐式代数曲线,它具有次数低、分段光滑和