基于PFD过滤器查找DNA序列中相似性重复片段

来源 :第二十四届中国数据库学术会议 | 被引量 : 0次 | 上传用户:neiki1120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在DNA序列中查找重复片段是基因序列分析的一个重要课题.由于重复片段的模式长度范围较大,所以仅使用编辑距离(edit distance)很难良好的衡量序列的相似性.提出了衡量重复片段相似性的新标准,新标准表达了序列间的距离与序列中相同部分的关系.考虑到计算的复杂性,基于频率向量提出了新的距离函数PFD(partition frequency distance)以及相应的过滤函数,用以产生重复片段的候选集,提高查找算法的效率.采用后继数组代替滑动窗口的方法进行序列划分,避免只可在等长的片段上查找重复片段的限制.实验结果表明,与TRF(tandem repeat finder)方法相比,基于PFD过滤函数的算法可以找到更多的满足相似性要求的重复片段.
其他文献
(上略)昨日接到「關於测製二十萬分之一地質圖之商討」,閱後,知兄對各計劃莫不悉心研討,以求至善,至頌至慰!愚意尚有微末兩點,願一述及以供參考: (LEFT) Yesterday receive
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
数据流应用往往要求数据流上的连续查询能够满足用户期望的查询服务质量,以保证查询结果的有效性.针对数据流上的统计性QoS保证问题进行了研究,给出了统计性QoS的定义,并提出
我们有时候会因工作需要.在电脑里保存成百上千个Word、PDF等格式文档.而工作文档的文件名往往冗长复杂.难于记忆.也不好按文件名搜索.这些文档中的语言往往有着相似的字句,
丽声65R系列音箱,专注于高品质、专业化,做工严谨、外观漂亮且贴近实际乐手,整体外观设计很美,剖析内部整体及局部做工非常工整,电路设计科学。丽声系列音箱可分三组音箱音色
先前无线传感器网络的数据查询处理层的研究主要集中在利用谓词、网内数据汇集来减少传感器节点通信量.当连接操作的选择度足够小时,采用网内连接操作也可以减少传递到网外信
会议
偶是个地道的大“马虎”,前脚要做的事情后脚就会忘记.这不,半夜一回家,就被老婆劈头盖脸地骂了一顿,弄得偶是一头的雾水,细问缘由,原来今天是偶们的结婚纪念日,老婆等了一晚
数据流上的突变检测在网络流量监测、金融风险分析、传感器网络等领域都有着十分广泛的应用.传统的突变检测算法只能对流上的聚集函数值进行检测,这在实际应用中往往不能满足
会议
游戏的全屏操作可以让玩家更加投入和尽情的游戏.但有些时候全屏游戏也让我们不得不放弃其他操作,也就有了游戏时候不能与朋友聊天的遗憾.如果全屏游戏可以变成窗口化游戏操
双核心的处理器有着更好的性能表现.那双核心的浏览器又如何呢?其实双核心浏览器最大的特色就是拥有更好的兼容性.当然也有着普通浏览器所欠缺的功能.“Sleipnir”浏览器就是