基于生物信息学特征的DNA序列数据压缩算法

来源 :电子学报 | 被引量 : 0次 | 上传用户:Flying_wind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过将生物学特征和生物学含义引入DNA序列数据的压缩处理中,提出了基于生物信息学特征的BioLZMA压缩算法.在BioLZMA算法中,DNA序列根据组成部分生物学含义的不同切分重组为四个集合:编码序列CDS集合、内含子序列集合、RNA序列集合以及剩余序列的集合.根据各集合中序列的具体生物学特征分别使用针对性的压缩策略进行预处理,并通过LZMA算法进行压缩编码.实验结果表明,BioLZMA算法在基准测试序列上的压缩性能优于原有的DNA序列压缩方法.特别是对于生物信息学特征清晰的长序列,算法能够在较短的时间内获得较高的压缩率.
其他文献
随着经济的发展,电子商务在社会中扮演的角色越来越重要,随着真个社会步入商务时代,为了满足电子商务对人才的要求,其教学必须贴近市场的发展趋势,电子商务教材的基础内容应
本文提出了一种基于领域模型和构件组合的软件开发框架,使用领域模型捕获系统业务静态需求,描述领域内业务对象之间的静态关系,通过领域应用框架描述系统的共性,并在框架中提
以呋喃丹为原料,在强碱性(pH>12)下水解生成呋喃酚,与对硝基苯氯甲酸酯和6-氨基己酸反应,合成呋喃丹半抗原,即6-[[(2,3-二氢-2,2-二甲基-7-苯并呋喃基氧)羰基]氨基]己酸(BFNH
本文将文化因素引入传统的公司金融领域进行研究,试图证明文化是影响上市公司流动性风险的一个重要因素。文章首先参照文化领域学者的研究成果,提出了中国传统文化中两个最为
为揭示高强混凝土早龄期构件温湿耦合影响下的应力变化规律与开裂风险,以混凝土棱柱体为例,建立了高强混凝土构件温湿耦合计算方法和早龄期约束收缩应力计算方法,通过编程实
本文重点阐述了初中英语教学中存在的问题及对策,对缺乏一定的口语交流环境、教学时课堂积极性低下、初中英语教学的语言与文化割裂等问题进行了详细分析,并一一指出了针对性
TPM就是以设备为切入点,通过所有员工积极参与的自主保全活动,让企业点点滴滴合理化的过程,它对改善生产型企业现场环境,提高设备可靠性、运行效率、生产效率、员工综合素质,
在企业领域,质量控制(QC:Quality Control)活动是指为达到和保持质量而进行控制的技术措施和管理措施方面的活动。由于国内企业QC小组活动管理普遍存在小组及小组活动管理原
道路作为重要的人为活动因素之一,对其两侧的土地利用具有重要影响.以深圳市为例,从道路等级和道路密度出发,采用缓冲区分析和城市化影响指数,研究了快速城市化地区道路格局
<正>自2007年山东、广东、海南、宁夏四省区首次进入新课程高考以来,伴随着课程改革的地理高考也在不断探索与改革。试卷的命制在贯彻新课程精神、落实新课程理念、体现新课