基于阶乘矩及时间序列方法识别人类基因编码区

来源 :第十一届中国人工智能学术年会 | 被引量 : 0次 | 上传用户:wain155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以人类基因编码区中50bp以下(短)、100bp左右(平均)及300bp以上(长)三种长度外显子为对象,运用阶乘矩和时间序列方法将生物位点特征、统计特征相结合,在较高精度上识别外显子特别是较长和较短的外显子.通过使外显子与内含子差异最大的k-tuple作为阶乘矩特征向量,分别采用50bp、100bp和200bp三种窗口计算相应长度外显子序列的阶乘矩,突显外显子和内含子统计特性差别.再采用时间序列Time-Delayembedding方法将得到的数据展开成二维空间,进一步突出统计特性差异,并在第三维空间加入生物位点特征.最后用贪婪算法进行聚类,得到短外显子Sn为0.70,平均长度外显子Sn为0.92,长外显子Sn为0.78.本项目研究结果在保证一般长度外显子识别精度的同时解决目前对较长及较短外显子识别精度普遍低下的问题,有较高的精度和较强的学习能力.
其他文献
福建省晋江县陈埭镇1984年工农业总产值突破一亿元,成为省内第一个亿元镇,被誉为“福建一枝花”。时隔不久,又出了假药案,轰动全国。这枝花近况如何?带着这个问号,我来到了
群体运动领导机制是人工生命领域新课题.本文提出了一种在群体中个体间不需要进行信息传递的高效的群体运动领导机制,该领导机制以虚拟生物三大基本运动定律为基础,并加入了
目的 探讨术中射频消融止血法在肝右叶外伤中的应用.方法 回顾性分析术中射频消融治疗18例肝右叶外伤患者的临床资料.结果 所有患者均痊愈出院,无死亡病例.术后出现膈下脓肿1
期刊
@@
目的探讨脑死亡状态下黄芪多糖(Astragalus polysaccharide,APS)对肝脏损伤的保护作用及其机制。方法将24只健康成年雄性新西兰兔随机分为3组:空白对照组、脑死亡组和APS组,
本文结合京沪高速、提速干线、客运专线及大秦货运专线的工程可研及设计,总结出现代铁路对通信系统的要求、通信网络的特点及整体配置.
广西百色杨志宇 1986第6期王景中的《无巢脾诱王法和优质快速造脾法》在江西的《养蜂科技》1986年第3期已刊登。四川中江孙家奎 1986年《蜜蜂杂志》第6期13页题为《适时扩大
蛋白质折叠热力学假说认为天然结构下的蛋白质的自由能是全局最小值.本文将已有蛋白质能量函数与HP二给格子模型相结合,构建了一种简化的能量函数,运用遗传算法进行了结构求
镇江属于长江下游潮流区,全年以雨洪径流为主,同时受海洋潮汐影响,总体上每年进入内江的泥沙总量大于排出内江的泥沙总量,泥沙在内江中产生淤积沉淀.本文根据现有水文资料,综
在湖北仙桃市发展民族经济增强民族团结交流会上,有三个代表叫魏光元,而且都是回族,共产党员,五十岁上下。更巧的是:都来自郭河区。 At the exchange meeting for developi
目的探讨急诊内镜下使用止血夹治疗消化道机械吻合术后早期吻合口出血的疗效。方法回顾性分析2005年1月至2016年12月期间在笔者所在医院胃肠外科接受内镜下止血的12例消化道
期刊
@@