基于序列信息对人类DNaseⅠ超敏位点进行预测

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yjso579202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在遗传学中,超敏位点是一个相对较短的染色质区域,它可以在所有的活性基因上发现。DNaseⅠ超敏位点(DHSs)是失去其高级结构的特殊染色体区域,可被DNaseⅠ酶识别,结合和切割。因此,这些DNA区域变得暴露,更容易被酶接触,从而发挥其生物学作用。DNA序列中DHSs的研究对于理解转录调控机制和定位一些顺式调控元件(如启动子,增强子,绝缘子,沉默子和基因座控制区等)具有重要意义。因此,识别DHSs成为了从非编码序列中发现功能性DNA元素的有效途径。尽管后基因组时代已提出了许多实验方法来识别DHSs,但这些实验方法需要大量实验人员的辛勤劳动,以及需要耗费大量的实验原材料、实验器材和实验时间。与此同时,这些实验方法的大量涌现也为后续的研究提供了宝贵的实验数据。因此,开发用于预测DHSs序列的计算方法既有重要意义,又是推进科学发展不可或缺的一步。在本文的研究中,我们提出了一种基于DHSs序列信息的预测分类器模型来识别人类DHSs。研究采用的基准数据集是Noble课题组通过可靠的实验方法测序出来的,共包含1017条样本序列,大小均在240bp左右,并去除了序列冗余。我们的模型使用了k-mer、二核苷酸理化值、二型伪核苷酸组分、基于两个窗口的二型伪核苷酸组分、G-gap kmer、DNA的natural vector和k-mer组合理化性质矩阵的特征集七种特征提取方法构建特征向量,对结果进行比较,初步挑选最优的特征提取算法并使用mRMR算法对特征进行特征筛选,再根据筛选结果用F-score进行进一步筛选,得到最优特征集,通过SVM和随机森林两种分类算法的比较,最终得到最佳的基于SVM的分类模型。鉴于DHSs的识别对后续非编码序列中调控因子的发现具有促进作用,我们提出的预测分类模型具有重要的参考意义,模型的AUC和最终准确度分别达到0.85和0.87,与已有的DHSs预测模型相比具有优势,表明我们的方法具有良好的性能,能够为相关领域研究者提供便利。同时,我们提供了在线网站给相关领域的研究人员下载我们的模型相关数据。
其他文献
与压力驱动膜分离过程相比,渗透压驱动膜分离过程由于其独特的优势正获得更多的关注。例如,渗透压驱动膜分离过程在水/废水处理以及海水脱盐等领域中有着降低能耗的潜力,并且
非线性问题一直是数学物理中一个热门的研究课题,近几十年来,随着科研的不断深入,非线性科学取得了巨大进展.研究发现自然界中的许多现象可以通过建立非线性发展方程的解的数
大气同化反演方法已被证明是获取地表碳源汇的有效方法之一。但是,当前开展的碳同化反演研究主要集中在全球或大洲等较大尺度,其空间分辨率较为粗放(通常以度为单位),反演结果
焊接是现代钢结构主要的连接方式之一,在高层结构的节点中应用十分广泛。高层钢结构的焊接节点由于局部的应力集中效应和焊接缺陷,在交变荷载作用下,可能会在工作应力低于甚至远低于静力强度的工况下发生疲劳损伤乃至破坏,对结构的正常工作和安全性能产生严重的威胁。目前缺乏可靠的焊接节点累计疲劳效应计算和寿命评估方法,使得高层钢结构节点抵抗风力和强震作用产生的累计疲劳损伤的能力不足。因此必须重视高层钢结构焊接节点
细菌性食品污染不仅会导致食物资源浪费,而且会造成严重的公共卫生安全隐患,针对细菌性食品污染的防控问题亟待解决。群体感应(Quorum Sensing,QS)系统及其信号分子的揭示可为
市政污泥产生量逐年递增,污泥出路面临困境。厌氧消化产甲烷可实现污泥减量化、稳定化和资源化。但污泥厌氧消化效率普遍不高使得其工业化运用受到阻碍。低温热水解污泥可提
目的:探究Lnc RNA RP11-46C24.7在脑胶质瘤和脑胶质瘤干细胞中的功能。方法:1.采用无血清富集脑胶质瘤干细胞。2.查阅相关文献,运用q RT-PCR的方法在脑胶质瘤和脑胶质瘤干细胞中筛选出具有表达差异的lnc RNAs,并从中选出表达差异比较明显的lnc RNA RP11-46C24.7。以lnc RNA RP11-46C24.7为研究对象,探究其在脑胶质瘤和脑胶质瘤干细胞中的功能
目的通过观察益气养阴祛瘀方对原发性干燥综合征患者血清TLR9、IFN-α、BAFF蛋白表达的治疗前后的改变,探讨益气养阴祛瘀方对原发性干燥综合征患者血清TLR-IFN-BAFF信号通路
Heck反应启动的的串联反应具有便捷高效的特点,其研究一直是有机合成研究的热点。常规的由Heck串联反应的研究都集中在烯烃和炔烃,而基于吲哚2,3位的Heck串联反应还不是很多
随着数字化时代的兴起,互联网行业成为国家经济结构里不可分割的一环,国家政策和市场导向都推动着互联网行业的飞速发展,互联网行业的持续革新带来的不单是生活习惯上的变革,也让互联网行业的相关研究成为了学者持续聚焦的领域。当前我国互联网行业人口红利逐步降低,市场环境竞争压力不断增加,科学的财务战略能够让公司在竞争压力与日俱增的市场环境下良性发展。财务战略的制定不仅要与公司总体战略目标方向一致,也要结合公司
学位