【摘 要】
:
随着基因工程的完成和后基因组时代的到来,生命研究的方向越来越多地转向功能蛋白质组学等新领域。其中,蛋白质翻译后修饰(PTMs)参与细胞内的信号转导、增殖、发育和分化等大部分生理活动,在各种生物进程中具有重要的意义。各种生物芯片以及高通量测序技术的发展,各种组学数据如基因组,转录组,蛋白质组及代谢组学数据源源不断地涌现。传统实验方法已经不能满足现代研究需求,以计算机为工具,利用数学以及生物学各种工具
论文部分内容阅读
随着基因工程的完成和后基因组时代的到来,生命研究的方向越来越多地转向功能蛋白质组学等新领域。其中,蛋白质翻译后修饰(PTMs)参与细胞内的信号转导、增殖、发育和分化等大部分生理活动,在各种生物进程中具有重要的意义。各种生物芯片以及高通量测序技术的发展,各种组学数据如基因组,转录组,蛋白质组及代谢组学数据源源不断地涌现。传统实验方法已经不能满足现代研究需求,以计算机为工具,利用数学以及生物学各种工具的机器学习方法,可以解决传统的实验方法昂贵且费时的缺点,在该研究领域地位日益凸显。本文运用机器学习方法,对蛋白质翻译后修饰位点预测进行研究,内容如下:1.提出蛋白质巴豆酰化位点预测模型LightGBM-Cro Site。首先,采用BE、PWAA、EBGW、KNN、Pse PSSM五种方法从氨基酸残基的序列信息、物理化学信息、进化信息多个方面对蛋白质进行特征提取,融合后运用elastic net筛选出最优特征子空间。然后,为了避免样本不平衡对预测结果的干扰,使用SMOTE算法对数据进行处理。最后,使用LightGBM对巴豆酰化位点和非巴豆酰化位点的分类。通过对模型进行性能评估,得到ACC值、MCC值和AUC值分别为98.99%、0.9798和0.9996。结果表明,本文提出的方法优于其它预测方法,可以更好地应用于巴豆酰化位点的预测。2.提出蛋白质丙二酰化位点预测模型Stack-Mal Site。首先采用AAC、BLOSUM62、BPB、EBGW、KNN、MMI、Pse AAC、PSPM和PWAA从氨基酸残基的序列信息、物理化学信息、进化信息多个方面对蛋白质进行特征提取,融合后运用Group lasso筛选出最优特征子空间。最后,使用DNN、CNN、RF和LightGBM为Stacking集成分类器的基分类器,SVM为元分类器对丙二酰化位点进行分类。运用10折交叉验证得到Stack-Mal Site在训练集的ACC值、MCC值和AUC值分别为98.96%、0.7117和0.9921,独立测试集上ACC值、MCC值分别为95.15%、0.7029。和其它预测方法进行比较,结果表明,本文提出的方法优于其它预测方法,可以更好地应用于丙二酰化位点的预测。
其他文献
先秦儒家美学并非一个整体,而应细分为儒家正宗和别宗两种美学思想,并加以分别看待。儒家正宗美学以孔子、孟子、荀子为代表,主张以礼导欲、礼乐同盛、由善致美。他们充分肯定人性中的自然情欲,始终面向生存发展,运用道德理性的智慧,构造、调节礼乐制度,引导个人情欲在群体间和谐、自由地满足,从而达成仁民爱物的道德情欲,并无限趋近万物共在共生的天命/存在。他们把礼乐视为一种呵护众生的伦理秩序,使爱民压倒尊君,建构
在经典微分博弈模型中,通常假设在博弈初始阶段局中人就已知关于博弈整个时间区间上的信息,但是在现实生活中往往无法知道整个时间区间上的信息.因此引入连续更新的概念,不仅能完善现有动态及微分博弈的框架,而且更符合实际生活中的设定.在具有连续更新的微分博弈中,假设在每个瞬时时刻局中人仅知道固定时间长度上的信息,而不需要了解整个时间区间上的信息.事实上,生活中充满不确定因素,可将未知参数描述为随机变量,贝叶
在孤立子理论这门学科中,可积系统是主要的研究课题之一.由于非线性偏微分方程及其精确解在描述自然现象中的作用,可积族的构造及其精确解的研究也一直是学者们关注的研究热点.本文在Hirota双线性方程及其扩展方程的基础上,主要对四个(3+1)维非线性偏微分方程的lump类解进行了研究.全文结构如下:第一章,简述孤立子理论的起源发展、相关理论基础和本文的研究成果简介.第二章,基于Hirota双线性方程,应
近年来,一些关于在Heisenberg群上与Riesz型算子及其交换子的有界性问题成为调和分析研究中的一个课题。令Hn为Heisenberg群,Q=2n+2为其齐性维数。本文旨在研究Heisenberg群上Riesz型算子Tα=Vα(-ΔHn+V)-α及交换子[b,Tα]的Hardy型估计,其中0<α
高能量、高密度和高稳定性是含能材料研究追求的永恒目标。兼具长氮链和稠环结构的长氮链稠环化合物同时具备优秀的含能性能和高稳定性,有望成为含能材料的新突破口。当前的长氮链稠环化合物研究主要集中在N5链系列合成方面,对其它系列的研究尚处于起步阶段。本文以四唑并[5,1-c][1,2,4]三嗪(N4链)、四唑并[1,5-b][1,2,4]三嗪(N5链)、四唑并[1,5-c][1,2,3]三嗪(N6链)和3
MWP967KV型地基微波辐射计,是我国西安电子工程研究所自主研制的一款多通道地基微波辐射计,可以连续不间断的接收大气中的分子、气溶胶、冰晶等物质发射的微波信号,输出的一级数据即为"亮温度"(Level-1),单位为开尔文,代表辐射计在指定频率处接收到的电磁波强度。该辐射计通常输出22个通道亮温,其中第1-8通道位于20~30GHz(K波段)之间,参考频率分别为22.235、22.500、23.0
本文采用基于泰勒级数展开和加权移动最小二乘拟合的无网格方法-广义有限差分方法来求解椭圆界面问题和弹性界面问题。广义有限差分方法将原始的椭圆界面问题转化为两个耦合的椭圆非界面子问题,这些子问题可以产生大型稀疏矩阵,通过使用通用稀疏矩阵求解器求解耦合的椭圆子问题,找到界面问题的解,从而显著提高求解界面问题的效率,特别是对于具有复杂几何界面的界面问题。此外,基于广义有限差分方法的关键思想,即可以通过附近
地基微波辐射计观测已经用于数值预报中,并对预报效果产生不同的影响。目前,中国约有上百台地基微波辐射计,但是观测数据用到数值预报系统的很有限。本文尝试将两台地基微波辐射计数据同化到WRF数值预报模式,并针对北京一次暴雨过程,进行同化试验,结合地面雨量计测量结果进行比对。试验结果比较表明:同化地基微波辐射计能较明显影响降水初期的降水强度和分布,与雨量计分布更为接近;随着暴雨系统发展,同化两台地基微波辐
一、新时代劳动教育的内涵与育人价值不同的历史时期,劳动教育承载着不同的时代使命。马克思曾言“未来教育对所有已满一定年龄的儿童来说,就是生产劳动与智育和体育相结合,它不仅是提高社会生产的一种方式,而且是造就全面发展的人的唯一方法”。在新时代背景下,为了构建更高水平的人才培养体系,培养德智体美劳全面发展的社会主义建设者和接班人,对劳动教育的内涵提出了新的要求,也进一步强调了劳动教育对落实立德树人
利用武汉观象台2010年6—7月及2013年6月的加密探空资料,采用两种不同的方法与同期同址的MP-3000A型地基微波辐射计资料进行对比分析,讨论了地基微波辐射计探测精度的日变化特征。对比结果显示,无降水时,微波辐射计探测的温度及相对湿度在14:00的系统误差较08:00及20:00明显偏大,这可能与探空仪在上升过程中接收太阳辐射导致温度升高、相对湿度减小有关。温度及水汽密度在08:00的均方根