基于多特征信息融合的癌症凝集素的鉴定方法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:oceanspring
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着后基因时代的来临,越来越多的未知功能的蛋白质序列也在被迅速的被发现,预测蛋白质的功能是后基因时代的主要挑战之一。癌症凝集素是一种在肿瘤细胞分化和转移中发挥重要作用的蛋白质,准确鉴定出癌症凝集素有助于明确癌症治疗发展的方向。然而,传统的生物化学实验方法既费钱又耗时,现有的基于计算机的鉴定方法也不尽如人意。鉴定效果不够好的主要原因是输入分类模型的特征没能很好的表达出蛋白质的复杂性与序列多样性。因此,本文提出了一种将多特征信息相融合的特征表达算法来区分癌症和非癌症凝集素,主要内容如下:(1)基于多信息融合的两步特征提取算法。具体地,基于几种常用的单特征表达算法进行融合:包含序列信息的三肽组成(Tripeptide Composition,TipC)、包含序列信息和物理化学信息的联合三元组(conjointtriad)和包含功能信息的基因本体论(Gene Ontology,GO)注释。两部特征提取算法结合了序列信息与GO注释信息:首先使用将TipC和蛋白相互作用网络(PPI网络)融合的DeepGO算法得到GO注释,然后将所得GO注释转化为特征向量。实验结果表明,相对于单特征表达,该方法包含更多蛋白质信息,能更好的对凝集素进行鉴定。(2)高维度问题在单特征表达中已经出现,融合后的特征向量更是不可避免出现地会出现高维度问题。区别于以往在癌症凝集素鉴定中只出现过的特征选择算法,本文使用线性判别分析算法对特征进行降维处理,将两步特征提取得到的588维特征向量降至更适合用于分类的低维向量,并将预测准确率提高到了87.57%。(3)进一步结合蛋白质物化信息,将包含氨基酸偶极子和体积信息的联合三元组与上述两步特征提取算法相融合,得到包含序列信息、注释信息和物化信息的特征向量,再次将预测准确率提高了 1.95%。
其他文献
多丽丝·莱辛是2007年诺贝尔文学奖获得者,且被誉为继弗吉尼亚·伍尔夫之后最伟大的英国女作家,她的作品集中表达了对女性、殖民、种族、冷战和霸权等当代社会和政治问题的深切关注。太空五部曲《南船座中的老人星:档案》是莱辛从传统现实主义小说大胆转向科幻创作的成功标志。《三四五区间的联姻》是其中的第二部,主要讲述拥有不同文化背景、意识形态和思维方式的两个代表性人物,受神谕启示被迫联姻的故事。国内外对《三四
托卡马克是目前最有希望实现受控核聚变的实验装置之一,托卡马克装置的等离子体控制系统是进行深入物理实验的基础,主要对等离子体的各项参数进行实时控制,涉及到多种控制算法和多个子系统之间的协调运作,不同的子系统之间具有很多相同之处,为了提升控制系统的开发效率,增强软件的可维护性和可扩展性,JTEXT计算机团队开发了J-TEXT实时软件框架(JRTF),并且基于JRTF框架开发了第三代等离子体控制系统,开
这是一个移动互联网与人工智能飞速发展的时代。移动互联网的蓬勃发展变革了信息的生产、传播和消费方式。在供给侧,大量的信息不断产生,在需求侧,消费者对短文本偏好不断增
中共中央、中国国务院于2019年2月发布了《中国教育现代化2035》文件,表示要以现代信息技术为手段,培育符合时代的创新型人才,实现教育的规模化与学生个性化培养相结合的新型
《饥饿游戏》三部曲是苏珊·柯林斯的代表作,它一向被视为当代杰出的反乌托邦小说之一。因为其内容和题材的丰富性,许多学者从道德、性别、性质、政治问题等多方面对其进行研究。但是,很少有评论家关注三部曲的医学内容。医学内容是三部曲中的重要组成部分,对揭示小说的主题内涵具有重要的作用。书中包含了许多对人物的身体、疾病和药物的详细描述。在三部曲中,帕纳姆通过医疗手段操纵并折磨普通人民的身体,以维持它的政治地位
离心叶轮是飞机发动机关键部件之一,对其高精密数控加工技术的研究,是提高企业核心技术竞争力的重要手段。由于离心叶轮是在坯料上对轮毂和叶片进行整体加工,为了保证气流在
随着电力电子器件、高端微处理器使用量的骤增,大功率设备在工矿企业的广泛应用,使得电力使用效率提高,运行工况得到改善,但随之系统谐波的出现对电能质量带来了考验,因此在
图像是人类进行视觉信息传递和快速获取有效信息的主要方式。然而,数字图像在采集、传输和存储过程中存在不可控因素,如环境光线的变化、成像系统的缺陷,以及不可避免的人为
随着社会的巨大进步和经济的快速发展,环境与能源等问题受到广泛关注,电力电子化电力系统的概念成为未来微电网发展的主要方向。在大电网难以接入的偏远地区,新能源在整个区域微电网中所占比重较大且渗透率较高。因此,电力电子变换器与传统发电设备——同步发电机之间的协调运行成为不可忽视的问题。由于两类系统的机电惯性等因素具有较大差别,光伏逆变器的并入规模与外界扰动可能会对此类组网系统的稳定性造成较大影响,因此对
在金融科技的驱动下,智能服务行业日渐兴盛,并且通过将传统金融与互联网融为一体,以其低成本、低门槛、技术创新程度高等优势,促使大批金融机构和客户参与其中。智能服务行业,虽然发展速度快,却存在诸多难以忽视的问题亟待解决。其中,信用问题频发尤为突出,无论是对于提供还是接受服务的双方都会产生极其不利的影响。为保护双方利益、实现金融平台安全运营以及行业健康发展,建立智能服务交易主体的个人信用评估模型是有其必
学位