【摘 要】
:
随着机器学习的不断发展,多任务学习成为关注的热点问题之一。在一些应用中,多个任务之间往往存在着相关性。多任务学习可以通过任务之间的相关性来挖掘信息,建立更具鲁棒性的模型。任务的相关特征使得多个任务的模型共享一个低秩结构。每个任务会具有独特特征,这些特征构成的是稀疏结构。因此基于稀疏低秩的多任务学习在实际中得到了很多的应用。本文主要研究稀疏低秩多任务学习方法,用于预测药物靶标和配体分子结合的活性值。
论文部分内容阅读
随着机器学习的不断发展,多任务学习成为关注的热点问题之一。在一些应用中,多个任务之间往往存在着相关性。多任务学习可以通过任务之间的相关性来挖掘信息,建立更具鲁棒性的模型。任务的相关特征使得多个任务的模型共享一个低秩结构。每个任务会具有独特特征,这些特征构成的是稀疏结构。因此基于稀疏低秩的多任务学习在实际中得到了很多的应用。本文主要研究稀疏低秩多任务学习方法,用于预测药物靶标和配体分子结合的活性值。方法的具体步骤为:首先,获取数据集;然后,处理数据集,利用Pub Chem分子指纹的方法提取特征;接着构建稀疏低秩多任务学习模型;最后进行回归预测和评价模型的性能。此外还通过改变训练样本的数量来模拟信息不充分的小样本学习。稀疏低秩多任务学习的方法在利用了多个相关任务的共同性之外,还考虑了每个任务的独特性。应用在小样本上,能够克服样本信息不充分无法构建鲁棒的模型的缺点。最后进行了特征筛选。根据权重值的大小重新对特征进行排序,利用筛选出的相关特征构建新的回归模型。这样的做法可以减少模型的难度和复杂度。本文在46个数据集上进行了回归预测和特征筛选的实验,通过两个常用的评价指标来衡量回归预测的结果。实验选取了常见的单任务学习方法和其他多任务学习方法作为对比。在9个数据集上进行了改变训练样本数量的实验。最终的实验结果表明,回归预测模型的r~2比单任务学习平均提升30%,比深度多任务学习平均提升50%,比其他多任务学习平均提升10%。特征筛选的模型在三分之二数据上取得了最佳性能。
其他文献
在清末的中国,随着传统天下体系的解构,近代社会思潮与传统学术之间发生了激烈的冲突与融合。在此期间,为了实现废除不平等条约的目的,中国的法律近代化进程不断加速,与此同时,对国家前途命运的思考也使得中国知识分子开始关注为谁立法、由谁立法、立怎样的法的问题。章炳麟作为支持革命的政治家,其思想兼具传统性与近代性,在东西方文化的碰撞下具有极强的特色,对其立法观的解读有助于我们更好地认识中国法理学的起点与本质
随着4K、5G等技术的实现与应用,纪录片的创作也正发生着诸多变化。从前几年的《航拍中国》《创新中国》《AI脑力觉醒》开始,中国的纪录片在内容、创作手法等方面都有了较为新颖的突破。其中有关历史内容的纪录片通常是以一种叫做历史文献片的形式存在。在传播历史、记录历史、还原历史的基础上,历史文献纪录片更是成为了一种全新的历史文献公布新途径。i本文主要从以下几个方面探讨动态地图制作作为毕业作品历史文献纪录片
大数据时代,数字信息资源已成为社会信息资源的主流。然而,由于数字资源本身的脆弱性,人们在不断创造数字资源的同时,也有越来越多的数字资源由于没有得到有效保存而丧失价值。因此,如何有效地长期保存数字资源成为保存机构面临的一大难题。数字资源的长期保存是一个充满风险的过程,对数字资源进行有效长期保存,就是要保证数字资源在长期保存过程中持续可用。即,保证数字资源在长期保存过程中的可用性、可识别性、持续完整性
目前,结构的连续倒塌已成为严重威胁公共安全的重要问题,因而日益受到关注。国外已经对连续倒塌问题进行了三十余年的研究,提出了一些结构抗连续倒塌设计分析方法。自9·11事
琼东南盆地陵水凹陷油气资源丰富,勘探潜力巨大,近年发现了LS17-2气田及一批气藏,但也伴随着部分周缘构造连续失利,这表明,研究区的天然气成藏规律及主控因素仍待深入分析。
2021年7月1日,举世瞩目的庆祝中国共产党成立100周年大会在北京天安门广场隆重举行。习近平总书记发表重要讲话,强调"一百年来,中国共产党团结带领中国人民进行的一切奋斗、
高等职业教育是高等教育的重要构成,肩负着高技能、应用型人才的培养,具有不可替代的作用。在新的历史时期,高职教育规模不断扩大,经历着跨越式的发展,人才培养更加侧重实用
近年来,随着我国经济的不断发展和人们饮食结构的改变,现代化畜禽养殖场的数量也随之不断增多。这些养殖场的主要养殖模式是集约化和工厂化。养殖过程中抗生素的使用频率和总
近年来针对大尺寸零件的高精度测量需求日益增多,特别在航空航天、汽车制造等领域,对测量精度与效率提出了更高的要求。三维光学扫描系统在复杂曲面测量中拥有出色的性能,使用视觉跟踪系统对三维光学扫描测头进行跟踪,可以进一步提高其测量精度。为保证多相机视觉跟踪系统的性能,需要合理规划相机布局,并提高相机标定精度等。为此,本文视觉跟踪系统的相机布局进行了优化,并针对基于五点一维标定杆的多相机标定算法进行了研究
以L-薄荷醇为拆分试剂通过一锅法制备含有膦手性有机膦硼烷化合物,重结晶分离出两种构型产物,发现它们在核磁图谱上有显著差异。利用所得到的单一构型产物在甲基锂作用下转化