基于岭回归和SVM的高维特征选择与肽QSAR建模

来源 :物理化学学报 | 被引量 : 0次 | 上传用户:smoking11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
岭回归估计权重绝对值在一定程度上体现了对应特征作用大小,据此发展了基于岭回归(RR)和支持向量机(SVM)的高维特征选择算法.对苦味二肽(BTT)和细胞毒性T淋巴细胞(CTL)表位9肽两个肽体系,以氨基酸的531个物理化学性质参数直接表征肽结构,各获得1062、4779个初始特征;对训练集,初始特征以岭回归排序后序贯引入,当SVM留一法交叉测试(LOOCV)的均方误差(MSE)显著上扬时终止,最后以多轮末尾淘汰进一步精筛,分别获得7、18个物理化学意义明确的保留特征.基于保留特征与支持向量回归(SVR),对训练集建立定量构效关系(QSAR)模型,预测独立测试集,其拟合精度、留一法交叉测试精度、独立预测精度均优于现有文献报道结果.新方法运行速度快,选取的特征物理化学意义明确,解释性强,在肽、蛋白质定量构效关系建模等高维数据回归预测领域有较广泛应用前景.
其他文献
弗劳恩霍夫模式是德国弗劳恩霍夫应用研究促进协会在政府资助下,以企业形式运作,官产擘研相结合,公益性地进行应用科学研究的一种独特运营方式.该模式将应用科学和基础
会议
本文对于应用回归分析课程的内容和题型,对其难度系数进行了综合打分;通过对难度系数的剖析,说明了应用回归分析课程中哪些内容宜用多媒体进行教学,哪些内容宜用黑板板书进行
土壤培肥是维持旱地农业土壤肥力水平、提高生产力的最主要的措施之一,但不同土壤培肥措施对全膜双垄沟播土壤肥力及玉米肥水调控的作用机制及其增产效应尚缺乏系统研究认知.
近年来,企业社会责任成为决定企业生存的重要因素,影响着经济社会的发展。本文从国外、国内角度入手,对企业社会责任相关文献进行系统梳理,在对比分析已有研究成果的基础上提出个
随着节能产业的发展,建筑外墙外保温体系的种类越来越多,工程上裂纹、脱落等质量问题不断出现,因此对耐候性指标要求越来越高。为适应检测市场的需要,文章就一种新型的建筑外
正如世界上未有两片相同的树叶一样,文化背景完全相同的两个国家是不存在的。也正是由于每个国家均有着自己与众不同的文化,因而才构成了丰富多彩的世界,所以才会有那么值得
目前,在各高等学校中青年教师的队伍在不断壮大,已经成为课堂教学的中流砥柱。本文从青年教师在教学中与学生的互动入手,阐述了青年教师在培养创新型人才中的重要性。
<正>由于现有的保温材料品种繁多,加之各种外墙外保温系统施工工艺不同,使得现有的外墙外保温工程材料及施工质量参差不齐,有的保温层一两年
随着社会经济的发展以及人们生活水平的提升,加强电网建设,保证电网建设和电力供应稳定,已经成为人们对于电力发展的基本要求。在电网建设中,判定电网运行稳定的标准除了电力供应
分别在酸性和碱性溶液中,结合旋转圆盘电极技术和电化学石英晶体微天平技术原位考察了钯铁合金催化剂对氧还原反应催化活性的稳定性.发现在酸性溶液中,钯铁合金催化剂对氧还