改进深度神经网络预测有机分子原子化能研究

来源 :淮阴工学院 | 被引量 : 0次 | 上传用户:zhaokfq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在化合物空间(CCS)中分子性质的准确预测是化学和制药工业中进行合理化合物设计的关键因素,使用实验和理论自动筛选CCS不仅成为发现新体系的有力工具,而且也为目标应用的化学物质和材料的合理设计提供了有力工具。原子化能是化合物最基本的性质之一,一些化合物的原子化能可以通过实验测定,但对测量上有困难或尚未合成的化合物,就有必要对其进行估算或预测。化合物的原子化能与分子结构密切相关,因而可以通过理论分析和实验规律建立的模型预测方法来实现对原子化能的计算和预测,引入机器学习算法,只根据分子中原子笛卡尔坐标和核电荷组成的库伦矩阵预测分子原子化能。但随着数据集中分子数量的增多,得到的预测均方根误差(RMSE)也不断地增加,本文将结合深度神经网络和库伦矩阵特征值分子描述符,设计出一套系统的原子化能预测方法,并将对Bootstrap自助算法进行相应的改进,消除自助法无法获取样本外特征和利用率不足的缺陷,将改进后的算法重新应用在深度神经网络模型中,进一步提升模型预测整体性能,改进思路如下:(1)针对因分子数量增加而导致随机采样特征无法代表全部特征和无法获得在非连续样本观测点处的分布特征问题,本文将改进的Bootstrap自助采样法加入到深度神经网络中,对于数据集D,首先计算数据集D的邻域,中包含了原数据集D和D中样本邻域的集合,然后对进行自助法采样,随机采样出训练样本,此时训练样本中不仅包含了原数据集D中的样本,而且包含了非原数据集之外的样本特征,改进后的自助法可以将原非连续的分子样本数据集拓展为连续性的分子样本数据集,保证数据连续性的同时也将分子采样拓展到原分子样本之外的特征。(2)针对分子样本数据集利用率不足问题,将对传统自助法的采样方式进行改进,对于含有M个样本的数据集D,从每次有放回地取出一个样本改变为M个分子样本,在下一次取样中这M个分子样本被取出的概率仍与之前相同,重复随机取样N次,得到的训练数据集中包含了M*N分子样本,提高分子样本利用率的同时增加分子训练样本的数量。(3)优化深度神经网络模型结构,使用反向传播算法(backward propagation)优化神经网络,将学习率设置为动态下降形式,指定训练迭代次数,对特定迭代次数内损失值未下降的训练模型降低学习率,通过BP算法优化后的神经网络很有可能会出现过拟合,本文通过早停和正则化策略进行缓解模型的过拟合,使用主成分分析(PCA)进行样本特征降维,使用十折交叉验证的方式验证模型。最后,使用采集PubChem数据库有机小分子数据作为实验数据,使用DNN-Atom模型进行原子化能的预测,结果证明提出的DNN-Atom模型降低了原子化能预测均方根误差,相比于DNN、XGBoost和SVM经典算法,DNN-Atom模型的RMSE更低,预测结果更精确,对抽取样本进行分析的结果表明,抽取出的样本可以明显地代表全部样本的特征,证明了提出的DNN-Atom模型在原子化能预测方面的可行性。
其他文献
厨余污水含油量高、成分复杂、来源分散,是一种较难集中处理的废水。国家政策和各地实施办法要求对厨余污水进行就地脱水减量处理、无害化处理,涉及到的油水分离已经成为当今亟需解决的热点问题之一。厨余含油污水的研究都集中在如何利用大型专业机械分离出来的油相上,利用的方式主要是将分离后的油制成燃料,基本没有关注家庭型、分散性厨余含油污水。材料科学领域对于油水分离中的关键技术——膜材料的制备进行了大量研究,但研
学位
在数学集中教育活动中,为达成活动目标,幼儿教师常利用自身的言语,通过创设情境、解释说明、提问追问等方式引导幼儿进行思考与探索,言语是教师与幼儿沟通的重要载体,在教学活动中,教师言语是引导幼儿思考与探索、实现科学教学目标的重要载体和工具,也是教师教学行为的重要组成部分。教师在数学教学活动中的言语行为直接影响着数学教学效果,对幼儿数学探究欲望与能力的培养发挥着不可替代的作用。但是在一线幼儿教师的数学教
学位
学位
学位
书读百遍,其义自见。阅读使人明智,学生只有通过阅读各种内蕴丰富的读物,才能汲取生命成长所需要的营养。阅读课是当前语文教学中必不可少的重要组成部分,如果没有阅读课程的辅助,不管语文课内的效率有多高,都不会收到明显的成效。而初中语文阅读教学不仅能帮助学生面对中考的“硬指标”,更能够帮助学生在学习语文的同时完成情感、表达、美育等多方位的教育,能够使教师更好地完成教书育人的神圣使命。近些年来,随着新课标对
学位
《语文课程标准(2022年版)》对如何提高综合素质和实践能力提出了更高的要求,因此,在开展语文综合性学习时,必须选用优质的资源。根据各类区域、各类学校以及各类学生的相关需要,积极开发符合课程目标的课程资源。在语文课程教学创新里,综合性学习与课程资源的发展息息相关,将地域文化资源融入到语文综合性学习中,就是在丰富语文综合性学习的课程资源。将地域文化资源与语文综合性学习加以融合,既能激发学生的学习兴趣
学位
小学低年级是学生接触汉字的关键时期,《语文新课程标准》明确指出“识字教学”是一、二年级的学习重点,在整个语文教学中非常重要。在现有研究中,众多学者或教育工作者对低年级的识字教学进行了充分研究,但针对城乡结合部区域小学低年级识字教学研究较为少见。我国城乡结合部小学较多,识字教学中存在着教师难教、学生难学、家长难管等问题。本文从学生学情、教师教情和家长互动等入手,以N小学历史传承、教学理念等出发,结合
学位
学位
高中语文教学中,作文是其中的重要内容和组成部分,学生语文综合能力评价的一个重要方面就是学生写作水平的高低。当前课程改革持续深入的背景下,作文教学的思维理念和方法模式也得到了改进与发展,力求同课程改革的步伐相契合、相适应。但日常教育教学中,受传统应试思维和应试压力的影响,作文教学改革的力度还不大、成效还不够明显,高中作文教学一定程度上处于进退两难的状况。基于此,本研究将研究对象充分聚焦到高中生作文写
学位
混合痔手术因其手术部位的特殊性,在手术之后常采用开放处理,创面被污染的风险高,创面肉芽组织生长不良、水肿、伤口愈合缓慢等都是肛肠外科医师治疗患者时出现的常见问题。近些年关于创面修复的相关机制认识不断深入,特别是新型材料及技术的应用,提供了更多的临床选择。中医药治疗创面具有疗效确切、安全性高、价格低廉等优势,临床应用十分广泛。本文就近些年痔术后创面修复的中西医诊疗进展进行综述。
期刊