基于集成学习的分子吸收能含时密度泛函计算校正模型研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:supersonic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能是以研究计算机算法模拟人类智能的理论和方法,以及开发用来模拟人类智能的技术和现实系统为主要目的的前沿学科,涉及领域广泛。机器学习作为人工智能的重要分支,从最初的符号学习演变到现在的统计机器学习,从纯理论到现实问题研究,至今已经应用在很多科研和工业领域。分子的吸收能是指分子因吸收光子而发生跃迁时所吸收的能量,反映了分子的电子性质以及内在的结构信息,是重要的激发态光学性质之一。利用对物质分子所产生的吸收能以及吸收强度的了解,可以分析、测定和推断物质的组成和结构等性质,对于太阳能电池光伏材料研究和设计等有重要参考价值。因而如何测量或准确而高效的预测分子的吸收能,尤其是较大分子的激发态性质,十分值得探究。近几十年来,量子化学计算在研究化学各领域问题上已有显著成效。近年来,量子化学计算与机器学习的结合,在提高量子化学计算方法的计算精度和计算效率上,得到了巨大进展。计算分子吸收能最常用量子化学方法之一是含时密度泛函理论(TDDFT),因为其效率高,并且可应用多种分子体系的特点,成为计算分子激发态的上佳选择,但是其计算精度和可应用分子的尺度还有很大的提升空间。本文使用集成学习方法对TDDFT计算的分子吸收能进行了校正建模。本文研究对象是433个有机分子,包括276个芳胺类染料分子。首先使用量子化学(TD)DFT中的B3LYP,分别在三个不同基组STO-3G,6-31G(d),6-311G(d,p)下对分子进行基态的结构与激发态光谱的计算,以获取三个数据集;然后使用SPXY,Kennard-Stone两种方法划分数据;再分别使用Pearson,顺序前向筛选(SFS)和LASSO方法进行特征选择;之后使用单一算法支持向量机(SVM),极限学习机(ELM),广义回归神经网络(GRNN)以及集成学习方法梯度提升决策树(GBDT)和随机森林(RF)进行校正,从中选择预测高精度分子吸收能的稳定、有效模型,从而提高TDDFT的计算精度。通过一系列对比实验,研究预测分子吸收能在使用机器学习方法中的最佳校正模型,即在STO-3G基组下,使用集成算法随机森林RF对量子化学方法(TD)B3LYP的分子吸收能计算结果进行校正,所得效果最佳。该模型把(TD)DFT得到的均方根误差RMSE的0.97eV降低成0.14eV,平均绝对误差MAE从0.71eV校正到0.11eV,且用时最少。RF模型预测其它两个基组的误差也有明显的减小,且所得结果均超过单一机器学习方法,可以看出集成学习算法在本实验中表现优异。由此可见,集成学习与量子化学方法的结合,能够更有效的提高校正模型的预测效果。
其他文献
重视学习、善于学习是中国共产党的优良传统,十八大以来,面对新形势新任务,中国共产党不断加强党员队伍建设,从重视理论学习着手。习近平多次强调补足精神之“钙”,不断丰富发展理论学习的内涵要求,加强党的思想理论建设。中国共产党坚持理论和实践相结合原则,循序渐进开展党内理论教育活动,教育对象从少数到多数逐步拓展,将理论学习工作步步推进,层层深入。本文以一个城市基层社区“四方堰社区”作为个案观察的样本,通过
中国女性长久以来以其含蓄内敛的魅力傲立于世界女性群像之中,但是对于中国内地电影女性的表达却始终游离在主动与被动之间。“女性身体”作为女性表达的重要途径被中国内地新时期导演们拾起后应用在电影文本直观的叙事当中。从身体角度出发,电影文本分析入手,总结女性身体叙事对电影文本的突出作用,可以摸索出特定时代下女性、社会、女性主义之间的联系。本研究以女性身体为主要研究对象进行了四个部分的分析:(1)概念明晰及
随着科技的进步,尤其是近几年来大数据和人工智能的快速发展,农业领域随之产生了海量的数据资源,人们不再满足于当前简单、表面的数据分析,更多的是希望能从海量农业数据中获取对人类经济、市场、乃至更多领域有价值的信息。但由于有关部门对各种农产品需求量没有科学有效的统计方法,这就导致在农产品市场调控和库存建设等方面带来巨大困难。从而可以看出,采用有效合理的方法对农产品需求量建立精确的需求分析模型并加以预测,
本文研究了主弱内射和主弱平坦性质推广的问题.利用张量积相等的等式组,以及同调分类方法,获得了对一些新的幺半群的特征,推广了关于正则幺半群刻画的主要的结果.
药品质量的好坏直接关系到人们的生命安全,随着近些年一些重大药品事故的发生,药品质量问题得到整个社会越来越多的关注,药品质量检验检测机构也面临着前所未有的挑战。另一方面,随着越来越多的国外大型检测认证机构进军国内市场,这些检测机构有着先进的管理理念、高端的检测设备、高水平的技术团队,使得国内的检测市场竞争日益激烈。为了提高自身的竞争力,国内的检测机构迫切需要加强实验室质量管理,提升检测技术水平,提升
本学位论文首先运用矩阵分析的方法研究了四阶线性差分方程边值问题的谱结构.然后结合Leray-Schauder延拓定理、极小极大定理和临界点理论研究了几类非线性四阶差分方程边值
河南省地处中原大地,物产丰富、交通渠道四通八达、物流运输畅通无阻。近几年来,党中央对农业发展问题非常重视,大力实施乡村振兴发展战略,农业产业新业态不仅是推进农业现代化产业体系建设的支撑,也是实现乡村振兴战略的重要组成部分。加速推进农业产业新业态发展,提高河南省农业现代化水平,不仅能够加快河南农村经济发展的速度,增加农民收入,而且还有利于促进河南省农业经济向更有效的方向发展,加速实现河南农业产业结构
面包糕点产品因品种多样、组织松软、便于携带、食用方便等特点,成为人们休闲旅游的必备食品。面包糕点作为一种重要的食品,在我国食品市场上需求量很大。但由于受原料、加工
在新课程改革大背景下,国家对培养新人提出了更高的要求,学校教育更加注重培养全面发展的人,表现出由原来的看重学生成绩到现在的更看重学生能力培养的转变,于是提高教学质量,提供更好的教学方式和手段势所必然。思维导图作为一种直观的图示工具,具有图文并重的特点,可以把各级主题的关系用相互隶属与相关的层级图表现出来(1),能够形象地表征头脑知识并将其外显化。因此,本研究通过查阅相关文献资料和书籍,了解思维导图
为解决当今社会面临的能源短缺和环境污染问题,可充电金属-空气电池由于具有很高的理论能量密度值而成为十分有潜力的绿色能源。然而,金属-空气电池在实现大规模商业化的进程中,始终面临着充电和放电过程中固有动力学缓慢的问题,由此而引发电池在运行过程中严重的极化现象,同时库伦效率低和循环稳定性差等问题也阻碍着可充电金属-空气电池的进一步发展。解决以上问题的有效途径之一就是开发高效的双功能催化剂,来促进充放电