【摘 要】
:
亲脂性是表征化合物诸多理化和生化特性的重要指标,能够影响分子在体内的溶解、吸收、分布和转运等一系列过程。其中,正辛醇/水分配系数log/,已经逐渐成为药物、环境、生化和毒理学等领域的重要研究对象。如何快速、准确地计算出化合物的log/,从而筛选出具有适度亲脂性的化合物分子是药物与材料设计中最为关心的问题之一。我们通过机器学习的方法寻找合适的描述符,预测分子的log/,为筛选具有良好亲脂性的化合物提
论文部分内容阅读
亲脂性是表征化合物诸多理化和生化特性的重要指标,能够影响分子在体内的溶解、吸收、分布和转运等一系列过程。其中,正辛醇/水分配系数log/,已经逐渐成为药物、环境、生化和毒理学等领域的重要研究对象。如何快速、准确地计算出化合物的log/,从而筛选出具有适度亲脂性的化合物分子是药物与材料设计中最为关心的问题之一。我们通过机器学习的方法寻找合适的描述符,预测分子的log/,为筛选具有良好亲脂性的化合物提供了一个有效的方法。本文的主要研究内容如下:我们基于Martel数据库和Phys Prop数据库,使用不同的特征选择方法筛选特征描述符,建立了预测模型,寻找出其中最能影响目标特性log/的描述符。我们搭建人工神经网络模型,在一定范围内遍历不同的网络结构、激活函数和优化算法,以找到表现最好的模型参数。我们对Martel数据库1325个描述符进行特征选择,筛选出3个描述符(SLog P,Filter It Log S,ETA_eta),其在测试集上的预测结果为:R~2=0.6218,MSE=0.3782,MAE=0.4488。我们以Martel数据库200个描述符为基础进行特征选择,筛选出的7个描述符(Mol Log P,Mol MR,qed,Chi1n,Labute ASA,PEOE_VSA7,Heavy Atom Mol Wt)具有很好的预测能力,能够很好地预测Phys Prop数据库分子的log/(R~2=0.8479,MSE=0.1521,MAE=0.2849)。将Martel数据库与Phys Prop数据库合并起来,经过特征选择筛选出4个描述符:Mol Log P,PEOE_VSA6,PEOE_VSA8,qed。使用这4个特征构建的机器学习模型,预测的性能更好,在测试集上的预测结果为:R~2=0.8293,MSE=0.1707,MAE=0.2976。结果表明:表征分子连接度和表征分子大小的范德华表面积是影响log/值的重要因素。
其他文献
通过运用有限元软件,对四种异型钢产品的孔型工艺设计、辊形配置、导卫设计过程进行全过程模拟计算优化,提供设计工艺的离线模拟轧制和轧制过程工艺参数,对在轧制工艺设计过程出现的各种缺陷进行分析,降低异型钢产品试轧的成本投入,提高异型钢产品的一次试轧成功率。论文主要研究工作和结果如下:(1)利用有限元软件,为四种异型钢新产品(400MPa级J型门架槽钢、29#矿U钢、18&25#门架槽钢)的轧制工艺设计提
近年来伴随着我国经济的快速增长,越来越多的家庭拥有私家车。国内机动车保有量也呈现逐年增加趋势,致使交通拥堵的状况愈发严重,交通事故也越发频繁。面对复杂的交通路况,行动方便的人在过马路,尤其是交通十字路口的时候,也要谨慎小心,对于行动不便的康复病人来说更是一件不易之事。针对这类康复病人,本文基于Unity平台搭建了一个虚拟的城市道路交通路口模拟系统,通过该系统模拟交通路口中车流人流交通灯等,让康复病
芳香醛和芳香酸是一类重要的化工产品,也可作为中间产品合成医药、农药、染料等领域的精细化学品,需求量与日俱增。在众多合成芳香醛和芳香酸的方法中,以甲基芳香烃为原料,通过氧气或空气将其选择性氧化制备特定产物的方法有着原子经济性高、绿色环保的天然优势。相较于气相氧化的高温高压条件带来严苛的设备要求,液相氧化则因其反应的温和性更具优势,其操作温度不高,所需能耗较低因此更适合工业生产。以Co/Mn/Br为主
蛋白能否行使功能严格依赖其正确的构象和定位。真核细胞内质网中存在着精细的蛋白质量监控机制(Endoplasmic Reticulum Quality Control,ERQC)来确保新生肽链能够正确折叠,并转运至特定位点发挥功能;另一方面,内质网中同时存在着对错误折叠蛋白识别和降解的机制(Endoplasmic Reticulum associated degradation,ERAD)。因此,E
移动学习是现代教育的一种新形式,它与音乐教育的结合是近年来人们讨论的热点之一。音乐教育的基础是视唱练习,视唱是指练习者通过对乐谱的演唱练习音符的发音。传统的视唱教学依赖教师和学生一对一的方式进行,效率不高。而现有的视唱评测系统又存在平台兼容性差,无法模拟真实考试环境的问题。因此,结合移动开发与人工智能技术设计一款轻便且智能化的视唱评测系统具有重要的意义。为了给学习者提供更方便的视唱练习服务,本文提
座椅悬架起到减缓驾驶员振动、提高行驶平顺性的作用,广泛应用于商用车领域中。主动座椅悬架通过外部供能使作动器向座椅输出控制力,相比被动座椅悬架大大提升了行驶平顺性。为了解决主动座椅悬架能耗过高的问题,本文设计了一款具有能量回收功能的馈能式主动座椅悬架,完成了其动力学建模、控制器设计与仿真、样机设计与软件在环仿真,从平顺性、经济性等角度对其进行了分析。(1)建立了基于车辆四自由度模型的座椅悬架系统动力
随着高速列车速度的提高,轮轨噪声,牵引噪声等机械噪声退居其次,而气动噪声逐渐占主导地位,并造成环境污染。因此,研究高速列车气动噪声的产生机理和预测方法,进而提出有效的降噪措施,具有重要的理论研究意义和工程实际应用价值。以高速列车受电弓为研究对象,通过数值仿真,研究了其气动噪声的产生规律,并讨论了高速列车受电弓气动噪声的控制方法,完成了如下的研究工作。(1)建立了整车的三维模型,利用流体运动方程标准
Al-Zn-Mg-Cu超高强铝合金由于其具有较高的强度与较优的韧性等优点受到广泛关注,在航空及航天领域得到较大程度应用。而且,稀土元素的添加对Al-Zn-Mg-Cu系的性能提升起到了关键性的作用,可改善合金组织并提高力学性能。为了在能够获得更优异的性能同时降低生产成本,Sc和Zr的复合添加作为一种优异的解决方案被广泛应用于铝合金生产中,Sc和Zr元素联合生成纳米级的Al3(Sc,Zr)粒子对合金组