基于集成学习的化合物肝毒性分类预测系统的设计与实现

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:sysylh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在药物的研发过程中,通常要考虑药物的吸收、分布、代谢、排泄和毒性五个特征,其中毒性主要包括致癌性、致畸性、致突变性和肝毒性等重要特性。肝脏作为人体的重要器官,对有害物质特别敏感,在新陈代谢中起着关键作用。同时,药物诱导的肝损伤则是药物研发失败和被市场撤回的主要原因之一。因此,对化合物肝毒性的研究有着十分深刻的意义。研究肝毒性的传统方法包括体内和体外方法,但这些方法通常伴随着过程复杂、耗时长、成本高昂并且成功率低的缺点。随着传统方法弊端愈发显著和计算机技术的飞速发展,越来越多的毒理学研究者开始利用计算机模拟方法对肝毒性进行评估。通过计算机对肝毒性进行评估,即在一定量的数据集的基础上利用机器学习的方法对化合物的分子结构进行建模评估,具有快速、经济和易于实现的特点,被认为是肝毒性筛查的重要替代技术。本系统建模过程主要依托R语言进行计算,以从各文献和各药物组织搜集的大量化合物及其肝毒性作为数据支撑,将支持向量机(SVM)、随机森林(RF)和极限梯度提升(XGB)三种机器学习算法为基算法,对化合物的12种分子指纹分别建模共形成36个基模型,而后通过对这36个模型进行混合集成选出表现最佳的模型。最后得到的表现最好的模型的五折交叉验证结果的准确率为71.1±2.6%,AUC值为76.4±2.6%,在外部测试集中准确率为84.3%,AUC值为90.4%,达到肝毒性测试领域很高的水平。本系统的搭建在Linux操作系统下进行,前端由Html+Css+JavaScript建立,后台使用Apache+PHP+MYSQL环境,利用集成的最佳模型对输入化合物的肝毒性进行预测,并实现了注册登录模块、数据准备模块、分类预测模块、结果分析模块和系统管理模块。不仅能将分析结果清晰地展示在系统中,并能为用户包括提供结果查询、结果下载和用户管理等功能,极大地方便了肝毒性研究者。无论在功能方面还是在性能方面均达到预期的水平。
其他文献
第四届城市与景观"U+L新思维"全国学术研讨会于2010年11月19—21日在华中科技大学隆重召开。本次会议由华中科技大学主办,湖北大都地产集团有限公司和《新建筑》杂志社协办。会
近年来我国篮球运动的成绩起落不定,出现这种现象的原因固然是多方面的,但就目前我国单一的“举国培养体制”不能不引起我们的深思.后备人才培养是竞技体育的战略问题,也是一个系
土壤缺钾已成为影响作物产量和品质,限制我国农业可持续发展的重要因素之一,亟待深入开展如何提高土壤钾素生物有效性的相关研究。本文收集整理了近年来研究者比较感兴趣的生
纵观世界经济史,投机泡沫破灭事件频繁发生,近100年来国际发生了多起投机性泡沫破灭的事件,对经济产生了巨大影响。近年来我国经历了多次股灾,股票价格泡沫对我国实体经济发展和金融系统稳定产生了相当大的冲击,因此围绕股票价格泡沫防范系统性金融风险的研究成为当前的理论热点问题,研究股票价格泡沫的成因、度量方法和经济效应具有重要的现实意义。首先,分析了泡沫的特征及形成泡沫的影响因素,进而对泡沫进行识别和测度
笔者通过举例分析了英美法系法庭审问的语类结构潜势及其语体特征,结果表明,英美法系法庭审问有其特定的语类结构,即CR-OS-DE-CE-CS-JSI-J,且法庭审问各阶段在语音、词汇、句法、
目的:观察线粒体钙单向转运体在心肌低氧/复氧损伤中的作用并探讨其机制。方法:应用Langendorff大鼠心脏灌流模型,低氧/复氧(H/R)采用冠脉前降支结扎30min、复灌120min的方法。用生物
构图是造型艺要的要素之一,也是绘画形式美的具体体现。无论是西方绘画还是中国绘画,不同的构图形式均可增强画面的艺术表现力。画面绘画创作中的构图方法颇多,格状构图即是被广
本文介绍了DirectShow的体系结构,用C++类对其基本接口进行了封装,并结合实例讨论了多媒体文件播放的实现细节。
采用变密度纤维集合体力学和传导性原位综合测量系统,测试低密度山羊绒纤维集合体在压缩及回复过程中的受力情况,通过计算特征值对集合体的压缩性能进行表征。结果表明:低密度
<正>农村经营机制,是指一种能规范和推动农村生产经营,使农村经济持续快速健康发展的内在机理。它包括农村生产机制、投入机制、流通机制、经营组织机制、经营管理机制等方面
会议