论文部分内容阅读
化合物的毒性和致突变性是制药行业新药数量下降的主要原因之一。目前对于此类问题研究人员采用了多种方法来评估该风险,包括体内、体外和计算机模拟等方法。研究发现,定量结构-活性关系(QSAR)等计算方法在药物发现早期阶段的安全筛查中,具有出结果快、不需要药物实验的优点。然而大多数已发表的人类药物性肝损伤(DILI)和化合物致突变模型的预测性能并不令人满意,准确度还有待提高。此外,人类DILI和细菌反向突变试验(Ames试验)等有限的可靠数据也是计算建模的一个巨大障碍。本文主要从化合物的毒性和致突变性两个方面开展相关研究:1、提出一种基于集成分类器方法的药物性肝损伤预测。新药的开发受到多重因素的限制,即使很多药物能够到临床试验这一步,依然会因为药物性肝损伤等因素造成药物研发失败。美国食品和药物管理局的国家毒理学研究中心(NCTR)建立了关于药物性肝损伤(DILI)的数据集,并根据该数据集建立一个良好的预测模型,为以后的药物开发提供参考。但是该模型是依据单一分类器模型进行预测的,预测的准确率很低。本文根据NCTR公开发表的数据集进行基于多基集成分类器的方法进行建模,从12个指纹图谱筛选出8个对于药物性肝损伤预测相关性比较高得指纹,从公开发表的文献中找出7个分子描述符,并测试出指纹图谱与分子描述符对模型贡献的最佳比例。从9个基分类器中寻找出最优秀的5个分类器,并利用投票(Voting)集成的方法对这5个基分类器进行建模,并在预测药物性肝损伤方面取得良好的效果。2、基于集成分类器方法的化合物致突变预测研究。本文利用公开发表的Ames致突变性基准数据集进行建模并预测相关化合物是否会导致突变,从而开展化合物致突变性研究。首先本文依据公开发表的数据集借鉴药物性肝损伤预测的相关工作经验,从12个指纹图谱中选择5个对模型贡献度比较大的指纹图谱。从9个基分类器中选择最性能最好的5个基分类器,并基于经典的集成方法Stacking进行集成建模,并取得好的预测结果。此研究可以更好的为药物研究的开发提供参考,大大降低了传统药物研发所带来的巨大人力物力财力的浪费,为新药的开发提供保障。