论文部分内容阅读
本文将数据挖掘技术引入中药及化学领域,对中药化学数据库进行了新版本的研制及数据挖掘研究,并对咪唑苯并二氮杂卓类化合物对五种重组GABA<,A>受体亚型α<,x>β<,3>γ<,2>(x=1,2,3,5,6)的亲和力进行了分子模型化的研究.主要研究内容和结果如下:进行了数据库新版本的研制,其中包括规范集、结构框架、结构信息、中药命名系统、合法性检验等方面,给出了很多数据库的检索实例,探讨了中药化学数据库的功能和用途.统计了中药化学数据库的"类药性"性质,结果表明数据库中化合物的分子量和LogP值大部分都满足的Lipinski原则.建立了中药化学数据库的数据仓库和数据集市,对源数据进行了数据清理和概念分层工作,并在此基础上进行了关联规则的挖掘,包括单维关联规则的挖掘和多维关联规则的挖掘.结果表明建立在共有成分基础上的科的单维规则在Takhtaja系统中的解释度不如在Cronquist系统中的解释度.同时还挖掘出很多有趣的可以利用的关联规则比如降血糖(糖尿病)→抗菌、如毛莨科→抗高血压药、抗高血压药→毛莨科、茄科→M胆碱受体拮抗剂、M胆碱受体拮抗剂→茄科、安胎→唇形科.对中药化学数据库进行了包括主成分分析、因子分析、聚类分析以及判别分析等在内的数据挖掘工作.通过因子提取,获得了5个因子,得到一组分布更加密集,更有代表性的化合物集合,对因子进行了命名.考察了变量的选择和标准化对于聚类结果的影响.对一个5个活性的化合物集进行了判别分析,取得了较好的结果.对一系列的咪唑苯并二氮杂卓类化合物与五种重组GABA<,A>受体亚型α<,x>β<,3>γ<,2>(x=1,2,3,5,6)的亲和力进行了分子模型化的研究,得到了比较理想的模型,并对预报集中化合物的活性进行了预报,结果令人满意.比较分子场的研究表明:对于咪唑苯并二氮杂卓类化合物,C8位正电荷的小体积的取代基、C3位大体积的取代基有利于活性的提高.在FLARM方法中,同时建立了五个模型并得到了五个虚拟受体,并将虚拟受体和统一药效团/受体模型进行了比较发现模型具有一致性,同时说明C8位的取代对于α<,5>的选择性起到很重要的作用.验证了CoMFA中C3位大体积的取代基有利于活性提高的结论,并对CoMFA和FLARM方法进行了比较.