论文部分内容阅读
物性数据是进行化工研究、生产、设计及开发的基石,化学数据库中收集整理了大量的实验测定的物性数据,这为物性数据的获取提供了极大的便利,但因实验测量难度较大、实验成本较高以及新物质的数量快速增长等问题,目前物性数据不足仍是普遍存在的情况,基团贡献法物性估算是解决这一问题的有效手段。基团贡献法是一类将分子结构片段(基团)对物性的影响(贡献值)加和来预测化合物的性质的方法,在化工计算中应用广泛。开发基团贡献法物性估算程序可以使用户简便、快速的利用基团贡献法进行物性估算,物性估算程序的核心是分子结构的自动拆解,然而在分子结构自动拆解中,不同的基团匹配顺序有可能造成拆解的结果出现多解或歧义,有时甚至会导致分子结构拆解失败,导致物性估算错误或无法进行。
针对这一问题,本文分析了基团贡献法定义基团间的相互关系,研究了不同结构重叠情况下,各类基团在分子结构拆解过程中的先后匹配顺序对拆解结果的影响,并以此为基础设计了分子结构拆解的基团优先级方法。以Joback、C-G和CSGC等典型基团贡献法为例对多种分子结构进行了拆解测试,结果表明基团优先级方法能够有效地解决分子结构自动拆解的多解问题。
在此研究的基础上,本文采用SMARTS编码建立了几种基团贡献法的基团优先级排序编码表,采用CACTVS化学工具库和Tcl语言开发了物性估算程序,并以此为基础实现了Joback、C-G和CSGC三物性估算方法。与文献报道的同类方法估算结果相比,本文开发物性估算程序可以获得相同精度的结果,这进一步表明了基团优先级方法的正确性及开发物性估算程序的可靠性。此外,程序还为新增基团贡献法的实现留下了接口。
考虑到物性估算程序与化学主题数据库的集成及其对外服务的需要,本文开发了物性估算Web服务,设计了基于XML的数据交换格式,在此基础上实现了化学主题数据库的物性估算功能,进一步提高了化学主题数据库服务的能力和水平。