论文部分内容阅读
针对化学分子二维结构检索中经典VF2算法检索效率低,系统反馈时间长等问题,提出一种改进的化学分子二维结构检索算法。该算法首先利用gSpan算法挖掘数据库中的频繁子图并根据得到的频繁子图建立特征索引,将输入的查询分子结构与该索引进行匹配,实现预筛选的功能,减小了待匹配的数据的规模,然后用VF2算法进行匹配。将改进后的算法应用于化学虚拟合成系统的数据处理上,实验结果表明,相对于经典的VF2算法,该算法的检索效率得到了显著提升。