一种改进的化学分子二维结构检索算法

来源 :山东农业大学学报(自然科学版) | 被引量 : 0次 | 上传用户:kaida111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对化学分子二维结构检索中经典VF2算法检索效率低,系统反馈时间长等问题,提出一种改进的化学分子二维结构检索算法。该算法首先利用gSpan算法挖掘数据库中的频繁子图并根据得到的频繁子图建立特征索引,将输入的查询分子结构与该索引进行匹配,实现预筛选的功能,减小了待匹配的数据的规模,然后用VF2算法进行匹配。将改进后的算法应用于化学虚拟合成系统的数据处理上,实验结果表明,相对于经典的VF2算法,该算法的检索效率得到了显著提升。
其他文献
DIV+CSS是目前最流行的网页制作技术,但学习起来枯燥,不宜熟练掌握。为了提高教学质量,提升学习效果,进而使学生由浅入深、循序渐进地掌握这门技术,本论文通过教学方法的选用
农田水利建设管理的根本任务是保障农田水利建设的施工质量,确保建设优质的农田水利工程,但是目前的农田水利建设中仍然存在盲目性、随意性等问题。因而强化农田水利的建设管理
在蛋白质二级结构预测中,常用的氨基酸序列编码方法产生的编码除了具有较高的维数外,也没有利用氨基酸序列片段中的统计信息。为此,提出了一种新的氨基酸序列编码方法--基于词频
大规模网络开放课程(MOOC)的出现,为学习者提供了一种新的知识获取渠道,成为二十一世纪人们学习的新途径。基于关联主义的大规模网络开放课程(MOOC)具有不同于传统教学的特征和结构
为解决传统协同过滤算法中数据稀疏性的问题,本文提出了基于用户评分与用户特征相结合的混合推荐算法。该算法在一定程度上解决了传统协同过滤算法数据稀疏性的问题并且提高了
无处不在的大数据给原有的挖掘技术带来了挑战。它与以往的数据库数据并不完全相同,来源的分散性,结构上的无序性等特点使原有的数据处理陷入了困境,可视化分析技术的出现使大数
由Google公司提出的Map Reduce分布式并行编程模型是一种用于处理大数据的工具。在大数据时代,为解决在海量文本数据中提取有效信息的迫切要求,本文结合中文文本特征,在利用位置
利用初等方法,证明了2阶整数矩阵的Catalan方程无解。
CP-nets是表达定性偏好的图模型,从偏好知识的推理角度看,其上的一个典型的推理任务是CP-nets所表达的偏好是否一致,即CP-nets是否蕴含着矛盾知识。目前无环CP-nets上的一致性已
重叠社区发现是复杂网络挖掘中的重要任务之一,在恐怖组织识别、蛋白质功能预测、舆情分析等方面具有重要的理论和应用价值。但是,现有的社区挖掘算法很少针对网络中的动态网络