【摘 要】
:
一篇文献的知识元是隐含的,而且没有统一的标准,怎样定义文献的知识元并有效得提取文献的知识元已日益成为研究者关心的话题,也是进行文本挖掘的一个重要研究方向。本文采用
论文部分内容阅读
一篇文献的知识元是隐含的,而且没有统一的标准,怎样定义文献的知识元并有效得提取文献的知识元已日益成为研究者关心的话题,也是进行文本挖掘的一个重要研究方向。本文采用引文关联的方法来提取文献的知识元,使得可以绕过文献这个门槛,而深入文献内部,对文献内容的结构进行评价,从而使对文献的评价由传统的以文献为单位提高到以文献知识元为单位的深度。首先,本文综述了国内外研究现状,分析了引文索引的规律,在此基础上提取出了相关联的文献特征句子,并根据句子相似度计算方法,提取所对应的参考文献中的特征句子,分别存放在数据库的两个表中。其次,根据自定义规则抽取出了特征句子中的三元组,表示成本体,同样分别存放在数据库的另外两个表中。再次,本文提出了一种基于双权重的本体相似度计算方法,用于比较文献知识元和对应的参考文献知识元之间的相似度。接着,按照上述步骤,以具体例子进行了说明,并给出了试验结果。最后,总结了本文的创新工作,分析了本文存在的不足之处,探讨了今后的工作。本文的创新工作主要表现在:(1)本文在引文链的基础上,提出了用引文关联的方法来提取并关联文献知识元的思想,改进了原先只能对文献进行评价的不足;(2)本文提出了一种基于双权重的本体相似度计算方法,可以快速、准确地计算出文献知识元和相应的参考文献知识元之间的相似度。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
刘三读中学的时候读书是比较认真的,课余时间也经常逗一些女同学,逗笑啦问题啦写纸条啦邀请去看电影啦,这些事基本上都有过。不过没有一位女同学能够回过头来喜欢他。当了农
坐在火车车厢,望着窗外一点点后退的田埂、麦苗、树林。这是华北平原,春季,嫩绿广袤的土地在北半球和煦乍暖的微风中如期回馈给世界静默的报答。隔几个月,就有坐火车旅行的欲
扳罾罾是一种古老的渔具了,《楚辞·九歌》中就有“罾何为兮木上”一句。罾的种类也多,像吊罾、提罾,还有蟹罾、虾罾……这里说的,是那种横跨整个河面的大罾。里下河水乡,有
“乃可径来”:怀素《苦笋帖》有一次,怀素给朋友写信,只写了这样一句:苦笋及茗异常佳,乃可径来。怀素上。此信寥寥数笔,言简意赅,盛情却扑面而来!读这样的句子,我不禁在想,这
蝴蝶与裸奔第一次接触裸奔这个词大约是二十年前。那时候,因为没有现在这么多直观的、纷纭的刺激,所以,哪怕是一个简单的词语,也能够让你想入非非。而这种想象仍还停留在浪漫