基于开放域抽取的多文档概念图构建研究

来源 :计算机应用研究 | 被引量 : 2次 | 上传用户:gyzviking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息过载的背景下,如何从拥有共同主题的多篇文档中挖掘并组织核心概念及其语义连接已成为当前信息抽取任务中的一项重要挑战。为此,提出了一种新颖的基于开放域抽取的多文档概念图构建方法。首先基于预定主题挖掘主题词,通过改进的TF-IDF算法对文档进行排序;然后通过共指消解、篇章权重计算、三元组实例抽取等一系列步骤从多篇文章中抽取出大量具有事实表达能力的三元组实例。为去除开放域方法本身的噪声以及提高信息抽取的准确率,提出一种三元组实例过滤算法。通过该算法可有效提取高置信度且具有良好语义兼容性的显著关系实例集
其他文献
为了对SLAM技术有更为全面的把握,在回顾过去三十年里视觉SLAM技术发展历程基础上,详细分析了视觉SLAM问题的本质与求解的复杂性。重点对在提高位姿估计精度、构建全局一致地图与提升算法求解效率上的最新研究成果进行了介绍,并对当前代表性的算法实现方案进行了分析与比较。针对未来大尺度环境、全生命周期应用需求,对现有算法框架的不足与最新研究趋势进行了归纳总结。最后,探讨了深度学习技术与视觉SLAM问题
我把学生在10年内应当掌握的最重要的技能和技巧按一个竖式排列出来,其结果如下:1.会观察周围世界的现象。2.会思考——即会类比、比较、对比,找出不懂的东西;能提出疑问。3.会表达
摘要:根据泡利不相容原理、费米子所满足的反对称波函数和升降算符的对称性,应用二次量子化的方法,讨论(np)^3电子组态在L-S耦合情况下的波函数.
尽管很多人认为,2005年以后.电热水壶在中国市场的增长一直不愠。不火,但却从几百万只发展到目前的三四千万只。进入二十一世纪的第二个十年,有人预言.国内的电热水壶市场将呈现出
京津冀一体化战略格局下,轨道交通的规划和建设日益重要,各区域的不同交通需求,适宜采用不同的城市轨道交通方式.为此,分析了轨道交通的模式,重点介绍了各种制式系统的特点和
近年来,按照习近平总书记视察江苏提出的“一个不少、一户不落”的要求,江苏大力实施脱贫致富奔小康工程,加快低收入人口精准扶贫,着力增强经济薄弱地区发展能力、广泛动员社会力
报纸