面向中文自然语言文档的自动知识抽取方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:rsilent
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动知识抽取方法可以自动识别并抽取Web文档中与本体匹配的事实知识。利用这些事实知识既可以构建基于知识的服务,也能够为语义Web的实现提供必要的语义数据。但面向自然语言特别是中文自然语言的自动知识抽取非常困难.提出了基于语义Web理论和中文自然语言处理(natural language processing,NLP)技术的自动知识抽取新方法AKE,用聚集体知识概念刻画N元关系知识,能够在不使用大规模语言知识库和同义词表的情况下自动识别中文自然语言文档内容中显式和隐含的简单事实知识和N元关系复杂事实知识.实验结果表明该方法优于目前已知的其他方法.
其他文献
This paper has interpreted O. Henry’s short story The Furnished Room from various aspects like setting, plot, themes and so on. And it also tries to establish
期刊
农村面源污染是指农村生活污水、生活垃圾、农药化肥、畜禽粪便等对环境造成的污染。当前海城市面源污染主要存在化肥农药不科学施用,畜禽粪便随意排放,农村生活污水、垃圾严
卡尔·桑德堡是20世纪美国著名的诗人,他早年的游历生活为其文学创作提供了契机。其杰出的代表作《芝加哥》展现了工业化发展下美国的社会现实。该文试图从文体学的分析
With the rapid development of the society, people are expected to improve their language quality as well. So when people have to express something unpleasant, t
植树造林早期,苗木的成活需要大量水分,但在风沙干旱地区,降雨量较少,无法满足苗木成活的需要,因此必须采取措施促进抗旱节水与造林技术的发展。本文结合灵武地区实际,探讨抗
针对目前基于动态规划查询超图(dynamic programming hypergraphs,DPhyp)优化SQL查询算法产生指数运行时间、传统代价模型难以直接适用于Impala大数据实时查询系统等问题,提
在现代分布式网络环境中开发与应用科学工作流系统时,由于受数据采集的准确度和网络链路可靠性影响,将会导致工作流运行中所产生数据源图的不确定性,在这样的不确定式数据源
当前科技发展非常迅速,我国农业水利工程得到了很大发展,尤其在农田水利节水技术方面获得了可圈可点的成果。但在实际运用中,还存在着问题。本文以此作为出发点,对我国的农田
双关语在广告中有着广泛的应用,该文试图从概念整合理论视角来揭示了双关式广告语意义的形成机制,即读者在解释广告意义中需要进行概念整合形成意义的新显结构,证实了概念整
法国斯特拉斯堡大学教授尼古拉斯·朱塞波尼领导的研究小组首次成功合成了一种长长的聚合链,通过超分子键把成千上万的纳米机器结合在一起,每个纳米机器都能产生约1nm的线