基于QnA网络论坛的知识表示系统及应用

来源 :南开大学 | 被引量 : 0次 | 上传用户:sonic0824
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网络的不断发展,网络应用已深入到日常生活的方方面面。互联网上的各类服务,在为用户提供方便的同时也积累了大量的数据,如何有效的利用这些数据已成为一个重要课题。基于Web的自动问答系统就是利用丰富的网络数据,回答用户提出的自然语言问题的应用。 本文分析了现有Web自动问题回答系统的特点和不足,着重在自然语言处理和知识推导两个方面进行了深入研究,建立了基于QnA网络论坛的知识表示系统“KNEW”。该系统选择了更有针对性的QnA(Question and Answer)问答论坛数据作为建立知识库的数据,以提高数据源的可靠性及准确性。QnA问答论坛是一种流行的网络服务。使用者通过问答论坛提出问题或提供答案。论坛积累了大量的问题与答案链数据。使用论坛数据中蕴含的知识可以建立自动问题回答、自动百科辞典、专家搜索系统等多种应用。 本文总结了建立KNEW系统四个方面的工作:第一,数据清洗,包括纠正拼写错误及网络用语,避免了问答数据上下文中拼写错误、网络用语等对匹配准确率的影响;第二,使用自然语言处理技术将问题和答案文本,通过语法分析(Parse) 和句型转换(Sentence Pattern Conversion)等步骤分解为便于查询和匹配的Term、Statement集合,以高效的数据库结构加以存储;第三,系统根据WordNet提供的先验知识,为Term集合建立了上、下位、同义、反义关系,以方便在现有知识的基础上进行推导,弥补了知识库有限性的不足,大大提高了知识查询的效率及准确性;第四,KNEW 系统还为上层应用提供了丰富的接口函数,为更有效的利用QnA论坛知识库提供了方便。 本文还基于KNEW系统,提出了建立了自动问题回答系统应用的详细解决方案。自动问题回答系统可以使用KNEW系统提供的接口函数,调用为问答系统定制的高效综合查询函数,实现自然语言问题的处理与匹配。本文还提出了专家搜索和自动百科全书应用的建立思路,KNEW系统也为以上应用提供了丰富的接口函数。
其他文献
金融网点选址是指在一定社会条件、经济条件下,对金融企业的各个办事机构的区位选择过程。面对激烈的市场竞争和日益复杂的社会经济环境,科学的金融网点选址决策以及动态的网点
现场总线技术具有可靠性高、稳定性好、抗干扰能力强、通信速率快、造价和维护成本低等特点。该技术的出现解决了传统现场控制系统自身存在的无法克服的缺陷,使得构建高性能、
图像的对象分割是计算机视觉领域一个重要的研究课题,也是计算机理解与分析图像的重要步骤。至今,图像对象分割方法种类较多,目前主流方法采用条件随机场框架。这些方法一般以像
商业网点的选址与布局是企业经营管理战略决策中的重要内容之一。地址在很大程度上影响企业未来的规划与发展。GIS技术的应用为商业网点选址提供了新的思路和方法,在对传统商
随着数据量爆炸式的增长,导致存储成本的不断上涨,同时加大了数据存储管理的难度。云存储作为一种“基础设施即服务”的表现形式,能够提供一个高性能、低成本、易管理、虚拟化的
学位
随着人们对各种应用需求的增加,网络也朝着多样化发展。在某些网络中,节点是不断移动的,节点之间的消息传递依赖于节点的相遇机会且得不到可靠的保证。网络中的移动节点具有间歇
随着Internet网规模的急剧扩大,网络用户越来越多,给电子商务的发展和普及提供了广阔的发展空间。网络上的信息量爆炸性地激增,但是网络中信息组织是非结构化或半结构化的。如何
随着显示技术的进步以及人们对阅读舒适度要求的不断提高,电子阅读装置的显示屏越来越大,色彩越来越丰富,与此同时,人们对于电子读物版面描述能力的要求也在不断提高,电子读物的版
本文主要介绍了基于USB系统的DSP仿真器的开发与实现,在实现过程中既有硬件的设计与实现,又有软件的研究与开发,从而实现整个系统的运行。 论文首先介绍USB的体系结构和特点,