基于QnA网络论坛的知识表示系统及应用

来源 :南开大学 | 被引量 : 0次 | 上传用户：sonic0824

【摘要】

：

随着互联网络的不断发展，网络应用已深入到日常生活的方方面面。互联网上的各类服务，在为用户提供方便的同时也积累了大量的数据，如何有效的利用这些数据已成为一个重要课题。基

【作者】

：

李楠

【机构】

：

南开大学

【出处】

：

南开大学

【发表日期】

：

2007年期

【关键词】

：

自动问题回答自然语言处理知识推导 QnA网络论坛知识表示系统数据库结构

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网络的不断发展，网络应用已深入到日常生活的方方面面。互联网上的各类服务，在为用户提供方便的同时也积累了大量的数据，如何有效的利用这些数据已成为一个重要课题。基于Web的自动问答系统就是利用丰富的网络数据，回答用户提出的自然语言问题的应用。本文分析了现有Web自动问题回答系统的特点和不足，着重在自然语言处理和知识推导两个方面进行了深入研究，建立了基于QnA网络论坛的知识表示系统“KNEW”。该系统选择了更有针对性的QnA(Question and Answer)问答论坛数据作为建立知识库的数据，以提高数据源的可靠性及准确性。QnA问答论坛是一种流行的网络服务。使用者通过问答论坛提出问题或提供答案。论坛积累了大量的问题与答案链数据。使用论坛数据中蕴含的知识可以建立自动问题回答、自动百科辞典、专家搜索系统等多种应用。本文总结了建立KNEW系统四个方面的工作：第一，数据清洗，包括纠正拼写错误及网络用语，避免了问答数据上下文中拼写错误、网络用语等对匹配准确率的影响；第二，使用自然语言处理技术将问题和答案文本，通过语法分析(Parse) 和句型转换(Sentence Pattern Conversion)等步骤分解为便于查询和匹配的Term、Statement集合，以高效的数据库结构加以存储；第三，系统根据WordNet提供的先验知识，为Term集合建立了上、下位、同义、反义关系，以方便在现有知识的基础上进行推导，弥补了知识库有限性的不足，大大提高了知识查询的效率及准确性；第四，KNEW 系统还为上层应用提供了丰富的接口函数，为更有效的利用QnA论坛知识库提供了方便。本文还基于KNEW系统，提出了建立了自动问题回答系统应用的详细解决方案。自动问题回答系统可以使用KNEW系统提供的接口函数，调用为问答系统定制的高效综合查询函数，实现自然语言问题的处理与匹配。本文还提出了专家搜索和自动百科全书应用的建立思路，KNEW系统也为以上应用提供了丰富的接口函数。

其他文献

基于神经网络的金融网点选址系统的研究与实现

金融网点选址是指在一定社会条件、经济条件下，对金融企业的各个办事机构的区位选择过程。面对激烈的市场竞争和日益复杂的社会经济环境，科学的金融网点选址决策以及动态的网点

学位

地理信息系统决策支持系统神经网络遗传算法金融网点选址

基于LonWorks的机载智能分布控制网络数据采集系统研究

现场总线技术具有可靠性高、稳定性好、抗干扰能力强、通信速率快、造价和维护成本低等特点。该技术的出现解决了传统现场控制系统自身存在的无法克服的缺陷，使得构建高性能、

学位

现场总线技术LonWorks技术数据采集机载测控

基于层次条件随机场的图像对象分割

图像的对象分割是计算机视觉领域一个重要的研究课题，也是计算机理解与分析图像的重要步骤。至今，图像对象分割方法种类较多，目前主流方法采用条件随机场框架。这些方法一般以像

学位

图像对象分割层次条件随机场高阶势能超像素贝叶斯和谐度

基于粒子群优化算法的商业网点选址系统的研究与实现

商业网点的选址与布局是企业经营管理战略决策中的重要内容之一。地址在很大程度上影响企业未来的规划与发展。GIS技术的应用为商业网点选址提供了新的思路和方法，在对传统商

学位

粒子群优化算法商业网点选址系统网点规划地理信息系统

云存储数据完整性验证和问责机制的研究

随着数据量爆炸式的增长，导致存储成本的不断上涨，同时加大了数据存储管理的难度。云存储作为一种“基础设施即服务”的表现形式，能够提供一个高性能、低成本、易管理、虚拟化的

学位

云存储完整性验证问责可信第三方

基于Spark和BCPNN算法的并行ADR检测研究

学位

延迟容忍网络的连接查询处理

随着人们对各种应用需求的增加，网络也朝着多样化发展。在某些网络中，节点是不断移动的，节点之间的消息传递依赖于节点的相遇机会且得不到可靠的保证。网络中的移动节点具有间歇

学位

延迟容忍网络多连接查询布鲁姆过滤器GPU

基于商务智能的电子商务企业客户价值分析研究

随着Internet网规模的急剧扩大，网络用户越来越多，给电子商务的发展和普及提供了广阔的发展空间。网络上的信息量爆炸性地激增，但是网络中信息组织是非结构化或半结构化的。如何

学位

电子商务客户价值商务智能数据挖掘

面向版面加速的嵌入式ASIP设计与实现

随着显示技术的进步以及人们对阅读舒适度要求的不断提高，电子阅读装置的显示屏越来越大，色彩越来越丰富，与此同时，人们对于电子读物版面描述能力的要求也在不断提高，电子读物的版

学位

版面加速屏幕印刷现场可编程门阵列微处理器软核电子读物专用指令集处理器

基于USB接口的DSP仿真器驱动程序的设计与实现

本文主要介绍了基于USB系统的DSP仿真器的开发与实现，在实现过程中既有硬件的设计与实现，又有软件的研究与开发，从而实现整个系统的运行。论文首先介绍USB的体系结构和特点，

学位

USB接口JTAG驱动程序仿真器

基于QnA网络论坛的知识表示系统及应用

与本文相关的学术论文