问答系统中的文本信息抽取研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：hsb1588

【摘要】

：

近年来,互联网的迅速发展,使得人们能够在这个平台上方便地保存数据、交流信息以及共享知识。但是,互联网中海量的数据给用户快速准确地获得这些所需的知识带来了困难。针对

【作者】

：

李欢

【出处】

：

中国科学技术大学

【发表日期】

：

2009年期

【关键词】

：

互联网问答系统信息抽取依存关系树知识库基于案例的推理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,互联网的迅速发展,使得人们能够在这个平台上方便地保存数据、交流信息以及共享知识。但是,互联网中海量的数据给用户快速准确地获得这些所需的知识带来了困难。针对这样的需求,基于Web的信息检索和信息抽取逐渐成为了重要的研究课题。当搜索引擎的不足开始凸现,如何将丰富的资源合理地利用,使机器理解其中信息,成为网络时代机器智能的一大热门研究课题。在这样的背景下,建立在信息检索与信息抽取技术之上的问答技术领域蓬勃发展起来。问答系统以自然语言的问题取代关键字作为输入,允许用户准确表达自己的需求;将准确的答案短句返回给用户,节约了用户搜索、定位答案的时间。问答系统按照获取答案的方式可以分为自动问答系统和交互式问答系统两种;根据系统所处理的问题的范围可以分为开放领域问答系统和特定领域问答系统两种。前者不限输入的问题范围,试图为任意主题内的任意问题寻找答案。后者只接受针对某一个特定领域的问题,往往有此领域内的领域知识作为指导。本文针对信息抽取在问答系统中的应用,围绕这两种不同的问答系统展开了研究。对开放领域内的问答,研究了如何加强对问题的语义分析能力、如何更有效地利用历史数据库以提高机器智能;对特定领域内的问答,研究了如何更好利用经验解决新的问题等,以提高问答系统的答案正确率。本文的主要研究内容和创新之处如下:第一,对问题语义的准确分析是把握用户需求的关键。本文对文本中语义约束信息的识别展开了研究,期望对有信号词指示的语义约束部分,给出正确的检测,并对由同一信号词指示的多种语义约束,给出正确的区分。为此提出了一种运用依存关系树比对来检测文本中多语义约束的方法。对每一类语义约束,搜集信号词以及相应的例句组成案例库,并定义部分依存关系树(PDT)核函数来计算两个对象之间的相似度。在实际计算过程中,运用Apriori算法,来降低计算该核函数的复杂度。第二,不管是自动问答系统还是交互式问答系统,都在日积月累的用户使用中积累了大量的问答数据。为了有效地重用这些历史数据,本文开展了从历史问答对中抽取知识的研究,期望将短文本答案的问答对蕴含的知识自动转化为结构化的知识表达,不断积累;并使得系统可以凭借积累的知识库进行查询检索,并返回结果。这样一是可以节约建造知识库的人力,二是可以对新问题给出一个参考答案,节约交互式系统中用户得到答案的时间。为此本文描述了从问答对到知识库转化的工作流程,将语义模板匹配和上述语义约束的识别的工作相结合,来获取对问题句中知识的提取,并运用以语义网络为基础的结构来表达互相联系互相约束的知识簇。实现了一个用户交互式的原型系统,演示了上述知识库积累和使用的过程。第三,在特定领域内的自动问答中,领域知识起到非常关键的作用。在一些领域中,经验是解答新问题的最好的依据。因此,本文以植物生长环境的推荐任务为应用场景,对用基于案例推理的方法来重用该领域内的经验进行了研究。提出了一种学习获取修正规则的方法。运用资源空间模型(RSM)和语义链接网络(SLN)来表达和构建案例库,将案例之间相互联系起来。以案例比对的方法分析案例库,以得到修正规则;案例之间的联系和基本领域知识,给相似度计算提供了指导;运用距离测量值和置信度值来提高修正规则的生成和运用的精度;设计了一个进化模块,依据解决新问题的经验来更新修正规则集,提供了系统的学习能力。

其他文献

论专业新闻报道如何突出重围进入大众视角

<正>近年来,特别是随着经济社会的快速发展和各行业分工的不断细化,专业新闻的重要性日益凸现,而各行业和各领域也亟须以新闻报道为窗口,对自身进行专门的报道,从而达到宣传

期刊

受众兴趣天地图生活化

养生美食黑糯米

在山清水秀的贵州惠水县生产了一种黑糯米．这种产品具有很高的营养价值．是历代皇宫的贡品．据史料记载．清宫的康熙皇帝、乾隆皇帝常年饮用黑糯米酿制的黑糯米御酒．他们精力充沛．身体

期刊

黑糯米养生美食营养价值康熙皇帝史料记载乾隆皇帝粮食品种

观察孕产期盆底功能训练指导对产后压力性尿失禁电刺激治疗效果

目的孕产期盆底功能训练指导在产后压力性尿失禁电刺激治疗中临床效果分析。方法将我院于2016年1月~2018年12月收治200例自然分娩产妇作为观察对象并将其进行分组:参考组与实

期刊

孕产期盆底功能训练指导产后压力性尿失禁电刺激治疗

博采众长的个性化出品

陈景俊，现任湘鄂情餐饮投资管理有限公司行政总厨，中国烹饪大师，法国国际厨皇会金牌会员，国际美食评委，广东名厨联谊会会员，环球名厨联谊会会员，2005年他获得全国十佳金勺奖和十佳粤

期刊

个性化中国烹饪大师行政总厨投资管理烹饪艺术会员国际法国

湘菜奇葩农家菜

农家风味菜属于湘菜的一种，有别于都市菜品和市肆菜品，它起源于广袤的乡村、田园，远离了城市的喧嚣和繁华，以无公害、少污染、轻化学试剂的绿色原料为特色，就地取材于自家的菜园中

期刊

农家菜湘菜生长周期绿色原料化学试剂就地取材生活规律风味菜

“齐二药”案例在药事管理学课程教学中的应用

药事管理学是一门注重法规在实践中应用的学科,章节内容较多,对于法律基础知识薄弱的药学生来说,知识点掌握方面有一定难度。"齐二药"案例作为近年来的典型案件,代表性强,可

期刊

齐二药药事管理学课程教学

不做消极经理人

职场中有一类经理人，专门和老板对着干，他们所做的一切工作和努力都只有一个目的：证明老板是错的，反证自己是对的。我叫他们消极经理人。

期刊

经理人消极老板

转基因诱导新生大鼠耳蜗大、小上皮嵴细胞分化为毛细胞样细胞实验

目的通过转染Hathl基因诱导大鼠耳蜗大上皮嵴细胞（greater epithelial ridge，GER）和小上皮嵴细胞（1esser epithelial ridge，LER）分化为毛细胞样细胞。方法取出生后第l天的大鼠耳蜗，

期刊

毛细胞再生大上皮嵴小上皮嵴Hair cells Regeneration Greater epithelial ridge (GER) Lesser e

米其林在欧洲和美国推出“米其林餐厅指南”iPhone应用程序

继“米其林红色指南”的iPhone应用程序在法国以及欧洲市场取得成功之后．米其林公司近日宣布该应用程序又增加了新的内容：4本欧洲的红色指南——德国卷、西班牙及葡萄牙卷．意大

期刊

米其林公司IPHONE应用程序欧洲市场指南餐厅美国网站开发

亲切乡土菜

2007年2月5日，为期1个月的“乡土美食京城迎奥运会——首届乡土美食节”终于拉开了帷幕，推出了百道乡土美食推广菜。在此，我们展示七道乡土菜供读者参考。

期刊

乡土菜美食奥运会地域文化

问答系统中的文本信息抽取研究与应用

与本文相关的学术论文