面向数值问题的答案抽取与生成

来源 :沈阳航空航天大学 | 被引量 : 3次 | 上传用户:luo_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数值作为信息最直观的表达类型之一,能够有效地反映信息的含义。随着大数据和人工智能时代的到来,人们迫切希望用更加智能的方式从互联网中获取数值信息。问答系统能够为用户提供自然的交互体验和精准的信息内容,已受到学术界和产业界广泛关注。本文面向数值问答系统的构建,重点研究数值类问题的答案抽取和生成。可以把研究工作分成两大部分:1、通过数值信息抽取来构建候选答案库,2、根据具体的数值问题从答案中抽取或生成答案。通过数值信息抽取来构建候选答案库部分是指从web中抽取数值信息,并存放在答案库中,为后续的问答提供答案。完整的数值信息要素包含有数字,数字的量化对象,如:主体及其属性,以及时空约束条件。本文提出一种基于数值模板结合条件随机场的数值信息抽取方法,该方法利用数值相关知识来制定数值信息抽取模板,对文本模式匹配,并使用条件随机场修补模板的局限性。实验结果的准确率、召回率和F值分别为0.847、0.665和0.745。根据具体的数值问题从答案库中抽取或生成答案部分是指通过分析数值问题,从上述构建的候选答案库中选择或生成答案。在答案选择部分采用一种知识和tfidf算法相结合的答案选择方法,该方法将问题分析中的核心词映射到知识中,并利用tfidf算法在数值答案库中检索答案。在实验中,前三个答案的正确率分别为0.66,0.6,0.52。在答案生成部分通过引入外部知识和相对数值,并建立求解公式,进而生成答案。
其他文献
背景pten(Phosphatase and TENsin homolog deleted on chromosome 10)人第10号染色体缺失的磷酸酶及张力蛋白同源基因,位于10q23.3,转录产物为515 kb m RNA,属于PTP(protein
随着无线通信技术、传感器技术、嵌入式技术等领域的快速发展,使得无线测量技术日趋成熟,它在军事、工业、农业、交通等各个领域应用广泛,本文要研究的对象是桥梁健康检测。
随着我国海洋强国战略的大力实施,海洋经济得到快速发展,对于无居民海岛的开发利用也逐渐步入人们的视野。而大部分无人海岛气候恶劣,常年处于高湿高温大风的环境下,建筑物室
历次金融危机的爆发,产生影响的持续性与波及的范围均在不断增加,体系性风险的发生呈现出由点到线,由线到面的辐射。所谓牵一发而动全身,不同行业之间的存在着相关性,而且其
眼控技术是人机交互的一个重要研究领域,广泛应用于用户研究、医疗事业、户外广告分析、电梯广告分析、虚拟现实等领域,有非常重要的应用研究价值。本文章首先针对眼球在正常
当代的音乐是一个百家齐放的音乐时代,各类音乐风格、种类不尽相同,不同的音乐哲学观点和不同人生阅历,造就每位作曲家的创作作品的方式方法也不一样,在整部作品中我尽量的去
原发型家族性脑钙化(Primary familial brain calcification,PFBC)是一种极为少见家族性常染色体显性遗传病,钙化可能发生于大脑的豆状核、尾状核、脑丘、齿状核等部位。患者
随着科学技术的发展,将接收到的彩色图像进行处理,以备进一步的分析和研究,已经成为了图像工程领域亟待解决的问题。图像分割作为图像处理的基础,是保证图像分析进行的根本。
从船舶航行的安全角度出发,为确保船舶具有良好的操纵性能,有必要对船舶操纵性进行深入研究。由于船舶操纵性本身的复杂性,特别是船体、螺旋桨、舵之间复杂的干扰效应,其机理
目前葡萄糖醛酸的制备主要采用化学工艺法,但实际生产过程中化学法仍存在着许多亟待解决的问题。结合现有问题,本论文提出利用微生物法生产葡萄糖醛酸的途径,即细菌通过发酵