基于问答对关键词提取的问答系统研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:uuuuurzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的快速发展与普及,智能问答系统的出现得到了广大用户的认可,而且在社会上广泛使用。它能够针对使用者提出的问题进行解析,然后快速明了地返回给用户所需要的答案。目前随着神经网络的完善,各行各业的智能问答系统也都是有着不错的表现,在正确率上来说已经将近达到了百分百的准确率。但随着AI3.0的到来,可解释性成为一个热门的话题,如何让模型变得可解释也是未来工作的方向。本文的主要研究工作如下:(1)针对现有的神经网络框架可解释性差以及传统方法精度缺失等问题,抛弃了常用的端到端的方法,尝试融合神经网络和传统框架,实现两种技术优点的结合,在保证精度的前提下实现可解释性,提出一种新颖的可解释性框架——基于问答对关键词提取的问答系统(KW-QA)。首先是针对问题中的问题词映射到词向量空间。然后找寻相应的内部词(问题词)及其权重、外部词(和问题词相似的词)及其权重,这便是关键词的提取,之后针对提取的关键词在候选答案中匹配。(2)针对单词的语义信息提取不完善以及传统递归神经网络网络(RNN)对语义提取只能串行等问题,本文使用Bidirectional Encoder Representations from Transformers(BERT)作为语义提取的部分,BERT的出现使得整个自然语言处理(NLP)进入到一个全新的领域,之前的RNN网络训练时间缓慢,归结于其本质是“递归的”,无法实现并行。BERT融合位置信息可以实现并行,而且也充分融合了上下文信息,使得词向量的嵌入更加丰富,用在本文中可以丰富单词嵌入的信息。(3)针对传统的IR检索技术效率低下的问题,本文提出一种新颖的基于Bayesian方法的信息检索技术来实现基于关键词的答案提取,针对前两部分提取到的关键词及其权重,针对下一步的答案检索,使用Bayesian公式可以解决该任务,而且可以使得过程更加透明、可解释。
其他文献
随着陆上风电容量愈渐饱和,对丰富的海上风能源资源的开发已成为全球发展趋势。但海上漂浮式风机在实际运行过程中往往会面临更为恶劣的工作环境,使得外部扰动总是时刻存在,风机各个系统模块的一些参数也会出现不确定性,如零件老化引起的系统参数变化,同时,各类执行器及传感器故障的发生也是难以避免的。在多数情况下,故障的发生具有随机性和难以预测性,而故障发生后则会使得整个风机性能降低,从而影响发电机稳定的功率输出
随着集成电路的快速发展,对超高纯铜和铜铝合金溅射靶材的微观组织和织构提出更高的要求,研究不同轧制方式和退火工艺对超高纯铜与铜铝合金微观组织与织构的影响,有助于提高溅射靶材的品质。基于此,本文通过金相显微镜、X射线衍射、电子背散射衍射等技术,系统研究了不同轧制方式和不同形变量的超高纯铜和铜铝合金板材的微观组织,及其在不同退火工艺后的再结晶组织和织构演变规律,通过研究得出如下结论:(1)单向轧制和交叉
近年来,深度学习由于其强大的特征提取和表示能力,已经被广泛应用在遥感图像中提升目标检测与跟踪的性能。遥感图像凭借其对地面信息抓取的优势,可以准确反映各种真实场景,使得其不仅在民用中服务于交通、农林、环境监测等,而且对于军事中的目标侦察,战场动态分析以及打击效果评估等方面都有着广泛的应用。但是,在真实场景下遥感图像会存在目标尺寸差异大、背景复杂度高、小尺寸目标、和目标稠密等多种情况,导致目标在检测与
传统的被动缓冲装置通过流道内节流小孔产生阻尼力,缓冲力无法实时控制,只能针对特定的冲击进行有效缓冲。一旦冲击条件发生变化,被动缓冲装置就不能达到很好的缓冲效果。磁流变缓冲器(Magnetorheological energy absorber,MREA)使用磁流液作为控制介质,利用其在磁场作用下阻尼可调的特点,产生连续可控的缓冲力。本文以落锤冲击载荷下的MREA作为研究对象,采用试验和数值仿真结合
抑郁症和精神分裂症作为比较常见的精神疾病,具有患病率高、自杀率高、治疗率低等特点,对个人以及社会造成严重的危害。当前诊断方法严重依赖医师临床经验和患者自我描述,受主观因素影响较大,因此需要一个客观、有效、便捷的评估手段实现精神疾病检测。在众多的精神疾病识别模态中,语音以其无损伤、价格低廉、携带情感信息丰富等优点逐渐受到人们的关注。在目前众多学者的研究中,关于精神疾病语音诊断的有效特征获取方面,人们
我国城镇化的快速推进使得城镇污水厂的受纳水量也随之快速增加,常造成一些污水处理厂近期建设完成后,远期水量的增长速率远超过项目立项时的水量增长测算,即便提前启动远期设施建设甚至扩建,也需要必要的审批程序和建设周期,因此诸多快速城镇化的地区的城镇污水厂常会面临一段较长时间的超设计水量运行的情况,当服务区域包含有老城区时,合流制管网在夏季转输而至的混合污水将使得在旱季本来已经接近甚至超过设计水量的污水厂
齿轮作为机械设备中最常见的机械零部件,起着传递转矩和传递运动的作用,由于其传动精度高、传递功率大、结构紧凑等优点,齿轮广泛应用在生产生活以及国防军事领域。齿轮箱是机械设备传递运动和动力的基本部件之一,其工作状态关系到整个机械设备的运行。在齿轮箱的零部件中,齿轮相比于轴、轴承、壳体等其它零部件的失效概率更高。其中,疲劳点蚀是齿轮最常见的失效形式之一,其恶化后易造成断齿,进而导致设备损坏、经济损失甚至
第一部分FcRL5的表达及FcRL5 CAR-T细胞的制备目的:检测FcRL5在多发性骨髓瘤(Multiple myeloma,MM)患者的原代骨髓瘤细胞、多发性骨髓瘤细胞株、B细胞淋巴瘤细胞株和正常人原代T细胞、B细胞和NK细胞以及CD34+造血干/祖细胞(hematopoietic stem/progenitor cells,HPCs)中的表达;构建靶向FcRL5的一代CAR(不含共刺激结构域
人群健康研究是全人类永恒的主题,而社会健康是组成人群健康的关键一环。但随着快速城镇化的发展,原本以“地缘”和“业缘”为基础的社会纽带愈发松弛,街邻关系萎缩、纠纷与冲突剧增,如不加以控制,将会产生严峻的社会问题,即“社会健康”问题。在建筑规划领域,构建增进邻里交往的高品质空间环境有望解决这一问题,这也是城乡规划和风景园林需要攻克的重要科学问题。社区公园是居民日常集体活动的重要场所,本文以社区公园为研
随着用户的数据请求和内容访问不断增多,激增的数据流量对网络容量和回程链路带来了巨大的挑战。研究者们尝试通过增强网络设备的性能、部署更多的基站等方式来解决问题,虽然取得了一定的成效,但仍然无法支持网络性能的长期演进。为了应对这一问题,边缘网络缓存技术应运而生,它将用户可能会访问的内容缓存到离用户更近的边缘设备中,这样用户在请求这些内容时就不需要经过回程链路,从而解放了回程链路的压力,提高了网络性能。