基于注意力机制的保险领域自动问答系统的研究

被引量 : 0次 | 上传用户:zjm2190
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机算力的增强,人工智能也得以快速发展,信息和数据也呈现出指数级爆炸增长,如何从海量数据中精准地获取所需信息已然成为人们研究的热点和目标。问答系统作为解决此类问题的重要途径之一,比如作为其应用的智能客服而言,它不仅可以减少人力成本,而且对于重复率高的问题有标准答案,不会受情绪等人为因素而影响服务质量,并且更加高效快捷。随着人们生活水平的不断提高,保险意识也逐渐增强,通过了解保险进而购买保险来转移家庭风险的人也越来越多,不少人想要了解相关的保险机制。而现有的一些问答系统往往似于聊天机器人,一旦涉及相关专业领域就显得有些人工智障,那么设计一款保险领域的问答系统就能满足人们这方面的需求。本文正是基于上述目的,利用开源的保险数据集Insurance QA来完成保险领域问答系统的研究工作,因为Insurance QA数据集是根据人们在Insurance Library上提问,且由保险领域的资深专业人士进行了解答,进而构成了该数据集。本文研究的主要内容如下:(1)数据集的构建及预处理。本文对Insurance QA语料信息完成正例标签的提取,并对每一个语料完成类别标签的标注。结合维基百科语料与Insurance QA各类别60%的语料信息一起,经去停用词、分词等处理后,生成了word2vec的词向量。(2)设计了一种快速文本匹配方法。首先对文本完成意图识别,判断用户问句对应的保险类别,其次通过改进的余弦相似度算法在相对应的类别问答库里进行粗排,找到top-k个最相似的候选答案,最后通过改进的深度学习相似度计算模型对这k个候选答案分别与用户问句计算相似度值,找到最相似的问题和答案。(3)提出了text BLCNN分类模型,采用Bi-LSTM替换text CNN模型中的固定窗口卷积层,并且融合了原来的text CNN增加一个卷积核的卷积网络,通过最大池化完成最优潜在信息的提取,提高了分类效果。(4)提出了基于注意力机制的ESIM改进模型AG-ESIM。对Bi-GRU引入attention机制,并取代ESIM模型的编码和推理合成层,使模型能够学习到构成句子的各个词语的重要性,从而提高句子的表征能力,提高相似值计算的准确性。本文设计的问答系统模型通过实验结果表明其在精准率、召回率和F1值上均比原模型有所提高,模型在测试集上的测试效果能够满足预期。
其他文献
随着数字化技术的兴起,数字经济时代的高阶发展,世界各国的政府与税务部门纷纷主动或被迫寻求创新税收征管方式以适应新阶段的经济运行模式。积极利用数字化技术,改变传统税收征管方式成为众多国家快速提升税收征管质效的重要方式。在我国经济数字化快速发展的时代背景下,中办、国办于2021年3月发布《关于进一步深化税收征管改革的意见》,明确全面推进税收征管数字化升级和智能化改造,加快推进智慧税务建设,深化税收大数
学位
近年来,深度强化学习(Deep Reinforcement Learning,DRL)已成为人工智能领域的新兴技术之一,它结合了深度学习(Deep Neural Network,DNN)的特征提取能力,以及强化学习的序列决策能力,解决了许多重要问题并取得了显著成果。然而,由于DRL引入了DNN作为策略输出,其黑盒性质在实际应用中同样面临着诸多安全问题,包括对抗攻击、模型窃取以及后门攻击等。尤其是在
学位
本翻译报告材料节选自拉尔夫·蒂勒(Ralph Thiele)所著的军事科技文本《混合战争:未来与科技》(Hybrid Warfare:Future and Technologies)。该书介绍了混合战争的概念、方式手段及应对措施,强调高新科技的发展对混合战争的推动作用。译者所节选书中的前言、序言、概要、第一章以及附录1、附录4,主要介绍了混合战争的背景和发展趋势,深入探讨5G技术和人工智能等高科技
学位
我国对中小学生个人信息保护的研究多见于未成年人个人信息保护,甚至一般主体个人信息保护。相关论述也分散于各类文献中,直接对中小学生个人信息保护的研究较少,而从学校保护角度研究该问题的更是不多。虽然近些年国家和社会对未成年人和个人信息保护的重视程度越来越高,但中小学生个人信息从未被准确界定,其在学校保护层面的问题也有待被进一步研究。论文结合我国在此方面的立法情况以及欧盟、美国的保护制度,针对我国目前中
学位
作为世界上主要的三大油料作物之一,油菜是我国种植面积最大的油料作物。但是作为一种以收获籽粒为主的经济作物,相较于水稻和花生等具有50%以上收获指数的作物,油菜栽培品种的收获指数却只有20-30%,因此提高油菜收获指数对提高其产量显得尤为重要。在影响收获指数的“源、流、库”三因素中,油菜有充足的源和库,因此研究流-即光合同化物的转运和分配成为提高油菜收获指数的突破口。油菜青荚期的光合作用可为籽粒产量
学位
近年来,磁性Fe3O4纳米材料因其超顺磁性、高比面积和生物相容性等优点,广泛用于生物医药、磁分离和生物分子富集与检测等领域。然而,由于粒子稳定性差和粒子间的偶极-偶极相互作用,导致Fe3O4易氧化和团聚,限制了其应用潜力。为了增强其稳定性,人们采用相应的修饰策略为Fe3O4纳米粒子提供稳定性的外壳(如二氧化硅、贵金属、小分子表面活性剂和聚合物等)。在众多包覆材料中,二氧化硅不仅赋予了Fe3O4优异
学位
股票投资组合管理问题一般被认为是一个包含高维输入和连续决策的复杂系统工程,这一特点恰好与深度强化学习(DRL)的强大感知能力和决策能力相契合,因此将DRL算法应用于股票投资组合管理具有重要意义。首先,本文进行了DRL建模的可行性分析,在模型假设的基础上设定了模型的重要概念(包括环境、状态、动作和奖励),并采用DDPG、TD3和A2C这三种前沿的基于执行者-评论家架构的DRL算法,构建了基于DRL的
学位
随着信息技术的快速发展,法律关系变得更加复杂,新型人格利益被不断挖掘,对人格权制定更系统和完善的法律规定,是顺应时代的必然要求。我国现行民法典扩大对人格权益的保护范畴,体现了立法的与时俱进。虽然此次民法典中对声音权的保护有了概括性的规定,但主要采纳的是肖像权规定的保护模式,并未对声音权制定系统且独立的法律条文进行保护。从现实角度来说,声音的表现方式以及客体、权利内容等,和肖像相比,均存在较大差异。
学位
目的:研究姜黄素对人神经母细胞瘤细胞株SK-N-SH、SH-SY5Y细胞增殖、凋亡、ROS生成、内质网应激及自噬的影响,初步探讨姜黄素通过诱导ROS生成对SK-N-SH、SH-SY5Y细胞增殖、凋亡及内质网应激及自噬活动的分子机制。方法:(1)课题组选取SK-N-SH、SH-SY5Y细胞为研究对象,以不同浓度姜黄素(0、1.25、2.5、5、10、15 μmol/L)作用于细胞,采用CCK-8法检
学位
城市污水处理过程中产生的剩余污泥是污水处理厂需要处理处置的主要副产物,污泥产量逐年增加。污泥中富含大量的重金属和有机污染物,若处置不当会对环境造成严重的二次污染;但污泥中又含有丰富的蛋白质、多糖等可利用资源,对污泥进行处理的同时可以实现资源回收。可利用高铁酸盐的氧化性能,加速对厌氧发酵过程中剩余污泥的破解作用,加快水解速率,强化厌氧发酵产酸效能,实现污泥中的资源回收。本研究首次采用电化学循环制备高
学位