【摘 要】
:
随着互联网的高速发展,信息数据呈指数倍增长,如何有效利用这些信息成为人们关注的热点,随之自动问答系统步入人们的眼帘。自动问答系统依据内容所涉及的领域分为开放域及限定域两类。基于开放域的自动问答系统得到各行各业的广泛关注,取得一定的研究进展,但不可直接将其运用到限定域中,原因是限定域的知识专业性强,基于开放域的自动问答系统无法对其进行正确的判断与识别。因此,对于限定域自动问答系统的研究也是不可或缺的
论文部分内容阅读
随着互联网的高速发展,信息数据呈指数倍增长,如何有效利用这些信息成为人们关注的热点,随之自动问答系统步入人们的眼帘。自动问答系统依据内容所涉及的领域分为开放域及限定域两类。基于开放域的自动问答系统得到各行各业的广泛关注,取得一定的研究进展,但不可直接将其运用到限定域中,原因是限定域的知识专业性强,基于开放域的自动问答系统无法对其进行正确的判断与识别。因此,对于限定域自动问答系统的研究也是不可或缺的。基于限定域自动问答系统的关键环节是文本匹配及答案抽取,其本质是通过计算问答对间的相似度来对候选答案进行排序,并返回给用户相似度最高的答案。为了充分利用文本的语义信息,提高模型的准确性,本文做了以下工作:首先,构建数据库。从专业医疗平台爬取问答对,经过数据预处理,去除多余字符及不符合规定的查询及答案,构建医疗领域数据库,有效的解决专业知识不足的问题。其次,将卷积深度结构语义模型运用到医疗领域中。由于深度结构语义模型采用的词袋模型不能考虑到语法信息,将卷积神经网络与该模型结合,可以弥补深度结构语义模型不能考虑词的位置信息和语序信息的不足,使模型能够提取潜在语义信息。再次,提出了基于注意力机制和卷积深度结构语义模型的深度学习方法。在卷积深度结构语义模型的基础上,引入了注意力机制,使模型对文本信息更为敏感,能够忽视文本的无关信息而集中关注有效信息,扩大有效信息的权重,从而提高模型的准确性。最后,进行实验验证。对模型进行实验并对比分析实验数据,同时对模型进行模拟测试,验证模型的有效性。本文在自建数据集的基础上进行实验,发现基于注意力机制和卷积深度结构语义模型相较于深度结构语义模型,Acc、MRR等指标均得到提升,对模型进行模拟提问得到的返回答案也较为合理,多方面验证了该方法的有效性。
其他文献
集成光学是将大量光学元件集成与一块衬底上,经过集成能够大大的减小光电子系统的体积,使原先体积巨大的系统可以被缩小在几个平方厘米的尺寸范围内。除了小型化这个优点之外,与传统的集成电路等相比,集成光路还具备高性能,结构稳定等许多优点,拥有非常广阔的发展前景。作为很多光子学器件的基本元件,光波导是集成光路的十分重要的组成元素,它的作用原理与光纤类似,运用的是光学中的全反射原理,由材料中折射率较低区域围绕
微博是国内使用用户较多的社交平台之一,它具有信息传递速度快、覆盖方面广的特点,人们在微博上可以针对某一事件进行评论,以此来表达自己的情感态度。通过对用户评论信息情感倾向的判断,不仅有利于管理部门的监控,对于谣言制止、舆情导向、市场营销等都具有非常高的应用价值。微博评论多以文本的方式呈现,并且规定评论字数不多于140个字符,属于短文本。对于微博评论这种短文本数据存在以下问题:首先,篇幅较短,导致可以
气肿疽是由气肿疽梭菌(Clostridium chauvoei)引起的,主要感染牛、羊等反刍动物的一种急性、热性、败血性和高致死性传染病。病原体易对受损动物机体侵袭,芽孢由咽喉或口腔向血液或受伤组织入侵。临床证实,死亡率与年龄具有相关性,年龄越大,感染率及病死率相对越低,且地方性流行特征明显。若没有进行针对性干预,会增加疾病死亡率,养殖户营业额下降。气肿疽前期症状隐匿,是一种高死亡率、低治愈率传染
猪繁殖与呼吸系统综合征(PRRS)是由猪繁殖与呼吸综合征病毒(PRRSV)引起的一种严重危害养猪业的高度接触性传染病。PRRSV作为一种全世界范围内可导致猪发病的重要致病原,不同性别、年龄阶段和品种的猪均可被感染,临床上可引起仔猪呼吸道疾病、妊娠母猪早产、流产和木乃伊胎等症状。当前商品化的PRRSV灭活疫苗与减毒活疫苗可提供的保护作用十分有限,中和抗体和细胞介导的免疫反应产生较弱,且疫苗毒株很有可
目的:探讨尼古丁(Nicotine;NIC)是否通过细胞凋亡和内质网应激(endoplasmic reticulum stress;ER stress)加重高糖刺激足细胞的损伤。方法:复苏后,将细胞置于含10%胎牛血清、100 IU/ml青霉素、100 UG/ml链霉素和4 ng/ml小鼠干扰素-γ的RPMI-1640培养基中,置于5%CO2培养箱中,33℃培养。当细胞密度达到80%时,用0.25
量子关联和量子相干是量子理论中的两个基本概念。量子关联表征了两体或多体系统的量子特征,而对于整体系统则定义了量子相干。而且,从实际的角度来看,量子关联和量子相干对于量子信息和计算任务也是宝贵的物理资源。一个成功而安全的量子网络依赖于分布在子系统之间的量子关联,这就解决了量子关联的分布问题。量子纠缠的单配性关系表征了这种相关分布。作为量子关联和经典关联的一个基本区别,与一个子系统纠缠的量子系统限制了
目的:通过体外实验,研究坏死性凋亡抑制剂(Necrostatin-1,Nec-1)能否在人近端肾小管上皮(Human kidney proximal tubular epithelial,HK-2)细胞受到高糖诱导的损伤情况下,对其产生保护作用及机制。方法:在体外对HK-2细胞株进行培养,将细胞随机分为5组:对照组(Control,CON):5.5mmol/L葡萄糖、甘露醇组(Mannitol,M
近五十多年来,非线性科学已逐步成为一门跨学科的综合性科学.非线性科学在各个领域里面都有所涉猎,对现代科学理论体系的形成具有明显的推动作用,其中,在各个领域和学科的研究中非线性微分方程始终占有一席之地.无论是在科学理论里亦或现实应用中,非线性偏微分方程都有其应用于实际的重要意义,它通常被用来研究力学、工程技术科学、生命科学以及流行病学等领域方面的问题.而在非线性偏微分方程里,非线性薛定谔方程是一种非
研究背景:胰腺癌是致死率极高的消化道恶性肿瘤,因其早期症状不明显、起病快等原因,致使患者5年生存率不足10%。目前,临床主要采用手术切除、辅助化疗和放疗等治疗策略,但效果欠佳。因此,迫切需要深入探索胰腺癌演进的分子机制,以期为胰腺癌的诊断和治疗提供新策略。多项研究证实,脂质代谢异常是恶性肿瘤的十大标志之一。脂质代谢因子-羟基类固醇脱氢酶样2(HSDL2),隶属于类固醇脱氢酶家族成员,可与还原型辅酶
目的 探讨多层螺旋CT对不典型肝脓肿(Atypical Hepatic Abscess,AHA)的诊断价值,并提高与肝内胆管细胞癌(Intrahepatic Cholangiocarcinoma,ICC)鉴别诊断水平,尽量做到早诊断早治疗,改善愈后。方法 本研究纳入2018年1月至2020年10月期间经超声穿刺、细菌培养证实的肝脓肿患者23例及病理证实肝内胆管细胞癌患者25例,分为不典型肝脓肿组和