基于深度学习及知识图谱的垂直领域问答研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:chinaoristand
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答的目的是让机器理解人们提出的问题,并以自然语言的形式给出准确的答案,这项技术需要机器存储大量的背景知识。近年来,知识图谱技术的飞速发展,使得基于知识图谱的问答系统得到更多的研究。自动问答的研究领域可以划分为开放领域和垂直领域,本文主要针对医疗垂直领域进行研究。但研究中存在实际场景标注数据不足、机器在各个垂直领域对用户问题理解有偏差问题,因此,本文研究主要解决以上问题。首先,为解决训练模型标注数据不足的问题,本文基于自然语言建模和文本增强算法的最新进展,提出了一种融合面向表示和面向原文的文本增强方法,并利用反向翻译的技术提高增强后文本的多样性。在多个中英文数据集上分不同场景验证了本文提出的文本增强算法的有效性。然后,针对机器对用户问题理解有偏差的问题,本文通过对用户问题进行意图识别的方法来解决。基于已有的意图识别方法,本文提出了利用胶囊网络进行改进的算法。该改进算法具备胶囊网络的优势,解决了原来算法中在池化阶段导致一些特征丢失的问题。而且该算法将信息分层分组,以解决更复杂的问题。该算法在训练过程采用动态路由算法,从而增加了重要特征的权重,能够发现更多的隐藏特征,进而提高了意图识别的性能。最后,本文构建了医疗领域的知识图谱,并基于前文对文本增强和意图识别的研究,实现了医疗垂直领域的自动问答系统,验证了本文所提算法在实际场景中的可行性。此外,本文所提算法也可迁移到其他垂直领域。
其他文献
To reveal the damage mechanism of high chrome bricks for opposed multi nozzle gasifier with expanded diameter,the chemical composition and the morphology of a used high chrome brick were researched using XRF,SEM and EDS,and the properties of the high chro
郭落山金矿位于蓬莱—栖霞金成矿带南侧,矿体呈脉状或透镜状赋存于林家庄—万家沟断裂的碎裂岩和绢英岩中,共圈定含矿蚀变带6条和金矿体9个,主要发育硅化、黄铁矿化、黄铜矿化、绢云母化等围岩蚀变.金主要来源于上地幔岩浆和古老的变质火山岩系,经断裂活化和迁移以粒间金和包裹金形式赋存于含金黄铁矿化硅化碎裂岩中,金矿化与硅化、黄铁矿化和黄铜矿化关系密切,矿床成因属中低温热液裂隙充填交代型金矿床.中生代花岗岩、构造破碎带和矿化蚀变为重要的找矿标志.
青海柴北缘大柴旦尖峰山金矿具有重要的找矿前景.通过开展地质调查、钻探、槽探等野外工作,研究矿床地质特征,探讨矿床成因,预测找矿前景.研究结果表明:矿区内圈定金矿化蚀变带5条,矿石类型为石英脉型.矿石结构主要为自形—半自形粒状结构、他形粒状结构和交代残余结构.矿石构造主要有脉状构造、浸染状构造、团块状构造.矿床属于受构造控制与岩浆热液有关的石英脉型金矿.找矿远景优越,韧性剪切内石英脉依然是寻找金矿化富集体的重要目标,加强该区地球化学测量和工程控制有望在该区发现新的找矿空间,在区内选择韧性—脆性叠加强变形部位
The progress of research and production of bauxite based homogenized grogs in China was summarized and the achievements of their application and modification in recent years were epitomized.In combination with the shortcomings existing in the research,pro
地下水环境监测井作为开展地下水环境监测工作的重要依托,其“健康状况”直接影响到监测结果的准确性,井下电视像胃镜一样,可使监测井问题一目了然.在研究了大量监测井调查实践案例的基础上,梳理提炼工作成果,论述了井下电视在地下水环境监测井调查中的应用,形成了一套可推广、可复制的操作经验.
随着国家对矿山地质环境问题的越发重视,加强矿山地质环境保护及治理,实现矿山环境健康可持续发展成为当前亟待解决的重要问题,以焦桐高速巩义北山口镇白窑至老井沟段废弃矿山为研究对象,总结了研究场区内比较典型的4种地质环境问题,即不稳定边坡、崩塌、渣堆、采坑等,并对该现象有针对性地提出治理对策,为类似的矿山地质环境问题治理提供参考对策.
近年,随着大数据、人工智能等领域的蓬勃发展,相关应用对于计算资源、存储资源的需求不断增长。为了支撑这些不断增长的需求,越来越多的应用正在迁移到“云端”上。云计算是指基于互联网,统一管理和调度计算资源,存储资源,软件资源等,并将这些资源按需求共享给终端用户。另外,云计算平台可以降低开发者的开发难度,提高开发效率,满足全栈需求,实现快速稳定的迭代。而新兴的虚拟化技术Docker容器凭借其自身启动快,资
火灾对人类生命和财产安全有很大的威胁。因此,火灾的防范和早期及时发现对人类生命和财产安全至关重要,特别是对于学校、家庭和园区等其他一些可燃物密集场所。如今,涌现出了各种智慧消防系统,涉及到视频监控、可燃气体泄露检测、烟雾检测等等。有些消防系统主要依赖于各种传感器设备对相关场所的各个物理量进行监控,有些消防系统基于视频图像分析进行监控。如今的消防系统主要面临以下几个主要问题:首先是消防系统中对传感器
介绍了两矿一步法的反应原理,在分析两矿一步法于实际生产中的各流程后,发现并解决了在实际生产中的问题,通过总结两矿一步法十多年来在全国主要高纯硫酸锰和电解锰企业中的应用,完善了工业生产流程,验证了此法工艺成熟可靠,安全稳定,效果良好.
This work studies the fabrication and pressureless sintering of silicon carbide (SiC) refractories.SiC particles were adopted as aggregates,introducing different amounts (20%,30%,40%,50%,and 60%,by mass) of submicron SiC powder,adding resin as the binder