基于深度学习的领域智能问答系统设计与实现

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:eire
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的不断发展,自然语言处理的相关研究与应用在人类生活中发挥着越来越重要的作用,信息检索便是自然语言处理中的重要技术之一。而在信息检索中基于关键词的中心化检索技术已逐渐无法满足人们获取目标信息的需求。相比之下,智能问答系统因结合深度学习等方法可准确识别文本中关键实体以及用户意图,这样使得返回结果更加符合用户需求,且回复效率更高,结果也更为准确。本文将以医药领域切入,构建基于深度学习的领域智能问答系统。通过深度学习模型可识别用户输入文本中的关键实体,并有效识别用户提问意图,结合系统所构建的大型医药领域知识图谱完成信息检索及语义槽填充,返回用户正确答案。本文主要工作内容和创新点包含以下四个方面:(1)构建数据丰富的医药知识图谱。领域知识图谱作为系统的数据支撑,通过爬虫技术在公开医药网站进行结构化数据获取,并采用数据清洗、Schema定义、知识存储等方法完成医药知识图谱的构建,知识图谱中包含实体、属性、关系等信息五十余万条。(2)提出面向实体识别任务的融合模型BiLSTM-CRF-Attention。本文在基准模型BiLSTM-CRF的基础上,充分利用问句中关键实体的上下文特征信息,并引入注意力机制中的并行头用于多次计算和学习文本序列在不同子空间上的信息,得到新的融合模型BiLSTM-CRF-Attention。本文将其与基准模型进行对比试验分析,以验证模型的有效性与可行性,选择性能最优的BiLSTM-CRF-Attention模型作为应用。(3)提出面向意图识别任务的融合模型BERT-TextCNN。本文在基准模型TextCNN和BERT的基础上,充分利用二者局部特征提取能力和全局学习能力,得到新的融合模型BERT-TextCNN。本文将其与基准模型进行对比试验分析,以验证模型的有效性与可行性,选择性能最优的BERT-TextCNN模型作为系统应用。(4)结合以上创新方法,设计、构建与部署基于深度学习和医药垂直领域知识图谱的智能问答系统。系统主要由数据层、业务层和交互层组成。数据层以知识图谱作为数据支撑,业务层以语句解析模块和答案检索模块作为核心。交互层通过实现系统后端数据与微信间的通信,以微信聊天界面作为问答界面,实现了人机交互,支持用户进行医药领域问题咨询并返回优质答案。
其他文献
目的:通过许尤琪教授治疗非小细胞肺癌的经验总结,整理其用药特点和用药规律,经统计分析探讨其在改善临床症状、提高生活质量以及配合放化疗、靶向治疗方面等减毒增效作用的研究,为中医辨治提供新的思路及方法。方法:本研究收集江苏省第二中医院2018年9月到2020年8月记录完整、符合非小细胞肺癌纳入标准的病例,将患者姓名、性别、年龄、就诊日期、病例分型录入SPSS 26.0数据库中,进行基本信息频率统计;运
学位
目的 研究脾虚湿阻型类风湿性关节炎患者的舌象特征,分析其与相关因素的关系,为今后脾虚湿阻型类风湿性关节炎的临床辨证论治提供参考。方法 选取125例符合脾虚湿阻型类风湿性关节炎研究标准的患者作为本次的研究对象,记录其性别、年龄、病程、家族史、病情活动指标等一般信息,通过数码相机拍摄患者的舌象,计算机分析RGB量值的方式计算RGB的构成比例,对舌苔的厚薄和腐腻程度进行量化,分析血沉、C反应蛋白、类风湿
学位
协作学习活动强调学生与同伴针对特定的主题开展协作,通过共同学习达成学习目标。学生通过协作不仅能达成知识技能的增长,还能锻炼沟通表达能力等。文献研究及课堂观察发现,协作学习活动存在以下问题:学生对知识的加工深度不够,仅存在于转述与分享层面;学生讨论积极性不高,课堂沉默现象较多;在协作过程中学生处于浅层学习阶段,学习效果有待提升等。如何使学生从浅层学习走向深度学习是教学研究需关注的关键问题。基于此,本
学位
数字教育资源建设是教育信息化的基础工程之一。在“互联网+教育”环境下,基于个性化的优质数字教育资源诉求与适切的学习资源和服务供给之间的矛盾日益凸显,现行教育资源“供需”出现结构性失衡。利用平台模式实现资源的众筹众创可以有效改变传统数字教育资源自产自销的服务模式,改善资源供需的瓶颈问题,从而为教和学提供海量的学习资源及服务,实现教育专用资源向教育大资源的转变。但是,在众筹众创模式下,如何设计众筹众创
学位
在信息时代网络环境下,开启了新一波的知识传播浪潮。获取、传递信息变得快捷,但同时也带来信息过载的挑战。在海量的信息中淘选出有价值的信息,需要耗费极大的精力和时间。由此促进了知识服务行业的兴起和发展。拥有大量用户群体的微信,也推出微信公众平台,作为新形势下开展在线知识服务的重要平台。在“互联网+教育”新生态下,将微信公众平台嵌入教师培训的应用也逐步开展研究探索。本文通过搜集、整理已有的文献和研究,对
学位
随着学习者对在线学习需求的增长,越来越多的教育资源平台和在线学习平台得到发展。面对呈爆炸式增长的学习资源,学习者在线学习时难以找到符合自身认知水平和当前知识体系的学习资源。并且学习者的在线学习偏好往往被忽视,导致其对于学习资源推荐的个性化需求无法得到满足。通过对当前在线学习平台中学习者遇到的问题以及个性化推荐的难点分析,提出个性化学习资源推荐策略。首先,基于知识图谱在教育领域对知识点的结构化组织功
学位
在健康中国背景下,深度发掘民族传统体育项目在健康中国建设中的潜力,有利于中华民族优秀的传统体育项目发展,也有利于传承和弘扬优秀的民族传统文化,增加我国文化软实力。空竹是中国民间传统体育项目,具有1700年历史,也是我国国家级非物质文化遗产,在健康中国背景下探索宁夏空竹项目发展的现状以及分析空竹发展存在的弊端,深入剖析宁夏地区空竹开展现状及所受的影响因素,发展当地空竹项目,更好的推动健康中国的建设。
学位
核心作者是学科领域发展中起着重要作用的研究者,识别、评价核心作者一直是关键性研究问题。在学科知识网络中,作者与主题的关联关系在语义层面揭示了作者的研究兴趣及知识创新,依据核心作者的网络特征展开影响力研究,不仅能揭示核心作者在网络中的地位,还能从主题语义层面评价作者的学术影响力,对探究学科研究动态具有重要的支撑作用。人工智能强大的数据分析和处理能力为图书情报学带来了新的机遇和挑战,厘清图书情报领域的
学位
多谷物复合营养粉因营养丰富、食用便捷、低热量、高纤维、易饱腹等优点而受到消费者青睐,并且作为一种新营养型方法针对患有肥胖症、糖尿病等慢性非传染性患者进行临床治疗,效果显著,发展形势良好。对多谷物复合营养粉的相关研究进行概述,包括多谷物复合营养粉的预处理技术以及多谷物复合营养粉的研究进展,并对未来多谷物复合营养粉的发展前景进行了展望,以期为谷物食品的深度开发提供参考。
期刊
随着教育信息化的不断发展,越来越多新兴技术应用在课堂教学活动中,这些技术为教学研究提供了海量、多维度的信息,但同时也使师生获得的信息呈现“爆炸式”增长。通过文本摘要技术对课堂记录文本的核心内容进行提取,生成一份简明扼要的课堂纪要文本,能够显著提高师生获取信息的效率。教师可以通过课堂纪要分析教学过程,针对性地调整教学策略,提升教学质量;学生可以将课堂纪要作为每节课的内容大纲,回忆、整理和归纳所学的知
学位