心脏病电子病历中问答对抽取方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:wik2pwerq32
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
构建高质量问答系统的关键是构建高质量的问答对,在医疗领域问答系统的构建中,通过网络爬虫获取问答对难以保证知识的准确性,并且通过人工构建问答对难以保证构建效率。电子病历是半结构化文档,其中包含了大量的知识,通过分析病历结构,可以构造出一部分问答对,对于无结构的含有大量语句的文本,如何从这些文本中提取出问答对是本文的研究重点。因此本文针对医疗领域问答对的构建问题,提出了基于电子病历的问答对构建方法,并将该方法应用于心脏病电子病历中。本文提出的问答对抽取算法包含两个部分,答案句提取算法和问句生成算法。在基于特征选择的答案句提取算法中,本文将答案句筛选视为短文本分类过程,从心脏病电子病历中的陈述句集合中提取出答案句,为了提升对短文本的描述能力,本文通过结合信息增益、改进相似度计算公式,引入Apriori数据挖掘算法,提出了多层次特征选择与扩展算法,分别从陈述句集合本身和电子病历中提取特征。在基于深度学习的问句生成算法中,本文结合使用依存句法分析和基于Bi LSTM-CRF神经网络的命名实体识别算法,生成了疾病类问答对。在基于模板匹配的问句生成算法中,本文通过人工构建问句模板,使用基于Text CNN的分类算法,在embedding层融合心脏病电子病历的结构信息,将答案句分类到对应的模板中。并且,本文从关联度的角度对抽取的问答对进行评估,作为评价问答对质量的参考。最后,本文将上述算法应用于心脏病电子病历中,从心脏病电子病历中提取了包含专业知识,关联度良好的问答对,有利于日后构建高质量的问答系统。
其他文献
(R)-4-氯-3-羟基丁酸乙酯((R)-CHBE)是重要的手性中间体,利用羰基还原酶催化4-氯乙酰乙酸乙酯(COBE)发生不对称加氢还原反应制备(R)-CHBE是很有潜力的合成方法。文献调研发现存在高比活氧化还原酶但都申请过专利保护,并且目前鲜见对羰基还原酶进行分子改造以提高其催化活性的报道。本研究利用基因挖掘技术构建具有自主知识产权的高比活氧化还原酶,再对其进行分子改造和产酶优化,并构建了双菌
随着教育信息化时代的到来,微课作为课堂教学的重要辅助手段,对教育教学具有重要意义。普通高中思想政治课程标准中明确提出要充分利用现代信息技术,拓展教育资源和教育空间,实现课程资源共享。本研究回应课标要求,研究在思想政治课教学中有效应用微课的策略。本研究总共三部分,第一部分是思想政治微课相关理论研究。通过文献研究揭示思想政治微课的内涵、特点以及将其用于课堂教学的依据和意义。第二部分是微课在思想政治课教
近年来,人工智能已经成为全球讨论最热门的技术之一。无人驾驶汽车试行,智能机器人广泛应用于社会生产和生活各个领域,人工智能技术已经成功地融入我们的生活。人工智能的运用使我们生活变得更加便捷,社会生产效率快速提高,为世界各国带来巨大的经济和社会效益。与此同时,人工智能的发展也带来许多新的社会问题,如工人失业、公众安全等。本文从马克思异化理论的视角出发,研究人工智能在发展过程中所产生的问题,并提出了建议
售后服务是许多产品成功营销的关键要素。资本货物(例如制造设备)需要售后服务,通过维护和修理,使顾客从产品中获得全部价值。一些制造商已经开始向顾客提供成套的产品和服务,这被称为产品服务系统。售后服务是在购买产品之后发生的活动,它致力于协助顾客使用和在产品出现故障时提供维修服务。售后服务能够与顾客建立可持续的关系,增加客户的黏性,并极大地提高顾客满意度。如今,顾客满意度被认为是非常重要的,顾客满意是公
地震数据的质量是成像和解释地层的基础,但是噪声的存在会对后续地震数据的处理和解释产生严重影响,特别是在有效信号能量较弱的部分,噪声与有效信号严重的混叠,这使得采用常规方法恢复地震数据非常困难,尤其是部分噪声的频带与有效信号频带相互叠加,使得难以将传统的噪声压制算法应用于地震数据,因此,有必要开发一种有效的随机噪声压制算法,同时较好的保留有效信息。随着勘探目标的变化,水力压裂微地震逐渐成为了广大学者
车辆图像检索是研发公安视频大数据平台中重要的任务之一,其目的是从海量的图像数据库中快速、高效地找到与查询图像一致的车辆。近年来,基于内容的图像检索(CBIR)开始被大规模使用,当前深度学习方法成为CBIR提高车辆检索准确率的主流方法,主要利用深度神经网络对图像数据的强大表征能力来提升对车辆图像检索的准确率。尽管基于深度学习特征提取方法获得了一定的成功,但仍有一些不足:(1)目前网络上公开的大规模车
随着经济的发展,市场一直处在高速变化中,电商的崛起刺激着实体零售商发展,实体零售商急于创新,改变现状,以应对不断变化的市场发展。另外,客户的消费观念也正在发生变化,对所购买的服务和商品的要求越来越高,客户多样化的购物需求,同样刺激实际零售商的转型升级。综合超市作为零售业的典型业态,只有通过不断的创新,并保持客户满意,才能赢得竞争优势。而会员是零售业的重要客户资源,积累一批高忠诚度的会员,对于零售业
在我国畜牧养殖领域中,奶牛养殖是畜牧生产中的重要组成部分。奶牛体型评定成为国内外奶牛优化育种研究的一项重要内容,也是奶业生产中的核心环节。通过体型评定可以预测奶牛的产奶性能,同时还可以估测育种值,组织选配方案,进而能对奶牛的选种、选育和品种的改良起到指导作用,最终提高奶牛场生产效率和经济效益。传统的人工评定方法费时费力,效率与自动化程度均有待提高,接触测量也会对奶牛造成应激反应。基于二维图像的奶牛
当今社会已经进入数字化时代,越来越多的企业开始使用ERP系统来管理进销存等业务。但是随着ERP系统业务越来越复杂,用传统的模式开发也越来越困难,传统的开发模式已经无法快速响应市场的需求。此时敏捷开发模式的优势逐渐显现出来,敏捷模式开发采用小版本迭代,可以快速开发出适应市场的产品。本文介绍了项目、项目管理和ERP的相关理论,主要研究了现有开发模式在ERP项目的开发过程中遇到的问题,介绍了敏捷模式开发
竞品分析是产品设计运营时的常用手段,指对当前市场存在或潜在竞争产品进行深入分析,主要围绕产品定位、业务分布、发展历程、市场表现等方面进行分析,通过竞品分析找出产品差异,并从中挖掘出有效信息为企业作出科学正确的决策提供重要的依据。当前市面上的APP监控平台像七麦数据、艾瑞数据等,都是只能对APP的下载指数、搜索指数、下载量等指标进行分析,而无法对APP的界面数据进行收集与分析,因此需要功能更加全面的