中文医疗知识图谱半自动化构建研究

来源 :武汉科技大学 | 被引量 : 9次 | 上传用户:room_yuy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
百度指数发布的《中国网民科普需求搜索行为报告》表示人们最关注“健康与医疗”科普主题,但是目前大部分有关医疗的语义搜索、查询理解和自动问答都需要依赖于其背景知识图谱,才能很好的帮助用户快速地从海量非结构化文本中获取到感兴趣或者切合需求的知识。因此本文针对中文医疗知识图谱的半自动化构建进行研究,希望找到有效的构建中文医疗知识图谱的方法,构建领域知识图谱,解决上层应用依赖底层知识的问题,从知识层面上为用户提供有效的、较完备的以及可靠的医疗领域信息。本文研究成果主要包括:1.针对医疗领域网站中实体属性关系往往分布在不同的页面的特点,本文提出了一种面向实体属性分离存储的自动化关系抽取系统。本系统不仅可以完成分离存储的实体与属性关系抽取,还能够兼容常规的单页面级别的关系抽取,可以作为初步医疗数据收集和处理平台。实验结果表明,该方法有很高的准确率。2.针对实体的属性关系描述数据包含非结构化文本问题,提出基于卷积神经网络的弱监督关系抽取方法实现实体对关系的进一步挖掘,完成知识图谱的知识补充。主要方法是将实体的描述数据转换成句子级别的实体描述,使用弱监督方法生成包含该实体及其属性关系对应实体的正样本训练数据,基于卷积神经网络方法进行关系分类,达到关系抽取的目的。实验结果表明,该方法有很高的准确率。3.设计和实现了中文医疗知识图谱半自动化构建的系统架构,并提供可视化的医疗信息查询和展示页面。
其他文献
自从20世纪60年代MRP(物料需求计划)在美国出现到现在,以物流技术为主的供应管理系统也日趋成熟。但随着市场竞争的加剧,使得企业也不得不跟随市场的需求变化而变。如何在当
企业服务总线(Enterprise Service Bus, ESB)支持异构环境中的服务、消息以及基于事件的交互。Web服务客户端为企业服务总线中集成的服务调用提供了一种能力。然而,现有的Web
传统的计算机体系结构中,运算单元一般可以分为两类:一类是通用处理单元,该类运算单元依循特定指令集,通过软件编程方式进行运算,其特点是通用性强但性能不高;第二类是采用ASIC
遗传算法是一种基于概率导向的随机搜索算法,已被成功地应用到多种学习任务和最优化问题中。对于遗传算法,策略(包括算法流程、算子及其控制参数)的设计和选择至关重要,会对
随着语义Web技术的标准化,关联数据在各领域得到广泛推广和应用,使得关联数据的发布达到空前规模,这导致了关联数据的存储和传输难度增大。通过压缩技术减小关联数据体积的方
图像的超分辨率重建是指从相同场景的单幅或多幅低分辨率图像中重构出一幅包含更丰富细节的高分辨率图像的技术。这一技术突破了硬件成像系统的限制,经济且有效地提高了图像
当今的大数据应用往往具有一个共同的特点,同样的计算往往在不断变化的数据上重复执行,例如社交网络数据和网页数据。在这些应用中只是少量数据发生改变,如果重新计算则工作
近年来,随着互联网和分布式计算的发展,海量数据处理的性能有了很大提升。在许多应用领域中,都需要从海量数据中提取出增量数据来满足某种业务需求,尤其是对于不断更新的源数
企业的信息资源具有分布式和异构性等特点,随着通用数据访问提供多源、异构数据源的统一访问方式,用户通过统一访问接口可以访问数据源中的数据,继而通过可视化建模工具对数
鉴于传统语音应用系统获取信息手段单一、信息量少、成本高等缺点,本文在分析SIP协议和VoiceXML技术的基础上,采用软交换技术设计并开发了基于SIP协议的语音浏览器,实现电话