基于医疗知识图谱的探索式搜索研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:ghw0531
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网、移动互联网的成熟与发展以及网络数据的爆炸式增长,如何从海量信息中快速、方便、准确的获取需要信息是一个具有挑战的问题。而目前主流搜索引擎的“查询-应答”式的一次性交互模式难以满足用户便捷探索知识的需求,为达到探索目的,用户不得不分析、理解查询结果,并修正关键词再次进行查询。这一过程效率较低,并且需要用户自身使用一定的搜索策略,才能达到预期的目的,因此导致用户体验较差。而这些搜索策略由搜索引擎通过一定算法实现,使其对于用户透明。另外,产业信息化的进程使得生物医学领域的各类信息资源都以数字化存储形式下来。其中蕴含的大量的信息为人类医学的进步提供了助力,但如何从中挖掘出关键信息,便于医学研究者利用好海量信息资源找到感兴趣的研究点也是亟待解决的问题。医学信息检索需要有医学背景知识,利用知识图谱将专家知识保留并加以处理,是将领域数据用好的一个途径。因此,本文针对上述的一些问题,做了如下几点创新性的工作:(1)为弥补一次性交互模式的不足,我们利用共现关系构建了语义图谱,将知识概念通过语义关系关联起来,方便用户快速浏览知识网络。另外,我们提出了一种新颖的基于图谱的挖掘多目标关联关系的探索式搜索算法,通过扁平化压缩图谱和逆扁平化解压图谱操作,能快速、有效的从图中搜索出多个目标之间有较强关联的节点和路径,以推测用户的搜索意图。并实验结果得到,我们提出的方法挖掘的关联关系较其他方法更好。(2)将医学文本作为研究对象,分别基于Medline引文数据和CT影像报告文本从不同关系粒度上构建了知识图谱,提出了一种相对共现关系具有更细粒度的基于CRF和规则推导的知识图谱构建方法。测试发现在不同粒度图谱中,挖掘出的实体之间关联关系在不同应用场景下都具有较好的效果。(3)构建了医疗信息的探索式搜索引擎的原型系统,我们在系统中采用了基于边的索引机制,便于关系集合的运算。并提出了一种高可扩展性的分布式关系抽取算法,提高系统计算吞吐,以适应海量数据需求。
其他文献
<正> 柑橘类果树落果严重,往往满树花的植株,最后一个果都不剩。落果一般有两次,第1次在花后,带花梗脱落,第2次幼果脱落在蜜盘处,不带梗脱落。作者经多年试验观察,找出几点对
期刊
随着社会的创新和发展,人们对于高校体育健康教学活动的必要性和有效实施性都有了更多的认知和重视。高校是培养高素质、全方位综合性人才的摇篮,特别是伴随着素质教育的快速
<正>1阿根廷成交价:深色蜜2 700美元/t;浅色蜜2 850~2 900美元/t。报价:深色蜜2 900美元/t;浅色蜜3 000美元/t。欧盟进口关税17.3%。阿根廷出口税10%,对所有目的地。对美国市
甘肃省"十二五"以来的环保统计数据显示,目前甘肃河流污染形势依然严峻;饮用水水源地水质未全部达标,水源存在安全隐患等问题;排放工业废水中化学需氧量平均浓度449 mg/L,氨
自尊作为自我结构的重要组成部分,对处于心理发展关键期的中学生尤为重要。本文运用罗洛梅的存在主义心理学的观点,将中学生的低自尊姿态总结为四种类型,并对低自尊中学生群
美国黑人女作家托尼·莫里森在其小说《宠儿》中生动逼真地痛述了奴隶制下黑奴们所遭受的非人待遇以及滞留在他们心灵上的深重创伤。在黑奴制废除多年后,广大黑人民众仍无法
<正>对中国近代史稍有涉猎的人都知道,来自英国的罗伯特·赫德是个轻易绕不开的人物。他在十九岁那年(1854),抱着去东方传播上帝福音的念头从北爱尔兰乡村来到中国,担任宁波
<正> 强制拍卖船舶是海事审判领域的一项别具特色的法律制度。它是指海事法院依法对船舶实施保全措施以后,在一定条件下依申请人申请或依职权,经过一定程序,运用司法强制对被
分析高职体育教育的地位,指出职业素养培养对于促进高职院校体育教学改革的重要性在于能契合高职院校人才培养工作的基本目标、增强人才培养工作与社会需求的适切性、辅助学
从目前我国大学出版社运作情况看,出版教材教辅为大学教学服务的职能得到了较好的发挥,而在学术著作的出版上努力还很不足,甚至有出版不力的现象。但是大学出版在学术类图书