【摘 要】
:
随着医疗技术和生物科技的快速发展,生物领域的大数据急剧膨胀,数据的快速、有效检索成为了至关重要的问题。传统的搜索引擎在检索过程中,采用文本相似性作为相关度的计算指
论文部分内容阅读
随着医疗技术和生物科技的快速发展,生物领域的大数据急剧膨胀,数据的快速、有效检索成为了至关重要的问题。传统的搜索引擎在检索过程中,采用文本相似性作为相关度的计算指标,但是这一方式无法检索出文本不匹配但相关的信息。本文针对该问题,在疾病本体及其相关数据的搜索问题中,设计并实现了基于本体的疾病关联搜索方法。本文考虑到疾病及与之相关的数据之间的关联关系,将其抽象为加权异构网络,通过定义网络中的路径、路径分数等概念,将搜索相关度最高的若干条数据这一问题转化为在网络中,找出从搜索关键词节点出发,分数最大的若干条路径这一最优化问题,并提出和证明了基于贪心策略的算法实现思路。同时,本文在计算路径分数时,引入了节点类型间的偏好度这一概念,通过设置不同的偏好度,可以满足不同用户不同的搜索需求。最后,本文结合众多医学数据库,构建了疾病本体及其相关数据的知识网络,并在其上实现了基于本体的疾病关联搜索算法,在实现的过程中,为了提高性能,引入了若干优化操作。为了更加直观清晰的展示搜索结果,本文实现了基于浏览器-服务器架构的网页展示形式,并对搜索结果进行展示和分析。搜索结果表明,关联搜索算法取得了良好的效果,达到了预期的需求。
其他文献
随着计算机技术的飞速发展,在计算机视觉领域内的图像处理和模式识别等技术也逐渐变得更加完善,其中检测问题也是图像处理等领域大多数学者研究的主要问题之一,并且在实际生
远程医疗是将计算机、多媒体、通信、网络等技术与现代化医疗技术结合起来,为了提高医疗诊断水平、降低医疗费用、满足众多特殊人群的需求而产生的一项全新的医疗服务模式。
交通流参数检测是智能交通系统的重要研究内容之一。基于视频的交通流参数检测具有信息含量丰富、设置灵活、成本低等优点,目前已成为国内外的研究热点,有着广阔的应用前景。
大数据计算框架Spark运用内存空间极大提升了任务的执行效率,但由于内存空间的局限性,Spark任务常常因为内存瓶颈导致执行效率低下,甚至任务失败,这与框架本身的缺陷和RDD(Re
TTCN-3语言越来越多地被应用于协议一致性测试中,TTCN-3的图形化表示给用户提供了友好的图形化描述手段。标准的GFT标准只能够描述测试逻辑对应的图形化表示,自动生成的测试
目前云计算已经大量出现并逐渐成为一种主流的计算范式,市场上将云平台作为主要IT基础设施的公司正在逐渐增多,这些趋势使得云计算的核心价值从最初的降低成本逐渐向具有敏捷
伴随生物医学数据得到爆炸式增长,快速发展的生物信息学也在不断剖析这些数据背后隐藏的信息,相关研究已成为热点。识别致病基因是人类健康研究的根本挑战,针对识别致病基因
目前WAF(Web Application Firewall,网站应用防火墙)设备应用得越来越广泛,它能够较好地阻止Web应用层面的攻击,并满足我国信息系统安全等级保护第三级别的要求。不过对于三
随着互联网技术的发展,恶意软件的传播越来越广泛,使得系统安全受到威胁,其中有很大一部分原因是因为越来越多的程序变为不可靠的可疑程序。这些程序没有通过安全验证。当前
随着社会的发展,人们已经不满足于只给出一个总分的成就性测验,而是希望能从被试的实际作答反应中获得更多有关被试认知结构的信息,以便对被试做出更具体更客观的评价,并且给