基于Lucene的医学知识搜索系统设计与实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:jpjxn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对信息库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎和普通的搜索引擎的最大区别是对信息进行了结构化抽取,也就是将信息的非结构化数据抽取成特定的结构化信息数据,垂直搜索就是以结构化数据为最小单位,将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。LUCENE是一个支持全文检索的开源工具包,它提供了查询引擎、索引引擎以及部分语言的分词器。在LUCENE提供的框架的基础上,可以方便地进行二次开发,轻易建立完整的桌面或WEB全文检索应用。随着国家信息化建设的不断深入,各行各业都加快了信息化建设的步伐,对于医学行业来说也是一样,海量的医学知识和信息多元化的增长,让医学行业不得不考虑如何快速有效的解决医学知识的管理,因此垂直搜索引擎的引入就成为了必然的趋势,再加上对于医学工作者的再教育和再学习和受打造全科医生的趋势影响,建立一套医学知识搜索系统就日趋迫在眉睫。论文结合一个医学知识搜索系统来介绍垂直搜索引擎在医学行业的应用。论文将搜索引擎应用到医学行业,是一个在LUCENE的基础上设计的专门针对医学行业的专业模型,论文分析设计了天爱医学搜索系统的主要功能模型,优化了LUCENE自带的索引机制,分词技术和搜索效率,并且结合医学领域特有的需求做了个性化的排序处理,且开发的系统无论从界面还是从功能都尽量做到让用户使用方便,搜索准确,系统现已设计实现,且得到医学行业的认可。
其他文献
图像的大部分信息都是从图像边缘感知的,人们观察一幅图像时首先认识到的是图像中物体的形状也就是边缘信息。边缘包含着图像中多种有用的信息,它是图像最基本的特征。边缘检
随着信息技术的飞速发展,特别是计算机互联网络和移动通信技术的推广应用,人们获取、交流和处理信息的手段发生了巨大变化。网络带来方便的同时,信息的安全性也日益严峻,信息在网
高强度激光通过非线性介质时,因受上游光学元件上的污点或缺陷等模糊斑调制,在下游会导致非线性热像的形成,热像强度可能达到光学元件的损伤阀值,从而造成元件的损坏。系统研究强
随着Internet技术的不断发展,企业对于信息的依赖已经到了前所未有的程度,信息化的快慢直接决定着企业的前途和命运,企业级Web应用的需求随之日益增多。为此企业级应用系统的多
微生物群体中包含着大量诠释人类健康、自然进化和生态构成等问题的重要信息,高通量测序技术使获取这些信息成为可能。通过对微生物群落的样本数据进行测序,产生了大量的宏基
随着数字化影像设备在医学领域中日益广泛的应用,医院每天都要产生大量的数字图像。如何有效地进行数字图像的管理,是实现计算机辅助诊断,达到“无纸化、无胶片化”的信息化
汽车是现代人类最重要的交通工具,是现代文明的标志。汽车的普及为人们的工作和生活带来了很多便利,但是随着社会和经济的发展,车辆越来越多,交通越来越拥挤,交通阻塞和车辆的失窃
随着社会信息化程度的发展,越来越多的场合需要对人的身份进行可靠地识别,传统的以密码方式进行身份认证的技术日益暴露出很多弊端。为确保信息安全,用人特有的生物特征作为
随着互联网技术和数字信号处理技术的飞速发展,数字媒体信息被广泛地应用到不同领域,数字媒体信息的安全问题也逐步成为不可忽视的事情。数字图像是数字媒体信息中应用最为广
作物病虫草害严重影响作物的产量和品质,针对作物病虫草害识别自动化程度不高,识别诊断不及时问题,应用计算机视觉技术对玉米生长期的叶部病害识别诊断进行研究,以常见的玉米