面向微博的医学健康智能搜索的研究与应用

被引量 : 0次 | 上传用户:jiajia0321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的广泛应用,web上的数据信息正在呈指数级增长,因此,如何在这种海量级的数据中查找到目标信息并对其进行自动处理已成为当前重点的研究课题。现在信息速度急剧上升,以微博、微信等新媒体所产生的巨大的碎片化信息极具代表性,新的研究方向是将这些传统的领域知识与智能技术相结合,从而产生基于海量数据的智能搜索引擎。本文主要介绍web上微博信息的采集与存储、智能信息检索的原理及相关算法与实现、数据挖掘中聚类算法与应用等。利用新浪微博的API接口按照事先定义好的字段抓取相关内容,将信息批量存入非关系型数据库MongoDB中,利用Lucene4.0工具对MongoDB数据库中已存入的信息建立索引文件并存放在本地,使用carrot2开源框架与建立好的索引文件进行关联,carrot2是一个库包,利用它可以建立一个基于聚类的搜索引擎,只要向这个基于聚类的搜索引擎提供搜索关键词即可获得相关结果集,对返回的结果集使用Lingo聚类算法对其进行聚类操作,给用户展现树状形式的聚类结果图。通过上述实现的各个模块,并且伴随着生物医学模式向“生物-心理-社会医学”模式转变以及人们对健康的要求越来越高,人们的认识也从以疾病为中心转向以患者或人为中心。最终本文建立起面向微博的基于医学健康信息的智能搜索系统。本论文在最后对系统中聚类结果进行了优化操作,主要对系统中Lingo聚类算法所引用的字典文件以及停用词文件进行修正,可以得到优化后的聚类结果图。为了本文中实现的智能搜索引擎系统能够在未来应用中得到扩展,分析并提出了几点可以改进的意见,可以使系统在性能和功能上更加健壮、完善。
其他文献
<正>陶行知曾经说过:"在教师手里操着幼年人的命运,便操着民族和人类的命运",他们的言行与品格不仅引领着学生成长的脚步与后劲的勃发,更要担负起创新教育理念,提高国民素质,
近年来,与东方文明相结合的新闻理念在西方新闻学界日渐兴起,其中,对以东方宗教文明为核心的正念新闻的研究具有一定的变革意义,引起世界各地新闻学者的共同探讨。
目的考察秀丽隐杆线虫(C.elegans)是否适合作为一个快速初步评价药物急性毒性的模型。方法采用秀丽隐杆线虫野生型N2和突变型glp-4;sek-1线虫对药物毒性进行评估,通过监测在
目的 研究综合护理干预在小儿支气管哮喘中的护理效果及对生活质量的影响。方法 选取本院2015年1月~2017年2月收治的支气管哮喘患儿74例,按随机数字表法分为对照组与干预组,
为了提高公交停靠站通行能力计算方法的精确性,针对目前城市的公交运行现状,使用时空分布图分析了公交车在直线式停靠站的服务过程,在此基础上,综合考虑停靠站排队概率和停靠
随着生活水平的提高,人们对食品和营养的需求越来越多,天然的抗氧化肽在食品和医药领域中具有潜在的应用前景,并且越来越受到人们的关注。红花籽蛋白作为一种新型的蛋白资源,具有
对双向晶闸管的触发电路和过电压RC缓冲电路进行了研究和设计。经理论分析,本设计可以满足10kV电力用户有载调压的需求,具有广阔的发展前景。
目的:选择慢性乙型肝炎湿热蕴脾证患者,分别给予具有清热祛湿活血化瘀作用的茵芍散(导师经验方)和茵芍散去活血化瘀药物治疗,通过观察、比较两组患者治疗前后的临床症状、体征、肝
目的 探讨舒心口服液对冠心病心绞痛(属于中医气阴两虚兼心血瘀阻型)的临床安全性与有效性。 方法 采用随机双盲多中心平行对照的方法,选择气阴两虚兼心血瘀阻证冠心病心
随着国家出口法定检验目录大幅调减,原则上一般工业制成品不再实行出口法检,法定检验制度的重大改革,给原有出口商品检验监管体系带来极大的冲击。党的十八届三中全会吹响了全面