基于协同过滤的健康知识推荐系统的研究与应用

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:zxjz520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今互联网应用地迅速崛起,广大用户很方便地接收到来自各种应用渠道的大量信息,对信息的需求得到了极大地满足。互联网信息数量激增随之带来的信息过载问题使得互联网信息的利用率降低,用户越来越难以快速地找到自己想要的信息,推荐系统的提出就是为了解决这个问题。协同过滤推荐算法是业界应用最为广泛的推荐算法,该推荐算法能够根据用户在系统中已经产生的行为数据来分析用户的兴趣特征,为用户产生个性化推荐结果。本文立足于实验室“智慧医疗”项目需求,将协同过滤推荐技术应用于健康知识领域。由于每个用户自身健康状况以及关注的健康类别不同,导致每个用户需要的和感兴趣的健康知识也是不同的,因此,从大量的健康知识中,找出用户喜欢的健康知识是非常必要和有意义的。基于以上项目背景以及技术调研,本文开展了如下工作:(1)详细了解推荐系统和推荐算法相关理论知识;重点研究协同过滤推荐算法的工作原理、组成部分以及开源实现框架Mahout的相关实现模块;对基于协同过滤的健康知识推荐系统的功能模型和存在问题进行分析,提出本文的两项重要工作内容。(2)对传统的协同过滤推荐算法的关键问题进行研究,提出对冷启动和数据稀疏性的改进办法;重点引入本文使用的用户兴趣特征模型、健康知识属性特征模型和用户对健康知识的兴趣度模型,提出基于用户兴趣度的改进协同过滤算法,是本文的创新点。该算法通过分析用户兴趣特征数据和健康知识属性数据,结合用户的历史行为数据来综合分析用户对健康知识的兴趣度,改进了传统协同过滤算法的不足,能够得到质量更高的推荐效果。(3)阐述系统的设计目标、需求分析以及架构设计。本文包括四个功能模块:用户界面模块、日志收集模块,推荐引擎模块和数据存储模块。日志收集模块获取用户界面模块所产生的用户行为记录,为推荐引擎模块提供初始的数据源;推荐引擎模块提取日志记录,采用离线数据计算和在线数据处理相结合的推荐流程,实时响应用户需求,为用户推荐其感兴趣的健康知识。(4)结合Mahout,完成了健康知识推荐系统以及改进算法的实验;使用MAE和覆盖率评估标准对改进算法的实验结果进行评价。
其他文献
基于视频分析的智能视频监控是计算机视觉与模式识别领域的一个重要研究方向,也是近些年来很受重视的一项技术。伴随着公共安防需求的不断增加,滞留目标检测已经成为智能视频
由于可变形体仿真广泛的应用领域,它在计算机图形学中变得越来越热门。这类仿真被广泛应用于计算机图形学动画中,例如电脑游戏中布料的模拟,医学手术训练系统中人体软组织的
数据挖掘的大多数算法主要研究问题是发现“大模式”,孤立点发现算法是用来发现数据集中“小的模式”,孤立点是指数据集中那些偏离其他的观测值以至于被怀疑为从不同的机制产
人体肝脏的数字化模型是数字医学和图像分析领域的研究热点之一,近年来备受研究者的关注。肝脏数字化重建的目的是将医学成像获取到的数字图像通过计算机技术实现可视化,为肝
由于现实世界的数据大多存放在关系数据库中,近年来多关系数据挖掘受到越来越多研究人员的重视,而多关系分类和聚类都是多关系数据挖掘中的重要技术。在进行多关系分类时,由于关
在计算机世界,尤其是图形学的动画制作中,渲染过程是最后一项非常重要的步骤,可以实现人们想要实现的、逼真的视觉效果。随着人们对视觉效果的要求越来越高,基于物理的流体渲
在数据网格环境中一个文件可能有多个副本,这些副本通常数量级大并且是分布存储的,因此当计算结点在远程调用某个文件时需要对该文件的众多副本进行优化选择。本文在深入研究
大容量存储设备和数字化设备的出现和广泛使用,以及多媒体技术和网络技术的迅速普及,导致互联网上的图像数据海量增加。如何迅速、准确地从浩瀚的图像库中检索到所需要的图像
在软件工程中,软件成本估算与需求分析并列,是软件开发成功最重要的两个因素。软件成本估算是将用户需求和软件项目开发联系起来的重要桥梁。软件成本估算是软件成本管理和制定
早期基于文本的视频检索需要耗费大量的人力,而且由于人的因素,对视频的描述信息及其提取的关键词都具有很强的主观性。因此,基于内容的视频检索技术成为了近年来视频检索的