论文部分内容阅读
随着信息技术的发展,信息过载问题严重,用户需要耗费大量的时间和精力寻找满足需求的信息,信息生产者绞尽脑汁为用户提供的推荐信息难以获得用户的青睐,用户体验差。如何从海量数据中快速精准地筛选出满足用户需求的信息便是一件极富挑战性的任务。推荐系统的迅猛发展为解决这些问题提供了可能。推荐算法常借鉴机器学习、深度学习领域的方法,获得了快速发展,同时也促进了其他领域的发展。本文对推荐算法及应用进行研究,将增量式频繁模式挖掘算法EFUFP(Efficient Fast Updated Frequent Pattern Tree Algorithm)与深度学习模型WDL(Wide and Deep Learning)相融合,提供自动化交叉特征的学习。并将特征间的结构学习引入到WDL模型中,建立一个混合推荐算法FWDL(Frequent Wide and Deep Learning)模型,在此基础上构建一个医疗健康知识推荐系统,为用户提供医疗健康相关知识的个性化推荐服务,节省其获取有效信息的时间。为了达到该目标,本文主要内容如下:1.分析了推荐算法及频繁模式挖掘算法的发展现状,探究了深度学习在推荐领域的应用及其优势,重点分析了WDL推荐模型。2.提出了基于支持数的增量式频繁模式挖掘算法EFUFP,完成了大规模数据下频繁特征的高效挖掘,并将其应用于推荐系统中,进行频繁项挖掘以及关系挖掘的工作。3.基于EFUFP算法和WDL模型,提出FWDL算法,从而将频繁模式挖掘与深度学习相融合,建立了一个混合推荐模型FWDL模型。该模型提供了自动化频繁交叉特征及关系的学习,无需人工特征工程的工作。4.分别对EFUFP算法及FWDL算法的性能进行验证,在多个数据集上进行对比实验。结果表明,保证正确性的前提下,EFUFP算法的运行效率,本地环境下提升10.7%以上,Spark平台下提升26.8%以上。FWDL算法与原有模型相比,AUC提升1.16%,准确率提高1.22%,召回率提升2.76%。5.基于以上研究,设计并实现了基于Android端的医疗健康知识推荐系统,搭建了健康知识传播平台,检验了 FWDL算法的精准推荐应用能力。该系统可为用户提供高效的个性化推荐服务,节省了用户在医疗健康相关知识的访问和搜索时间。