基于半监督学习的推荐算法研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:reg8c4user
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤推荐方法计算用户相似度时存在计算单一问题,并且随着用户数量增加计算量变大,同时也没有充分考虑用户偏好和用户对物品的标记信息对推荐结果的影响。为缓解以上问题,本文提出一种基于半监督混合聚类的协同过滤推荐方法,使用半监督聚类的方法确定相似用户,能够提高推荐的效果。主要内容如下:1.为有效融合有标记数据提高聚类精度,利用人工蜂群算法进行半监督聚类,提出了一种半监督人工蜂群聚类算法SSABC,设置权重参数来平衡标记数据与无标记数据的比重,并据此重构目标函数确定聚类中心点。使用自适应学习机制为权重参数赋值,同时结合聚类算法,提出了参数自适应学习的半监督混合聚类算法APL-SSHC。最后基于UCI数据集和MovieLens数据集,分析研究APL-SSHC算法的聚类效果,目标函数值逐步变小,F-Score值增大,将其与若干已有算法进行对比,以准确率为度量标准,实验表明APL-SSHC算法较其他算法的聚类效果更优,具有更高的准确率。2.基于APL-SSHC算法,提出一种基于半监督混合聚类的协同过滤推荐算法SSHC-CF。该算法首先利用APL-SSHC聚类算法对用户聚类,在目标用户所属类中确定其相似用户,多维度考虑用户的属性,更准确的找到目标用户的相似用户集合,克服计算用户相似度单一的问题,提高推荐算法的效率。3.考虑用户偏好对推荐结果的影响,提出一种基于半监督混合聚类与用户偏好的协同过滤推荐算法UP-SSHC-CF。将隐含狄利克雷分布(LDA)模型应用到用户、物品、标签的关系分析中,计算用户选择不同物品的偏好概率,利用APL-SSHC算法确定目标用户的相似用户集合,找到相似用户偏好概率较大的物品,形成推荐列表。基于MovieLens数据集,将SSHC-CF算法和UP-SSHC-CF算法与其他推荐算法进行对比,具有更高的准确率和F-measure值。
其他文献
通过对本院妇产科门诊1592例女性性传播疾病回顾性分析,了解本地区女性性病患病特征,为制定治疗措施提供参考依据。报道如下:
目的探讨腹腔镜辅助下阴式子宫切除术(LAVH)的临床应用价值。方法对121例需行子宫全切术的患者,按入院先后随机分为两组:A组(LAVH组)61例,B组(TVH组)60例。A组行LAVH,B组行单纯阴式
目的探讨新型农村合作医疗制度实施前后我院剖宫产率变化趋势及可能原因。方法回顾性分析我院新型农村合作医疗制度实施前(1999-2004年)后(2005-2010年)共12年住院分娩的孕产妇病
腱/韧带是坚韧的结缔组织,它们通过其结构、力学性质和外形的变化以响应外力的刺激,在运动中起着重要作用,但活动范围超过极限或拉扯过剧,腱/韧带常常会受到损伤甚至断裂,严
《中国乡村医药》第三届编委会暨专家委员会成立大会于2012年12月5日在北京召开。出席本次会议的领导、编委、专家和新闻记者共70余人。会议由杂志社社长兼总编辑朱宝铎主持
一、前言合成氨生产系统的6L2K型氮氢气压缩机机,其主电动机功率为5000kW,主轴转速为125r/min,排气量为19400m3/h。机组结构如图1所示,一、二、三级为低压侧,四级前、四级后
期刊
GKH型虹吸刮刀卸料离心机是粉体加工中的关键生产设备,主要用于脱水工序。该设备不仅具有过滤离心机的全部优点,而且利用虹吸原理增加离心过滤的推动力,提高了生产能力,降低了滤
目的探讨持续质量改进(CQI)在临床医务人员标准预防行为(手卫生、戴手套、使用防护用品、锐器及伤口处理)管理中的应用效果,以提高标准预防行为依从性。方法收集资料评估目前现状
目的 研究抗环瓜氨酸肽(CCP)抗体和类风湿因子(RF)检测在类风湿关节炎(RA)诊断中的临床价值.方法 采用酶联免疫吸附试验(ELISA)、速率散射比浊法分别检测RA组87例、非RA组80例和健康