先验知识辅助的Top-N推荐算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:shigaomin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网、电子商务、云计算、移动计算等技术的快速发展推动了大数据时代的到来,由此产生的信息过载问题严重地制约着人们对有效信息的获取。推荐系统的提出和应用,缓解了这一问题。事实上,广义的推荐系统已经被广泛运用于网购平台、新闻阅读、社区服务等场景,提升了用户体验,同时也为平台创造了价值。因此,推荐系统已经成为人工智能领域重要的应用之一。推荐算法的本质是基于对历史数据的学习,提供符合人们预期的物品。然而,目前的推荐算法对先验知识的应用并不充分,这在一定程度上制约了推荐性能的提升。因此,论文围绕设计推荐系统时有效结合先验知识的目标,分别从特征工程、模型结构设计、优化目标函数三个角度提出以直接或者间接的方式融合先验知识的推荐方法,从而为用户提供更准确的top-N推荐列表。论文的主要贡献如下:(1)提出了能够直接融合先验知识的推荐框架6)NND-nn,该框架结合了基于规则和基于K-近邻的数据驱动推荐方法。同时,该框架在提取特征时考虑了多个推荐子任务之间的联系,实现了面向多任务的协同特征提取。该框架中还包含了基于遗传算法的特征权重学习方法,通过为不同错误设置不同惩罚力度进一步提高了推荐结果的有效性。6)NND-nn框架成功应用于医疗方案推荐系统中。(2)从模型结构设计出发,通过考虑用户意图与用户偏好之间的差异,设计了能够模拟用户序列化决策过程的神经网络模型KAMem NN。该结构体现了用户具有层次化意图这一先验知识,使得模型能够学习更加精细化的用户画像;论文基于用户所处的分组动态变化这一先验知识,设计了能够动态评估用户分组以及各分组对其决策影响程度的神经网络模型LSUG。基于先验知识设计的模型架构KAMem NN和LSUG能够有效提高推荐的性能。(3)从推荐算法模型训练的目标函数的设计出发,借鉴不同算法在建模时各有其侧重点、可以进行结合的这一先验知识,提出了逐点预测类方法和排序学习类方法的集成学习框架CPL。该框架使得topN推荐系统关注物品排序的同时,也能兼顾到用户对物品的评分细节。同时,论文针对传统方法仅关注于单个物品排序的不足,提出了对物品集合进行协同排序的GTRM算法,在目标函数的设计中运用了相似物品具有相似排序的先验知识,使得模型在提升正样本位置的同时,也连带地提升了与之相关的潜在正样本的位置。CPL和GTRM使得训练得到的推荐算法模型更为合理。论文中提出的框架和模型在多个真实数据集上进行了实验评估,实验结果证明了所提出的考虑先验知识的策略有助于提高top-N推荐的效果。
其他文献
近年来,为满足配网负荷需求,提升供电可靠性、经济性,以及响应低碳经济的要求,用户侧建设了大量分布式发电、储能、需求响应资源。在国家政策扶持下,掌握各类用户侧资源资产或运营权的利益主体正在形成;然而,随着分布式资源补贴逐年下降,用户侧利益主体收益渠道单一,投资回收周期长的问题开始呈现。各利益主体迫切需要进入电力现货市场谋求收益。然而在市场机制上,用户侧各类利益主体所拥有的分布式能源规模小,无法参与电
学位
为了应对大规模可再生能源发电集成入电力系统所带来的巨大挑战,需要充分利用电力系统的灵活性。通过对发电侧、输电网和用电侧等环节的优化均可以实现电力系统的灵活性提升。本文的主要着眼于挖掘电力输送环节的灵活性,以实现电力系统的最佳运行。首先,提出了考虑最优线路开断(optimal transmission switching,OTS)的两阶段随机机组组合(Stochastic Unit Commitme
学位
建设资源节约型社会已经在世界范围内达成了共识,高效节能电机在新能源车中得到了大力发展和推广。为了进一步提升功率密度,驱动电机必然朝着高转速、高频率和高服役温度的趋势发展,制造工艺对电机磁性能和安全性能的影响更加显著,不合理的制造工艺参数容易导致电机铁芯发生结构破坏或使得电机效率过低。因此,研究制造工艺对电机磁性能和安全性能的影响规律对于改善电机性能,提升行业竞争力具有十分重要的意义。定子铁芯的制造
学位
<正>吴门医派是我国中医学流派中一个重要的学术流派,具有鲜明的地域性特色,对疾病的诊治独具特点。络病即络脉病证的简称,是由于各种致病因素导致的络脉功能和(或)结构发生异常的一类病证。络病理论萌芽于“内经”时代;汉代张仲景首开辛温通络,虫药通络,“络病证治”微露端倪;清代叶天士提出“久病、久痛入络”等创新性理论,使络病发病理论具体化,成为吴门医派核心理论内涵之一[1-3]。络病理论虽然广泛应用于内科
期刊
膝骨关节炎(KOA)是多种原因引起的退行性、不可逆转的骨关节疾病,是中老年人的常见病、多发病,严重影响中老年患者的身心健康与生活质量,加重社会的医疗负担。该病的发病机制十分复杂,尚不完全清楚,具有难治性等特点。近年来,在中医基础理论的指导下,中医药在慢性复杂性疾病中被广泛应用,尤其在治疗膝骨关节炎中已突显巨大优势。众多医家认为“肝肾亏虚、痰瘀伏络”是膝骨关节炎病机演变的关键环节,本文结合中医学“络
期刊
将可再生的农作物茎秆用于建筑材料的开发,有望实现建筑物真正的可持续性。近年来,得益于优异的调湿性和保温隔热特性,大麻等植物秸秆混凝土受到广泛关注。通常,植物骨料混凝土(PAC)采用石灰和传统波特兰水泥作为胶凝材料。由于水泥的高碱性,植物骨料与水泥相容性差,由此产生诸多缺陷,如延长凝结时间、成核位点的污染及在碱性环境下植物颗粒的溶解等。因此,制备的PAC力学性能和耐久性较差。为更好地制备PAC,研究
学位
高比例可再生能源并网是未来电力系统的重要特征。含高比例可再生能源的电力系统呈现运行方式多样、转动惯量下降、输配潮流双向以及交直流混合输电等新特性,给输电网规划带来新的挑战。本文结合鲁棒规划与随机规划理论,旨在研究解决高比例可再生能源输电网规划中的安全稳定与可再生能源消纳问题,主要工作如下:(1)针对高比例可再生能源导致的电网运行方式多样,提出了内嵌海量场景静态安全约束的输电网鲁棒规划方法。通过快速
学位
混合式教学以满足学生的需求为中心,满意度成为衡量混合式教学效果的重要指标。以小学生发展与教育心理学课程为例,重点考察了混合式学习的学生满意度及其影响因素。根据顾客满意度基本理论构建混合式教学的学生满意度模型,该模型包括学生特点、教师特点、课程特点、系统功能特点四个维度和19个自变量。对调查数据的分析显示,其中有4个自变量显著影响混合式学习学生满意度,并以此为基础提出以学生为中心、系统为辅助的混合式
期刊
大规模电动汽车的充放电负荷可能会给电力系统的安全性和可靠性带来挑战。作为智能化负荷,考虑到电动汽车用户行为的随机性、对电网充电容量的影响、电池特性及实时电价的变化,研究电动汽车(EV)的智能化调度及充电定价算法具有重要意义。本文主要分为两个部分。第一部分,针对多时间断面、非线性、动态及外源时变输入向量,基于先进的最优自回归神经网络(NARX),分析电动汽车充电基础负荷预测的精确度问题。为验证NAR
学位
电力设备是电力网络的基础组成单元,电力设备的安全运行对电网的供电可靠性有着决定性的影响。针对电力设备运行状态的在线监测不仅能够及时监测设备中的各类异常电气量以及非电气量,而且可以对电力设备的运行状态进行全面、系统地分析,及早发现设备中潜在的故障,近年来已被广泛研究。基于声电传感阵列的电力设备在线监测方法具有覆盖范围广、监测效率高以及抗干扰性能强等优点,已在部分变电站中开展试点应用。然而在实际应用过
学位