基于离散增量的混合推荐算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:qiuzhiye51
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网高速发展,各类信息渠道相互贯通,数据量呈指数式激增。以电子商务领域为例,商品条目以亿万计,用户的时间被大量地耗费在检索和筛选上。过量的信息远超出用户处理范围,从而造成信息负担;所以如何缓解信息过载问题是目前研究的一个热点。协同过滤算法是目前研究最深入、应用最成熟的一种推荐技术,是应对信息过载问题的高效手段。相似性度量是包括协同过滤在内的推荐算法的核心环节,极大地关系到推荐结果的精准度和算法的综合性能。而先前的很多相似性度量方法普遍受制于以下问题:一是典型的相似性度量方法仅利用共同评分项,数据利用率低,在数据高度稀疏环境下表现较差。二是仅依靠评分数据计算相似性,未考虑其他方面信息,容易造成误判。三是用户的评分行为带有习惯等因素,评分不能直接与满意度等同。本文针对上述问题提出了如下策略,主要包括:
  第一,设计适应稀疏数据的项目相似性度量方法。随着稀疏性的增大,愈难发现共同评分项,此时以共同评分为计算基础的相似性度量方法效率明显下降。本文引入生物信息科学领域的离散增量,依此构造了相异系数,提出了一种基于相异系数的项目相似性计算的方法,利用项目所有评分值的频数分布来计算相似性,摆脱了共同评分限制,有效缓解了数据稀疏性的影响。
  第二,构造多维度度量的项目相似性模型。典型的协同过滤算法只依靠评分值计算项目相似性,维度单一,度量的全面性不足,容易误将评分上相近但实际相差很大的项目判定成相似的。为减少误判、提高推荐精度,本文首先结合改进的Jensen-Shannon(JS)散度,将绝对数量因素纳入相似性度量中;接着,引入属性标签,依据标签计算项目在属性上的相似度;最终,提出融合分值密度、评分数量、项目属性的多维相似性模型。
  第三,构建能反映用户真实满意度的偏好模型。用户的评分行为带有主观性、习惯性,评分值不能直接等同于用户的实际满意度。针对此问题,本文基于波达评分理论构造了评分值转换为偏好的规则,接着加入用户习惯、评分倾向等因素对规则进行修正,得到最终的偏好模型。实验表明,现有的一些推荐算法使用本文模型转换后的数据进行计算,所得结果误差更小。
  第四,提出混合推荐方法。利用偏好模型获得偏好数据,作为聚类算法的输入,产生用户的最近邻居集;结合多维的项目相似度算法,产生项目的最近邻居集;最后,设计出混合利用两个邻居集进行预测和推荐的策略。
  本文提出的方法增强了对抗稀疏问题的能力、提高了推荐的质量,有较大的应用潜力。
其他文献
目的:1.观察生脉饮联合阿托伐他汀钙治疗糖尿病心肌病气阴两虚证的临床效果。2.探讨生脉饮联合阿托伐他汀钙对糖尿病心肌病大鼠心肌的保护作用。  方法:1.临床研究:选择符合糖尿病心肌病气阴两虚证患者60例,按随机数字表法分为两组,对照组、治疗组各30例。两组均给予常规对症治疗,对照组在常规治疗基础上给予阿托伐他汀钙片(立普妥)20mg/d;治疗组在对照组治疗的基础上,给予生脉饮口服,两组治疗期均为1
目的:  研究和探讨通腑法对脑出血急性期胃肠功能障碍的临床疗效,通过胃肠症状评分、神经功能缺损评分对比观察,做出客观、系统的评价,为临床治疗脑出血急性期胃肠功能障碍提供新证据。  方法:  将符合标准的60例患者随机分为常规治疗组30例和中药干预组30例,两组均予相同的西医综合治疗,中药干预组在辨证施治的指导下予调胃承气汤颗粒剂冲服。两组均进行为期两周的治疗,于入组当天治疗前、治疗14d时进行中风
目的:  探究鱼腥草挥发油和新鱼腥草素钠的体内外抗肺癌活性及其诱导A549细胞凋亡的相关机制。同时改善鱼腥草挥发油易挥发,生物利用度低的不足之处,制备包封率符合要求,长效缓释的PEG修饰鱼腥草挥发油脂质体。  方法:  本研究首先采用MTT法检测鱼腥草挥发油和新鱼腥草素钠对A549细胞的增殖抑制率。采用FITC-AnnerxinⅤ/PI双染法检测新鱼腥草素钠对A549细胞凋亡的影响,PI单染检测新
恶性肿瘤是目前严重威胁人类生命健康的头号疾病。表观遗传学在恶性肿瘤发生和发展的作用以及围绕其相关调控靶点的药物研发,已经成为抗肿瘤药物研发过程中的一个重要领域和分支。而在表观遗传学的众多成员中,组蛋白修饰无疑是最为热门的研究方向之一,组蛋白修饰在转录调控、基因组完整性和染色体稳定性方面发挥着重要作用。作为组蛋白赖氨酸去甲基化酶中重要一员,组蛋白赖氨酸去甲基化酶5B(Histone Lysine D
抗肿瘤免疫治疗即利用患者自身免疫系统识别清除肿瘤细胞,近几年在抗肿瘤治疗过程中展现出巨大的临床治疗潜能。相比于传统治疗方式,免疫治疗不仅对原发性肿瘤具有抑制作用,同时还可以对抗肿瘤转移,抑制肿瘤复发,因此免疫治疗是极具潜力的一种肿瘤治疗方式。随着恶性肿瘤的不断发展,肿瘤会通过多种机制抵抗免疫治疗,如何实现有效的个体化免疫治疗是抗肿瘤免疫治疗亟待解决的一个问题。本研究在纳米科技层面上,针对免疫治疗过
学位
胃癌是世界范围内最常见的恶性消化道肿瘤之一。中国每年约占全球发病病例的50%,已成为胃癌发病和死亡的重灾区。本研究以QTRAP-MS技术为主要分析平台,基于不同的研究目的,建立一套高效简便、灵敏度高、特异性强、重现性好的分析方法,并应用于胃癌细胞和血清代谢组学及抗肿瘤候选药物MDH-7的药代动力学研究,以期发现与胃癌诊断、治疗相关的代谢标志物群,开发具有自主知识产权的新型抗消化道肿瘤药物,这将对于
学位
肿瘤靶向药物的成功离不开对治疗靶点作用机制的深度认知。组蛋白赖氨酸特异性去甲基化酶1(LSD1,Histone Lysine Specific Demethylase1)是2004年发现的首个组蛋白去甲基化酶,可去除H3K4、H3K9的单双甲基及部分非组蛋白赖氨酸的甲基。已报道LSD1在前列腺癌、肺癌、乳腺癌、脑癌等多种癌症以及血液病中高表达,是多种癌症的潜在治疗靶点,目前已有多个LSD1靶向药物
学位
Nedd8,a core molecule of the neddylation pathway,was discovered as an ubiquitin-like molecule responsible for different kinds of regulation of its target proteins such as cellular localization,changes
学位
顾客满意度是衡量企业外部效率的关键指标,越来越多的企业特别是服务型企业逐渐建立起以顾客为导向的企业文化,并把追求符合顾客需求的服务内容和服务态度作为提高顾客满意度最直接有效的方法。服务型企业的员工作为直接接触顾客的个体,当企业现行的标准化服务不能满足顾客个性化和多样化的需求时,能够及时根据顾客要求进行适当创新成为服务型企业提高顾客满意度的关键举措。越来越多的管理者意识到组织内部人力资本的重要性,提
学位
近年来,随着互联网用户的持续增长,互联网经济蓬勃发展,互联网信息服务业逐渐成长为国民经济中重要的先导性产业,其在推动经济发展、创新社会管理、服务民生、繁荣网络文化、提高国家竞争力等方面发挥了显著的作用。与此同时,越来越多的互联网信息服务企业为了占领市场份额、追求最大的经济效益,开始通过产品附随扩散的方式进行跨领域竞争。在这一过程中,有的企业跨领域扩散很成功,例如:腾讯以即时通讯——QQ作为核心产品