电子商务推荐系统中用户聚类问题与用户兴趣变化问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xiaoPhaiM
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤推荐技术是推荐系统中应用最广泛的一种技术,然而随着系统规模的逐步扩大,该技术使推荐系统的实时性与推荐精确性面临极大的挑战。针对实时性问题,基于K-Means用户聚类的协同过滤技术将算法分为离线和在线两个部分,离线部分将用户进行K-Means聚类形成簇,在线部分寻找用户所在簇并进行推荐。该方法使系统的实时性得到改善,但是本身却存在缺陷:算法需要初始划分并且初始划分的优劣直接决定聚类结果的好坏,另外算法聚类结果存在局部最优性,而这些缺陷势必影响算法的性能。于是,为了克服这些问题,本文提出了使用AntClass蚁群算法对用户进行聚类,该算法不仅不需要任何初始信息,而且算法参数设置简单,所以规避了算法本身的复杂性,使聚类过程更符合实际应用情况,聚类结果更合理。系统规模扩大给系统带来的另一个问题是用户的兴趣爱好可能会随着时间推移而发生变化。如果像传统协同过滤推荐技术那样使用所有历史评分数据,可能会影响推荐的质量,因为用户在很久之前的评分可能不再具有预测价值。针对这个问题,本文提出了将系统中的评分数据看成数据流,利用金字塔时间框架存储方式对其进行数据筛选,从而使历史信息中离当前时间越远的数据利用率越低,离当前时间越近的数据利用率越高。综上所述,本文针对系统中的数据流利用金字塔时间框架进行存储,再利用AntClass蚁群算法对用户进行聚类,形成基于AntStream用户聚类的协同过滤推荐系统。通过对比性实验证明,该算法能在保证实时性的基础上,明显的提高推荐质量。
其他文献
据统计,截至2011年底,我国60岁及以上老年人口约1.85亿,占总人口的13.7%。据预测,到“十二五”期末,老年人口将达到2.21亿;到2025年将突破3亿。同时,困难老人数量增多,80岁以上高龄老人超
百货店是零售业态之一,它的出现是零售业的第一次重大变革。从1852年,法国第一家百货店的诞生到现在已经有100多年的历史。在这100多年的时间里,百货店已经从一开始的创新期,
伴随着电子商务的快速发展,在线交易中的信用危机也日益凸显。在线交易由于信息的不对称和非人格化特性使得交易双方信任更难建立,信用问题已经成为阻碍电子商务发展的瓶颈之
【正】 当代中国电影对文化价值的追求,大约有七八年的历史了。而创作上的自觉,也许可以说始于张暖忻导演的《青春祭》。是她创造性地从数以万计的知识青年“上山下乡”的历
软件需求工程是包括创建和维护软件需求文档所必需的一切活动的过程,可分为需求开发和需求管理两大工作。需求开发包括需求获取、需求分析、需求定义和需求验证四个阶段,本文将
荣格的心理治疗思想是其理论体系的基石,是他进行各种各样研究的动机和目的,也是他在研究中不断回归的原点。荣格的心理治疗思想是以人格的自性化为终极目标的积极性心理治疗
国有资产是国民经济发展的命脉,是我国建设社会主义市场经济的重要物质基础。2008年十一届全国人大常委会第五次会议通过了《中华人民共和国企业国有资产法》,对于建立与社会
大型综合交通枢纽在实现各种功能的同时,如何打造便捷舒适的交通流线组织,实现车流、人流的快捷疏散,是规划设计中需要高度重视的问题。结合深圳北站综合交通枢纽工程的总体
目的:探索淫羊藿苷(ICA)对后肢缺血大鼠模型血管新生的作用及可能的作用机制。方法:动物实验采用单侧股动脉结扎并离断制备后肢缺血大鼠模型,实验随机分组:空白+ICA 40 mg/kg,
在经济全球化步伐加快,信息技术迅速发展的环境下,企业的采购管理的重要作用日益突显,已成为企业增强竞争力的重要手段。电子采购作为这种环境下发展起来的新兴采购模式,显示