基于奇异值分解和k-means聚类的电子商务推荐算法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:thirdeyes
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的大规模覆盖和电子商务的飞速发展,不断膨胀的网络信息量和网络资源,将用户带入了一个信息过载的时代。伴随着持续增长的海量信息,网络用户无法迅速地找到自己真正需要的部分。如何从海量的资源中主动为用户定位和推送其可能感兴趣的内容是当前推荐系统的主要任务。推荐系统的最大优点在于能够快速推送用户真正感兴趣的资源,缓解了信息检索的压力。目前,在众多的推荐技术中,协同过滤推荐是其最为成功和应用最为广泛的推荐技术。在协同过滤推荐研究领域中,主要涉及的模型问题多数是数据的稀疏性和可扩展性,以及推荐精度的问题,而k-means聚类算法是一种无监督学习的算法具有良好分类性能,且适用范围广、算法简洁。然而面对数据矩阵稀疏性,聚类算法能有效地根据相似兴趣爱好将用户分配到相同的聚类簇中;聚类产生后,根据邻居用户预测评价目标用户对该商品的评价。但是由于数据稀疏,使得目标用户处在聚类的边缘,对该目标用户的推荐精度较低,鉴于此,本文首先采用奇异值分解技术化解数据稀疏性给数据对象聚类造成的不利影响;然后针对初始聚类中心的随机性,提出的改进算法与协同过滤算法进行融合,并对其进行仿真实验,实验验证了改进算法具有良好的推荐性能。基于奇异值分解的推荐算法的基本思想:首先以协同过滤算法为主体,针对出现的稀疏性数据造成的推荐精度低问题的基础上,采用奇异值分解技术,对评分矩阵进行降维处理,并结合着梯度下降法对用户和项目特征进行更新,有效的避免了过拟合现象的发生,同时克服了零评分用户对相似度计算时出现的推荐不精问题。通过MovieLence数据集的测试,并与传统的推荐时推荐算法进行对比,结果表明该算法在推荐精度方面有较好的改善。一种改进初始质心的k-means聚类算法的基本思想是:针对传统的k-means聚类算法k个初始聚类中心选择上的随机性,造成聚类结果的波动性,提出了一种能够生成比较稳定的初始聚类中心的改进算法;同时,借助均衡化函数有效寻找最佳k值。通过UCI数据集的仿真实验,并与传统k-means聚类算法进行比较,结果表明该改进算法有较好的性能。基于KSVD模型的推荐算法的基本思想是:在引入改进k-means聚类算法对数据对象进行分类处理时出现的高维稀疏性数据对算法造成的负面影响,采用奇异值分解技术,在另一空间进行信息传递重新表达数据。通过MovieLence数据集进行函数仿真,并与其它推荐算法进行对比,结果表明改进算法具有较好的寻优能力。
其他文献
从民族音乐学的"历时-共时"视角观照萨满文化,不难发现分布的民族之多,分布的地域之广,可称之为"准全球"文化现象。关于萨满教的概念界定,学界存在广义与狭义之分。广义上讲,包括
旅游演艺在全国的持续发展过程中,呈现出明显的地域性、空间性特点,旅游演艺的空间发展受地域文化、旅游业规模、经济规模、交通区位等多种因素的综合影响。河南省作为文化大
对外贸易是我国经济快速增长的一个重要引擎。国际贸易竞争力在学界一直被广泛讨论。一方面,提高国际贸易竞争力是一国经济繁荣的有力工具。另一方面,缺乏竞争力可能是导致经
中国(上海)自由贸易试验区是中国政府设立在上海的区域性自由贸易园区,随着国家重点实施“一带一路”战略,特别是中国金融业提供的跨境金融服务面临产业升级和历史发展机遇,
伴随着社会信息化进程的不断深入,互联网的普及率不断提高,电子商务的发展已经成为推动全球经济发展的重要力量,而第三方电子商务平台是开展电子商务活动的基本手段。面对日
目的探讨宫腹腔镜下输卵管插管通液术治疗输卵管阻塞性不孕患者的临床效果。方法选择输卵管阻塞性不孕患者86例,随机分为两组,每组43例,对照组采用宫腔镜插管通液术治疗,观察
如果说当代画家中有对二十世纪末的世界文化产生了重要意义,那么安塞尔姆·基弗则当之无愧。安塞尔姆·基弗(AnselmKiefer,1945年生)师从约瑟夫·博伊斯(JosephBeuys,1921-1986),自博
目的 提高上清胶囊的质量标准.方法 采用薄层色谱法(TLC)进行定性鉴别,以高效液相法(HPLC)测定大黄素和大黄酚的含量.采用Phenomenex GeminiC18(250mm×4.6,5μm)色谱柱,
目的分析利奈唑胺联合乌司他丁治疗重症肺炎的临床疗效及其对血清皮质醇(COR)、高迁移率族蛋白B1(HMGB1)水平的影响。方法选取2016年1月-2017年1月惠州市中心人民医院收治的