基于大众标注和HOSVD的推荐系统研究

被引量 : 5次 | 上传用户:happy1072298534go
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的飞速发展,以知识共享和大量用户交互为特点的大众标注(Folksonomy)概念随之产生。大众标注网站中所含有的标签功能使得用户可以根据自身喜好对网站中的资源添加相应信息。将大量的标注信息进行整理分析,可以为新的用户提供网站资源的参考从而形成资源的推荐。目前电子商务网站的个性化推荐系统已有多种,较为成熟的推荐方法是分析项目资源或者近邻用户之间的相似偏好来过滤信息达到向其他用户推荐的目的。而大众标注网站的数据特点是用户和项目之间通过标签进行桥接,因此对近邻用户、项目或标签计算相似偏好使得推荐系统的运算复杂程度增加;同时随着网站规模和数据量的增加,评分数据矩阵稀疏性问题也会导致系统推荐精度的下降。针对以上这些问题,本文运用基于高阶张量降维原理的高阶奇异值分解(HigherOrder Singular Value Decomposition)算法和数据聚类技术,结合具有典型大众标注网站特点的数据提出一种个性化推荐系统。对含有“标签”信息的标注网站推荐系统进行改进,避开繁杂的运算过程,提高推荐精度。本文的研究重点主要有以下几个方面:1.对典型大众标注网站进行数据收集,建立含有用户、标签、项目的数据列表。利用K均值(K-means)聚类技术对初始数据进行聚类。对数据进行初始聚类的目的在于增加数据之间的关联性,减少原始数据中的空余数据成分,从而为建立张量模型提供数据基础。2.通过对含有用户、标签和项目的三级数据库建立三维的张量空间矩阵,利用二维的奇异值分解在处理数据稀疏性问题上的良好特性,在多维张量空间矩阵中进行拓展。该方法能够在保证数据结构完整的情况下除去数据中的空缺部分,以达到降低数据稀疏性的目的,同时生成推荐结果;此外还能够有效降低大众标注网站当中的数据冗余,提高推荐精度;并且将标签信息较好地加以利用产生推荐,从而提高了推荐系统的效率。3.通过数据实验与几种传统的协同过滤算法的推荐效果进行对比,以检验本文所提出的将聚类技术与空间张量分解算法相结合的一体化推荐系统在社会化标注网站中的有效性。
其他文献
<正>人物档案施军平:主任医师、教授、博士生导师,临床医学博士后。杭州师范大学附属医院副院长,杭州市转化医学研究所所长,杭州师范大学转化医学中心副主任。现任中华医学会
近几年,儿童图书无论从出版种数、印张数量还是定价总金额都呈现出逐年增长的发展态势,在纸质图书面临威胁的数字出版时代,出版社把少儿类图书当成救命稻草,纷纷进军少儿出版领域
文章从高职艺术院校雕塑专业的专业特殊性角度,提出了雕塑艺术和古希腊雕塑艺术发展史是雕塑专业学生的艺术理论教学的重点内容,讲授古希腊雕塑以利于学生了解西方雕塑史的起源
普通高中文理分科问题并不是一个新的话题,但一直以来是一个学者们常常争论的问题,往往人们只是关注于“分”与“不分”的二元争论,其实,文理分科问题是一个具有中国特色的问题,国
随着经济社会的发展,各个领域对安全警戒的需求都在提升,基于可见光系统的视频监控作为一种十分重要的安全警戒手段已经被广泛应用,但这类系统固有的缺陷使其不能满足市场的需求
近几年来,许多学者在书籍、论文及期刊上相继发表了关于意象油画研究的学术成果,并呈现出欣欣向荣的态势。这说明意象油画理论的构建与发展得到众多人的支持与关注。意象油画作
目的:观察基于祛瘀生新原则应用复元活血汤对手指软组织缺损皮瓣移植修复效果的影响。方法:60例患者按随机数字表法分为2组各30例,均急诊或择期行手指软组织缺损皮瓣移植修复
目的探讨胃肠癌患者手术前后异常糖链糖蛋白(TAP)表达及临床意义。方法114例胃肠癌患者,均行胃肠癌根治术。比较患者手术前后TAP凝聚面积及阳性率;比较患者手术前后癌胚抗原(
随着互联网技术的飞速发展,标签系统得到广泛的应用并且成为众多Web2.0网站的重要组成部分。标签系统是为用户提供标签标注功能的应用系统,因为其方便操作、容易使用等特点深受
水产品在养殖、腌制加工过程中普遍存在亚硝酸盐过量问题,具有一定的安全隐患,而乳酸菌是降解腌制食品中亚硝酸盐的最理想微生物。乳酸菌通过产亚硝酸盐还原酶来降解亚硝酸盐,而