基于商空间模型的协同过滤推荐算法研究

来源 :安徽大学 | 被引量 : 7次 | 上传用户:chj0821031
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网的飞速发展,网络资源变得极大丰富,多渠道的信息来源使得信息的产生变得更加便捷。随之带来的海量信息在给人们提供丰富资讯的同时,过载信息(overload information)也带来人们选择的困难。推荐系统作为一种能够解决信息过载问题并可提供个性化服务的有效工具近年来得到了广泛地关注。协同过滤是目前运用最为成功的推荐技术,近年来在此之上的新算法层出不穷,随着网络规模的扩大,用户和商品人数的激增和社交媒体的加入,协同过滤方法面临着诸多挑战。商空间粒度计算理论利用人类处理复杂问题的求解思想,将问题高度抽象成论域,属性和结构三元组(X,f,T)进行描述,其采用由粗到细粒化逐步求解的分析方法,对复杂问题的求解具有重要的意义。本文利用商空间模型对推荐问题进行表示,通过粒化可改善推荐性能。首先依据商空间理论对推荐问题进行总体描述和说明,接着分别依据属性和结构对协同过滤算法进行研究,重点研究了推荐系统中的数据稀疏性问题、实时性问题、鲁棒性问题、社交关系对推荐系统影响等若干问题,给出了商空间模型的对应描述,从粒计算的角度对这类问题提出了相应的解决方法。本文的主要研究工作概括如下:(1)给出了商空间理论对于推荐系统问题的整体描述;利用商空间中三元组(X,f,T)表示问题的论域、属性和结构。将推荐问题看成用户评分为论域X,用户相关特征为属性f,用户与用户相互关系为结构T的系统,构建了用户为核心的商空间模型。并进一步给出了常见的协同过滤推荐算法的粒度视角下的描述。以该该模型作为基础,对以用户声誉、用户间评分关系、用户间社交关系等作为属性和结构,为论文提及的推荐系统中若干具体问题研究与求解奠定了基础。(2)研究了用户声誉属性对多种推荐系统的影响;隐语义分解模型以商空间的视角可以看成在某一最优准则下生成两个较小粒子,并进一步合成较大粒子的过程,我们将用户声誉属性代入到最优准则中,将其用于不同的隐语义分解模型中,考察用户声誉值对不同推荐系统的影响。本文利用历史评分迭代学习得到用户声誉值,并将其引入到一般推荐系统和社交推荐系统中,提出了结合声誉的LFM模型(LFMrep)和基于声誉的社交推荐PMF模型(SoRS)。实验结果表明使用用户声誉可以去除系统由于用户评分不严谨带来的噪声,提高系统推荐精度;在一般推荐系统中对声誉值过高的用户进行抑制可以提高系统的鲁棒性,增强系统的抗攻击能力;在社交推荐中引入声誉系统在数据稀疏训练集不足的情况下推荐精度亦可得到保证。另外使用粒化思想,提出了基于用户声誉粒化的社交推荐算法(SrBug),实验结果表明在短推荐列表推荐精度无明显变化的情况下,推荐响应优势明显。(3)研究了利用粒度思想对推荐问题中用户邻域进行结构粒化的方法;本文将用户之间的相似性关系视为推荐问题中具有无权特性的网络结构关系,使用商空间粒化的思想构造出用户邻域,并在用户邻域中进行推荐。提出了一种依据无结构的评分数据进行建模,映射出用户问评分关系网络,并使用社团发现算法对其用户邻域进行结构粒化的方法(CUCRA),实验结果表明,利用结构粒化的方法,可以更有效发现用户近邻,在不降低精度的前提下,算法具有较好的线上响应时间。进一步地我们使用分层聚类的思想对用户邻域进行优化,形成层次粒化用户邻域模型(HGUCRA),相关实验表明该模型中的推荐结果在获得较优时间响应的同时也获得了较好的推荐精度。(4)以模糊等价关系定义了社交网络中的“三度”之内的社交关系及其分层递阶结构,深度挖掘了三度之内的社交关系对推荐系统精度的影响。本文选取用户间社交关系及其相似性作为推荐问题中的有权特性的网络结构进行研究,依据模糊等价关系的定义得到以步长为截集的分层递阶结构,提出了基于上下文子图传播的隐含关系的社交推荐算法(IRSubNet),该算法将“三度”之内的隐含关系和明确关系整合到了一个统一的框架中来,相比其他推荐算法,IRSubNet深度挖掘了三度之内的社交关系,定义了社交网络中任意两点基于上下文子图的社交相似性的计算方法,重点分析了隐含关系在推荐系统中对精度的影响。在两个真实的具有社交网络的数据集上所做的实验结果表明,该算法的精度有明显提升。
其他文献
目的探讨腹腔镜、胆管镜、扩张导管(逐级扩张导管、球囊导管)、T管支架(T形管+塑料胆管支架,LCDTS)治疗肝左外叶及胆总管结石的应用体会。方法回顾性分析2002年4月至2017年9
针对多光谱夜视图像,探索新型智能的场景理解和目标感知方法已经成为夜视技术发展的必然趋势。本文将视觉建模和信息学习引入到多光谱夜视目标探测识别中,构建一系列具有人眼
目的从人卵巢癌细胞株HEY中筛选出CD117~+细胞亚群,探讨其体内、外增殖、呈瘤和分化能力。方法卵巢癌细胞株HEY采用流式细胞仪分选,筛选出CD117~+细胞亚群,分为CD117~+细胞组
互联网的高速发展将人们带入了信息化时代,而信息量的指数级增长意味着大数据时代的到来。如何从海量数据中分析和挖掘出潜在有价值的知识或者规律,帮助用户找到感兴趣的信息
在农产品加工与流通过程中,品质检测与质量分级是其重要环节。农产品品质检测技术水平的高低对农产品质量、市场竞争力、劳动强度都有着很大的影响。在众多农产品中,大豆在我
我国传统法律与乡民们的生活习俗是同构的。由于法律一元论与立法中心主义排斥其他社会规范的司法进入,司法解释制度也抺灭了基层法官解释法律的可能性,从而导致我国乡村基层
观看过好莱坞电影《机器战警》的观众,都会记得那个半人半机器的警察,在各种危险场合下刀枪不入,所向披靡。看完这部电影,大家会想,现实中如果真有这样的机器警察就好了。
北京时间10月19日9时20分,我国自主研制的第一颗业务型地球静止轨道气象卫星——“风云”二号C星,在西昌卫星发射中心由“长征”三号甲运载火箭发射升空。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
自唐至明,田氏一直是黔东思州望族大姓,在黔、湘、鄂、渝边区举足轻重。本文对思州田氏的渊源进行了考辨,认为其族属应为土家族,元明思州宣慰司当为土家族土司。文章对思州田氏在