基于分布式符号数据的个性化推荐算法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:sayaka66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,推荐算法作为一种高效的信息过滤技术逐渐受到了用户的青睐,并成为了各大互联网站的核心竞争力.在计算机科学没有普及的年代,传统推荐算法在小规模、类别单一的数据场景下表现出高效的信息处理能力,但随着大数据时代的到来,推荐算法在面临大规模、多类型、高纬度数据时遇到了瓶颈,其难以为用户与群体合理建模,并进行精准推荐.本文就探索如何采用合适的方法处理多类型数据,如何归纳群体评分,如何消除群体偏置的影响,以及更好地刻画用户与群体的轮廓等方面,作出了相应的研究.具体内容和方法作出如下说明:
  由于符号数据这一“工具”本身擅于处理多源异构数据,因而本文将其应用到个体推荐算法中的多类型数据处理上,提出了基于分布式符号数据的个体混合推荐算法.该算法利用分布式符号数据表征项目内容,将项目内容量化;并创新性地引用了用户积极子模型与消极子模型,同时采用改进的分布式符号数据距离度量的方式计算用户间的相似度;最后基于传统的协同过滤算法理论完成推荐预测.实验在电影评分数据集上的结果证实,该方法是有效的,并在大规模,实时性要求不高的场景下有着更好的表现.
  伴随着用户往往以群体形式出现在各个场合中,为群体用户作出单一的推荐同样势在必行.本文提出了基于分布式符号数据的群体推荐算法,算法着重分析了符号数据在群体推荐中的归纳作用.首先利用矩阵分解算法填充原始的评分矩阵,弥补用户评分稀疏的不足.并在随机生成由不同人数组成的小规模群体后,利用分布式符号数据对整个群体中的用户评分进行归纳,消除群体偏置的影响,得到群体不同偏好的子模型;最后基于两种改进的相似度公式预测推荐,比较优劣.实验在大规模电影评分数据集上进行,结果表明:基于分布式符号数据的群体推荐算法相比于点数据模型能够更好地刻画用户群体偏好,推荐满意度更高的项目.
其他文献
19世纪末,胡塞尔创立的现象学最重要的贡献就是指出了一种新的哲学思考方法的可能,或一个看待哲学问题的更原初的视野。现象学的基本口号是“面向实事本身”,把所有先入之见和偏见加上括号,把所追问之物的本质之外的东西悬搁起来。现象学的基本方法是本质还原的方法,把非本质的东西悬搁掉,从而找到所研究对象的本质结构。这要求我们从自然态度向现象学态度的转变。所有这些不仅是胡塞尔现象学的基础,也是后来的现象学家们进
学位
M2/GDP比例的不断走高是中国市场化改革以来出现的一种特有经济现象。为了能够对这种经济现象做出较为合理的解释,本文利用弗里德曼所提供的货币理论分析框架以及麦金农的理论研究方法,将经济生活中一种重要的经济现象--投机引入货币需求函数,由此形成了一个有助于更加全面解释不发达经济运行的宏观经济模型。该模型和麦金农的宏观经济模型的唯一不同之处在于引入了一个投机市场,它的存在虽然没有改变麦金农关于实际货币
学位
近年来,金融科技发展越来越受到社会各界的关注。随着核心技术——大数据、人工智能、云计算和区块链的成熟和广泛应用,银行也开始大力发展金融科技,建立金融科技子公司并且与外部科技公司合作。在2019年9月6日,中国人民银行发布的《金融科技发展规划(2019—2021年)》中提出,到2021年,要建立健全我国金融科技发展的“四梁八柱”,并且要求银行年报开始披露科技员工的数量,体现了国家对金融科技的高度重视
学位
随着竞争的加剧,企业不得不投资于高影响力的企业创新,以获得竞争优势。然而,企业创新是一个长期项目,涉及探索新的、未经测试的,且极有可能失败的事物。因此,风险厌恶的管理者不倾向投资于创新项目,由此便产生了委托代理问题,即有价值的长期风险投资可以增加股东价值,然而管理者却不青睐这种高风险的投资。风险厌恶的管理者避免投资于高价值、高风险的创新活动,这些活动可能导致企业的短期收益损失和价值下降,这通常又会
学位
商业银行竞争对金融稳定的影响一直是学术争论和政策辩论的焦点。随着金融脱媒的日益深化,利率市场化的不断推进,我国商业银行如何在经济改革和金融改革进程中成功转型以及如何在日益激烈的竞争中防控风险、良性发展是学术界和业界极为重视的问题。2008年金融危机爆发后,金融稳定重新成为世界各国政策制定者和学者们关注的热点,对银行竞争与稳定关系的研究思考也上升到了新的层面。激烈的竞争虽然可以实现银行业竞争主体的多
学位
并购作为企业成长、产业调整、经济发展的基本载体,以及我国“一带一路”倡议下对外投资的重要方式,因其涉及众多经济主体、影响重大而成为研究的热点问题。对于并购是资源再配置有效方式这一命题已达成共识,但其中具体机制尚未明晰。有关并购收益、并购后整合以及并购的资源配置机制、效率等基本问题,仍处于“黑箱”状态。随着近年来我国经济金融化趋势渐显、经济增长新常态出现,如何提高资源配置效率成为亟待解决的关键议题。
学位
近年来,世界经济增速下行压力较大,贸易摩擦和逆全球化思潮涌动,贸易保护主义和单边主义抬头,金融市场动荡,阻碍了经济全球化的进一步深入和发展,危害全球贸易秩序。2020年新冠肺炎疫情给全球贸易发展带来负面影响,据世贸组织发布的《全球贸易数据与展望》报告显示,受新冠肺炎疫情影响,全球贸易将缩水13%-32%。对外贸易是推动中国经济发展的重要动力,尤其是当前,中国经济发展增速放缓,如何有效推进中国出口贸
学位
随着高铁的迅猛发展,国家的交通基础设施得到了极大的改善和发展,高铁的建设相对也取得了成功。如今,高速铁路已成为居民的重要出行交通工具。高铁开通极大的改善了交通状况,缩短了城市与城市间的行驶距离。依照新经济地理学理论,交通基础设施的改善促使运输成本降低,助推区域之间生产要素的流动,并改变区域的经济发展和经济布局。中国高铁“四纵四横”规划已基本完成,“八纵八横”规划仍在继续,未来交通基础设施将得到进一
学位
由于市场经济条件下,市场竞争会导致部分劳动者失业,造成家庭经济状况困难,同时,市场竞争会导致社会成员之间贫富差距悬殊,导致社会分配不公,另外,当社会成员老弱病残、丧失劳动能力、生活条件艰苦等情况下,也会导致社会成员生活困难。因此,为了有效配置劳动力、缩小贫富差距、维护社会公平正义、维护社会稳定和国家安宁,我国建立了社会保障制度,其中,农村最低生活保障制度对于保障农村贫困人口的生存需求尤为重要,有利
时间序列分析在数理统计中占有非常重要的地位,而自回归(Auto-regressive,AR)模型是线性时间序列分析中研究最广泛的模型,在许多科学和工程领域的应用已非常成熟,因此利用AR模型对已有数据建模具有重要的实际意义.在AR模型的实际应用中,首先需要确定描述模型行为的必要参数的数量,因为这直接关系到模型的可用性以及使用精度.尽管有多种模型定阶方法,但这些方法各有优劣,并且定阶问题没有通用公式,