协同过滤中转移矩阵建模的非负张量分解方法

来源 :厦门大学 | 被引量 : 0次 | 上传用户:ourui4108432566
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的大规模普及,日益增加的信息、日新月异的商业模式,让人们处于信息过载的困境。推荐系统,作为一个帮助用户筛选出更有效信息的工具,在学术界和工业界都得到了快速的发展。为了能够对用户行为偏好数据进行更加准确分析,基于模型的协同过滤在近些年成为研究重点。其中,基于矩阵分解模型和基于张量分解模型的协同过滤能够很好地从稀疏大规模数据中学习,并且这些模型的变体考虑了更加细致的数据特征,增加了相似度计算来对用户偏好进行准确建模。然而,我们通过文献调研发现,尚未有研究工作探讨张量分解模型和矩阵分解模型之间联系,常规的Frobenius范数约束难以充分地刻画用户偏好随时间的动态变化,模型求解之后得到的隐向量缺乏解释被认为是理所当然。因此,本文从非负张量分解的基本性质出发,揭示了张量分解模型和顺序矩阵分解模型的数学联系,并赋予隐向量合理解释。在这些发现的基础上,我们提出了两个新的非负张量分解模型。具体工作如下:首先,本文在CP张量分解性质的基础上,从数学形式上推导了顺序矩阵分解模型与张量分解模型之间的关系,将用户偏好转移矩阵和时间隐向量这两者联系起来,从而给时间隐向量的可解释性做了初步工作。其次,本文针对时间片数据设计了一种新相似度度量,并将它添加到非负张量分解模型当中,提出基于时间相似性的非负张量分解的算法。接着,本文讨论了如何使用Tucker分解来描述转移矩阵,并在此基础上提出了一种具有核稀疏性约束的非负张量分解模型及其求解算法。最后,本文在多个公共数据集上验证了本文提出的模型和算法的有效性和优势,并对我们的算法开放源代码。
其他文献
近年来,诸如康美药业财务造假等事件,我国上市公司盈余操纵丑闻屡见不鲜。虽然近年来对上市公司信息披露的监管力度有所加强,但仍有不少上市公司通过虚假交易虚增利润、重组债务、伪造IPO信息、通过误导性披露扭亏为盈等行为进行盈余操纵。它客观存在于我国资本市场,我国上市公司的盈利质量不容乐观。有效保护投资者利益,共同营造良好的市场氛围,是资本市场健康发展的基石。然而,盈余管理作为资本市场的不成文规则,有意或
学位
环境安全规划设计无疑是舒缓城市治安管理压力的有效途径,然而我国城市建设对安全规划设计的关注较少。通过对国际基于政府犯罪预防策略主导的社区环境安全规划设计经验的剖析,提炼不同国家应用安全规划策略的共性特点。从犯罪预防法规政策、国家预防犯罪委员会的统筹作用、城市规划部门职能、公众参与设计4个方面,梳理并介绍北美、英国、北欧、东亚等多个国家和地区环境安全规划设计实践的经验,以期为我国城市规划设计预防犯罪
期刊
经过全党全国各族人民持续奋斗,我们实现了第一个百年奋斗目标,在中华大地上全面建成了小康社会,历史性地解决了绝对贫困问题,正在意气风发向着全面建成社会主义现代化强国的第二个百年奋斗目标迈进。2011年3月中共中央国务院印发的《关于分类推进事业单位改革的指导意见》要求到2020年事业单位管理体制基本完成,但随着改革的进一步深化,改革效果并非尽如人意,诸多深层次问题逐渐暴露出来。从国家层面看,存在着体制
学位
新冠疫情的突发给我国经济社会带来前所未有的冲击,主要表现在:一是经济增长放缓,2020年一季度,国内生产总值同比下降6.8%,首次出现负增长。二是就业压力进一步增大,一方面,由于我国劳动人口基数庞大,加之农民工、大学生两大重点群体规模持续扩大;另一方面,疫情导致产业发展受阻,作为拉动就业主力军的服务业更是首当其冲。在经济发展和就业增长都面临很大挑战的情况下,作为新经济业态的直播电商展现出了强劲的发
学位
税收是国家依靠公共权力,取得的一种无偿性国民收入。在来源上取之于民、并用之于民、更是为了造福于民,税收不仅为国家治理提供了有关财力方面的基础保障,更是政府获得财政收入的主要来源,对促进经济发展、维护社会稳定发挥着无可替代的作用。税务机关可以从履行税款征收、税源管理、税务稽查、纳税服务等相关职能来入手,从而对现代税收工作实现系统化的管理。在税务机关的四个职能中,税收征管是税收工作的核心,而税源管理又
学位
通过几十年的发展,进化算法已经成为解决复杂优化问题的常用方法。随着实际生产力的发展,新型的优化问题层出不穷,多因子优化就是一类新的优化问题,指的是在同一表达空间中同时优化多个任务。多因子进化算法是一种为了有效解决多因子优化问题、以多因子遗传模型为基础,受到迁移学习思想启发而提出的新型优化算法。算法主要利用了跨任务的基因迁移来提高同时处理多个相似任务的优化效率。尽管多因子进化算法已经证实在处理多因子
学位
工业4.0时代的到来,推动了通信及信息技术迅猛发展,数据资源已经成为新时代全球范围内关注的焦点,如何有效采集、分析和利用海量复杂的数据来提高人民生活质量已经成为全世界专家学者共同的研究课题。在我国,大数据分析技术的应用正处在高速发展的阶段,近些年国家发展战略中多次提及大数据,并且已经在多个政府部门进行全方位的开展。海关作为重要的口岸监管部门也紧跟时代步伐提出“科技兴关”并将大数据分析技术在多个领域
学位
伴随互联网经济的不断发展、科技的进步和电子商务的日益强大,与互联网相伴相生的线上广告在过去的数十年间实现了迅猛的发展。作为一门崭新的学科交汇科学,计算广告学倍受关注。其主要包含广告学、文本计算、信息检索、统计模型和经济学等多个学科的理论和应用。计算广告是为某些特定的用户群体而设计的,从出现至今都是互联网新兴应用领域中的热门问题,成为了一个新的商业增长点。广告点击率预测(Click-Through-
学位
社区犯罪预防是社会治安综合治理的重要组成部分。目前,我国农村地区犯罪问题日益凸显,发案率高,急需构建农村社区犯罪预防模式。以社会资本理论为剖析视角,从个体与社会网络间的纽带关系、社会信任、公民参与、社会结构的稳定性和政治权威五个方面分析农村社区犯罪行为产生的原因,在此基础上应当从改进新型集体经济模式、创新调解制度、重建乡土文化、创新农村社区警务工作等方面予以构建完善农村社区犯罪预防模式,以维护农村
期刊
大量3’端测序或RNA-seq转录组的研究发现,动植物中多达70%的基因会发生选择性多聚腺苷化(alternativepolyadenylation,APA),这是引起转录组多样性和复杂性的重要原因。在人类疾病发生、胚胎发育和分化的过程中,已有研究观察到APA使用模式的多种情况,并发现APA在不同组织中具有明显的特异性,这为基因表达调控机制的研究提供了重要信息。目前主要是从细胞群的整体水平解析AP
学位