社交网络中媒体数据处理关键技术研究

来源 :中国科学院大学(中国科学院沈阳计算技术研究所) | 被引量 : 1次 | 上传用户:cryingboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线社交网络因其高效便捷、使用成本低廉的优点而为广大用户所喜爱。尤其是随着移动互联网的发展,数以亿计的用户可以通过智能终端进行互联互通的同时,也可以借助在线社交网络发布最新状态和以消息、图片、音视频为代表的媒体资源。这促进了在线社交网络繁荣,但也产生了一些问题,如在线社交网络中的媒体推荐、信任度计算等。如何能够充分利用当前社交网络的资源和结构等信息的同时,更好地为用户服务是一个值得研究的课题。本文考虑到在线社交网络是以用户、媒体资源和社交网络为核心的人际交往关系的总和,因此本文重点研究了如下内容:针对社交网络中用户和媒体数量呈现海量数据的情况,而聚类方法是主流的大数据处理办法,因此本文首先研究了K-Means初始化方法。本文在分析主流研究成果的基础上,以高斯内核密度估计为基础,分析单维度内数据点的密度值,结合K个聚类中心应该互相远离的特点,从中选择密度值较大且互相远离的点作为初始中心点,并使用从高方差维度到低方差维度进行映射的方法,构建初始中心点。在此基础上,选择机制改为基于矩的计算方法,使用数据点的密度值与该点和极值密度值点距离的乘积作为该点的矩,进而选择初始中心点。实验结果表明,这两种方法都取得了较好的效果。针对社交网络中媒体数量众多而产生的人工标注困难的问题,本文研究了基于分层结构的音乐自动分类方法。传统的平面型分类方法不能充分利用不同属性在不同音乐间的分类效果,且不能表现出不同类型音乐间的距离和层次关系。在分析当前主流音乐分类方法的基础上,本文提出了基于分层结构的分类方法。该方法首先使用K均值聚类方法,结合LDA的方法完成对以MFCC为核心特征的聚类分析,并以此为基础构建了分层的结构,再通过对音乐特征的合理抽取,构建了基于分层结构的分类方法。实验结果表明,该方法能够取得较为理想的分类效果。针对社交网络中音乐推荐问题,本文研究了基于相关性成分分析的音乐内容相似度计算方法。当前主流的音乐内容相似度计算方法更强调从音乐文件数据的总体特征来分析,进而获取相关的特征数据,这类方法没有能够突出一些核心特征对于音乐文件相似所起的关键作用。本文提出使用相关性成分分析的方法以提升音乐相似度计算的准确率。本文首先使用PCA白化处理歌曲的MFCC数据集,在此基础上使用K-Means方法分析出MFCC数据集中的核心信息,通过选取部分距离聚类簇中心较近的数据作为核心数据,再使用相关性成分分析这些核心数据,有效地提升了核心维度的权重,同时降低了非核心维度的权重。最后使用欧式距离公式计算不同歌曲的距离。实验结果表明该方法提升了音乐相似度计算的精准性。针对社交网络中用户众多而寻找有影响力的用户困难的问题,本文研究了社交网络中影响力计算模型。本文在充分分析现有模型的基础上,提出了基于社交网络特征的影响力计算模型,即影响力分为全局影响力和局部影响力。全局影响力主要从用户的社交关系网络出发,分析由用户的关系数量而产生的影响力;局部影响力主要从用户所参与的社群出发,结合用户在该社群中的好友占该社群全体成员的比例,进而推断出用户的局部影响力。通过分配给二者合理的权重,进而预测出用户在社交网络中的影响力。实验结果表明该方法能够取得较好的影响力预测效果。针对社交网络中用户交往之间存在信任关系的情况,本文研究了在线社交网络中信任度计算模型。传统以图模型为基础的影响力计算方法存在多方面的问题。本文提出了混合型的社交网络中信任度计算模型。该模型主要考虑交互式信任和荣誉式信任。其中,交互式信任主要从信任双方的交互程度来判断,如果双方有过历史交互记录,则双方进行直接交互信任,否则双方属于间接交互信任。荣誉式信任又分为群体荣誉信任和跟随式荣誉信任。其中,群体荣誉信任是指社交网络中用户所有粉丝形成的信任,而跟随式荣誉信任则指有该用户所有粉丝中前K个荣誉度最大的粉丝所产生的信任。将这些因子通过合理的权重有效地组织起来,则用于计算在线社交网络中的信任度。实验结果表明,该模型能在信任度计算方面够取得较好的效果。
其他文献
2008年,中国工商银行股份有限公司赣州分行积极应对宏观经济金融形势变化带来的机遇和挑战,紧紧围绕“打造核心业务具有同业领先优势的强行”目标定位,坚持以市场为导向,以客户为
2003年以来,砖瓦工业稳步发展,整个行业克服非典带来的不利影响,正常生产,实心粘土砖总量得到控制,新型墙材发展迅速,产品质量有所提高,产销平衡,亏损企业较去年同期减少,行
纽士达品牌芳纶1313纤维是由烟台氨纶股份有限公司生产的。它同美国杜邦公司的Nomex以及日本帝人公司Conex是同类产品,属于间位芳纶,它有以下性能:①优异耐热性、阻燃性,其极限氧
目的:分析社区管理与综合干预对糖尿病患者病情控制的效果。方法:选择366例糖尿病患者,采用问卷调查的方式对治疗满1年以上的患者实行社区管理和综合干预手段,测量患者干预后的血
详细介绍了阻塞的概念、防阻塞控制技术工作原理及系统构成、防阻塞阀控制逻辑,以及防阻塞实验过程、防阻塞线形成过程,并生成防阻塞模块应用于高炉鼓风机控制系统中,取得了
针对倾斜工作面大吨位综放设备在安装与回撤过程中,因重力作用导致运输过程中发生设备前倾、掉道等问题,通过采取现代机械化高效运输技术,保证工作面设备快速安装与回撤,提高
一、建材市场各种组织形态将在一定时期内共存 改革开放以来,在邓小平建设有中国特色社会主义理论的指导下,特别是党的十四大明确提出建立社会主义市场经济体制的目标以来,我
供应链是企业赖以生存的商业循环系统。供应链管理包括了从生产到发货、从供应商的供应商到顾客的每一个环节,从过去的单个企业扩大到全社会全世界,供应商需要同制造商建立起一
10月汇总平板玻璃企业43家。生产平板玻璃2462.16万重量箱,比上年同期增长1.42%;累计生产平板玻璃23026.73万重量箱,比上年同期增长3.27%;本月销售平板玻璃2589.99万重量箱,比上年同期增
做好对水库大坝的除险加固是保证水库大坝质量与延长水库大坝使用寿命的重要途径。对水库大坝除险加固工程设计进行探讨,并介绍了水库大坝除险加固施工技术,希望能够为水库大