基于多元属性的媒体热度预测算法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wcd_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着传统媒体不断向数字化转型,数字媒体内容逐渐成为互联网的主体。然而,大量的数字媒体内容中只有少部分是真正热门的,这就需要及时而有效的热度预测算法来甄别热门内容。热度预测研究在诸多方面都有很高的应用价值,例如广告投放、网络管理、缓存策略等。考虑到热度受诸多因素影响,同时,在缺乏历史数据情况下媒体内容的多元属性对热度影响最大,因此本文基于媒体内容的多元属性展开热度预测算法研究,并以帖子和视频两种主流媒体内容为主要研究对象。首先,本文基于帖子的相对热度预测展开研究分析。尽管热度与非内容因素有着强相关的关系,但内容因素对热度的影响不可忽视,而内容的多模态之间复杂的相互作用关系使得预测相对热度并不那么简单。因此,本文提出多模态模型来预测相对热度。该模型借助深度神经网络的帮助,并利用注意力机制得到帖子的图片特征和文本特征,同时,模型引入多任务学习方法,一方面使得同一帖子的图片和文本保持相关性,另一方面隐式地构建起图片和文本的交互关系,并通过成对帖子来预测相对热度。在真实数据集上的实验结果表明该模型的有效性。其次,本文针对视频早期热度预测展开研究分析。以往研究表明视频早期热度在视频生命周期中占据着主要部分,同时,早期热度与未来热度关系密切。本文首次对国内优酷视频数据展开研究,根据数据的多元属性构造视频属性特征、用户属性特征以及文本分析特征,并以SVR-L、SVR-RBF、神经网络以及XGBoost四种基本模型来构建早期热度预测模型框架。多种实验指标结果表明上述三组特征的有效性,并指出XGBoost模型预测性能最佳。此外,通过特征重要性分析,本文发现视频类别是影响优酷视频早期热度较为重要的特征,而这一特征在以往基于YouTube视频数据的研究中被指出是不重要的,同时本文还发现情感特征对优酷视频早期热度的贡献不大。
其他文献
随着教育制度改革进程的推进,教育政策支持力度不断加大,民办教育行业迎来了新“风口”,其作为教育提供者的功能也被不断重视,涌现出了众多优秀的教育培训学校。然而,因为缺乏合理的引导,使得大量的教育培训学校呈现出竞争混乱、发展状况良莠不齐的情况。本文通过宏观环境分析、行业环境分析和SWOT分析,确定A教育培训学校的营销环境情况。此外,对学校所有任职教师和部分学生家长进行问卷调查,以品牌建设相关理论为基础
学位
在数据挖掘中,数据聚类是一项重要的任务。数据聚类通过优化特定的聚类指标来完成聚类划分任务,已知是一种NP难问题。进化算法是一种全局搜索算法,被大量用于解决这类NP难问题。然而,已有的进化聚类算法存在速度慢、精度不高等问题。为了解决这种问题,研究者将进化算法与k均值相结合用于数据聚类。虽然基于k均值的进化聚类算法取得了良好的聚类效果,但其仍旧存在一些问题可能会限制其聚类性能:1)进化聚类算法通常使用
阿格妮丝·赫勒是最重要的东欧新马克思主义理论家之一,她的历史理论是她独创性思想的重要组成部分,并在东欧新马克思主义理论乃至20世纪马克思主义演进中占有重要的一席之地。本文立足于文本研究,以赫勒“历史理论三部曲”为依据,在分析其历史理论产生的社会历史背景基础上,通过挖掘其理论渊源、系统解读其历史理论的逻辑思路和思想观点,试图阐明赫勒的历史理论在对传统历史哲学和马克思思想批判继承的基础上,从微观层面关
由于城镇化进程的加快和城乡经济的发展,国有存量建设用地和征地制度已不能满足城市建设对土地的需求,与此形成对比的是农村集体经营性建设用地的大量闲置,导致自发流转涌现
在信息革命向人工智能革命转换的当下,人工智能技术正深刻影响社会各领域,自动驾驶汽车概念的提出标志着人工智能技术开始向汽车行业渗透的开始。在现代风险社会的语境下,现代风险呈现出人为性、不确定性与主观建构性,法律对此产生积极与消极两种风险态度。自动驾驶汽车具有人身安全、个人信息安全、社会公共安全的三重风险面向,且大数据的全面性与算法不确定性致使风险具有不确定性。行政法在其风险规制过程出现事后归责模式的
机载DDMA-MIMO雷达发射的是多普勒频分多址(DDMA)信号。它利用傅里叶正交基作为不同阵元发射信号的脉间调制加权,即发射相位随阵元序号和脉冲序号改变。相当于在发射时给每个阵元增加了一个多普勒频率,在接收时就可以利用多普勒滤波器组将不同阵元的发射信号分离。虽然采用DDMA信号的慢时间MIMO雷达具有结构简单、回波相关性高、带宽利用率高等优点。但在决定不模糊距离的脉冲重复频率不变的前提下它的多普
线作为最基本的媒介,它存在于所有的绘画形式当中。在中国绘画和西方绘画中,虽然线的表现形式因为中西方文化的不同而存在着明显的差异,但是线都是用来造型的基本手段。不同的线条在绘画中会呈现不同的视觉效果,“十八描”就是典型的代表,均匀流畅的高古游丝描,刚劲有力的铁线描、轻盈灵动的柳叶描……每一条线都有自己独特的审美价值,具有深远的意义和强烈的表现力。在黑白木刻版画中,线同样具有与众不同的美感,由于黑白木
计算思维作为灵活运用工具、分析解决问题的思维方式,顺应我国创新驱动的发展需求,成为21世纪必备技能之一。计算思维和编程密切相关,然而目前的编程教育仍存在诸多问题。游戏化学习的引入解决了编程中的众多难题,因此本研究将游戏化编程教育应用到中学生的计算思维培养研究。首先梳理计算思维和游戏化编程文献,对其研究现状进行研读,分析目前计算思维的概念、方法以及游戏化教学模式、原则。其次以文献综述为基础,将分解、
随着互联网中流量激增和新业务的不断涌现,现有网络技术已难以满足工业物联网、5G移动通信、AR/VR音视频和智慧城市等新应用场景中对实时性和可靠性的要求。面对这种时间敏感性业务的急切需求,如何保证可靠性,准确控制端到端时延成为热点问题。鉴于其成本低、部署简单、产业链成熟且带宽不断增大,以太网技术在新一代传输和接入网络中被广泛使用。因此,出现了多种改善以太网“尽力而为”机制引起的分组丢失和不确定性等问
序列密码的设计思想正在从线性序列变换到非线性序列,与此同时涌现了很多性质良好的非线性部件。进位反馈移位寄存器(FCSR)由于自带非线性,类似于LFSR的代数结构,具备优良的密码学性能,被认为是LFSR的一个较好的替代。在研究FCSR的结构和生成序列的同时,基于FCSR设计的各种新型序列密码开始出现,催生了各种针对FCSR类密码的分析技术与攻击手段,这反过来促进了FCSR理论与结构的进一步完善。本文