论文部分内容阅读
随着社会化媒体的快速发展,像YouTube,优酷等视频分享网站正获得越来越多的关注,人们愿意花费更多的时间在社会化媒体上。社会化媒体的蓬勃发展改变了人们的生活方式,同时也促进了社会化营销。因此不管是企业、组织还是个人都希望自身在这些社会化媒体中上传的内容拥有更高的社会关注度,可以更好的分享信息,树立品牌,推广理念,以及创造更多的经济收入。因此,通过对YouTube等社会化媒体的数据挖掘,分析其有价值的信息,发现其潜在的规律,通过这些规律去研究如何提高社会化媒体的社会关注度成为许多研究者关注的热点。本文在研究了社会化媒体相关领域的发展现状以及相关技术理论的基础上,针对YouTube数据分析了视频关注度增长模式,根据数据分析的结果,创新性地提出了提高视频社会关注度的方法。本文的主要研究工作如下:(1)本文通过两方面分析了 YouTube的视频关注度增长模式。一方面,本文研究了累计关注度的增长模式。本文发现全部视频每日关注度在上传后的前几天达到峰值,并在接下来的几天迅速下降,然后在连续的几个星期内缓慢下降,最后,每日关注度趋于一个恒定的值。同时,研究发现上传两个月后的全部视频累计关注度符合线性增长。另一方面,本文分析了单个视频的关注度增长模式。研究结果显示大部分视频关注度的峰值出现在视频生命周期的开始阶段,并且引起视频关注度峰值的视频关注度来源是不同的。同时,研究发现在两个月后,单个视频的关注度和来自不同的视频关注度来源贡献的关注度趋于稳定。(2)通过对YouTube视频关注度增长模式的分析,本文得知影响视频关注度最重要的两个视频关注度来源分别是搜索引擎和推荐系统,此外,视频的标题和标签是描述视频内容最重要的文本信息,也是用户决定是否点击观看视频的重要依据。基于这些结论的基础上,本文提出了一种方法,在用户上传视频的时候,推荐给用户优质的关键词,帮助用户优化上传视频的标题和标签,来让视频获得更高的社会关注度。该方法基于语义相关性和视频内容识别的技术来生成关键词。该方法一方面针对初始视频标题中的关键词在WordNet中搜索语义最相关的单词;接着在YouTube,Yahoo视频,Bing视频三大主流视频分享网站中搜集与视频主题相关的视频标题关键词;另一方面,通过深度学习的图像识别技术提取视频内容中的实体信息;最后提出TF-SIM算法对扩展的关键词集合进行排序;最终提供给用户与上传视频最相关的关键词用于优化上传视频的标题和标签。(3)针对提出的视频社会关注度提高方法以及TF-SIM算法,本文做了详细全面的对比实验,针对实验结果分别进行了专业网站评价,用户主观评价,YouTube实验。通过这三方面的实验结果证明了通过方法推荐的关键词优化后的视频的标题和标签可以吸引更多的关注度和更长的观看时间,同时也说明了TF-SIM排序算法是有效的。