基于社交信息的网络视频分类

来源 :西南交通大学 | 被引量 : 0次 | 上传用户：guogangw1987

【摘要】

：

随着互联网技术的飞速发展,网络已经成为网民信息分享和交流的公共平台。视频作为声音、图像和文字等信息的载体,成为广大网络用户喜爱的交流媒介。随着网络视频的海量增长,

【作者】

：

朱义明

【机构】

：

西南交通大学

【出处】

：

西南交通大学

【发表日期】

：

2011年期

【关键词】

：

视频分类查询扩展伪相关反馈 SVM Hadoop

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的飞速发展,网络已经成为网民信息分享和交流的公共平台。视频作为声音、图像和文字等信息的载体,成为广大网络用户喜爱的交流媒介。随着网络视频的海量增长,如何对海量网络视频数据进行自动分类成为了研究的热点,同时它也是极具挑战性的前沿课题。网络视频分类是网络视频搜索中一项非常重要的任务。在本文中,我们结合模型驱动和数据驱动的方法,探索从新的角度对网络视频进行分类。新的分类模型从两个方面对分类性能进行了提高：一方面通过用户视频和相关视频的文本扩展,提高文本分类器的性能。基于模型的分类器使用视频标题和标签作为文本特征,我们将相关视频和用户视频作为扩展信息来补偿文本特征存在语义描述不足和噪声问题。用伪相关反馈来改善文本特征的分类性能。另一方面,我们结合模型驱动和数据驱动的结果。我们提取用户兴趣和相关视频信息,采用多数投票的方法结合支持向量机的分类结果来提高网络视频分类。我们结合文本分类提取的语义信息、相关视频中得到的视频相关性和用户视频中获取的用户兴趣信息,来获取最终的视频分类结果。从语义信息、视频相关度和用户兴趣信息的结合进一步的提高了网络视频分类性能。通过对YouTube的网络视频进行分类实验证明我们的方法分类性能优于传统基于文本的分类方法。在对网络视频进行分类的过程中,需要对大数据文件进行处理。我们采用当前广泛应用的Hadoop分布式处理平台来解决海量分类数据的预处理问题。Hadoop是目前云计算研究的关键技术,已经在Yahoo、Facebook等互联网公司有着运用。本文研究和分析了Hadoop分布式处理平台,在Hadoop平台上实现了海量分类数据的预处理。我们研究Hadoop的并行过程和数据接口；定义和实现基于图像处理的数据接口；对比了分布式平台和普通单机对海量图片处理的实验结果,最后分析了文件分片大小对时间效率的影响。

其他文献

时态关联规则挖掘算法研究及其在学术合作关系挖掘中的应用

学术关系是社会关系的重要组成部分,学术关系挖掘对于科技评价有着重要的意义。本文阐述了社会关系信息化分析技术的研究现状,研究并分析了数据挖掘中关联规则挖掘和时态关联

学位

渐进时间分区挖掘学术关系时态关联规则时间分区

结合路由服务的无线传感器网络按需时间同步协议

在无线传感器网络的众多技术中时间同步技术成为其重要支撑技术,其重要性是由无线传感器网络的特点决定的。众所周知,时间同步是在分布式系统中使用率非常高的一项技术,它涉

学位

无线传感器网络时间同步TPSNRBS路由协议GPSR按需

基于视频注册的视频水印算法研究

数字水印通过在数字产品中嵌入特有的数据信息的方法,保护数字产品内容的真实性和版权归属性,同时此种技术在法律中提供的证据、医院中的光片以及票据等领域也有着广泛的应用

学位

视频水印几何变换时域同步空域同步

基于信息瓶颈的图像分割算法研究

图像分割技术在图像处理领域一直以来都得到了广大研究人员的关注,它是从图像处理到图像分析过程中的一个关键环节,图像分割的质量直接影响到后期对图像分析的结果。传统的图

学位

IB方法图像分割信息瓶颈灰度图像

可拓检测中不可测物元的特征研究

随着科学技术的发展,检测技术已经成为一种关系经济发展和科技进步的关键技术。同时,现代科学技术的迅速发展也为检测技术与检测工具的创新提供了强大的推力,特别是计算机技

学位

可拓检测绝对不可测物元相对不可测物元数学模型模糊模型

WoIP over WLAN QoS的分析与研究

VoIPoverWLAN即VoWLAN,是一种基于无线局域网(WLAN)的VoIP应用。VoIP和WLAN技术均是处于蓬勃发展中的热门网络技术。VoIP具有低成本和高通话质量的特点,WLAN具有可移动性、低

学位

无线局域网网络技术VoIP服务质量

统一门户下分布资源库使用机制的研究

资源共享是人类追求已久的美好理想。随着信息化的不断推进,用户构建了大量的数据库,存储了丰富的信息资源。在企业信息化过程中,大多数用户采取的是“需要一个、建设一个”

学位

统一门户分布资源库二级代理

基于IPA和过滤驱动的文件控制系统的研究与实现

21世纪是信息的时代,信息已成为一种重要的战略资源,是一个国家综合国力的重要组成部分。随着计算机科学技术的快速发展,信息的安全和保护在各种应用中已显得越来越重要。文

学位

文件控制访问控制透明加解密IPA过滤驱动

基于平行坐标的线积分卷积矢量场可视化方法研究

矢量场可视化是科学计算可视化研究领域中具有挑战性的研究课题之一,具有广泛的应用领域。生活中大规模的矢量数据被转换为图形、图像,把矢量数据直观形象的表达出来,方便人

学位

矢量场可视化线积分卷积流线生成颜色增强场强驱动

多优先级队列CPI分组调度算法

随着网络业务的增多,某些交换节点经常发生拥塞,造成分组丢失和时延过大。这些现象引起了人们对网络服务质量QoS(Quality ofService)的关注。　　本文对网络服务质量进行了

学位

网络服务质量分组调度算法CPI算法超级优先级分组丢失率

基于社交信息的网络视频分类

与本文相关的学术论文