色情视频的音频辅助识别

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:jinhait2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术和多媒体技术的不断发展,人们日常生活中接触到的多媒体信息越来越多,数字视频便是其中重要的一种。数字视频在便利人们生活的同时,一些问题也随之而来:暴力,色情等视频借机传播,成为了社会的不和谐因素。基于以上原因,识别并检测该类视频就成为一项有实际意义的工作。但是,视频文件一般数据量巨大,在处理的过程中,对于存储和运算的要求都较高。同时,从一般的视频流中直接提取出高级的语义信息仍然比较困难。因此,我们可以通过其他的途径来选取解决这一问题的办法。在视频文件中,音频是对视觉信息的一个极好的补充。同时,音频自身含有大量的特征信息。而就色情类视频本身而言,其在特定场景下,音频也具有自身特征。因此,本文选取了音频作为突破口来对色情视频进行检测和识别。色情视频所对应的音频在物理特性上与普通音频没有差别,因此可以选择一些传统的音频处理手段来处理色情类音频。本文选取了高斯混合模型(GMM)和隐马尔可夫模型(HMM)来构建分类和识别模型。主要工作包括模型(GMM模型和HMM模型)的训练。重点在识别系统框架的构建和实现。首先,从视频文件中提取出音频信息并转化为WAV格式(16bit,22kHz,单声道)的待测音频。待测音频通过汉明窗加窗处理后被分成0.02秒的短时音频处理帧。接下来对每个短时音频处理帧中提取出26维MFCC系数、1维过零率、1维短时能量、4维子带能量和4维子带能量比等特征,形成36维的特征向量。在色情音频识别过程中,首先利用短时能量将音频处理帧分静音帧和非静音帧,再利用GMM模型将非静音帧进一步分成音乐、语音、音乐语音混合声和环境声四类。最后再利用HMM模型从剩余的语音和音乐语音混合帧中识别出可能包含色情的音频帧。整个算法在VC6.0平台下实现。测试结果表明,整个系统可以有效工作,起到了良好的辅助识别作用。
其他文献
本文通过分析湖北“十一五”经济发展成就及问题,研究《湖北省经济和社会发屉第十二个五年规划纲要》和湖北农行“3510”规戈U的发展目标.提出湖北农行必须通过完成三农使命、
要打造一个有管理力、执行力的企业,必须在全行员工特别是管理层干部中培养对制度的敬畏和戒惧意识,使大家都能够做到在赞扬声中保持清醒和自警,在诱惑面前保持坚贞和正气,真正做
广东省农作物技术推广总站、广东省农业良种示范推广中心每年举办一次“国际农业种子精品示范会展”,规模之大、品种之多、规格之高,被誉为“农业良种广交会”。据了解,广东省衣
2009年,内蒙古乌兰察布市遭遇50年一遇的干旱,使得该市农业遭受了沉重的打击。痛定思痛,乌兰察布市农机局领导班子在学习和实践科学发展观的活动中,确定了运用农机服务手段,破解制
1.播前准备1)播种前应仔细查看地块情况,做到心中有数,以确保作业质量和机械安全。
“亮点”,远没有像夜空中一闪而过的流星般耀眼夺目,也没有霓虹灯般的绚丽多彩“亮点”就像矿工头顶上的矿灯一样,照亮自己脚下的路。“年年检点人间事,报花消息是春风”,韶关农机
近年来,我们一直将县域市场称之为蓝海市场、,很多人谈起县域,也颇有市场风光无限、天下任我驰骋的感觉。然而,重新审视县域,我们会豁然发现,如今的县域市场格局不再单一.对手也并非
广东省一直以来都是畜牧大省,畜牧兽医事业的发展速度在全国同行业中也是有目共睹的,无论是在畜产品市场、产量,还是重大动物疫病控制等方面,在全国都处于前列。一份耕耘,一份收获
阮市镇机关档案管理工作在去年9月通过诸暨市档案局重新认定的基础上,自加压力,把档案管理工作省级达标作为争创目标,经过近一年的艰苦努力,迈上了新的台阶。8月24日,受省档
随着科学技术的进步和社会生产力的发展,世界政治、经济、社会环境发生了巨大的变化。我国加入了WTO后,经济国际化步伐进一步加快,在这种大背景下采购部门承担的责任越来越大