基于内容和用户标识的混合型垃圾弹幕识别与过滤研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:zhanghu216
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展和推进,网络信息技术的快速发展为电影、电视剧、综艺节目等视频内容创作开启了一个崭新时代。网络在线视频已经在人们观看视频过程中占据了重要地位,成为大众视频消费的主流。“弹幕”因其高互动性和娱乐性开始进入人们的视野,弹幕是指用户在视频网站上观看视频时,可以直接将评论发送并显示在屏幕上方的一种显示方式。在国内最早使用弹幕技术的是动漫圈内的视频吐槽网站Acfun(A站)和bilibili(B站),随着弹幕的发展,弹幕也不再仅仅使用在弹幕视频网站中,如今,国内弹幕应用虽然火爆,但是国内弹幕文化和技术的整体发展时间较短,当前针对弹幕的研究还相对匮乏,对弹幕的有效管理与研究还较少。本文以提高用户的弹幕使用体验为目的,探讨对弹幕文本的识别与处理,提出一种新的基于内容和用户身份标识的混合型垃圾弹幕识别算法,对已有算法进行改进,以更好的引导我国弹幕文化的积极发展,改善用户在使用与观看弹幕时的用户体验,提高网站的用户使用度和黏性,绿化弹幕使用环境。本文针对弹幕文本特征进行分析,对比以往垃圾文本识别研究中较多涉及的邮件以及短信等文本类型,总结出弹幕文本的自身特征,结合其自身特性以进一步加深垃圾弹幕识别的研究。结合弹幕文本自身特点,本文以基于内容的文本分类算法和基于用户身份标识的分类算法为基础展开研究,在已有研究基础上提出一种新的基于以上两种文本分类算法相结合的混合型垃圾弹幕识别算法,并据此进行垃圾弹幕识别与过滤。本文利用从土豆网热播电视剧《琅琊榜》中爬取的弹幕数据作为数据来源进行试验分析,以验证本文提出算法模型的表现效果。通过实验研究可以看出,本文提出改进算法能够有效提高垃圾弹幕识别的准确性。
其他文献
核工业西北地质局二一七大队原驻甘肃成县,1989年驻地迁至宁夏银川。在改革开放的新形势下,这个大队从80年代起实行了企业化管理,并开始了民品生产和经营。为了适应新的历史
工程教育教学质量的提升亟需成立工程教育系等专门凝聚工程教育教学和研究资源的组织机构.美国普渡大学工程教育系根基深厚、资源丰厚、特色明显,形成了涵盖新生工程教育项目
期刊
本研究旨在对某管理学院工商管理本科专业零售管理课程翻转学习的效果进行评估.该课程中消费者价值传递及运营管理的相关内容被翻转,重新设计后的模式从以教师为中心转变为以
地方农业高校的通识教育对服务于“三农”的优秀专业人才的培养意义重大.然而,通过对某地方农业大学通识教育状况的个案调查,发现通识教育建设存在内涵认知不清、全人教育理
期刊
近十多年来,全球气候变暖问题已被国际社会列为全球十大环境问题之首,人类活动排放的温室气体中对气候变化影响最大的是二氧化碳。2010年8月,国家将陕西确定为低碳试点省,低碳发
目的 探究肥大细胞对肾癌细胞侵袭迁移的影响,并探讨其分子生物学机制.方法 786-O和769-P细胞系均来源于原发性肾透明细胞癌,具有相似的遗传和分子特征.将人肾癌细胞786-O和7
海淀区人民法院重视北京《支部生活》的订阅和使用工作.全院204名党员中,有142人自费订阅;120名团员、青年和入党积极分子中有114人自费订阅。在广泛订阅的基础上.院政治处
微博作为新型社交媒体的代表,自诞生以来就具备以用户为信息产生源和以用户为关注中心两个不同于其他媒体的特点,这也使其吸引了全世界十几亿的使用者,成为当今最热的网络媒体。