面向视频弹幕的消费意图挖掘研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:gongleiwp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术给人们带来了便捷的交互信息的方式,随着技术的发展,视频弹幕作为一种新兴的文本交流方式,逐渐被广大网友接受和使用。弹幕是指直接显现在视频上的文本信息,它能够以滚动、停留以及更多特殊效果的方式展现在视频上,是视频观看者发送的简短评论。随着视频弹幕应用的日益广泛,对其中蕴含消费意图文本进行挖掘的需求也与日俱增。由于视频弹幕具有文本长度极短、语义缺失严重等特点,导致已有的消费意图挖掘方法在视频弹幕领域无法获得较好的效果。本论文结合视频弹幕的文本特征,研究更适合应用于视频弹幕环境的消费意图挖掘方法,具体而言主要完成了以下研究工作:1.视频弹幕数据的获取与分析。视频弹幕作为视频媒体中的主要文本存在形式,前人研究鲜有涉及。针对该领域的研究现状,本文首先对弹幕视频文本进行采集,其中主要运用两种方式,即调用视频网站官方API的方式和模拟登陆网页的方式。然后对获取到的数据进行分析,总结视频弹幕领域文本特征,并将这些数据特征应用于后续研究中。2.视频弹幕消费意图的识别。视频弹幕文本简洁,经常会有部分结构省略,导致已有的基于文本内容的消费意图识别方法难以达到理想的效果,因此本文提出了一种基于模板特征的消费意图识别方法。该方法首先使用基于Prefix Span算法的模板提取方法自动生成消费意图模板,其次通过文本匹配的方法借助上步生成的消费意图模板将弹幕文本转化为模板特征向量,再次将上步中转化而来的模板向量作为输入训练消费意图识别模型,最后使用该模型对视频弹幕的消费意图进行识别。实验证明,该方法相较于传统的文本特征分类模型,能够有效提升视频弹幕中消费意图识别的速度和准确性。3.视频弹幕消费意图对象的识别。对于确定具有消费意图的弹幕,本文提出了一种结合TF-IDF(Term Frequency–Inverse Document Frequency)、句法关系特征与文本交互信息的消费意图对象识别方法TF-SI-IDF(Term Frequency–Syntactic Relations&Interactive Information-Inverse Document Frequency),对视频弹幕中的消费意图对象进行抽取。在显式消费意图对象的抽取中,相比于原有的消费意图对象抽取方法,本文的抽取方法融合了句法特征及弹幕数据的交互信息,能够获得更好的抽取效果;在隐式消费意图对象的抽取中,本文首先利用弹幕文本的交互信息对存在隐式消费意图的文本进行补充,之后使用本文提出的消费意图对象抽取算法对补充词进行抽取。实验证明该方式能够很好地完成消费意图对象抽取,为隐式消费意图对象的抽取工作提供了一种新的思路。
其他文献
目的对小切口髋关节置换术及常规切口髋关节置换术患者进行比较,了解两种方式的各自特点,为临床治疗提供依据。方法60例初次进行髋关节置换治疗的患者随机分为观察组(n=30)及
肺结核合并肺真菌病随着抗生素及糖皮质激素广泛应用,其发生率逐年增高,临床及胸部X线表现呈多样化常,易导致误诊.本文就本所近5年收治的28例肺结核合并肺真菌病诊治情况进行
结合鸭嘴河烟岗水电站厂区枢纽工程,介绍了锚喷边坡防护设计方案。详细阐述了边坡锚杆喷射混凝土施工技术,并指出各工序应注意事项和相关技术要求,从而保证施工质量和防护效果。
患者,女性,13岁,学生,于1997年12月开始发热(T 38.5 ℃)乏力,胸痛,恶心,食欲减退,抗感冒治疗无效.于1998年2月25日在张家口市某医院经摄X线胸片诊为"粟粒性肺结核",用INH、RF
目的 探讨脂多糖(LPS)对感染卡介苗巨噬细胞表达细胞因子的影响。方法 用ELISA方法比较单独巨噬细胞组。巨噬细胞+卡介苗+LPS组,巨噬细胞+卡介苗组以及巨噬细胞+LPS组细胞因子
患者,男,22岁,主因间断咳嗽、右侧胸痛4月余入院.于入院前4月无明显诱因出现发热,体温38.5℃,咳嗽、咳少量白色泡沫样痰,右侧胸部刺痛,深呼吸及咳嗽时疼痛加剧,进食及二便正
暮春的阳光已有炙热之感,连片的桐花低调而浓烈。2020年4月15日,新密市人大常委会机关组织全体人员开展了"强信心、鼓干劲、奋力助推高品质城市建设"调研活动。一个上午,大家
背景食管癌是世界范围内发病率和死亡率较高的恶性肿瘤之一,其发病率居世界肿瘤发病率第七位,是肿瘤相关死亡的重要原因之一。我国是食管癌高发地区,其发病率高于世界平均水
目前,我国石油石化企业处在高速发展阶段,液化烃球罐的数量和规模不断扩大。液化烃具有甲A类火灾危险性,一旦发生泄漏,很容易引起火灾爆炸等重特大生产安全事故,造成大量人员
目的建立一个新的肺结核病涂阳患病率调查方法及其推算公式.方法利用肺结核可疑症状者与无肺结核可疑症状者涂阳病人数构成比的参数作常数,建立直接症状检查法及其推数公式,