论文部分内容阅读
近年来,随着移动互联网和物联网等计算机信息技术和应用的快速发展,各种互联网媒体中数以亿计的用户无时无刻地在产生各种交互行为数据,数据量巨大、格式多样。本文围绕用户生成的交互行为数据,综合分析用户的行为,开展其中的典型关键性问题研究,包括点击流行为、文本内容、图像识别和视频动作识别等。研究成果概述如下:(1)针对用户的点击流行为分别提出基于点击流和基于自定义事件的两层模型聚类算法。首先,设计通用的方法来计算会话的相似度;接着,利用改进的DBSCAN算法在第一层聚类中获取会话聚类;最后,在第二层聚类中利用K-means算法,根据每一个用户在不同会话聚类中产生的所有会话的分布对用户进行聚类。(2)针对用户行为分析中的文本识别问题,结合辅助句子提出一种基于BERT的改进文本分类模型,通过构造辅助句子的方式将训练数据中的知识更好地引入到BERT模型的微调中,同时针对学习率、句子长度和模型结构等方面对BERT模型上的一些不同微调策略进行对比分析。(3)针对用户行为分析中的图像识别问题,重点以衣物复杂图片作为目标研究对象,利用逆卷积上采样特征图的方法,解决了衣物关键点预测的热力图分辨率过低的问题,并且在用Res Net-50结构进行特征提取的基础上,加入基于注意力机制的多重特征增强模块,弥补了上采样过程中的空间细节及特征丢失的不足,并使得用于预测衣物关键点的热力图分辨率与输入图像一致。(4)针对用户行为分析中的视频动作识别问题,提出一种基于神经网络的模型,用于解决弱监督的动作定位问题。在仅给出视频级标签的前提下,利用候选片段选择层连接输入的动作候选片段和视频标签,使得视频级损失函数可以被迁移到候选片段级损耗,并且可以有效地微调网络参数,从而成功训练两级网络来定位视频中的动作。与面向用户行为的图像识别相比,视频动作识别有助于进一步识别时间序列图像中所包含的用户行为动作问题,提升用户行为分析的准确性,并为面向海量视频的用户行为分析研究奠定基础。