论文部分内容阅读
随着网络技术的发展和用户带宽的提升,未来网络业务的关注重点从传统的传输层面的服务质量(QoS)升级为用户层面的体验质量(QoE)。如何提升用户的体验质量,从而提升用户的认可度和黏度,是当下网络业务发展亟待解决的问题。本论文紧密围绕着视频业务中的用户体验感知关键技术这一科学问题,通过采集视频网站的视频数据和多个运营商的现网数据,分别建立了基于混合非均衡算法的用户投诉预判模型、基于人工神经网络的直播个性化体验预测模型、基于个性化的点播视频体验质量评价模型与基于时间序列特征和Adaboost的瞬时用户体验预测模型。本文的主要贡献如下:
(1)针对目前非均衡数据集的用户体验预测缺乏有效的模型这一科学问题,本文建立了基于混合非均衡算法的用户投诉预判模型。该模型将数据分布和成本敏感的非均衡处理算法相结合,分别从均衡数据分布和调整样本权重两个方面建立了用户体验预测模型。在基于数据分布的非均衡处理方面,本文首先提出了一种基于自适应合成采样的过采样算法,以解决传统过采样算法没有考虑样本之间距离的缺陷。然后将该过采样算法和逐级优化递减的欠采样算法相结合对数据分布进行均衡优化。在基于成本敏感的非均衡处理方面,提出基于Adaboost的改进模型K-Adaboost,其改进了Adaboost模型在更新样本点权重时,没有考虑数据分布的缺点。实验结果表明本文提出的模型相对于目前的主流机器学习算法,预测用户体验准确率有显著提升,模型整体的值最高达到了0.7292。
(2)针对目前在直播节目中用户体验评价模型没有充分考虑用户兴趣以及相应的量化方法这一科学问题,通过对直播节目的关键因素的相互作用以及其对用户体验影响的深入分析,本文提出了量化直播节目的用户兴趣指标uindex并建立基于人工神经网络的直播个性化体验预测模型。该用户兴趣指标考虑了直播节目用户观看行为的稳定性与多样性,因此能够在一定程度上反映出用户的观看兴趣。将该指标作为主观指标并结合客观的网络指标,通过人工神经网络算法构建了直播个性化体验预测模型。实验结果表明该模型能够更精确的描述和跟踪用户在观看直播节目时的用户体验的变化。
(3)针对目前在点播环境中网络参数提取成本过高以及用户兴趣存在稀疏性导致难以建立用户体验模型这一科学问题,本文建立了基于个性化的点播视频体验质量评价模型。该模型通过计算剧集标签之间的相似度生成相似度矩阵,然后提出一种量化用户观看兴趣的权重值。将用户兴趣标签权重值和相似度矩阵进行映射之后,取得了用户关键兴趣相似度样本并通过K-means算法将样本进行聚类生成用户簇,最后针对不同的用户簇建立随机森林模型。该模型在不使用网络参数的条件下对点播场景的用户关键兴趣进行量化和聚类形成了用户簇,从而解决了用户兴趣稀疏问题。实验结果表明,该模型比传统算法的准确率至少高出5%,能够解决点播节目中用户兴趣存在的稀疏性问题并能很好的预测用户体验。
(4)针对目前缺乏有效的瞬时用户体验量化方式及预测模型这一科学问题,通过对弹幕和视频属性之间的关联分析以及其自身的时间序列特征的研究,本文提出了基于时间序列特征和Adaboost的瞬时用户体验预测模型。该模型首先对弹幕进行自然语言处理,从中提取出用户的情感并映射成用户体验的时间序列。然后对用户体验的时间序列进行时间特征提取,并结合视频信息通过Adaboost算法构建了瞬时用户体验模型。该模型不但能够量化用户的瞬时体验,而且实验结果表明该模型的准确率达到了69.15%。
本文所研究的视频业务中的用户体验感知关键技术可为以后多个场景下的用户体验建模、用户兴趣分析以及各类基于用户体验的实际应用提供良好的理论依据、实验基础和工程支撑。
(1)针对目前非均衡数据集的用户体验预测缺乏有效的模型这一科学问题,本文建立了基于混合非均衡算法的用户投诉预判模型。该模型将数据分布和成本敏感的非均衡处理算法相结合,分别从均衡数据分布和调整样本权重两个方面建立了用户体验预测模型。在基于数据分布的非均衡处理方面,本文首先提出了一种基于自适应合成采样的过采样算法,以解决传统过采样算法没有考虑样本之间距离的缺陷。然后将该过采样算法和逐级优化递减的欠采样算法相结合对数据分布进行均衡优化。在基于成本敏感的非均衡处理方面,提出基于Adaboost的改进模型K-Adaboost,其改进了Adaboost模型在更新样本点权重时,没有考虑数据分布的缺点。实验结果表明本文提出的模型相对于目前的主流机器学习算法,预测用户体验准确率有显著提升,模型整体的值最高达到了0.7292。
(2)针对目前在直播节目中用户体验评价模型没有充分考虑用户兴趣以及相应的量化方法这一科学问题,通过对直播节目的关键因素的相互作用以及其对用户体验影响的深入分析,本文提出了量化直播节目的用户兴趣指标uindex并建立基于人工神经网络的直播个性化体验预测模型。该用户兴趣指标考虑了直播节目用户观看行为的稳定性与多样性,因此能够在一定程度上反映出用户的观看兴趣。将该指标作为主观指标并结合客观的网络指标,通过人工神经网络算法构建了直播个性化体验预测模型。实验结果表明该模型能够更精确的描述和跟踪用户在观看直播节目时的用户体验的变化。
(3)针对目前在点播环境中网络参数提取成本过高以及用户兴趣存在稀疏性导致难以建立用户体验模型这一科学问题,本文建立了基于个性化的点播视频体验质量评价模型。该模型通过计算剧集标签之间的相似度生成相似度矩阵,然后提出一种量化用户观看兴趣的权重值。将用户兴趣标签权重值和相似度矩阵进行映射之后,取得了用户关键兴趣相似度样本并通过K-means算法将样本进行聚类生成用户簇,最后针对不同的用户簇建立随机森林模型。该模型在不使用网络参数的条件下对点播场景的用户关键兴趣进行量化和聚类形成了用户簇,从而解决了用户兴趣稀疏问题。实验结果表明,该模型比传统算法的准确率至少高出5%,能够解决点播节目中用户兴趣存在的稀疏性问题并能很好的预测用户体验。
(4)针对目前缺乏有效的瞬时用户体验量化方式及预测模型这一科学问题,通过对弹幕和视频属性之间的关联分析以及其自身的时间序列特征的研究,本文提出了基于时间序列特征和Adaboost的瞬时用户体验预测模型。该模型首先对弹幕进行自然语言处理,从中提取出用户的情感并映射成用户体验的时间序列。然后对用户体验的时间序列进行时间特征提取,并结合视频信息通过Adaboost算法构建了瞬时用户体验模型。该模型不但能够量化用户的瞬时体验,而且实验结果表明该模型的准确率达到了69.15%。
本文所研究的视频业务中的用户体验感知关键技术可为以后多个场景下的用户体验建模、用户兴趣分析以及各类基于用户体验的实际应用提供良好的理论依据、实验基础和工程支撑。