论文部分内容阅读
在竞技体育中,估计参赛选手竞技水平的评分有着重要的作用。贝叶斯竞技水平估计是利用比赛结果(如胜、平、负)来客观估计参赛者竞技水平并对之线性排序的概率估计问题。当无法对大量参赛者进行直接比较时,这种仅对比赛结果信息建模的统计方法往往是非常客观和有效的。TrueSkill是使用概率图模型求解该问题的典型算法,而TrueSkill-T算法则用于估计参赛者在时间序列上的竞技水平。本文以参赛者竞技水平估计为研究对象,从比赛结果、比赛时间、比赛比分、先后手(主客场)等方面运用概率图模型构建了贝叶斯评分系统,在围棋比赛和足球比赛上测试了算法的性能,并将基于概率图模型的贝叶斯评分算法应用于推荐系统。具体而言,本文的主要工作如下:(1)将TrueSkill模型应用于围棋棋手竞技水平的估计上,提出排名结果的评估方法,对比分析等级分、E1o评分和TrueSkill算法,实验结果说明,TrueSkill算法有更好的客观性、时效性、稳定性以及准确性,在淘汰赛制的比赛中TrueSkill算法要优于Elo算法。(2)针对围棋比赛的特点对TrueSkill-T算法进行了简化和修改,实现了TrueSkillGo-Year模型。为了研究TrueSkill-T算法在实际排名应用上的可行性,分别基于真实的围棋比赛数据和仿真数据,从对数据缺失、对数据错误等方面考察了算法对数据的适应能力。实验结果表明TrueSkill-T算法排名结果符合领域常识,具备实际应用的性能。(3)针对体育竞技中先后手(主客场)差异会以影响比赛结果的噪声的形式干扰估计结果,本文提出了一种对先后手优势建模的方法,基于此方法的评分系统可以同时自动学习参赛者的真实竞技水平和先后手优势。在两个真实数据集上与三个已有模型的对比实验结果表明该方法的有效性,估计结果的精度有较大提高。(4)针对基于成对比较的推荐算法输入空间大、维度灾难等问题,本文将基于内容的推荐算法与用户对产品的评价信息结合起来,提出了基于概率图模型的推荐算法,模型的拓扑隐式地表达了产品评价的结构信息,缩减了模型的输入空间,并通过学习产品品质的全局随机变量和用户评分的偏好使得在用户评分数据较少的情况下能进行预测推荐,实验结果表明基于概率图模型的推荐算法的精度较以往算法有大幅提高。