论文部分内容阅读
本文主要以豆瓣中最值得推荐的前250部电影为例,通过探索性的数据分析利用均值和标准差量化了豆瓣评分和星级评分的差异性,在此基础上以最小二乘原理进行二项式的拟合,得到二次拟合方程。同时,利用这些评分差异性之间的数据进行K-means聚类分析,得到三类不同的电影类型。可以为综合评分提供一个参考意见,增加综合评分的科学性。同时也能研究电影内部之间的差异。