论文部分内容阅读
随着电子商务逐步进入社会化商务时代,消费者发布和获取信息的渠道日益增多,但同时导致了信息过载的负面问题。推荐系统的出现,为用户提供了有效解决信息过载的技术途径。但推荐系统通常很难获得足够的评分信息,仅仅依靠评分也很难有效地描述用户兴趣及偏好信息。在线评论是用户对产品使用经验的具体意见反馈,利用评论信息能更加准确地描述用户对项目的偏好,同时有效地解决数据稀疏的问题。然而,在线评论具有非结构化、口语化等特点,增加了描述事物的不确定性。为了解决这类不确定问题,本文以在线评论和评分为数据源,结合不确定理论、意见挖掘等方法和技术,根据推荐系统服务的对象设计了个体推荐算法与群体推荐算法,并进行深入研究,具体内容如下:首先,针对在线评论中用户的不确定偏好问题,研究了结合不确定理论的情感分析模型,并将该模型应用到个体推荐算法中。利用不确定变量与不确定集来刻画用户在评论中表达的情感强度和情感极性,从而实现用户意见的模型化。根据情感分析模型,提出了新的用户偏好相似度计算公式,并将该方法应用到个体推荐算法中。其次,针对在线评论中多准则情感分析问题,研究了结合不确定理论和用户关注度的多准则情感分析模型,并将该模型应用到个体推荐算法中。考虑了用户对项目的整体满意度,利用回归分析方法来确定多准则数量。基于多准则领域情感词典,协调了数据中正、负情感词数量的不平衡问题。考虑了用户对多准则的关注度,基于不确定理论,建立多准则情感分析模型,并将该模型应用到个体推荐算法中。最后,针对推荐系统的服务对象,研究了基于评分的群体推荐模型。该模型以不确定统计为基础,协同过滤算法为框架,建立群体模型以协调群体成员之间的偏好冲突,最终实现群体推荐。实验过程中,结合大众点评网的酒店数据、运动健身数据、餐馆数据、MovieLens中公开的部分数据和Yelp的餐馆评论数据,验证了本文提出的推荐算法具有良好的准确性,并能有效地缓解数据稀疏问题。