论文部分内容阅读
个性化推荐算法是通过把海量信息经过筛选、过滤,将用户潜在需求的产品呈现在用户面前。其中协同过滤算法是电子商务和社交网络中应用最广泛和最成功的个性化推荐算法,它是根据用户的评分或者用户在浏览网站时中产生的隐形数据来分析用户的偏好,进而推荐用户感兴趣的产品。但是这类推荐中存在明显的弊端,两个用户对产品整体的历史行为相似,但是他们对产品某些属性的偏爱程度是不同的,这显然制约了一个推荐系统的推荐效果。用户网购调查显示,用户在购买产品的时候更注重已购或者已使用用户对产品的评价,因为商品的评价信息中包含用户对产品某些属性真实的主观观点、情感、喜好。因此,基于产品评论信息挖掘产品的属性词以及用户对产品属性的情感倾向性分析,对构建更加精确、完美的推荐系统有着重大的意义。本论文针对美团网美食店的评论信息作为研究对象,提出了一种基于情感分析的个性化推荐算法,其中对产品特征词的提取和归类、用户情感倾向性分析、构建用户的兴趣模型等方面着重进行了研究分析。(1)提出基于频繁特征和非频繁特征两个方面从评论文本中抽取特征。首先利用Apriori关联规则算法提取频繁特征,并通过点互信息(PMI)和特征-情感词的共现率过滤频繁特征。然后针对频繁特征的情感词与非频繁特征共现的特点提取非频繁特征。(2)以字符串、语义的相似度以及特征对应的观点词作为特征词之间的关联权重,改进K-means算法初始质心的选择实现特征自动聚类。(3)细粒度的分析美食店评论信息,使用情感词典匹配的方法,对美食店特征句子极性判断。从用户对美食店特征的关注度以及挑剔度两方面构建用户的兴趣模型。本论文的研究摒弃了用户评分单个因素的推荐,通过对美食店评论特征多维度的提取,考虑了美食店多重属性因素,避免了推荐那些通过竞价排名、投机等行为而获得高评分的商家;对用户的评论进行了情感分析,深入分析用户潜在的内心活动,挖掘他们对美食店属性的兴趣。理论和实验表明,本论文的研究较传统的协同过滤算法大大提高了推荐的性能和效果,同时降低了对热门物品的推荐,更加符合用户的推荐要求。