论文部分内容阅读
近年来,各种基于互联网及移动终端的技术发展使得商业数据不断信息化并向互联网终端汇集。通过数据挖掘,能够将网络商品交易数据充分利用,提供商业决策的关键信息。近来,数据挖掘技术在电商推荐系统、客户关系管理系统等应用中有着相当广泛的应用,也是越来越多管理者采取的新型而高效的业务处理方式。数据挖掘和商务智能结合数据统计分析处理、数据集成、有效信息转化等方法对商品交易数据、用户反馈数据进行搜集,利用相应的机器学习、统计分析和关联规则等技术对数据进行处理,并根据分析结果了解产品的销售信息,确定用户的反馈意见以及用户的观点和情感变化,从而提高市场占有率,提升对市场的响应速度。当代电商业务发展与数据挖掘的研究着重于将网络商业数据转换成为对业务有用的知识。同时,不断改进数据挖掘的算法,设计出针对具体应用的信息处理系统,得出准确的挖掘结果来表征商业数据中的隐藏知识,也是近年来数据挖掘的热点。与此同时,互联网也成为人们发布与分享意见、观点的一个重要媒介,意见挖掘技术也广泛地被研究和应用到这些信息资源上。而随着互联网及移动互联的飞速发展,网络交易、评论数据呈爆炸式增长之势。面对如此海量、繁杂及不断更新、动态变化的网络信息资源,传统的文本挖掘技术显然已经不能满足互联网动态内容的高维度、大数据、动态更新处理的要求。对此,本文以商业领域需求为背景,提出了一种基于意见挖掘的网络评论动态分析方法。这种方法不仅能够对大量的网络评论数据行进动态更新处理,同时能够对用户评论文本进行分解归类,识别用户在不同时间段内对产品相关属性的关注程度,并且自动归纳出用户对于相关属性的情感倾向,得到产品待宣传和改进的属性。同时,能够动态更新挖掘结果,最终将挖掘结果清晰地展示给管理者,使他们了解人们对某个事物的关注热点及看法态度,便于更好地制定商业决策。本文以时间窗口模型和文本特征提取技术为理论指导。归纳提取产品属性,并对相应属性的情感倾向进行分类总结。实验结果表明本文的方法在动态分析上非常有效。该算法不仅能给出较为准确的分类结果,同时能够动态地反映用户观点的变化,自动识别出值得关注的产品特征信息。