论文部分内容阅读
近年来,随着信息技术以及互联网的蓬勃发展,我国网购市场发展迅猛,电子商务已成为驱动我国经济发展的重要引擎。然而,随着时间的推移,电商平台积聚的各种信息不断膨胀,碎片化、海量化特征日趋明显,导致用户因无法深入地了解电商平台中商品、商家、品牌的真实情况,而难以形成准确、全面的认识。双结构网络在基于分组交换的互联网主结构的基础上,引入基于“辐射-复制”模型的播存网络作为次结构,形成了一种主、次结构共轭互补的二元结构互联网。借助具有丰富语义特征的统一内容标签(Uniform Content Label,UCL),双结构网络能够基于电商信息汇聚分析方法实现海量、无序电商信息的有效治理。然而,传统电商信息汇聚分析仅针对具体评论文本进行定性的情感分析和定量的汇聚融合。一方面,评论文本情感分析粒度较粗,无法给出具体的评价对象。另一方面,电商信息汇聚融合缺乏有效的信息关联与组织结构,既无法处理电商描述性信息,也无法将具体商家、品牌、商品范围内所有的评论文本作为一个整体进行定量的汇聚融合。针对上述问题,本文基于综合集成原理,在双结构网络中,提出了电商信息综合集成研讨厅。在电商信息综合集成研讨厅的基础上,本文提出了一种Aspect级电商评论文本情感分析算法ECALSA(E-Commerce Aspect-Level Sentiment Analysis);设计了一种双层结构的电商信息库ECIL_TLI(E-Commerce Information Library with Two-Layer Infrastructure);并基于ECIL_TLI提出了一种电商信息汇聚融合算法ECIA(E-Commerce Information Aggregation)。本文的主要工作如下:1)针对传统文本情感分析粒度较粗的问题,提出了一种Aspect级电商评论文本情感分析算法ECALSA。首先,ECALSA算法利用词性、句法及共现性特征,借鉴PageRank算法的链接排序机制,提出面向评价对象的CommObjRank算法,实现评价对象抽取。然后,ECALSA算法引入动态滑动窗口机制对LDA(Latent Dirichlet Allocation)模型进行改进,将词项共现限定在评论段级,实现评论Aspect提取。最后,ECALSA算法利用同义词和领域频繁共现的形容词、副词对基础情感词典进行扩展,并基于领域情感词典、否定词典实现电商评论文本情感分析。2)针对传统电商信息汇聚融合方法缺乏有效的信息关联与组织结构的问题,设计了一种双层结构的电商信息库ECIL_TLI,并基于ECIL_TLI提出了一种电商信息汇聚融合算法ECIA。ECIL_TLI是一个动态的电商关联信息库,需要不断地进行更新。首先,ECIA算法对ECIL_TLI下层库范围内所有评论文本的情感信息进行定量汇聚;然后,ECIA算法依据ECIL_TLI上层库中的电商描述性信息,实现电商信息的汇聚融合,满足用户发散性思维的需求。3)在双结构网络中,基于从定性到定量的综合集成原理设计并实现了电商信息综合集成研讨厅原型系统,并通过实验对ECALSA和ECIA算法进行了实验与分析。实验结果验证了上述算法的可行性,表明ECALSA算法可以有效实现电商评论文本的细粒度情感分析,ECIL_TLI库能够有效地组织和关联电商信息,ECIA算法可以有效实现电商信息的汇聚融合,帮助用户形成对商品、商家、品牌较为全面、科学的认识。