基于综合集成原理的电商信息汇聚分析关键技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:ksxy008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术以及互联网的蓬勃发展,我国网购市场发展迅猛,电子商务已成为驱动我国经济发展的重要引擎。然而,随着时间的推移,电商平台积聚的各种信息不断膨胀,碎片化、海量化特征日趋明显,导致用户因无法深入地了解电商平台中商品、商家、品牌的真实情况,而难以形成准确、全面的认识。双结构网络在基于分组交换的互联网主结构的基础上,引入基于“辐射-复制”模型的播存网络作为次结构,形成了一种主、次结构共轭互补的二元结构互联网。借助具有丰富语义特征的统一内容标签(Uniform Content Label,UCL),双结构网络能够基于电商信息汇聚分析方法实现海量、无序电商信息的有效治理。然而,传统电商信息汇聚分析仅针对具体评论文本进行定性的情感分析和定量的汇聚融合。一方面,评论文本情感分析粒度较粗,无法给出具体的评价对象。另一方面,电商信息汇聚融合缺乏有效的信息关联与组织结构,既无法处理电商描述性信息,也无法将具体商家、品牌、商品范围内所有的评论文本作为一个整体进行定量的汇聚融合。针对上述问题,本文基于综合集成原理,在双结构网络中,提出了电商信息综合集成研讨厅。在电商信息综合集成研讨厅的基础上,本文提出了一种Aspect级电商评论文本情感分析算法ECALSA(E-Commerce Aspect-Level Sentiment Analysis);设计了一种双层结构的电商信息库ECIL_TLI(E-Commerce Information Library with Two-Layer Infrastructure);并基于ECIL_TLI提出了一种电商信息汇聚融合算法ECIA(E-Commerce Information Aggregation)。本文的主要工作如下:1)针对传统文本情感分析粒度较粗的问题,提出了一种Aspect级电商评论文本情感分析算法ECALSA。首先,ECALSA算法利用词性、句法及共现性特征,借鉴PageRank算法的链接排序机制,提出面向评价对象的CommObjRank算法,实现评价对象抽取。然后,ECALSA算法引入动态滑动窗口机制对LDA(Latent Dirichlet Allocation)模型进行改进,将词项共现限定在评论段级,实现评论Aspect提取。最后,ECALSA算法利用同义词和领域频繁共现的形容词、副词对基础情感词典进行扩展,并基于领域情感词典、否定词典实现电商评论文本情感分析。2)针对传统电商信息汇聚融合方法缺乏有效的信息关联与组织结构的问题,设计了一种双层结构的电商信息库ECIL_TLI,并基于ECIL_TLI提出了一种电商信息汇聚融合算法ECIA。ECIL_TLI是一个动态的电商关联信息库,需要不断地进行更新。首先,ECIA算法对ECIL_TLI下层库范围内所有评论文本的情感信息进行定量汇聚;然后,ECIA算法依据ECIL_TLI上层库中的电商描述性信息,实现电商信息的汇聚融合,满足用户发散性思维的需求。3)在双结构网络中,基于从定性到定量的综合集成原理设计并实现了电商信息综合集成研讨厅原型系统,并通过实验对ECALSA和ECIA算法进行了实验与分析。实验结果验证了上述算法的可行性,表明ECALSA算法可以有效实现电商评论文本的细粒度情感分析,ECIL_TLI库能够有效地组织和关联电商信息,ECIA算法可以有效实现电商信息的汇聚融合,帮助用户形成对商品、商家、品牌较为全面、科学的认识。
其他文献
农民工生计日益成为影响中国经济社会转型期国计民生的重要问题。本文基于生计概念和对英国国际发展署可持续生计分析框架的重新认识,探讨将其应用于农民工问题研究的必要性
本文详细地介绍了孙卫国和冯灏运用二阶微扰理论所导出的高阶振动力常数的求解公式、能量自洽法(energy consistent method-ECM)、ECM势能函数的定义以及用能量自洽法计算稳
<正> 现在青年第一个弱点,就是把事情太看容易,其结果不是侥幸,便是退却。因为大凡作一件事情,在起初的时候,很不容易区别谁为杰出之士,必须历练许多困难,经过相当时间,然后
期刊
<正>不久前央视3套和安庆电视台都播放了40集电视连续剧《女人花》,这是一部与安庆有关的电视剧,但在我市似乎并没有引起轰动,甚至还受到一些人的议论,因此,有必要冷静地对其
利用2000—2014重庆市人均地区生产总值、总人口数、房地产开发投资等相关数据,建立BP神经网络模型,通过与实际数据进行比较和误差分析,验证该模型在房价预测中的有效性。并
利用1985-2009年全国水平的时间序列数据,在测算了全要素生产率的基础上通过单位根检验、协整检验的方法实证分析了我国全要素生产率对食品加工业及机械设备制造业出口贸易的
<正>关于文化关系,现在流行的提法是"文化多元论",安乐哲甚至认为倡导"文化多元论"是解决亨廷顿提出的"文化冲突"的出路[1]。多元论是对中西文化二元对立思路的超越。然而,多
本文利用计量经济学方法,从四川省产业结构的实际出发,利用四川省1978-2010年各年三大产业的相关数据,建立了产业结构的经济计量模型,并对模型进一步分析,研究了四川省二十几
本文以促进学生之间人际关系的发展为基点,探讨了合作学习方法在体育教学中的运用所需要的有效条件及其教学效果,以期对同行有所裨益。
青藏高原拥有全球独特的放牧系统,国内外较少通过定量控制的放牧试验研究放牧率对畜粪分解的作用。用双层盆叠放法比较高寒草甸两个放牧率下藏羊粪的分解规律。8羊/hm~2放牧