【摘 要】
:
随着互联网的飞速发展,网络舆情信息量迅速增长,影响力不断增大。把握海量网络口碑舆情动向对维护企业品牌形象至关重要。通过搜集网络舆情信息,挖掘舆情正负面情感,提供舆情
论文部分内容阅读
随着互联网的飞速发展,网络舆情信息量迅速增长,影响力不断增大。把握海量网络口碑舆情动向对维护企业品牌形象至关重要。通过搜集网络舆情信息,挖掘舆情正负面情感,提供舆情统计报告,能够帮助企业科学监测品牌形象。企业需要为其定制的多品牌形象监测系统,且传统系统不能完成对海量舆情数据的处理任务。基于以上的现状,本文提出了基于Hadoop的品牌形象监测系统,利用Hadoop平台实现海量信息的存储和处理和情感挖掘统计,为企业实现各个品牌形象提供智能化的监测服务。首先介绍了基于Hadoop的品牌监测系统的背景和现状;对相关技术进行了学习,并对研究的关键内容进行了论述;以具有多个品牌的电信企业为例,进行了系统的需求分析;设计了品牌形象监测系统的总体架构,并对HBase数据库表和字段设计进行了详细说明;分别对舆情采集模块、网页预处理模块、舆情统计模块和统计图表web显示模块进行了详细设计,包括处理流程和类的设计。继而,在随后的章节,展示了最终的可视化界面,并对系统进行了测试;最后,对本文的工作成果进行了总结,并提出了改进方向。本文网络爬虫技术、HTML Dom技术、情感分析技术、Hadoop相关技术、jQuery等实现了“舆情采集->预处理->分析->呈现”一体化的品牌口碑监测系统。系统具有存储和处理大数据的能力,通过MapReduce处理实现所有品牌的舆情情感分析和统计、热词词频统计和倒排索引构建。实现了良好的可视化界面,可展示各个品牌的情感统计和打分、Top10热词,用户情感趋势,以及关注度趋势。综上所述,本文研究设计并实现的基于Hadoop的品牌形象监测系统可以支持大数据存储和处理,具有为企业的多个品牌提供实时、美观、可靠、智能、科学的品牌形象监测图形报告的强大功能。
其他文献
本文主要论述蚌埠市优质小麦的生产发展,系统分析蚌埠市优质小麦产业化发展的优势和小麦生产的相关问题,针对优质小麦的市场前景进行全面评估,并参照发展优质小麦主要省份的生产
稀疏性与组稀疏性在统计学、信号处理和机器学习等领域中具有重要的应用.本文总结和分析了不同组稀疏模型之间的区别与联系,比较了不同组稀疏模型的变量选择能力、变量组选择
目的1、基于肝细胞膜转运体初步探讨利福平(rifampin, RIF)和/或异烟肼(isoniazid, INH)致大鼠肝损伤的作用机制;2、基于肝细胞膜转运体初步考察甘草酸单铵(monoammonium glycy
数字媒体时代下,广告表现呈现出无限的可能性,其延展空间不断扩大。相对于传统广告,数字时代的广告表现无论在思维观念、形式调性、内容结构还是文体语言上,都更加强调互动、
目前我国人才派遣这种用工方式的产生和发展是建立在人力资源管理需求的基础之上,人才派遣用工方式的优点在于打破了传统的人才单位所有制,使人力资源实现了社会共享,并且通
2012年迎来了又一美国总统选举年,尽管总统选举,过程漫长,程序复杂,人们依然格外关注其中的总统电视辩论。本文以西方修辞学为理论基础,以2012年美国首场总统辩论视频和文本
水下滑翔器是一种新型的水下航行装置,它具有体积小、可反复使用、无污染等优点。根据所使用的驱动能源,水下滑翔器可分为电能驱动与温差能驱动,温差能驱动虽然能耗更低,但其适用
我国中小企业主要通过银行贷款这一途径进行融资。本文通过对广西207家获得贷款的制造业中小企业进行实证研究,分析企业资质、财务结构及"软信息"对中小企业融资绩效的影响。
隐匿性乙型肝炎病毒感染(Occult hepatitis b virus infection,OBI)常见定义为肝脏组织中可检测到乙肝病毒脱氧核糖核酸(Hepatitis B virus deoxyribonucleic acid,HBV DNA),
人粒细胞无形体病(Human granulocytic anaplasmosis,HGA)是一种新发蜱传人兽共患传染病,发病病原嗜吞噬细胞无形体(Anaplasma phagocytophilum)是一种专性胞内寄生菌,革兰氏阴性,可