一种基于Storm的在线产品评论信息采集的方法

来源 :广东工业大学学报 | 被引量 : 0次 | 上传用户:CoolSky_BO
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对如何尽早地获取电商网站中产品的评论信息,进而实时地把握产品舆情,提出了一种基于Storm的在线产品评论信息采集方法.该方法将流计算的概念应用于网络爬虫中,并通过SHHD算法对采集周期进行动态调整.实验结果表明:基于Storm平台进行信息采集具有吞吐量大、可扩展性强等优点;SHHD算法可以有效地降低采集系统对网络带宽和系统资源的消耗,实现了适应性的增量的在线产品评论信息采集过程;SHHD在产品的评论信息获取的滞后时间上较Poisson、SART等方法具有明显的优势.
其他文献
本文研究了树莓在低温(4~6℃)贮藏时其纵横径和感观品质的变化以及贮藏4d后的失重率,研究表明采后树莓在贮藏中果实大小和纵横径逐渐减小,失重率逐渐增加,其变化幅度为完熟>适
摘要:双语教学是经济全球化和教育国际化对我国高等教育所提出的新要求。国际贸易作为一门外贸以及经济管理各专业的核心课程之一,实施双语教学显得尤为必要。但是,当前在我国高职院校实施国际贸易的双语教学还存在许多问题,必须在教学理念和教学模式等方面进行改进。   关键词:国际贸易;双语教学;高职院校    双语教学的理论定位    双语以及双语教学的概念,最早起源于美国、加拿大等移民国家。双语教学的目的主
棉酚是存在于棉花色素腺中的一种不溶于水而溶于有机溶剂的黄褐色聚酚色素.结合棉酚在动物消化道内不被动物吸收,毒性很小;而游离棉酚则易被动物吸收,对动物毒性较大,尤其单
研究了一类连续时间广义随机仿射系统的线性二次(Linear Quadratic,LQ)控制问题.在定义了广义随机系统稳定性的相关概念后,通过一个线性矩阵不等式(Linear Matrix Inequality,LM