分布式主题舆情采集与分析系统设计

来源 :软件导刊 | 被引量 : 0次 | 上传用户:zhangchaoyi222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据和移动互联网的时代背景下,舆情信息的迅猛增长为其采集与分析带来挑战。运用分布式计算技术,有利于对领域海量主题舆情的快速采集与分析。研究主题舆情采集与分析关键技术,包括主题舆情采集技术、领域词典和中文分词,探讨分布式计算环境下的主题舆情采集与舆情数据分析,并利用面向对象的分析与设计方法,基于开源爬虫设计并实现了一个分布式主题舆情采集与分析系统。利用4个爬虫节点进行分布式采集,相比传统采集模式,该系统的平均采集速度提升了2.74倍。
其他文献
中国政府目前加大了海外追赃力度,但是中国目前的追赃手段均存在着不足,急需进行创新。《联合国反腐败公约》第43条提出了一个新的启示,即启动国外民事诉讼程序追逃海外腐败
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
为提高白芨组织培养效率,以白芨种子播种的无菌小苗为外植体,利用正交设计法研究了培养基中6-BA(A)、NAA(B)、香蕉泥(C)和马铃薯提取液(D)4种因素对株高和假鳞茎粒径的影响。结果表明
新生仔猪的饲养管理是整个工厂化猪场养猪流程中的关键阶段,也是最脆弱的阶段,极容易受各种因素的影响而导致仔猪死亡。初生仔猪死亡半数以上是发生在出生后的1个星期内,如能够
涡流无损检测方法是一种基于电磁感应现象对金属结构进行缺陷检测的有效方法,其具有检测能力强、非接触、扫描速度快等优点。但是,对于长输金属管道结构,当探头位于管道内部
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的:探讨MRI检查对膝关节韧带损伤患者检出率的影响。方法:选取2016年12月~2018年10月103例在我院接受诊治的疑似膝关节韧带损伤患者,入院后均行MRI检查,并于3~7 d后接受关
为获得等离子体点火器点火特性,使用自行设计的等离子体点火装置,对不同进口氩气压力和工作电流条件下的等离子体点火器高温射流特性和放电特性进行了实验研究,利用光谱仪对
目的:分析在乳腺微创手术中应用高频彩色多普勒超声定位的临床价值。方法:选取102例自2016年5月至2017年12月在我院经高频彩色多普勒超声定性并在其定位引导下切除乳腺肿块的
随着信息技术和计算机技术的进一步普及,为了满足用户需求的多样化,众包模式应用而生。一个众包网站能否成功的关键主要在于它能不能吸引相关用户的参与,并且拥有相对稳定和