基于Python的新浪微博用户数据获取技术

来源 :电子世界 | 被引量 : 0次 | 上传用户：sn00426

【摘要】

：

为了获取用于社交网络研究的新浪微博用户数据,本文改进了传统网络爬虫,设计了一个基于Python的新浪微博爬虫系统。该系统使用scrapy多线程爬虫框架,实现了模拟登陆、动态网

【作者】

：

罗咪

【机构】

：

东南大学信息科学与工程学院

【出处】

：

电子世界

【发表日期】

：

2018年05期

【关键词】

：

微博数据 Python Scrapy框架反爬虫机制

【基金项目】

：

江苏省高等学校大学生创新创业训练计划项目（201710286018Y）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了获取用于社交网络研究的新浪微博用户数据,本文改进了传统网络爬虫,设计了一个基于Python的新浪微博爬虫系统。该系统使用scrapy多线程爬虫框架,实现了模拟登陆、动态网页抓取和克服微博反爬虫机制等功能,抓取后数据被存储在My SQL数据库中,便于后续分析。实验结果表明,该爬虫系统获取数据的实行性和效率高,稳定性和准确性较好。

其他文献

福建省普通高校公共体育课程设置的研究

通过对福建省15所本科普通高校体育课程设置的调查，分析总结了目前福建省本科普通高校公共体育课程设置的内容、门类、学时以及考核评价等现状，并在此基础上提出了丰富体育课程

期刊

福建普通高校公共体育课程设置Fujian college Physical Education course setting

和谐社会视野下的大学生就业工作探析

大学生就业事关家庭、高校、社会和国家的发展与稳定，做好大学生就业工作是构建社会主义和谐社会的重要组成部分。当前，大学生就业工作中还存在着毕业生供求存在局部性、结构性

期刊

大学生就业和谐社会对策society of harmony college student job search measure

论4G技术在广播电视中的应用

随着社会正式迈入4G网络时代之后,4G技术在广播电视行业之中得到广泛的应用,并且其打破了环境、时间与地点的限制,其拥有非常明显的优势。因此,本文在分析4G技术特征的基础上

期刊

广播电视行业4G技术应用电视直播系统网络时代

社会主义荣辱观教育的难点及对策探析

来自经济、社会、家庭、教育等方面的诸多因素，给社会主义荣辱观教育造成一定的制约和影响，成为社会主义荣辱观教育的难点。从现有的社会经济发展状况和多数人思想道德的实际水

期刊

社会主义荣辱观教育难点对策socialist concept of honors and disgrace education difficulty

一款基于Arduino的遥控家居机器人的设计与实现

智能家居的发展优化了现代家庭的传统生活方式。基于Arduino设计和制作的家居机器人,在控制端(如手机)与受控对象(如家居机器人)之间采用无线通信方式,具有远程遥控功能,能够

期刊

ARDUINO智能家居遥控功能机器人设计生活方式现代家庭通信方式

在大学生入学教育中推广英语学习的需求分析

需求分析是科学地设置课程不可缺少的一个步骤，是西方教育中学前培训的一项重要活动．在中国高校中这项工作尚未受到足够的重视。以大学英语为例，针对教师“边调查，边教学”，即在课

期刊

大学生英语入学教育需求分析freshmen English orientational education need analysis

探讨在热能动力类专业开设经济管理类课程

本文阐述了在热能与动力工程专业培养计划中开设经济管理类课程的必要性,并针对目前动力工程学院经济管理课程的教学现状提出了有关该课程的教学内容、教材建设、教学时数等

期刊

热能动力经济管理教学改革

某型滤波器设备142.25MHz噪声干扰分析与解决措施

本文分析了某型滤波器设备在142.25MHz处受到干扰的原因,通过对干扰源以及干扰信号传播途径的分析,最后给出了解决措施,成功解决该滤波器的干扰问题。

期刊

干扰分析滤波器设备噪声传播途径干扰信号干扰源

"中华老字号"企业的视觉形象改造

通过对“中华老字号”企业存在问题的分析，面对“老字号”企业诸多方面的创新，提出导入视觉识别系统VI（Visual Identity），构建新的“老字号”企业视觉识别系统的基本元素和应用元

期刊

“中华老字号”企业视觉形象视觉识别系统Time Honored China Brands visual image VIS

’96四国女排邀请赛的技术统计与分析

通过对’96四国女排邀请赛六场比赛的各项技术统计，进行对比分析，为中国女排今后的训练和竞赛提供参考依据。

期刊

排球技术统计进攻拦网发球一传二传volleyball technical statistics offence blocking the

基于Python的新浪微博用户数据获取技术

与本文相关的学术论文