一种数据采集与分析平台的研究与设计

来源 :电脑与电信 | 被引量 : 0次 | 上传用户:historycode
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网大数据技术的不断发展,网络数据采集技术成为热门的研究领域之一.基于Python语言下的数据采集功能库如Urllib、Requests、Selenium等模块效率低、易阻塞,并且目前的数据采集和分析平台都是独立的功能模块,没有形成闭环,用户体验差.为了解决上述问题,提出一种数据采集和分析平台,首先使用Scrapy框架完成数据采集,其次将采集到的数据通过Kettle工具进行数据清洗,再次,将处理好的结果存入MySQL数据库,最后利用Flask框架,结合Echarts技术搭建Web系统,对数据分析结果进行可视化.以北京公交网站数据作为爬虫测试平台,通过对公交线路类型、公交路线等信息进行采集分析及结果展示,分析结果对城市公交的规划具有一定的指导意义,同时,平台具有稳定可靠、操作简单、实时性强等特点.
其他文献
最近五年,卷积神经网络(CNN)得到了充分的发展,在图像分类领域,基于监督学习的算法在相关任务中取得了巨大的成功.但是与分类极为准确地粗粒度标签数据集相比,细粒度标签数据集的分类依旧是一个难点.地理图像被广泛应用于社会的各个方面,研究者往往需要对大规模的地理图像数据进行分类,但是由于地理图像的特征差异较小,因此自动化分类是相对困难的.对地理图像的细粒度特征进行标记,通过深度卷积网络对其进行训练和学习,极大地提高地理图像的分类精度.
近几年来,智慧教育已经成为我国教育信息化发展的重要内容.以中国知网核心期刊和CSSCI数据库作为数据源,以2010年到2021年关于智慧教育研究文献作为研究对象,运用CiteSpace软件对文献进行可视化分析,绘制知识图谱来探讨我国智慧教育研究的热点和趋势.研究表明:对我国智慧教育领域研究的现状处于上升趋势,已经形成了一批核心的研究学者,其研究热点主要是教育信息化、教育大数据、智慧课堂、区块链、智慧校园等内容,人工智能、5G、智能教育、教育现代化的融合发展的研究是我国智慧教育研究的主要趋势.总体来说,我国