基于Python爬虫的豆瓣电影影评数据可视化分析

来源 :现代信息科技 | 被引量 : 0次 | 上传用户:rundahe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用Python网络爬虫技术对豆瓣热度较高的电影《你好,李焕英》的影评数据进行了爬虫分析,根据爬虫所得到的影评数据信息,制作了影评词云图,通过数据可视化技术,对影评分数分布、评论数量与时间的关系,以及评论数量与城市分布的关系进行了相关的分析研究,从而直观地展示了电影上映后观众的观影感受,同时也为其他用户提供了些许观影参考.
其他文献
文章介绍并对比了现有GNSS、激光雷达、一次雷达、二次雷达等常用列车测距技术手段.结合列车辅助防护需求和典型应用实例,介绍了基于二次雷达测距技术的列车辅助防护系统一般构成、工作原理、关键技术和工程化实施方案,针对基于二次雷达的列车辅助防护技术应用难点及问题进行了分析和总结,并对其未来技术发展方向进行了展望.
项目基于嵌入式芯片设计了一款脉搏波呼吸频率检测系统,可应用于临床和家庭保健中的呼吸信号检测.项目对光电容积脉搏波信号的特征进行了深入研究,系统整体采用ARM芯片加Linux操作系统方案,主要包括ARM微处理器主板电路、脉搏波信号采集器、信号处理电路、LCD显示四部分.脉搏波信号的检测方法采用经验模态分解方法,系统稳定且结果数据误差小,达到项目要求.
学位
文章研究了无人机在公网频谱共享下的接入与干扰管理,通过联合设计无人机轨迹与数据传输调度以最大限度降低无人机的任务信息传输时间,设计中充分考虑了无人机实际飞行约束以及地面基站的计算能力约束.然而,联合无人机轨迹和信息传输所建模的问题是非凸的,通常难以求出最优解.为此,提出了一种高效的求解算法以获得高质量的解决方案.最后,通过数值仿真得出,相较于基准方案,所提方案的无人机任务完成时间大大降低.
目前国内外研究人员均未能就车载自组织网络丢包率较高这一问题提出有效的解决方案,鉴于此,文章探索了一种基于无人机协同组网的地空一体式车载自组网框架,并对网络性能进行分析.仿真结果表明,通过无人机协同组网可以大大降低VANET网络丢包率,对未来无人驾驶场景中VANET网络的构建具有一定的参考价值.
为了提高计算机网络安全中数据加密技术水平,文章引入并行同态处理思想,对以往网络数据加密技术进行改进.新的加密技术应用方案,通过分割文件数据,采取串行Map加密,调用Reduce函数,并行整合串行加密文件,引入最小化处理,降低加密计算复杂度.实验测试结果显示,文章提出的并行同态数据加密方案,能够有效提高数据加密效率,建议根据文件内存大小分割Map.另外,该加密方案应用后,网络数据安全性更高.
数字化彻底解决各种不方便,然而没有摆脱采样损伤导致冗余爆炸式膨胀.由于理解模式不一样,计算机跟生命体凭借算法进行对接存在难以克服的局限性.从自然智能到人工智能的缺失环节,适合选择物理学层面和生物学层面搜索答案.围绕天地人一体化实现途径,提出一种通信多维信息耗散工具变量.尝试通过描述空间与时间的转化,进一步填充电子技术和光学技术的鸿沟.
为掌握水下海珍品分布情况,本文结合YOLOv5s算法和注意力机制,得到一种新的轻量化目标检测模型——SE-YOLO模型.实验结果显示,相较于原YOLOv5s模型,该模型的准确率提升了1.1%、召回率提升了0.7%,并且在设计对比实验的过程中,发现传统图像增强算法并不具备提升目标检测准确度的可能.由此可见,本文提出的改进模型符合轻量化模型标准并兼具检测准确度高的优点,能够很好地完成对水下海珍品资源评估的任务.
文章对基于深度学习的亲属关系验证方法进行了深入研究,并针对由于人脸图像与其他自然图像存在较大的差异而导致的感受野较小的问题,提出了一种基于空洞卷积神经网络的亲属关系验证方法,构建了残差空洞卷积神经网络(RDCN Net),分别从父母与孩子的人脸图像中提取深度特征,经过特征融合后使用鉴别器得到亲属关系验证结果.算法在公开亲属关系数据集KinFaceW上进行测试,实验结果表明,本文方法在亲属关系验证的准确率上有良好的表现.
学位