Python爬虫技术在信息流行病学中的应用

来源 :中华流行病学杂志 | 被引量 : 0次 | 上传用户:weinziel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Python网络爬虫技术是一种通过模拟用户的网络浏览行为以实现从网络中自动、大量提取信息的技术,是信息流行病学研究收集并整合多源异构信息数据的关键基础。Python网络爬虫可分为简单爬虫与大型爬虫,集数据采集与数据库构建于一体,语法简洁、灵活性高、学习成本低、维护成本低。它适用于信息流行病学的各种应用场景,通过对互联网中健康相关信息的分析,实现多种公共卫生监测、健康干预实施及效果评价、智慧寻医方略优化等目标。近年,我国政府开始鼓励对含互联网信息在内的多源大数据的整合利用,在此背景下,Python爬虫技术的应用场景势必会越来越多,相应的人才培养、技术革新建议纳入到公共卫生教育和科研体系之中。
其他文献
在当今知识经济环境下,科技成为时代发展的主流。一个好的企业能否在激烈的市场竞争中生存和发展,很大程度上取决于它的科技发展能力,即技术创新能力,它已经成为企业赖以生存的支柱和持续发展的动力。在不确定的技术和市场环境下,技术创新成为企业获得和保持竞争优势的重要途径。如何避免技术创新的困境,提高创新绩效,成为管理学界和企业界共同关心的问题。本文通过国内外文献研究,结合有关理论从技术创新过程的角度凝练出技
目的:探究孕妇在孕早-中期体力活动变化对孕中期抑郁的影响。方法:依托中国孕产妇队列研究·协和项目(2017年7月25日至2018年11月26日),将有效完成孕早、中期体力活动和抑郁情况
目的:了解重庆市部分地区新报告异性性传播HIV/AIDS的感染方式,为有效开展艾滋病经异性性传播的防控提供依据。方法:对重庆市部分地区2019年7月1日至10月1日新报告的异性性传
目的:了解MSM不同年龄组中CDn 4+T淋巴细胞计数(CDn 4)的进展变化,进一步探索HIV感染的疾病进程。n 方法:利用我国艾滋病综合防治基本信息系统截至2019年5月31日、
目的:探讨非肥胖人群的腰围轨迹与新发非酒精性脂肪肝(NAFLD)的相关性。方法:以开滦研究中符合入选标准的观察对象组成研究队列,依据观察对象2006-2007、2008-2009、2010-2011年健
随着企业信息化程度的不断提高,IT技术已经成为企业发展关键部分。IT服务管理,已成为企业发展的核心竞争力。源自于英国的ITIL(Information Technology Infrastructure Library