基于Scrapy框架影视信息爬取的设计与实现

来源 :北京印刷学院学报 | 被引量 : 0次 | 上传用户:huangyulin2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了充分利用网上大数据资源,让用户能够方便利用影视信息,采用基于Scrapy框架的爬虫技术,开发了检索电影信息的搜索引擎。对豆瓣网站的影视信息进行爬取,以方便用户准确获取最新的电影信息。
其他文献
目的探究Bi PAP无创呼吸机治疗慢性阻塞性肺疾病(慢阻肺)对患者细胞间粘附分子-1、E-选择素和D-二聚体浓度的影响。方法将慢阻肺患者80例随机分为两组,对照组患者40例接受常
第一部分实时定量RT-PCR检测乳腺珠蛋白mRNA方法学建立目的建立SYBR GreenⅠ实时定量RT-PCR检测hMAM基因的方法。方法将hMAM基因RT-PCR扩增片段克隆到载体pGEM-T后,经测序鉴定
以武汉市汤逊湖为例,基于情景分析法,选取社会经济发展状况和水污染管理体系的健全程度作为流域污染物排放两大核心影响因素,在此基础上细化为人口、城市化率、经济发展状况
【正】 各省、自治区、直辖市、计划单列市财政厅(局)、国家税务局、新疆生产建设兵团: 1994年实行新的增值税制以来,对商业环节一般纳税人的征管稽查,一直是增值税征管稽查
《富连成画传》这本厚重的大书,在历经十余年的资料搜集、遴选、整理、编辑之后,终于在京剧科班富连成社创办110周年之际得以出版,可喜可贺。作为京剧史上最著名的科班富连成社
报纸
目的:提高对糖尿病酮症酸中毒(DKA)合并多器官功能衰竭(MOF)的早期发现、早期诊断、早期治疗,以减少发生率及病死率。方法:对28例DKA合并MOF患者的临床资料进行回顾性分析。结果:病情
目的本研究旨在通过噬菌体展示技术寻找与肿瘤逃逸相关的CD59活性位点,研制特异性针对CD59活性位点的短肽封条,观测其封闭或干扰效应,为肿瘤的靶向免疫治疗开辟一条新途径。方法
生态旅游区客流量的大幅度增加、各种形态的污染物相继出现,直接威胁生态旅游区的环境质量。在自然保护区开展真正的生态旅游必须采取以下具体措施:完善生态旅游规划;建立高
采用电化学分析手段,研究了钛在20、40、60和80℃甲酸溶液中的电化学腐蚀行为。结果表明,在不同温度的甲酸溶液中,钛均能在表面生成具有保护作用的钝化膜;随甲酸溶液温度的升
从全球视角看,货币政策是一国政府为实现其特定经济目标而采取的重要手段之一,疏通货币政策传导渠道和提升其有效性始终是各国关心的话题。1984年以来,我国通过五次货币政策