科研论文爬取与多维度分析系统的设计与实现

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:hbb88191312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代的到来,知网(CNKI)成为国内最大的论文数据库,如何高效地获取论文信息,挖掘论文价值,成为了一个亟待解决的问题。目前,论文检索工具多为通用爬虫,只能采集到部分少量的信息,且包含着不符合用户要求的信息,因此实现一个集聚焦论文信息采集和实时论文数据分析的系统变得极为重要。该系统针对如何高效获取论文信息,挖掘论文价值等问题,使用Python Django框架和Celery框架将网站和爬虫结合,实现了爬虫的自动化。系统分为论文爬取模块和多维度分析模块。其中,论文爬取模块使用Selenium,模拟用户点击
其他文献
士文化是中国社会发展的产物又是传统文化的重要组成部分,民族企业形象包装设计的实质是对传统文化的传承和新文化的创造;当前企业形象包装设计对士文化的态度在很大程度上关
财政收支效率是国民经济的生命线,对国库库款变化有着至关重要的影响,财政收支效率的高低是评价我国财政体制框架的核心和关键指标。目前我国国库管理面临复杂的宏观形势,在
【目的】观察茯苓酸对宫颈癌细胞Caski存活、凋亡的影响及潜在作用机制。【方法】采用四甲基偶氮唑盐(MTT)法观察茯苓酸处理或转染的Caski细胞生存能力,流式细胞术观察茯苓酸
4月8日,2019中国工程机械国际品牌推介活动新闻发布会在国际最大的工程机械展览会,德国慕尼黑的bauma展,隆重举行。在十九大贸易强国战略引领下,商务部制定系列政策,着力推进
随着我国对外汉语专业的快速发展,海外大量的留学生来到中国学习汉语,大多数学过多的关注听、说、读的能力培养,而忽视了写作能力的培养,而写作能力对汉语学习是非常重要的,
屯溪,原为徽州地区屯溪市,一九八七年四月一日起改为黄山市屯溪区,为黄山市府所在地,古属徽州府。屯溪位于黄山南麓、新安江畔,正处于皖浙赣三省交汇地带,东邻歙县汪村区(今
本文阐述了建立肉类溯源系统对我国食品安全和国际贸易的重要性,并对溯源管理、食品溯源系统进行概述。重点讲述各种DNA标记技术的原理、利弊,以及在肉制品溯源标记应用的比较
梨园戏是闽南人民八百年来生活智慧的结晶,它于2006年成为首批国家非物质文化遗产。作为成熟的剧种,它在不断向前发展的过程中,势必要以"变"来持续激活自身的生命力,并在"变"中强
要想提高学生的作文能力,就要提高学生的语文综合素质。怎样才能有效提高小学生的作文能力呢?本文从六个方面展开论述,为小学语文写作教学提供新思路。