基于主题网络爬虫的科研信息管理系统的研究与实现

来源 :安徽大学 | 被引量 : 0次 | 上传用户:danyuhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息管理技术的应用越来越广泛、越来越深入,科研信息管理系统在实施技术上越来越成熟。以往的科研信息管理系统只是将现有的信息录入并保存在系统数据库中,并没有对信息进行有效性验证,所保存的信息可能不准确,对后续的科研工作总结、考核等带来很多不便。本文系统是基于主题网络爬虫技术实现科研信息资源的搜索、抓取和分类等功能,通过将信息分类存储到本地资源服务器,实现对科研信息的验证,并实现对下载资源的添加与删除管理。通过对已下载资源的检索,能够有效地避免重复下载相同的信息资源,为科研信息的管理和验证工作提供有效的数据支撑。该系统以实际应用为开发背景,利用软件工程原理、软件开发方法以及利用ASP.Net技术构建了一个基于B/S(浏览器/服务器)模式的科研信息管理系统。本文的重点和难点在于对科研信息管理系统中信息验证的关键技术的研究及实现,提出一种适用于主题网络爬虫的科研信息管理系统模型,设计出一套相对完整、可行性较高的解决方案。本文对网络爬虫和科研信息管理进行深入研究,目的是建立基于主题网络爬虫的科研信息管理系统,该系统要求能够实现对科研信息进行管理,并实现对科研信息的验证,本文的主要研究内容如下:1在现有科研信息管理系统基本没有信息验证的背景下,本文将主题网络爬虫技术引入到信息管理系统中。在系统需求分析的基础上,结合主题网络爬虫技术,给出详细的系统设计解决方案,讨论了系统中主题网络爬虫在信息检索、信息下载、信息保存等方面的功能和实现方法。2针对主题网络爬虫,本文在充分研究传统网络爬虫的架构及其工作原理的基础上,进一步对网络爬虫的实现进行深入研究,包括网页的解析、网页内容的提取等,然后针对科研信息管理的功能特性,选择向量空间模型为爬虫的基准模型,并在此基础上设计出基于网页内容的网络爬虫搜索策略。3在需求设计和详细设计的基础上,开发实现基于主题网络爬虫的科研信息管理系统。该系统引入主题网络爬虫技术,在爬取的同时对动态交互节点进行分析,并通过一个验证过程,将经过验证后与主题相关的信息存储在本地服务器,能够较好的实现科研信息的验证功能。
其他文献
文中介绍了微塑料污染的来源、定义和危害,分析了船舶微塑料污染防治存在的主要问题,结合我国海事部门的管理现状对开展船舶微塑料污染的来源与占比关系研究进行了开创性建议
目的了解肾移植患者备灾行为现状,为制定相关干预提供借鉴。方法采用肾移植患者灾害准备度问卷对四川大学华西医院222名肾移植患者用网络问卷进行调查,通过“问卷星”收集资
重庆国裕古窖酒业有限公司坐落于风光恰人的中华龙故乡——重庆铜梁县,是一家集高品质白酒研发、酿造、销售为一体的综合性酒类专营企业。独特的生态环境,严格的质量把关,造就高
8月24日.首届国际领袖产区葡萄酒(中国)质量大赛在昌黎开幕,大赛以“国际领袖产区”概念,对在中国市场上销售的国内外葡萄酒产品进行质量评比,这在中国葡萄酒行业还是首次。中国食
在中国白酒的版图上,占国土面积六分之一的新疆是目前全国唯一无深层次竞争的市场。近年来,随着行业竞争的加剧,新疆白酒品牌在本地的市场份额不断被外来酒蚕食,在疆外的市场也在
本文围绕会计内部控制制度在乡镇卫生院的应用展开研究,通过分析当前先乡镇卫生院在会计内部控制管理工作开展过程中存在的问题,结合制度建设、体系建设和财务会计人员团队建
目的:探究新型冠状病毒肺炎流行期间接受社区防疫网格化管理的社区居民的睡眠质量情况,分析其相关因素。方法:选取2020年2月10—14日529名社区居家居民为研究对象,将其采用匹
6月8日。郑州桥西酒藏储商贸有限公司成立庆典在郑州中都饭店举行。郑州桥西酒藏储商贸有限公司是根据石家庄桥西糖烟酒食品股份有限公司战略部署而成立的一家具有独立法人资
提起法国,中国的普通老百姓必定会知道两个城市:一个是巴黎,时尚的花都;一个是波尔多,高贵的酒乡。
相对其他酒水中高端市场来说,广西一直波澜不惊,郎酒的红花郎、洋河的天之蓝、国窖1573和地产酒丹泉15年,是大家公认的市场主角。尽管陆续有不少外来品牌进入这个市场,诸如仙潭酱