网络蜘蛛相关论文
提出了一个基于Agent技术的数据采集系统,介绍了它的设计思想和工作流程,根据系统的需求分析,建立了一套基于人才招聘用户自定义的......
随着Internet的迅速发展,Internet上的信息成指数增长。由于网络信息资源的飞速增加,给人们在网上寻找所需信息带来了很大的困难。搜......
市场竞争日益激烈,为了减少复杂多变的企业竞争环境中的不确定因素,越来越多的企业开始逐步构建竞争情报系统。企业竞争情报具有不完......
随着因特网技术的广泛应用,因特网上Web信息资源呈指数级增长,传统的搜索引擎正面临巨大的挑战。各类专业搜索引擎应运而生并受到广......
近年来,如何在Web海量信息中尽可能多地获取与用户兴趣相关的页面是搜索引擎领域研究的热点之一。本文通过改善网络蜘蛛的自适应性......
因特网上的信息日益丰富,已经成为知识获取的一个重要来源。信息资源的丰富也使信息的检索有如大海捞针,检索到自己所需要的信息资源......
随着WWW上信息资源数量成几何级数的增多,如何在海量数据空间中快速、准确的获取用户所需Web信息成为研究的焦点。本文设计并实现了......
搜索引擎是用户利用网络资源不可或缺的工具,离开搜索引擎用户几乎无法利用海量的网络资源。但是目前搜索引擎的查准率有待提高,这是......
随着Internet的发展,网络信息爆炸和人们日益增加的信息获取需求矛盾暴露出来。网络信息检索技术成为了社会研究的热点技术,其中搜索......
搜索引擎是从WWW上快速而有效地获取信息资源的捷径,而网络蜘蛛技术则是搜索引擎的关键。本文围绕WEB信息挖掘这一前沿性研究领域......
随着Internet和Web技术的飞速发展,WWW已经成为人们进行信息交流不可缺少的巨大信息空间。面对如此大量的信息,人们在寻找自己所需要......
随着网络的发展和Web资源的丰富,利用Web全文信息检索系统来获取所需信息已经成为人们日常生活的重要组成部分,用户也越来越关注如何......
目前,随着万维网上信息量的爆炸性增长,搜索引擎已日益成为人们获取各种信息的重要工具。针对通用搜索引擎的缺陷,一种结合领域知识和......
随着Internet的迅速发展,网络信息增长的速度与人们获取所需信息能力之间的矛盾越来越突出。搜索引擎这一新兴技术也越来越体现出......
随着互联网技术的飞速发展,互联网络上的信息量正在以几何级数的增长速度增长,因此,对网络上信息的高效检索成为互联网发展必须要解决......
由于Web海量信息处于不断的变化中,通用搜索引擎已经很难再为用户提供一个高质量的、全面并且更新及时的信息搜索服务。通用搜索引......
随着互联网(Internet)的高速发展,人们的信息来源得到了极大的丰富,信息获取方式也随之而改变。这为人类带来机遇的同时也带来了挑......
当今的社会已经由信息主宰,用户对于计算机的应用提出了更多的需求。用户对于事务处理的电子化与自动化,信息管理自动化系统,web搜......
伴随着信息化进程的加快,越来越多的企业构建了自己的Web站点,通过站点向用户提供产品和服务信息。但伴随的问题是,随着Web信息资......
随着网页信息量越来越大,采用通用搜索引擎搜索某一个方面的信息时覆盖率和准确率低,回馈的内容不够详细,噪音过多,维护庞大的网页......
每天众多的财经网站会发布股票信息,这些信息数据量巨大、存在大量冗余和容易混淆的数据,一般的用户需要花费很多时间才能获得自己......
跨站脚本(XSS)攻击是目前Web应用程序最大的安全问题之一。最近研究人员提出的漏洞检测模型XSS-SAFE通过Java Script的特征注入和J......
搜索引擎是信息检索必备的工具,也是一门非常适用的技术,虽然各大搜索引擎在不断地完善和发展自己的技术,但是仍然满足不了用户的......
网格信息检索是信息检索和网格技术相融合的新领域。与搜索引擎相比,网格信息检索将搜索任务分配给网格上相关的计算资源,极大地提升......
随着Internet的飞速发展,Web的信息量越来越大,传统的搜索引擎已经不能满足人们对个性化信息检索服务的需求。对于用户提供的关键......
随着信息技术的迅速发展,互联网已经成为了当今世界上最大的信息存储库,它为人们提供了良好的信息共享和资源共享的服务。但是互联......
当前,伴随着因特网的普及,网页信息、各种类型的课件资源和电子信息载体等各种教育资源也不断产生。虽然这些海量的教育信息和资源......
摘要:目前在全球市场里占据主要份额的谷歌、雅虎、百度等搜索引擎,提供给人们的依旧是比较笨拙的工具,因为它们始终受制于传统Web,对......
加哥西北大学的Rich Gordon教授在两年前对芝加哥地区的新闻与信息网站做过链接分析,看看谁链着谁.今年他又做了一次分析研究,除了......
现在越来越多的企事业单位和政府部门均建立了自己的Intranet,局域网上的信息管理越来越成为各单位领 导和信息安全管理人员的课题......
简要介绍基于情景的知识库的概念及作用,通过调研分析当前数据库出版商与收录在线电子期刊的情况,以此设计基于情景的知识库,通过......
随着Internet的发展,搜索引擎在因特网中的地位日趋重要,搜索引擎也成为研究的热点。有别于传统的搜索引擎研究的焦点Internet网络......
面对互联网信息量爆炸式的增长,人们越来越对搜索引擎产生需求和依赖,对搜索引擎技术的研究具有非常重要的理论意义和实用价值.本......
分析了现有的通用搜索引擎技术,并指出了其局限性。针对企业用户的需求,提出构建面向企业用户的专用搜索引擎的设计思想。该设计采用......
垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸。通过垂直搜索引擎能够从互联网上自动搜集信息,并为用户提......
为了提高网络蜘蛛在爬行网络论坛时的爬行效率,从论坛布局结构特点出发,分析论坛所具有的普遍特征,设计了一个针对论坛的特殊的网......
目前的移动网络蜘蛛往往采用递归爬行的方法,该方法会造成系统资源开销大、爬行速度慢,而且可能会因为被搜索Web页面本身结构的原......
网络蜘蛛搜索策略的研究是近年来专业搜索引擎研究的焦点之一,如何使搜索引擎快速准确地从庞大的网页数据中获取所需资源的需求是......
搜索引擎已经成为互联网用户进入网络的一个重要入口。但目前搜索引擎的结果还存在着许多有待改进的地方。本文从搜索引擎返回结果......
中文WEB文档自动分类是中文自动信息检索的核心技术之一。中文WEB文档的分类涉及到文档的自动抓取、信息加工和提取、自动分类等,本......
传统的基于本地搜索算法的信息采集系统存在诸如主题漂移和采集结果局部最优等问题。在深入研究Web拓扑结构基础上,利用网络蜘蛛的......