网络蜘蛛相关论文
Nutch是一款非常优秀的开源的软件。需要快速构建自己的搜索引擎时,可以考虑用Nutch来实现.Lucene和Nutch是针对国外英文系统环境的......
随着Web信息量的迅猛增加,传统搜索引擎所查找到的结果精度不高,难以满足用户的需求,基于智能化搜索引擎技术的研究成为搜索引擎发......
文章介绍了搜索引擎面临的智能化挑战以及未来的智能引擎的特征和技术。
The article introduces the intelligent challenges th......
文章探讨了WWW搜索引擎技术的现状,分析了WWW搜索引擎设计和实现面临的问题,详细阐述了Google的体系结构和工作原理,并展望了WWW搜......
提出了一个基于Agent技术的数据采集系统,介绍了它的设计思想和工作流程,根据系统的需求分析,建立了一套基于人才招聘用户自定义的......
随着Internet的迅速发展,Internet上的信息成指数增长。由于网络信息资源的飞速增加,给人们在网上寻找所需信息带来了很大的困难。搜......
市场竞争日益激烈,为了减少复杂多变的企业竞争环境中的不确定因素,越来越多的企业开始逐步构建竞争情报系统。企业竞争情报具有不完......
互联网上的信息是当今世界上最丰富的知识宝藏,但如何有效地获取信息却一直是个难题。Web信息采集系统可以对用户所关心的目标站点......
随着因特网技术的广泛应用,因特网上Web信息资源呈指数级增长,传统的搜索引擎正面临巨大的挑战。各类专业搜索引擎应运而生并受到广......
WWW的发展给人们带来了巨大的变化,面对如此大量的信息,人们迫切需要有效的信息发现工具在WWW上进行导航。搜索引擎就提供了这样一......
近年来,如何在Web海量信息中尽可能多地获取与用户兴趣相关的页面是搜索引擎领域研究的热点之一。本文通过改善网络蜘蛛的自适应性......
因特网上的信息日益丰富,已经成为知识获取的一个重要来源。信息资源的丰富也使信息的检索有如大海捞针,检索到自己所需要的信息资源......
随着WWW上信息资源数量成几何级数的增多,如何在海量数据空间中快速、准确的获取用户所需Web信息成为研究的焦点。本文设计并实现了......
随着搜索技术的发展,纯粹的web搜索由于受到IE的束缚,因而表现出应用能力偏低,而基于桌面的搜索则相当于一个“客户端+数据库”这样的......
随着Internet的发展,网络信息爆炸和人们日益增加的信息获取需求矛盾暴露出来。网络信息检索技术成为了社会研究的热点技术,其中搜索......
搜索引擎是从WWW上快速而有效地获取信息资源的捷径,而网络蜘蛛技术则是搜索引擎的关键。本文围绕WEB信息挖掘这一前沿性研究领域......
随着Internet和Web技术的飞速发展,WWW已经成为人们进行信息交流不可缺少的巨大信息空间。面对如此大量的信息,人们在寻找自己所需要......
目前,随着万维网上信息量的爆炸性增长,搜索引擎已日益成为人们获取各种信息的重要工具。针对通用搜索引擎的缺陷,一种结合领域知识和......
随着Internet的迅速发展,网络信息增长的速度与人们获取所需信息能力之间的矛盾越来越突出。搜索引擎这一新兴技术也越来越体现出......
随着互联网技术的飞速发展,互联网络上的信息量正在以几何级数的增长速度增长,因此,对网络上信息的高效检索成为互联网发展必须要解决......
由于Web海量信息处于不断的变化中,通用搜索引擎已经很难再为用户提供一个高质量的、全面并且更新及时的信息搜索服务。通用搜索引......
由于Web海量的信息处于不断的变化中,搜索引擎己经很难再为用户提供一个高质量的、全面并且更新及时的信息搜索服务,其局限性在于它......
当今的社会已经由信息主宰,用户对于计算机的应用提出了更多的需求。用户对于事务处理的电子化与自动化,信息管理自动化系统,web搜......
伴随着信息化进程的加快,越来越多的企业构建了自己的Web站点,通过站点向用户提供产品和服务信息。但伴随的问题是,随着Web信息资......
随着网页信息量越来越大,采用通用搜索引擎搜索某一个方面的信息时覆盖率和准确率低,回馈的内容不够详细,噪音过多,维护庞大的网页......
跨站脚本(XSS)攻击是目前Web应用程序最大的安全问题之一。最近研究人员提出的漏洞检测模型XSS-SAFE通过Java Script的特征注入和J......
搜索引擎是信息检索必备的工具,也是一门非常适用的技术,虽然各大搜索引擎在不断地完善和发展自己的技术,但是仍然满足不了用户的......
对于Web网点管理者来说,无尽的管理问题已经令人费尽心力,更何况还要考虑编写可检索的关键字数据库代码以及保持网点视图处于最新......
GNUTELLA:你在字典里是找不到这个词的——因为我试过。 如果以前你真的没有听说过这个词而又比较有好奇心的话,你不妨相信一下无......
网络技术的发展使越来越多的数字化信息以各种不同的形式存在于全球各地的计算机中。从爆炸性增长的数字信息中迅速有效地获得用户......
好友小小是一个图片收集狂,每次上网肯定会收集一大堆的精美图片,面对那些动辄拥有数百幅图片的网站,小小总是耐心地一一点击查看......
面对眼花缭乱的网站和无数的免费资源,如何快速而准确地找到自己需要的东西呢?相信有不少网友是使用搜索引擎去查找资料的,以笔者......
对于传统新闻界来说,过多的自家链接等于把自己孤立,尤其是不能运用社区网络的优势,更无法吸引新的读者。建议传统新闻机构增加对......
阜阳市局 £4a 局长——_MINtkMMtgj’#lnH$B——q.M——D收束志不他只邀狲位J则【科校为先导推动地租工作.B为广为戳民U用凶盼引眯B.......
随着互联网技术的快速发展,钓鱼网站已经成为威胁到互联网稳定的因素.本次设计中,首先,以真实URL链接为基准,利用网络蜘蛛来抓取与......
网格信息检索是信息检索和网格技术相融合的新领域。与搜索引擎相比,网格信息检索将搜索任务分配给网格上相关的计算资源,极大地提升......
随着Internet的飞速发展,Web的信息量越来越大,传统的搜索引擎已经不能满足人们对个性化信息检索服务的需求。对于用户提供的关键......
随着信息技术的迅速发展,互联网已经成为了当今世界上最大的信息存储库,它为人们提供了良好的信息共享和资源共享的服务。但是互联......
随着Internet技术的发展与普及,互联网的安全问题日益突出,Web应用安全环境危机重重。SQL注入漏洞是Web应用中最广泛、危害最严重的......
搜索引擎是从WWW上快速而有效地获取信息资源的捷径,而网络蜘蛛技术则是搜索引擎的关键。本文围绕网上信息智能搜索这一前沿性研究......
为了进一步提高网络蜘蛛在互联网、物联网和实时工业控制网络中信息采集的效率,分析了导致网络蜘蛛陷入局部最优解的原因,将遗传算......
当前,伴随着因特网的普及,网页信息、各种类型的课件资源和电子信息载体等各种教育资源也不断产生。虽然这些海量的教育信息和资源......