分布式搜索引擎相关论文
随着网络信息发布速度的提高,搜索引擎要想得到完整及时的信息变得越来越难,尤其是针对频繁更新的新闻和博客网站。本文提出利用RS......
搜索引擎技术是WWW信息检索技术的基础.在设计与开发扬帆搜索站的项目背景下,该文研究了搜索引擎技术的基本原理及相关WWW信息检索......
由于中文的特点,使得许多应用于英文的信息获取技术并不能够直接应用到中文IR中.正是在这样的背景下,我们对智能的中文信息获取技......
随着信息时代的到来,互联网上的信息爆发式的增长,我们日常使用的搜索引擎需要检索的内容信息量也随着迅速增加。整个世界的信息数据......
本课题所依托的国家863项目“分布式密文全文检索系统关键技术研究”的主要应用场景是具有较高文档保密需求的政府机关和大中型企......
伴随着互联网的高速发展,网络上的数据信息量急剧膨胀,有“互联网窗口”之称的搜索引擎的计算量及存储量不可同日而语。面对如此庞大......
随着资源爆炸式增长,搜索引擎已成为互联网用户获取信息的重要工具,传统搜索引擎多采用集中式架构,将搜索系统部署在一台服务器上,......
云计算已发展成为目前计算机产业界和学术界关注的热点之一,Hadoop,作为当今最流行的云计算平台,也得到了越来越广泛的应用。与此......
随着信息时代的迅猛发展,人们通过互联网可以摄取各种信息,真正做到足不出户就能知晓天下事。这些都源自于搜索引擎的出现与发展,......
随着互联网络的发展,网络中存储的信息量急剧增加,搜索引擎在网络中占据着越来越重要的位置.本文基于分布式处理平台Hadoop和开源......
摘 要:Hadoop平台,是一种具备扩展性,可靠性,高效性,低成本的软件框架,是一种分布式处理的软件平台,可以处理与运行海量数据。现今,互联网......
今天互联网已经发展到了大众普遍参与的时代,人们使用网络的方式愈发多样,发布信息也愈发方便,这使得网络中充斥着海量的数据。怎......
随着社会信息化程度的不断提高,传统的基于单机系统的集中式信息检索技术已无法满足以大规模数据集为基础的并发多用户并行信息检索......
从电子商务环境下服装供应链管理的需求出发,分析了目前服装搜索引擎存在的问题,提出了基于语义Web服务的分布式服装商品搜索引擎......
传统招聘网站所查寻的信息仅限于站内搜索,而且每个招聘网站往往都会有重复的招聘信息,导致重复投递,对求职者和招聘者都造成了资......
This paper presents a distributed search engine design of an on-line bookstore system. Sever-al principles are introduce......
近年来,互联网的发展和普及,各类科技信息网及其他网络的建设,为科技工作者提供了便捷的信息流通途径.目前国内外的搜索引擎从最初......
摘 要:分布式搜索引擎是一种结合了分布式计算技术和全文搜索技术的新型信息搜索系统。它改变了人们获取信息的途径,使得人们能够更......
从电子商务环境下服装供应链管理的需求出发,分析了目前服装搜索引擎存在的问题,提出了基于语义Web服务的分布式服装商品搜索引擎......
随着保险行业信息化规模的不断扩大,各垂直领域的业务数据越来越多,不可避免地给传统结构化数据库在存储和查询效率方面带来了巨大......
构建一个基于 RSS 的 P2P 分布式博客搜索引擎。利用 Pastry 协议,实现分布式博客采集系统的数据存储和传输。在各子采集系统上分......
本文从Hadoop和HDFS文件系统角度出发,对分布式搜索引擎技术进行了探讨,并以建立索引表和处理分词为基础,对基于Hadoop的分布式搜......
分析了目前运营商IP城域网络告警处理分析工作所面对的挑战,比较目前可用的大数据分析技术特征,选择其中较为合适的分布式搜索引擎......
伴随着互联网技术发展,新闻数据量呈爆炸式增长,GDELT就是这样一个庞大且快速增长的全球新闻事件数据集,迄今约有四亿八千多万条数......
在对Map/Reduce算法进行分析的基础上,利用开源Hadoop软件设计出高容错高性能的分布式搜索引擎,以面对搜索引擎对海量数据的处理和存......
分析了传统搜索引擎的不足,提出了一种基于智能Agent的分布式搜索引擎,以Agent的方法实现了搜索引擎的各项功能,描述了多个搜索引......
随着互联网上资源爆炸式的增长,越来越多的网络用户依靠专门的检索工具,如Google、Yahoo!、Baidu等搜索引擎来查找自己所需的信息......
随着各个行业信息化的快速发展,当今各个垂直领域的数据越来越多,而其中有很多数据都是无用的,不需要特殊处理。如何快速、高效从......
为了解决传统集中式搜索引擎所面临的性能瓶颈,研究人员提出将搜索引擎构建于P2P网络之上,通过P2P网络将分散的众多节点联系起来,......
针对互联网网内信息搜索效率低下问题,设计了以Redis数据库以及Map-reduce思想为核心的分布式搜索引擎框架。为了应对互联网信息时......
为提高搜索引擎语义检索的准确性,基于P2P技术的分布式搜索引擎架构基础上,在应用层Search Pocket模块引入基于WordNet语义关系的......
分析了Hadoop系统结构,提出一种改进的PageRank算法,使用Map/Reduce模式设计系统模块。实验证明,使用Hadoop框架能够设计出具有高......
针对分布式搜索引擎系统效能建模与评估问题,通过对当前分布式搜索引擎系统的建模与分类,扩展了能耗与网络开销的成本模型;对5种构建......
分析Apache开源框架Nutch和Hadoop的系统结构,利用Nutch和Hadoop设计高效、可靠、可扩展的分布式搜索引擎,来解决搜索引擎对海量数......
实现了基于Hadoop的分布式搜索引擎,着重讨论了实现分布式搜索引擎涉及的3个关键性技术:索引表的建立、分词的处理和索引前的预处......
期刊
随着搜索引擎、云计算、人工智能这些新兴技术的成熟和普及,人类在日常中产生的数据量出现了前所未有的爆发式增长,催生了“大数据......
信息爆炸、海量数据标志着大数据时代已经到来。基于云计算平台的Hadoop是领跑于大数据浪潮的开源技术,实现了海量数据的分布式存......
随着计算机网络的高速发展,搜索引擎这种基于因特网的信息查询系统,作为一种应用层的技术,也在不断发展与完善。由于Web的地域分布......
由于Web的地域分布式特性以及网络基础条件等方面的限制,随着Web的迅速膨胀,目前的搜索引擎由于其集中式的结构遇到覆盖率和更新率......
根据CNNIC2011年1月发布的《第27次中国互联网发展状况统计报告》,截至2010年12月,中国网民规模达到4.57亿,搜索引擎使用率达到81.......
随着互联网的发展,新闻、博客、论坛、微博等各种站点不断涌现,网络所承载的数据量不断增长。使用搜索引擎查找信息已成为一种通用......
针对传统搜索引擎对频繁更新的新闻和博客网站的搜索实时性较差的现状,提出利用RSS提供的结构化数据,通过Pastry协议,实现索引的分......