面向垂直搜索引擎的Web站点划分方案

来源 :计算机工程 | 被引量 : 0次 | 上传用户:ktaxx01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析传统搜索引擎分配任务的方式及存在的问题,根据垂直搜索引擎的特点,提出一种比传统方法粒度更细的任务分配方式——网站划分。该分配方式将较大规模的网站切分为若干较小规模的子集,并将子集交给若干爬虫节点并行抓取,以加快爬虫系统的整体获取速率,作为对传统方法的有效优化。将网站划分算法应用于样本数据集,验证其有效性。
其他文献
价值链贸易和金融全球化使得全球各国经济的相互依赖程度达到了空前的水平,任何一个国家的内部政策都会影响到几乎所有其他国家的国民经济状况,中、美、德这样全球价值链中心国的政策外溢效应更加显著。反之,任何一国仅凭自身的力量也难以调整内、外部经济结构的失衡,中、美、德尤其如此。  2008年之前的全球化是真实的,2008年以来的逆全球化也是真实的,但贸易差额代表的全球失衡却不是真实的。我们将其称之为“贸易
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
以多个智能机器人协作完成的实时区域监控为应用背景,3个智能车为硬件平台,设计定位算法、通信模型和控制任务,用C#编程语言实现该应用方案。考虑3台智能车保持队形在区域内巡逻
随着经济科技水平的稳步提升,档案管理也开始朝着数字化方向全面发展。在新形势下,城建档案也应朝着数字化管理的方向迈进,积极采取数字化管理策略,逐步突破技术层面的难题,
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着社会的发展,一些新鲜的事物层出不穷,出现在我们的生活当中,比如我们常见的微信、微博等。在我们的教育教学领域也出现了微课,这种新型的教育教学模式的出现有力地推动了
关系营销自二十世纪九十年代产生以来,在西方国家得到了广泛的研究和应用,它的重点在于围绕客户建立和发展并不断提升企业与客户之间的关系层次。我国对关系营销理论的认识较
针对软件开发早期阶段软件资源重用进展缓慢,反射机制在代码重用方面取得成功但还没有用于软件体系结构及其组成元素的重用等问题,提出一种支持软件体系结构设计时重用的反射机
我国经济水平的提高伴随着税收收入的高速增长,以及外商直接投资的大量流入。对这两者之间关系的研究一直停留在税收优惠对于外商直接投资流入的激励作用上,忽视了税收投入带
随着我国加入世贸组织以及金融体制改革的逐渐深入,越来越多的世界级外资银行涌入中国金融市场,银行业的竞争日益激烈。要想在竞争中站稳脚,银行必须要进行客户细分,将有限的