基于主题相关度的地理信息Web服务爬虫研究

来源 :地理与地理信息科学 | 被引量 : 0次 | 上传用户:biantaitai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对通用搜索引擎对于地理信息Web服务检索存在的不足,提出了一种基于主题相关度的服务爬虫方法,利用向量空间模型表示主题特征,通过引入特征值权重的计算方法分析页面内容与主题的相关度,过滤与主题无关的页面;并利用改进的PageRank算法从URL和锚文本两方面分析链接的重要性,优化爬取队列。实验表明,该方法在服务检索效率和抓取能力上都取得了良好的效果。
其他文献
中西方由于长期以来形成的生活环境、风俗习惯、价值观念的不同,形成了各自饮食文化的诸多差异,主要表现在饮食观念、饮食内容、烹饪方法、菜式命名、进餐方式及礼仪等方面.
普通高师以为地方中学培养师资为己任 ,在教学中应以突出师范性为特征 ,具体到普通高师文学史教学中 ,应从三个方面做起 :第一 ,教材应侧重于作家作品精神范式的选择、作品表
<正> 生产规模稳步增长 随着我国显示器及彩电产业的壮大,与之相配套的FBT(Fly Back Trans—former,行输出变压器)产业也得到了迅速发展,目前我国已成为全球最大的FBT生产基
目的:探讨采用强脉冲光联合中药内服治疗黄褐斑的疗效和安全性。方法:将300例黄褐斑患者,随机分为3组,每组100例。其中对照1组仅采用强脉冲光治疗;对照2组单纯采用口服中药治疗;治
古典舞是我国舞蹈的重要组成部分,其"神韵"是其最为突出的特点,在欣赏古典舞的时候,感悟"神韵"可以更好地理解古典舞的内涵表达。从目前的具体分析来看,古典舞的"神韵"根植于
作为表现音乐的重要工具,双排键电子琴将弦乐音色的演奏法分为"声效触键法"和"旋律演奏法"。本文旨在通过对技术要点、乐谱实例和练习要点的分析,阐述这两种方法的特点以及如何在
随着我国社会经济的发展和实现教育公平进程的加快,弱势群体的教育问题日益突显。如何建立、健全与我国实现教育公平发展步伐相吻合、有利于促进社会残疾儿童学生接受教育的政
五卅运动是中国工人运动史上前所未有的壮举.运动前夕帮会势力在上海工人群众中有哪些影响?运动爆发前后中国共产党与工人帮会的关系如何?其中又有哪些历史经验?这些都是本
<正> 人类虽然有共同的心理活动,但是具体表现在每个人身上,却是各不相同的。每个人的心理活动都有自己的特点,都有个人独特的色彩和风格,从而表现出个体的差异性,这种差异性