【摘 要】
:
搜寻引擎必须以crawler程式(又称spider程式)来自动抓取网页并建立索引,如果crawler程式仅仅循着网页所提供的超连结来搜寻网页并抓取內容,称为一般性的crawler程式;如果不论
【机 构】
:
台湾交通大学资讯管理研究所,金门技术学院资讯管理系
论文部分内容阅读
搜寻引擎必须以crawler程式(又称spider程式)来自动抓取网页并建立索引,如果crawler程式仅仅循着网页所提供的超连结来搜寻网页并抓取內容,称为一般性的crawler程式;如果不论网页是否提供超连结,crawler程式会自行计算并找到网页的所有內容并加以抓取,此种crawler则称为深度crawler。而crawler抓取网页內容的步骤可以细分为「取得资料」及「储存并建立索引」二大步骤。在「取得资料」阶段中,深度crawler虽然是自行透过演算法来取得网页的所有內容,但本文认为仍不至于构成非法存取(unauthorizedaccess)。此外,不论是一般的crawler或是深度crawl-er,如果取得网页內容时会耗费网站资源而干扰网站的正砊俗?就可能构成如美国eBay案中讨论的财产侵害(trespasstochattel)。在「储存并建立索引」阶段中,原则上应该不会侵害网页拥有者之重制权。然而,有些搜寻引擎(例如Google)将其取得的內容以「库存页面」(cache)的方式允许使用者存取,此时即有争议发生。但本文以为,由于搜寻引擎的主要目的是在使网路使用者更容易接触网页,所以此种「重制」与「散布」行为原则上应有著作权法「合理使用」原则的适用,故不会构成侵害著作权,但仍应考虑搜寻引擎与原网站之间是否处于竞<关系,以及所抓取之资料量占原网站之比例等因素综合判断。要解决搜寻引擎与网站间可能发生的法律<议,除可以强化现行的robotexclusion标准外,网站也可以考虑增强自动过滤crawler的功能,以杜绝<议。
其他文献
随着社会快速发展和生活节奏的改变,人们的休闲娱乐活动有向夜晚推移的趋势,而城市住区的景观及夜景观作为人们居住和生活的环境中的重要组成部分,也随着居民需求的增多而越
<正> 目的探讨结核性变态反应性关节炎的临床特点。方法收集我院自1993年元月至2003年元月期间住院病人中确诊为结核性变态反应性关节炎患者,资料完整的32例进行回顾性分析。
目的:以比较蛋白质组学方法筛选2,3,7,8-四氯二苯二噁英(2,3,7,8-tetrachloro-dibenzo-p-dioxin,TCDD)致胎鼠先天性腭裂发生的差异表达蛋白。方法:⑴以TCDD诱导建立C57BL/6J
人是文化传播主体,而语言是文化的载体,汉语国际教育已经成为现如今中华文化走向世界的重要途径。本文旨在探索在汉语国际教育背景下中华文化如何对外传播,使全世界人民都能
乳状液体通常指的是由两种或两种以上的液体或固状物所组成的乳白色混合物,比如天然浓缩胶乳就是一种乳状液体。天然浓缩胶乳是从含胶植物中提取并浓缩出来,由其制成的橡胶是
在高速公路建设中,为了改善线形,缩短里程,提高运营效益,避免病害,保护环境,公路隧道的修建逐渐增多。隧道开挖是破坏岩体初始应力状态的一个在时间和空间上都不断变化的过程
科学发展观是与时俱进的马克思主义发展观,是中国特色社会主义理论体系的最新成果,是发展中国特色社会主义必须坚持和贯彻的重要战略思想,也是国家教育改革发展必须长期坚持
<正>徐义林把苏州桃花坞的老房子租了出去,只留下一间五六平方米的斗室。说是斗室,其实就是一个砖瓦搭建的小棚子,还生生隔出一个卫生间。这便是"江南扇王"、苏州制扇工艺国
以湖南某高速公路煤矸石作填筑材料的施工路段DK127+720典型断面为工程背景,分析和模拟了三种不同压实度及3种不同填筑高度的煤矸石路堤的FLAC3D计算模型。计算了在不同压实
在市场经济背景下,建筑企业之间的竞争越发激烈,要确保企业立足于不败之地,必须全面加强建筑工程精细化施工管理。通过分析精细化施工管理的重要性,从落实精细化施工管理模式