A Cooperative Schema between Web Sever and Search Engine for Improving Freshness of Web Repository

来源 :武汉大学自然科学学报(英文版) | 被引量 : 0次 | 上传用户:jiangwei521521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Because the web is huge and web pages are updated frequently, the index maintained by a search engine has to refresh web pages periodically. This is extremely resource consuming because the search engine needs to crawl the web and download web pages to refresh its index. Based on present technologies of web refreshing, we present a cooperative schema between web server and search engine for maintaining freshness of web repository. The web server provides meta-data defined through XML standard to describe web sites. Before updating the web page the crawler visits the meta-data files. If the meta-data indicates that the page is not modified, then the crawler will not update it. So this schema can save bandwidth resource. A primitive model based on the schema is implemented. The cost and efficiency of the schema are analyzed.
其他文献
目前,后排假人的颈部在正面碰撞中损失了严重的分数,相关研究很少,并且在开发过程中缺乏科学指导和工程经验.因此,本文在对后排假人碰撞时颈部动力响应过程进行分析的基础上,
目的:深入了解利拉鲁肽的研究概况,客观反映相关国家、机构和科学家在研究利拉鲁肽的领域中具备的科学能力和影响力。方法:以科学引文索引(SCI)数据库Web of Science为检索平
期刊
羧酸酯酶(carboxylesterase,CES)是一类重要的Ⅰ相药物代谢酶,参与许多临床抗癌药物、氨基甲酸酯、拟除虫菊酯类杀虫剂、环境中有毒物质以及前致癌物的体内代谢。有研究表明,
We propose an algorithm for learning hierarchical user interest models according to the Web pages users have browsed. In this algorithm, the interests of a user
期刊
本文从胎压系统的重要性以及立法过程开始分析,介绍了胎压监测系统的组成和基本原理,并展望了胎压监测系统未来的可能发展趋势.结合本人在OEM中工作的经历及遇到的问题,总结
目的:了解我院药品不良反应(ADR)发生的特点,为临床合理用药提供参考。方法:对我院2013年收集上报的有效ADR报告322例按患者性别、年龄、给药途径、药物种类、ADR累及器官和
目的:调查某院血液病科2012 ~2013年分离细菌分布及其对抗菌药的耐药状况,为临床合理使用抗菌药提供依据.方法:对该科2012~2013年住院患者送检标本中分离得到的致病菌进行对比
病例1:患者女,19岁,4岁时患乙型脑炎,此后有发作性癫痫,一直服用丙戊酸钠片(0.2 g,bid),病情控制可.近因癫痫控制不理想,于2013年9月16日在医师指导下加服拉莫三嗪片(葛兰素
期刊
@@