专用Web信息收集系统的设计和实现

来源 :煤炭技术 | 被引量 : 0次 | 上传用户：liuganghy2

【摘要】

：

Heritrix是由Java开发的开源Web网络爬虫,HTMLParser技术对抓取后网页内容进行高效率解析,对信息进行再一次整合,很好的解决了专业搜索引擎所需数据来源问题。文章探讨了基于

【作者】

：

朱雪莲

【机构】

：

新疆艺术学院基础部,

【出处】

：

煤炭技术

【发表日期】

：

2011年08期

【关键词】

：

Heritrix HTMLParser Web

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Heritrix是由Java开发的开源Web网络爬虫,HTMLParser技术对抓取后网页内容进行高效率解析,对信息进行再一次整合,很好的解决了专业搜索引擎所需数据来源问题。文章探讨了基于Heritrix和HTMLParser构建Web信息收集系统的设计和实现。 Heritrix is an open source web crawler developed by Java. HTMLParser technology efficiently analyzes web contents after crawling, and once again integrates information, which solves the data source problem required by a professional search engine. The article discusses the design and implementation of Web information collection system based on Heritrix and HTMLParser.

其他文献

产业用:新升级谋划大未来——访中国产业用纺织品行业协会会长李陵申

产业用纺织品行业转型升级的确不同于传统纺织行业的转型升级概念。产业用行业更多的是升级，是技术创新，怎样完成产品的高端化从而延伸新市场，怎样进剑下游应用从而开拓新领域。

期刊

产业用纺织品印染企业品牌化发展中国纺织市场占有率纺织集团现代纺织棉纺织纤维加工医用

腹股沟淋巴结皮瓣解剖特点及临床设计的初步研究

目的：接受乳腺癌(改良)根治术同时行腋窝淋巴结清扫的患者术后有一定的上肢淋巴水肿发生率,临床治疗较棘手,至今仍无根治的方法。但在手术治疗方面,仍然取得一定的进展。特别

学位

淋巴水肿腹股沟淋巴结皮瓣供区多排螺旋CT动脉造影

当代美学艺术在室内装潢设计中的应用研究

人的一生绝大部分时间是在室内度过的，因此，人们设计创造的室内环境，必然会直接关系到室内生活、生产活动的质量，关系到人们的安全、健康、效率、舒适等等。本文就对室内装潢设计

期刊

美学装潢艺术

家长对孩子人园行为的影响

儿童年满三岁，一般可以进入幼儿园小班接受有目的、有计划的学前教育。入园是儿童生活上的一个转折点，对心理发展有明显的影响。对孩子来说，进入幼儿园去过一个时期的集体生活，不

期刊

幼儿园家长儿童生活入园小朋友独立生活能力学前教育一般接触转折点

可降解内支架法肠吻合术隔绝生物应力并促进吻合口愈合的体内外实验研究

第一部分目的(1)阐明捆绑线在可降解内支架法肠道吻合术愈合过程中的动态变化；(2)验证可降解内支架法在极端“粘膜-浆膜”对合情况下的安全性；(3)进一步证明可降解内支架法在术

学位

肠道吻合术可降解支架肠道愈合捆绑线生物应力腔内压力牵张力剪切力TGF-β1

新版生态纺织品标准实施出口欧盟面临新挑战

4月1日起,中国纺织品企业出口到欧美的商品需要注意了.新版"生态纺织品标准100"正式实施.与上一版相比,新版要求更加严格.生态纺织品标准100是世界上最权威影响最广的生态纺

期刊

浅析10kv架空电缆运行中存在的问题与防治措施

文章分析了10kv架空电缆一些容易出现的问题,并提出了相应的防治措施,仅供参考。

期刊

10kv架空电缆线路绝缘导线防雷

论服饰品牌包装设计中的视觉元素

随着服饰品牌的发展，服饰品牌包装设计在包装设计领域的应用也是越来越广，服饰品牌包装设计主要是通过图形、文字、色彩、材质等视觉元素展现出来的，是这些设计元素的综合运用，对

期刊

服饰品牌包装设计视觉元素

钻孔灌注桩在公路桥梁施工中的应用探讨

某特大桥主桥上部结构采取刚构一连续预应力混凝土连续梁，下部结构为单薄壁空心墩；引桥为预制预应力混凝土先简支后连续刚构T梁，下部结构为独柱T型薄壁墩；桥梁的桩基工程础均为钻

期刊

桥梁施工钻孔灌注桩护筒埋设

实施心理干预对胃癌围手术期患者肠内营养治疗的影响

目的评估心理干预在胃癌围手术期患者肠内营养支持治疗中的作用。方法将26例胃癌围手术期患者随机分成A、B2组。A组10例为胃癌术后应用肠内营养组，即对照组，B组16例为胃癌术

期刊

胃癌肠内营养焦虑自评量表心理干预

专用Web信息收集系统的设计和实现

与本文相关的学术论文