搜索引擎返回结果自动抽取

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:jujumao222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种从搜索引擎返回结果页面上自动抽取结果记录及后续页面链接信息并生成Wrapper的方法:对于一个有效的结果页面,通过比较其HTML标签树上节点的相似度从而识别出潜在记录块,利用启发式规则从潜在记录块中将结果记录块和后续页面链接分别识别出来,然后利用其在标签树上的位置信息分别构造Wrapper。实验结论及与已有方法的比较表明,该方法简单可行且高效。
其他文献
目的总结手足口病(HFMD)重症高危患儿的临床特点及治疗方案。方法回顾性分析2009年4月~2011年8月东莞市石龙人民医院3693例HFMD患儿的临床资料,根据疾病严重程度将其分为普通组36
Web页面所表达的“主题”信息通常隐藏在大量无关结构和文字中,准确完整地提取网页主题信息是影响Web应用服务质量的关键技术之一。目前的提取方法多依赖于网页模板信息,而We
分析在图书馆特色信息服务中Mashup应用的必要性,针对双层增值指出现有Mashup应用的不足。以服务增值为原则,开发出一种图书馆推荐书目与书评信息的专业应用方案。
微小RNA(MicroRNAs)是内源性小分子RNA,通过介导mRNA的降解或抑制其转录,在转录后水平调控基因表达。miR-132成熟序列长度为22 bp,由长度为66 bp的miR-132的前体序列剪切而来。
目的探讨AMT-A微波加复方甘草酸苷联合治疗斑秃的疗效。方法 120例斑秃患者根据治疗方法的不同分为治疗组与对照组各60例,治疗组采用AMT-A微波加复方甘草酸苷联合治疗,对照组
慢性肾脏病(chronickidneydisease,CKD)是由多种原因引起的肾脏结构和功能的异常,病理表现不同,最终多进入肾衰竭。发病率高达9.4%,病程漫长,治疗困难,临床表现多样[1]。
本文是一篇有关三星堆考古文献的翻译报告。笔者对《古蜀四川:失落文明的瑰宝》第三章进行了翻译。由于此类专业考古文献中存在大量的定语从句,而定语从句的翻译对地道的表达
网络旅游文本是指以互联网为载体,在虚拟空间里传播的旅游文本。网络旅游文本属于旅游文本,作为一种新型的旅游文本,在内容、语言、篇章等方面都呈现出自己的特点。环球网旅
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
通过对36例经皮脊柱内窥镜手术治疗的腰椎间盘突出症患者进行中西医结合护理,包括术前护理、术后护理及出院指导,并进行总结和分析。所有手术患者均恢复良好,功能锻炼效率显