基于Deep Web Search技术的主题式爬虫模块研究与设计

来源 :科技导报 | 被引量 : 0次 | 上传用户:yilong_hongru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web技术的飞速发展,海量数据的管理与搜索变得尤为重要。海量信息的异构性和动态性特点要求信息集成需要Web爬虫来自动获取这些页面,以便进一步处理数据。而一些企业内部的资料既要保密又要供不同的内部职员使用,这种既开放又保守的特点成为企业发展的瓶颈。为了帮助用户完成这样的任务,本文改变传统的资源共享形式,为企业提供了一个高效便利保密的资源共享管理平台--企业搜索引擎(ESE),提出了一种基于主题式爬虫的Deep Web页面的企业搜索引擎(ESE)的和基于开源Java Lucene的索引企业搜索系统设计与实
其他文献
本试验于2008~2010年连续两年度,在兰考县城关镇超高产攻关田,采用人工挖掘法,分层次从大田获取根样,用WinRHIZO Pro 2008扫描仪进行扫描,研究了不同施氮量下两个穂型冬小麦根系形态、生理特征及其构型分布的差异,分析了根系性状与地上部生长及籽粒产量的相关关系,以期为不同穂型小麦品种高产高效栽培及根系调控提供理论依据。主要结果如下:1.在高产麦田,冬小麦的根重密度、根长密度、根直径、
小麦是重要的粮食作物之一,然而,世界各地因程度不同的干旱所导致的小麦减产十分严重。目前,干旱已成为影响我国小麦产量的最主要因子。因此,选育抗旱性强的品种是干旱和半干旱地区挖掘小麦产潜力的迫切问题,利用组织培养筛选抗旱无性系为抗旱育种提供了一种有效捷径。到目前为止,在细胞水平上鉴定品种抗旱性尚缺乏具体而系统的方法。本研究旨在利用组织培养确定适合快速鉴定小麦品种抗旱性的筛选剂(PEG)最适浓度及适宜的
随着社会的不断发展,网络科技也在不断进步与发展,并被逐步应用于社会的各行各业,创造出巨大的价值。随着网络数字化时代的到来,基于网络数字化的广播电视技术也面临着一系列
本实验通过RT-PCR从番茄花粉中获得高效特异表达的高赖氨酸基因TSB的cDNA序列,构建其受控于单子叶植物Ubil强启动子下的高效表达质粒pBIUB-TSB。与此同时,以禾本科牧草中间偃
在建筑装饰行业不断发展的过程中,运用节能环保型装饰材料,对保护我国生态环境、促进人与自然和谐相处具有积极的意义。本文首先对节能环保材料的定义进行阐释,然后提出节能
土壤有机碳(Soil organic carbon,SOC)是评价土壤质量的重要指标,也是陆地生态系统碳循环的重要组成成分。SOC在改善土壤结构、保持水分、防止土壤侵蚀和退化、提供植物养分特
本试验以目前黄淮冬麦区大面积推广的弱春性小麦品种偃展4110、豫农949、郑麦9023和豫麦34为供试材料,采用分期播种试验的方法,系统观察了不同品种在不同播期条件下的幼穗发育进程,研究了低温胁迫条件下弱春性小麦品种间植株叶片与抗寒性密切有关的部分生理特性及保护酶基因的表达差异,分析了弱春小麦小麦品种对寒胁迫的生理响应。其主要研究结果如下:1.小麦的幼穗发育进程与其抗寒性密切相关。同为弱春性品种,
选用了8个具有明显株型差异的水稻品种(系),配制5个杂交组合,构成5套分析材料(每套包括双亲、F2、世代)运用多种统计方法,对所考察的33个性状作综合分析,试验结果表明:1.茎叶性状中所考察的性状中剑叶基角的变异系数最大,变异幅度最小的是倒二叶宽;穗部性状变异系数最大的是二次枝梗秕粒数,其次为一次枝梗秕粒数,最小的为穗长,一次枝梗数。碾磨品质中,变异幅度最大的是整精米率,最小的是糙米率;外观品质中
本研究利用SSR分子标记方法对贵州西山系列推广面积较广、生产潜力较大的玉米杂交种及其亲本共32份材料进行了系统研究。具体从PCR扩增体系、电泳优化以及指纹图谱构建、带型分析与应用等三大方面作了探讨。研究结论主要如下:1.PCR扩增影响因素:叶片细胞质基因未对SSR引物扩增结果造成影响;对玉米两种材料DNA提取,核心引物具有一致性;DNA模板、Taq酶、引物量对PCR扩增影响较小,而Mg~(2+)、