DeepSearcher一个中文Deep Web分类搜索引擎

来源 :全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会 | 被引量 : 0次 | 上传用户:mlove251
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎可以很好的搜索出大部分可索引页面,然而,Intrnet上有大量的页面是由后台数据库动态产生的,传统的搜索引擎搜索不出这部分页面,我们称之为Deep Web.研究表明Deep Web信息一般存储在数据库中,和静态页面相比信息量更大,主题更专一,信息质量更高,信息结构化更好,增长速度更快.把DeepWeb数据源按所属领域进行组织可以方便用户浏览这些有价值的资源,并且这也是大规模Deep Web集成技索的关键一步.本文设计了一个中文Deeo Web分类搜索引擎原型系统-DeepSearcher,提出了中文Deep Web爬虫策略,Deep Web查询接口判定和Deep Web数据源分类算法,并通过实验验证该方法是非常有效的.
其他文献
目的:合成4-去乙酰化长春碱氨基酸衍生物,为长春碱靶向前药的合成奠定基础。方法:氨基酸N端采用苄氧羰基(Z)保护,利用混合酸酐法合成(4-去乙酰化长春碱)-氨基酸-Z,然后催化氢
合成了一种新型苯乙炔封端剂4-苯乙炔基苯胺(p-PEA),利用该封端剂,采用PMR方法,将吡咙结构引入到聚酰亚胺分子链中,制备了系列聚(吡咙-酰亚胺)基体树脂(PPy-50),并对树脂的制
会议
研究了烯丙基苯醚和烯丙基苯酚合成方法并表征了其性能.讨论了烯丙基苯醚的合成及其转位成烯丙基苯酚反应的部分影响因素.结果表明,以丙酮为溶剂,NaOH为碱,烯丙基苯醚的纯度
从三聚氯氰、双酚A和氯丙烯出发合成了一种新型含均三嗪结构的双酚A烯丙基醚化合物(2,4,6-三(4-(2-(4-(烯丙氧基)苯基)丙烷基)苯氧基)-1,3,5-三嗪,TAPPPT).对其结构进行了表
目的:利用基因敲除的方法构建无氯万古霉素产生菌.方法:利用PCR-Targeting的方法获得破坏粘粒cLYLHl5(△vcm8: : apr),通过接合转移敲除东方拟无枝酸菌HCCBl0007中万古霉素生
用SEM对不同配比的热固/热塑(TP/TS)浇注体固化后的相形貌进行了观察.结果显示,当热塑性树脂含量在20~25 phr(质量为16.7%~20.0%)间时发生相反转;对发生相反转后体系的热固性颗粒
会议
本文介绍了以核糖体为靶点的几种重要抗生素的作用机制,在此基础上对近几年来出现的此类药物研究的新方法新思路进行了综述。远程交互作用网络及诱导-契合机制的发现、抗生素
通过形成电荷转移络合物,制得了一种低温固化双马来酰亚胺树脂体系.该树脂体系具有优良的综合性能和低温固化性能.
组蛋白去乙酰化酶(histone deacetylase,HDAC)是一类锌离子依赖性金属蛋白酶,广泛分布于各种真核细胞内并发挥着重要的生物学功能。HDAC抑制剂已成为一种新型的非细胞毒抗肿
在原有双马来酰亚胺改性烯丙基醚化酚醛树脂(BMAN)的基础上,通过对其中烯丙基醚化酚醛树脂(AN)的Claisen重排反应,制备出双马来酰亚胺改性烯丙基酚醛树脂(R-BMAN).对比研究了