Deep Web查询接口的自动判定

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:wangxingchuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统搜索引擎仅可以索引浅层Web页面.然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep Web的页面。由于查询接口是Deep Web的唯一入口,因此要获取Deep Web信息就需判定哪些网页表单是Deep Web查询接口。文中介绍了一种利用朴素贝叶斯分类算法自动判定网页表单是否为Deep Web查询接口的方法,并实验验证了该方法的有效性。
其他文献
中国特色社会主义进入新时代,成为我国发展新的历史方位。本文围绕中国特色社会主义新时代的内涵与要求,从切实履行新时代国家赋予的使命、不断满足读者的阅读需求、积极顺应
新农村建设日益受到关注。新农村建设不仅仅是改善农村的基础设施,还应该包括制度供应——村庄和乡镇的组织建设。在村委会选举中,选举权与被选举权权利主体的确定问题凸显出来
随着全球化进程的加快,飞散已成为了一种引人注目的文化现象。本文运用飞散相关理论,从文化飞散的视角分析了翻译实践和翻译策略选择。文化飞散视角要求译者以文化中间人的身
列车轨道故障检测的实现需要对大量的数据进行分析来判定检测结果,决策树是进行数据挖掘与分类分析的常用工具。文中主要讨论如何应用C4.5算法构造列车轨道故障检测的决策树以
融媒体时代下科技图书策划编辑应转变策划理念,不断提升自身综合素养,与时俱进,提升策划能力,充分利用新媒体技术的优势,打造能够满足新时代读者需求的优质图书。
融媒时代的到来,对于城市电视台来说既是机遇,更是挑战。如何打造“爆款”产品来有效抢占社会舆论场,发出主流权威声音是其面临和应探索的问题。本文以福州广播电视台创作实
湖南第一师范学院是毛泽东母校,拥有丰富的红色旅游资源。顺应时代潮流,发展红色旅游,是开发其旅游资源的重要途径。其中最核心的是要确定旅游资源的特色。在观念上,要处理好
作为ISO确立的新标准,主题地图用来描述知识结构及其内在关联。它提供了语义级的数据导航和组织方式,是一个表达和交换结构化信息的元数据模型。文中在介绍了主题地图的相关概念后,设计了一种基于主题地图、扩展关系数据库的方法,并利用主题地图的描述语言XTM导出数据库,为多个关系数据库之间的数据交换提供了新的理念。
期刊校对质量是期刊赖以生存的基础,也是期刊提高核心竞争力的有效手段。本文对期刊校对质量中遇到的实际问题进行简要分析,旨在为期刊出版工作中的难点问题提供参考。
DDoS(分布式拒绝服务)攻击正在对整个互联网产生巨大的危害和严重的经济损失,且不断增大。IP追踪技术用于反向追踪数据包到攻击源.在查找到攻击源之后可以对攻击源采取隔离或者其