深网相关论文
包括搜索引擎在内的各种基于互联网的数据服务都需要实现数据的抽取和解析,爬虫是一种最常用和最重要的途径。隐藏数据库是指组织......
本文综合应用主题搜索技术和深网信息集成技术,设计并实现了一个基于科普领域的主题深度搜索引擎.文中介绍了系统的体系结构、主题......
1月3-10日,总奖金50万美元的深圳公开赛将在深圳市龙岗区体育中心举行,第三届的赛事将迎来一套豪华的WTA球星阵容。......
随着Deep Web中数据的增多,深度网络所包含数据的检索变得尤其的重要。事实上大部分信息对传统的搜索引擎是不可见的。为了使搜索......
在同一领域中,不同Web数据库之间有重叠部分,为估计重叠部分在Web数据库中所占比例,提出一种基于属性高频字的重叠率估计方法.以中......
在正负关联规则中引入布尔矩阵的概念,在双重相关性挖掘算法的基础上提出一种Deep Web复杂模式匹配算法.将查询接口模式中的属性项......
随着数据库在Internet中的应用日益广泛,Deep Web集成(即Web数据库集成)成为当前信息领域的研究热点,模式匹配是Deep Web查询接口......
为了估计网络数据库的大小,提出了基于Capture-Recapture过滤二字亲密、二字排斥的方法。通过在接口文本框提交属性高频字,利用返......
在分析Dccp Wcb查询实现机制的基础上,给出了在语义本体的支持下,通过机器学习来实现自动填充查询接口,以实现自动数据抽取的算法:构造......
传统搜索引擎仅可以索引浅层Web页面.然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep ......
近几年,网络被在线数据库迅速深化。在深网中,大量的资料提供了丰富的数据模式。这些模式详细说明了它们的目标领域和查询性能。因此......
海量结构化数据隐藏在深网中(Deep Web),对有价值的深网数据抽取研究变得十分重要。提出一种面向深网网页的信息抽取算法,创新性引......
2014年12月29日,腾讯安全联合全国18个省市近30多名资深网警全面总结、深入研究后发布了国内首个《反信息诈骗白皮书》。《反信息诈......
提出一种基于模型匹配的深网(Deep Web)在线专业数据库查询接口特征抽取方法,该方法通过分析网页结构中特征词的深度自动抽取查询接......
Deep Web数据源的发现和其领域相关性越来越引起人们的关注和兴趣。针对在判别查询接口时,提取精度低和忽略领域相关性的问题,提出......
提出一种基于本体的Deep Web数据源发现方法,采用网页分类、表单内容分类、表单结构分类方式,确定符合某领域的DeepWeb查询接口。......
在DeepWeb数据集成系统中进行查询松弛时,面对众多异构数据源的属性,如何来判断松弛的先后顺序目前没有很好的方法。根据表单特征来......
为从海量深网中获得有价值的信息,提出一种深网数据源质量估计模型,综合考虑接口查询能力、接口页面质量和服务质量3方面因素,采用SVM......
论文综合利用主题搜索技术、深网信息集成技术和Wiki技术,设计并实现了一个面向数学领域的教育平台。此平台是一个集数学资源共享和......
深网(Deep Web)包含海量的结构化数据,深网数据集成有利于充分利用Web数据,提高领域数据的共享程度。提出一种建模语言,利用WF2OML,......
提出一种基于CSS选择器的深网结果页数据抽取方法,用于抽取深网结果页中的数据记录.实验结果表明在大多数情况下,该方法都能准确抽......
随着中文网站数量的日益庞大,中文的Deep Web信息集成已成为网络信息领域的焦点。属性相似度计算是Deep Web信息集成中模式匹配的关......
针对Deep Web的查询需求,提出了一种基于K-近邻算法的Deep Web数据源的自动分类方法。该算法在对Deep Web网页进行表单特征提取及......
如果说整个互联网是一座豪华的庄园那么我们平时所浏览的网站只是这座庄园里铺满阳光的一块草坪,互联网还有一部分,被锁在了一幢别......
在同一领域中,不同Web数据库之间有重叠部分,为估计重叠部分在Web数据库中所占比例,提出一种基于属性高频字的重叠率估计方法。以中文......
在正负关联规则中引入布尔矩阵的概念,在双重相关性挖掘算法的基础上提出一种DeepWeb复杂模式匹配算法。将查询接口模式中的属性项......
在深网集成检索中,用户通常希望仅向少量数据源提交查询即可获得高质量的检索结果,因而数据源选择成为关键问题。为提升实体信息集......
爬取匿名网站的信息是对匿名网站进行有效监管的重要基础.剖析了表层网络、深网、暗网与匿名网络等概念之间的区别与联系,分析了To......
随着Web规模的不断扩大,用户准确地从中找到所要查询的Web数据源并进行查询是非常困难的事情。为了能有效地访问这些数据源,Web数......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
随着Web在线数据库(Web DataBase, WDB)的激增,Web正在迅速地“深化”。通过WDB对外提供的唯一入口(表单/查询接口)有效地集成与挖......
近几年,网络被在线数据库迅速地深化。在深网中,大量的资料提供了丰富的数据模式,这些模式详细说明了它们的目标领域和查询性能,因此对......
针对目前网络家纺资源采集方式在处理海量网络资源尤其是深网资源时效率低下的问题,提出了一种自动化的网络家纺资源抽取方法。该......
隐形网络蕴藏着丰富的、高质量的信息资源,但却难以获得。本文介绍了隐形网络的概念、类型和形成原因,分析了隐形网络的内容,指出......
介绍了深网的概念、形成的原因及利用的必要性,提出检索深网的信息必须从信息意识的提高、专业目录的利用、专业及常规搜索引擎的......
Interuet上有大量的页面是由后台数据库动态产生的,传统的搜索引擎搜索不出这部分页面,我们称之为深网,其中大部分深网信息是结构......
随着Internet的快速发展,Web已经增长成为全球的信息资源库,网络信息量正以指数规模增长,人类已经步入信息爆炸时代。如何在海量信息......
<正>互联网上存在的国外军事特种医学研究信息具有一定的保密性和时效性,采用简单搜索方式难以查取。因信息大多在深网中存在,采用......
为满足用户精确化和个性化获取信息的需要,通过分析Deep Web信息的特点,提出了一个可搜索不同主题Deep Web信息的爬虫框架。针对爬......
在因特网上,每个主题往往拥有成百上千个相关的深网数据源,从众多的数据源中找到合适的源进行数据集成变得越来越重要.传统的考虑......