深层网相关硕士博士期刊学术论文

深层网相关论文

基于Hadoop的Deep Web查询结果自动抽取研究

随着互联网技术的快速发展与广泛应用，网络提供给用户的资源与日俱增。特别是不能被传统搜索引擎通过静态链接而获取的海量信息资源......

学位

Deep Web查询结果 DOM树模板 FIME算法 Hadoop

面向电子商务的深层网入口挖掘研究

电子商务在近二十年的蓬勃发展取得了世人瞩目的业绩,并以一种前所未有的方式改变着传统的商务活动的模式和格局,更深刻地影响着人......

学位

深层网可视化特征 Web挖掘语义层次结构 WordNet

深层网中查询入口的填充策略研究

目前搜索引擎索引的绝大部分是表层网的信息，限于一些技术原因，搜索引擎几乎无法索引深层网中的信息。但是深层网具有容量大、质量高......

学位

深层网查询入口表单填充爬行器语义相似度

定向查询引擎在Web化学数据库集成检索中的应用

Internet上的化学数据库是重要的专业资源,基于超链接分析的搜索引擎还不能索引这类资源.本论文以充分利用Internet上的化学数据库......

期刊

定向查询引擎深层网 Web数据挖掘分布式数据库集成检索 XML

Deep Web垂直搜索引擎设计与实现

将deep Web发掘与主题爬行技术有机地结合起来,对deep Web垂直搜索引擎系统的关键技术进行了深入研究.首先设计了deep Web主题爬行......

期刊

深层网主题爬行垂直搜索 deep Web focused crawling vertical search

一种应用于Deep Web环境下的重复记录识别模型

随着Web数据库数量和其蕴含数据量飞速的增长,对Deep Web数据的集成越来越成为研究领域关注的问题.然而由于Web上的信息以半结构化......

期刊

深层网编辑距离重复记录 deep Web edit distance identify duplicate records

深层网查询表单标签识别技术研究

随着Internet的飞速发展和动态网页技术的持续应用，深层网中含有越来越多宝贵的资源，如何让系统自动提取这些资源，供人们检索分享，成为......

期刊

深层网查询表单标签逆向搜索匹配算法 deep web search form label RSM algorithm

一种深层网的数据采集方法

为了解决网络信息采集过程中复杂的脚本解析和异步数据交互等一系列问题,提出了基于浏览器内核的网络信息采集方法;构建了以浏览器......

期刊

浏览器内核脚本解析网络爬虫深层网 brower kernel script parsing web crawler deep web

基于DS信度函数理论的Deep Web查询接口匹配方法

在Deep Web查询接口的匹配问题中使用DS信度函数的理论，将四种单独的匹配方法进行融合，综合多方面的特征来对查询接口中的属性进行一......

期刊

DS理论查询接口匹配深层网

Deep Web表单标签提取探究

随着Internet的不断发展，DeepWeb已经成为Web上重要的信息资源，DeepWeb表单标签提取是访问DeepWeb资源的前提与基础。该文提出了倒推......

期刊

深层网表单标签倒推算法查询 deep Web form-tag retrodict algorithm query

深层网网络爬虫表单检测器设计

传统网络爬虫只处理页面中的超链接,而忽略了大量有价值的深层网搜索表单。本文设计了一个表单检测器用于检测搜索表单,介绍了其功......

期刊

深层网网络爬虫搜索表单表单检测器 Deep Web： Web crawler search form form detector

基于主题模型的深层网数据源选择算法

联邦搜索是从大规模深层网上获取信息的一种重要技术。给定一个用户查询,联邦搜索系统需要解决的一个主要问题是数据源选择问题,即......

期刊

深层网主题模型隐含狄利克雷分布数据源选择联邦搜索 deep Web topic model Latent Dirichlet Allocation （L

基于查询接口文本的DeepWeb数据源分类

根据DeepWeb数量的爆炸性增长特点，提出一种基于查询接口文本的DeepWeb数据源分类算法，对于分类的查询接口，采用2种方法：基于向量空间......

期刊

深层网数据源分类知网 K—NN算法语义分类 Deep Web data source classification HowNet K-NN algorit

深层网中基于入口查询的表单填充策略

针对深层网中数据量大导致无法被传统搜索引擎索引的问题，在提取网页中，改进启发式规则识别表单查询入口，在表单标签与内容匹配时，改进......

期刊

深层网入口查询表单填充 deep Web entrance query form filling

基于搜索引擎的Deep Web数据源发现

提出一种利用搜索引擎发现数据源的方法。为向搜索引擎提交高质量的关键词,将本体作为等级化组织词汇的架构引入到初始词构建过程......

期刊

数据源发现深层网本体 data source discovery Deep Web ontology

基于Choquet积分的深层网数据源选择

提出一种基于Choquet模糊积分的深层网数据源选择方法。通过在1组关键字上的查询结果评价深层网数据源的质量，评价时不仅考虑到关键......

期刊

深层网数据源选择 CHOQUET模糊积分 Deep Web data source selection Choquet fuzzy integral

一种用于深层网接口集成的模式匹配方法

针对已有证据理论（DS）方法在深层网接口集成方面的局限性,设计一种基于概念词与语义异构模型的深层网模式匹配方法。通过提取概念词......

期刊

深层网概念词语义异构模式匹配接口集成 Deep Web concept word semantic heterogeneity pattern matc

基于相似URL的深层网数据区域识别

针对深层网查询结果页面中噪音信息对数据区域识别的干扰问题,提出一种自动识别深层网查询结果数据区域的方法。该方法利用网页的......

期刊

深层网重复结构相似URL 语义块数据区域 Deep Web repetitive structure similar URL semantic block

基于Scrapy的深层网络爬虫研究

随着大数据时代的到来,网络爬虫已经成为很普遍的技术,无论是做项目、科研、创业或者写论文,获得大量数据并且对数据进行分析都是......

期刊

深层网网络爬虫 Scrapy Python

深层网信息挖掘技术的研究在化工领域的应用

随着网络规模在全球的迅猛发展,Internet上的Web网站以及网页的数量目前在以爆炸性的趋势增长,网上蕴藏着数量巨大的信息资料。由......

学位

深层网信息挖掘自动提交表单信息抽取

基于模型匹配的Deep Web数据库分类

Deep Web指那些存储在网络数据库里、不能通过超链接访问,而需要通过动态网页技术访问的信息资源。网络数据库包括搜索引擎数据库......

学位

深层网文档对象模型向量空间模型相似度

深层网站Ajax页面数据采集研究综述

如果能够提高网络爬虫采集Ajax网页数据的能力,必然会提高搜索引擎的覆盖率和准确率。因此,深层网站Ajax页面数据采集成为当前网络......

期刊

Ajax 深层网 Web2.0 数据采集

看过本文同时还关注