深层网相关论文
随着互联网技术的快速发展与广泛应用,网络提供给用户的资源与日俱增。特别是不能被传统搜索引擎通过静态链接而获取的海量信息资源......
电子商务在近二十年的蓬勃发展取得了世人瞩目的业绩,并以一种前所未有的方式改变着传统的商务活动的模式和格局,更深刻地影响着人......
目前搜索引擎索引的绝大部分是表层网的信息,限于一些技术原因,搜索引擎几乎无法索引深层网中的信息。但是深层网具有容量大、质量高......
Internet上的化学数据库是重要的专业资源,基于超链接分析的搜索引擎还不能索引这类资源.本论文以充分利用Internet上的化学数据库......
将deep Web发掘与主题爬行技术有机地结合起来,对deep Web垂直搜索引擎系统的关键技术进行了深入研究.首先设计了deep Web主题爬行......
随着Web数据库数量和其蕴含数据量飞速的增长,对Deep Web数据的集成越来越成为研究领域关注的问题.然而由于Web上的信息以半结构化......
随着Internet的飞速发展和动态网页技术的持续应用,深层网中含有越来越多宝贵的资源,如何让系统自动提取这些资源,供人们检索分享,成为......
为了解决网络信息采集过程中复杂的脚本解析和异步数据交互等一系列问题,提出了基于浏览器内核的网络信息采集方法;构建了以浏览器......
在Deep Web查询接口的匹配问题中使用DS信度函数的理论,将四种单独的匹配方法进行融合,综合多方面的特征来对查询接口中的属性进行一......
随着Internet的不断发展,DeepWeb已经成为Web上重要的信息资源,DeepWeb表单标签提取是访问DeepWeb资源的前提与基础。该文提出了倒推......
传统网络爬虫只处理页面中的超链接,而忽略了大量有价值的深层网搜索表单。本文设计了一个表单检测器用于检测搜索表单,介绍了其功......
联邦搜索是从大规模深层网上获取信息的一种重要技术。给定一个用户查询,联邦搜索系统需要解决的一个主要问题是数据源选择问题,即......
根据DeepWeb数量的爆炸性增长特点,提出一种基于查询接口文本的DeepWeb数据源分类算法,对于分类的查询接口,采用2种方法:基于向量空间......
针对深层网中数据量大导致无法被传统搜索引擎索引的问题,在提取网页中,改进启发式规则识别表单查询入口,在表单标签与内容匹配时,改进......
提出一种利用搜索引擎发现数据源的方法。为向搜索引擎提交高质量的关键词,将本体作为等级化组织词汇的架构引入到初始词构建过程......
提出一种基于Choquet模糊积分的深层网数据源选择方法。通过在1组关键字上的查询结果评价深层网数据源的质量,评价时不仅考虑到关键......
针对已有证据理论(DS)方法在深层网接口集成方面的局限性,设计一种基于概念词与语义异构模型的深层网模式匹配方法。通过提取概念词......
针对深层网查询结果页面中噪音信息对数据区域识别的干扰问题,提出一种自动识别深层网查询结果数据区域的方法。该方法利用网页的......
随着大数据时代的到来,网络爬虫已经成为很普遍的技术,无论是做项目、科研、创业或者写论文,获得大量数据并且对数据进行分析都是......
随着网络规模在全球的迅猛发展,Internet上的Web网站以及网页的数量目前在以爆炸性的趋势增长,网上蕴藏着数量巨大的信息资料。由......
Deep Web指那些存储在网络数据库里、不能通过超链接访问,而需要通过动态网页技术访问的信息资源。网络数据库包括搜索引擎数据库......
如果能够提高网络爬虫采集Ajax网页数据的能力,必然会提高搜索引擎的覆盖率和准确率。因此,深层网站Ajax页面数据采集成为当前网络......