Web信息采集相关论文
传统搜索引擎技术满足了人们一定的需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的用户个性化的需求.本文......
随着中国纺织品出口量的扩大,中国已成为世界纺织面料的主要市场。利用互联网获取行业信息,使面料企业在信息资源的掌控中获得主动,对......
随着互联网的飞速发展及其影响力的不断扩大,网络上的信息量也随之不断增加。面对浩瀚如海的网络信息,通用的搜索引擎往往返回过多......
随着Web上信息的迅速扩展,各项基于Web的服务也逐渐繁荣起来。作为这些信息服务的基础和重要组成部分,Web信息采集正应用于搜索引......
随着Internet规模的迅速增长,网上的信息资源也迅速增长。这使得用户在网上迅速、准确地获得所需信息变得越来越困难。因此,改善传......
互联网的迅速发展和广泛普及导致网上信息爆炸性增长。如何在庞大的互联网上获得有价值的信息已成为网民日益关注的问题。 搜索......
随着网民数量急剧增长,中国网民的购物比例也在持续快速上升。C2C电子商务技术发展迅速,但由于其自身拓扑结构的开放性、动态性以......
针对传统搜索引擎不能满足用户个性化专业化需求的特性,提出了一种既面向用户又面向领域本体的搜索策略,设计了一个本体支持的Web......
构建轻量级、灵活的信息采集工具是信息集成工作需要重点解决的问题,也是Web信息采集技术的重要发展方向.本文基于个性化Web信息采......
深入研究了个性化Web信息采集技术,提出和设计了一个基于Multi-Agent技术的个性化Web信息采集系统。详尽介绍了该系统的体系结构、......
文章根据国内外在信息采集领域的长期发展以及并行采集技术的研究,展开了对Web信息的并行采集研究,提出了一个基于多线程并行的增......
介绍了一种适用于关键性大型业务系统的信息采集和处理模型。该模型较好地实现了基于WWW平台 ,采用低速连接来实现大规模的信息采......
针对个性化搜索需要多种Web Robot支持工作的需求,在分析Web Robot工作原理的基础上,利用面向对象的分析设计方法,提出了一种可实......
当今万维网已成为一个庞大的资源库,其中包含海量的信息,同时也充斥大量垃圾信息。所以,如何有效地采集Web信息是当前研究的热点问题......
本文为了能够突破原本网页信息采集系统无法实现脚本解析的动态化信息采集技术弊端,提出在Web信息采集系统中运用分布式JS解析技术......
面向主题的Web信息采集需判断提取的URL链接主题相关性。基于主题链接上下文提取,主题型语义块采用提取链接周围一定长度的文本,目......
基于Web—Harvest开源软件,并对其功能进行了扩展,设计并实现了具有较强通用性的Web铁路信息采集系统,阐释了系统构架和相关的技术,并......
介绍了解放军第二军医大学网络信息中心设计的军事主题信息采集系统的一项核心工作--军事主题信息的识别.主题识别算法从构造专业......
设计基于XML的Web信息采集系统,抽取出HTML页面中半结构化数据后,将清洗、解析后的数据置入My SQL数据库中。通过将类型相似页面的......
网络正深刻地改变着我们的生活,Internet已经发展成为当今世界上最大的信息库,如何快速、准确地从浩瀚的信息资源中寻找到所需的信......
随着开放获取运动的发展,越来越多的期刊加入到开放获取行列中来。开放获取期刊资源经过同行评审保证了学术质量,且分布广泛,具有......
小微企业由于信息严重不对称导致融资难、融资贵、贷款难等问题,基于大数据来源之一的互联网社交媒体的小微企业信息采集是获取小......
随着Internet的飞速发展,Web已经发展成为一个巨大的信息资源库,但是目前Web数据大都以HTML形式出现,这使得应用程序无法直接利用W......
Web信息的急剧增长,给信息的有效使用带来了巨大挑战.作为搜索引擎的重要组成部分,Web信息采集扮演着越来越重要的角色.文中从并行......
在Web信息采集的过程中,需要判断待采页面是否在已采页面集合中.为了实现快速采集,采用哈希函数来实现.基于一个含有2000多万个URL......
随着科学技术的飞速发展,我们已经进入了数字信息化时代。Internet作为当今世界上最大的信息库,也成为人们获取信息的最主要手段。......
NoSQL是非关系型数据库技术的总称,它是为满足日益增长的互联网及物联网等应用需求而产生的数据管理技术。本文从概念与特性、数据......
随着网络的迅猛发展,人们越来越依赖从网络上获取信息。网络信息资源的保存寿命通常只有几十天,随着时间的推移,大量旧的网络信息......
Web信息的急剧增长,给信息的有效使用提出了巨大挑战,如何快速、准确地从Web中获取所需信息己经成为亟待解决的问题。为了更加充分......
随着Web信息的爆炸性增长,如何快速、准确地从浩瀚的信息资源中寻找到所需信息已经成为困扰人们的一大问题。Web信息采集系统就是......
本文对Web信息采集技术的重要研究以及发展趋势给予了简要述评。主要内容包括:基于整个Web的信息采集,增量式Web信息采集,面向主题......
Web信息的急速增长给信息的提取和有效使用带来了巨大挑战,特别是对于众多的企业用户,如何从大量的网站页面中把需要的有用信息提......