【摘 要】
:
随着World Wide Web(WWW)的飞速发展,整个互连网上的有用信息量也在急剧增长。为了能够有效的利用这些信息,需要将来自于不同网站上的数据识别出来,并将这些有用的信息合并到
论文部分内容阅读
随着World Wide Web(WWW)的飞速发展,整个互连网上的有用信息量也在急剧增长。为了能够有效的利用这些信息,需要将来自于不同网站上的数据识别出来,并将这些有用的信息合并到一个统一的模式下。但Web数据库的异质性和自主性使得这项工作很具有挑战性。本文在分析国内外已有的Web数据合并方法的基础上,根据神经网络具有自组织、自学习以及自适应的特点,提出一种基于神经网络的Deep Web数据合并技术。主要研究的工作包括:(1)对Deep Web数据合并技术的国内外研究现状进行调查,对现有的经典的Web数据合并技术进行研究。(2)针对已有的Web数据合并技术的缺陷,本文提出一种基于神经网络的方法,该方法从数据表的特征和属性特征方面考虑来实现Web数据合并,为解决Web数据合并问题提供一种有效的途径。(3)以神经网络为基础的Deep Web数据合并方法的前提是先将Web上获得的数据进行数据转换,所以本文还研究了Web的数据转换技术,该技术实现将Web上的数据映射到结构化的关系数据库中,以便进一步进行研究。(4)应用神经网络工具箱来进行网络训练和仿真,保证该数据合并方法的可操作性,并采用实例验证基于神经网络的Web数据合并技术的准确性和优越性。最后,本文对所做的工作进行总结,并对以后的研究内容进行展望。
其他文献
在软件技术迅猛发展的今天,软件测试作为软件开发重要环节的同时,也成为了保证软件质量的重要手段。在面向对象软件的开发过程中,需要不断的测试和修改,在修改的过程容易引入
虚拟仪器就是利用数据采集设备加上数据分析软件来代替传统的测量仪器。以PC为平台的虚拟仪器系统长期以来充当着智能测试系统的平台,随着后PC时代的来临,业界对仪器的个性化
商业智能技术(Business Intelligence,BI)是当前信息处理技术中的一项热点课题,具有集成化数据管理、灵活的数据访问、强大的数据分析和可视化的报告等能力。BI主要应用了数
为了解决将对象持久化到关系数据库时所面临的问题,减少对象模型和关系模型之间的阻抗不匹配给应用系统设计开发所带来的消极影响,本论文分析了对象模型与关系模型相互映射的
工作流建模是当前工作流研究领域的热点问题之一。研究更具柔性和适应性的工作流建模方法,并探索模型对实际工作流系统开发的指导作用,使其更好地适应业务流程的动态变化,是
近年来随着因特网用户人数的增多,因特网通讯的体积迅速增长,这就要求越来越多的网络带宽。为适应因特网通讯,骨干网的容量已由WDM(波分复用)技术提高。基于WDM技术的波长路由
近年来,随着数据量的急剧增长,数据处理技术也同步获得非常巨大的发展。有别于过去传统的数据查询分析技术,借助于云计算技术的海量数据查询处理与分析技术有其本质特征。目
副本管理策略是云计算环境下分布式文件系统的重要研究方向之一。合理的副本因子以及副本放置策略不仅可以为用户提供更加可靠的数据访问服务,同时能够提高系统的负载均衡和
现阶段,中国的自动售货行业蓬勃发展。作为自动服务的核心部件,基于单片机的纸币识别系统已经越来越不能满足市场需求。本文对基于uClinux操作系统和S3C4510B的纸币识别系统
BPEL4WS(Business Process Execution Language for Web Service)是一种通过服务组合来定义业务流程的新的规范。通过BPEL4WS规范,可以直接对基于SOAP的Web服务进行编排、组