WIIS系统中信元集成机制的研究与信元抽取的实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:yjcog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因特网的出现给人类社会发展带来了前所未有的变革.目前WWW已经发展成为包含多种信息资源、站点遍布全球的巨大信息服务网络,成为世界上最丰富和最密集的信息来源.然而高速增长的信息量和信息类别,却没有带来信息利用效率的同步提高,相反人们似乎正在湮没于"信息"的海洋之中.根本原因在于WWW固有的特点导致了Web信息的获取和有效管理变得越来越困难.WWW信息集成技术是解决上述问题的有效方法之一.为此我们在研究了WWW信息集成技术要点的基础上,设计并实现了一个WWW信息集成系统-WIIS.该系统主要针对WWW上HTML文件的半结构化信息源,基于信元模型,采用多视图的信元集成机制,集成来自不同信息源的信息,为用户对WWW信息有效获取、整理、分析、利用提供支持.该文对该系统进行了整体设计,同时对基于信元的多视图集成机制进行了深入的研究,并对信元抽取的实现作了详细的阐述.
其他文献
基于组件的软件开发可以减少软件开发的时间和成本,它在软件工程中已经得到了相当的重视.基于组件的分布式系统也已经在商业、工业和学术研究中有了广泛的应用.要使分布式系
随着信息技术的发展,我们面对的数据信息量也表现的愈加巨大化。应运而生的技术是数据挖掘,但是传统的挖掘技术对不完备的信息系统表现出了诸多的不足。在本中,我们提出了Rough集理论的数据挖掘方法,Rough集理论是研究信息系统中的不完善、不准确数据的一种数学解决方法。本文在Lenarcik.A方法的启发下,提出了把Rough集理论和信息熵相结合开发的基于决策表属性重要性的属性值离散化算法。对于数据的补
全国专利管理信息平台是一个国家级准电子政务应用系统,其专利管理业务范围覆盖全国。本文据此提出在全国范围内建立以多层系统结构为模式,以数据库为中心的集中式与分布式管理
连铸技术是借助有效的冷却控制,使钢水连续并逐渐转变为钢坯的工艺过程.连铸坯内钢液的流动和传热直接影响着铸坯的表面质量及内部质量.为此,人们开展了大量关于连铸坯内钢液
随着技术的发展,移动设备越来越多,使用越来越频繁,手机、平板等设备上保存着用户大量的隐私。而传统的口令方式存在着易遗忘、易丢失、易复制等缺点,存在着相当多的安全隐患,因此
本文首先介绍了主动网的研究现状,现存的几种类型的主动网络及其实现方式,并作简单的比较。对他们所采用的代码移动技术做出简单的评估。然后,引入移动代理技术,论述移动代理技术
协同应用系统的开发正处于从简单到复杂、从支持工作组级的小规模协作到跨机构的、全球范围内的大规模协作的过程.企业级的协同系统需要建立在物理上分散,逻辑上异构的多种数
性能管理是网络管理中的重点和难点,网络流量的变化将对网络的性能产生影响.该课题的研究目的是试图发现网络流量的变化对网络性能产生影响的规律,并利用这些规律来监测网络
随着网络应用的发展,网络的复杂性不断增加,网络管理的作用也越来越凸显出来,并已经逐渐成为保障网络正常、高效运行的必要手段之一。简单网络管理协议(SNMP)以其简单、灵活
目前,XML及其相关技术已日益渗透到计算机科学的各个层面。用XML直接面向业务逻辑来进行软件开发,使应用(业务)逻辑与具体的代码分开,是软件工程中一个新的研究课题,这可以降低软