Web数据查询研究

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:fqdml
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web从1991年出现以来,经过十多年的发展已经成为一个巨大的全球化信息空间。网上信息繁杂,门户网站林立,面对信息的海洋,用户试图通过浏览器来查找信息已经相当艰难,往往花费大量时间却收获甚少。如何有效地检索Web信息,以帮助用户从大量文档信息集合中找到与给定查询请求相关的文档子集,也就成为一项重要而迫切的研究课题。同时,快速、有效的Web信息查询也是充分发挥Web在数字化图书馆、电子商务等方面潜能的一个基础前提。信息查询并不是Web所特有的一个研究课题。早在本世纪50年代初,当计算机被图书馆等部门用于存储和管理文档时,信息查询就作为一个独立的研究领域而展现在世人面前。到80年代,信息检索领域已经在文档内容表示、索引模型、匹配策略等方面取得了丰硕成果。Web的出现为信息查询提供了一个前所未有的试验环境和应用情景,许多Web信息检索系统应运而生,例如Yahoo!,Goggle等,同时,Web信息的大容量、异构性、分布性和动态性给信息查询领域带来了新的挑战,需要在传统信息检索技术的基础上开展针对Web特点的研究工作。Web查询的技术翻陈出新,逐渐从搜索引擎走出来。随着Internet的迅速发展,XML异军崛起,经过几年的发展,已成为科研机构和商家追捧的热点,XML可扩展性语言已经成为Web数据使用的通用语言,它具有结构化、规范化、可扩展性和简洁的特点,其跨平台的特性可以允许开发人员聚集和组合各种来源的数据,并使它们更富有价值。在XML查询中,索引的作用至关重要, XML查询的代价估算一般只考虑CPU代价和I/O代价,I/O代价的估算在很大程度上依赖于XML数据的统计信息,而这些信息都和路径有关,可以直接记录在路径索引上。由于XML能使不同来源的结构化数据很容易的结合在一起,因而使搜索多样化的不兼容的数据库能够成为可能,从而为解决Web数据挖掘带来了希望,也使Web挖掘成为可能。XML/RDF能够明确描述网上各种信息源的统一性、结构性和规范化,它把网络环境中的对象视为资源,并制定了明确的描述性语法和语义,使我们能够在一个规划化、结构化的统一数据层面上,研究和开发新的网络挖掘技术,同时可以运用传统的挖掘算法和工具对各种目标资源进行特定的多种层次的综合数据挖掘。<WP=6>本论文首先对Web数据库的Web特点进行综述,它给信息查询带来众多的难题和机遇,然后再探讨传统信息检索技术的原理和搜索引擎的工作机制;分析传统搜索引擎的难以弥补的缺陷,再对目前Web查询语言现状进行较为详细的叙述;最后,对目前的Web查询更高的境界——Web挖掘的一些新技术进行了分析。本文分为五部分;第一部分主要论述了Web数据库的Web信息特点;并将传统的数据库与Web检索进行了比较分析,二者最重要的一个区别是数据库的数据结构性更强,比信息检索的数据包含更多的语义,在一定意义上,信息检索技术更适合于处理无结构数据,数据库则是管理结构数据的最好途径;一般实现Web数据库系统的连接和应用可采取两种方法,一种是在Web服务器端提供中间件来连接Web服务器和数据库服务器,另一种是把应用程序下载到客户端并在客户端直接访问数据库。基于服务器端提供中间件来连接Web服务器和数据库服务器,最基本的中间件有CGI和API两种,而通过Web浏览器把应用下载到客户端运行,就能够在客户端直接访问数据库,主要采用JDBC。同时,在这两种方法基础上提出了一种通用的Web数据库系统体系结构。第二部分主要分析了Web搜索引擎工作机制,对Robot的搜索算法进行了全面的分析,说明各自的优缺点;然后对目前几种优化的搜索引擎技术进行了论述。第三部分先通过分析传统搜索引擎的难以避免的缺陷,然后对目前数据库界的Web查询方案进行了归类分析;随着XML技术的出现,Web查询出现了机遇和挑战,重点分析了XML技术所具备的独特适合于Web查询的优势。第四部分就是将传统的数据挖掘技术和Web结合起来,进行Web挖掘,形成解决Web检索问题的新思路;先对目前的Web挖掘进行了分类,然后再重点探讨了Web结构挖掘和Web使用纪录的挖掘;最后,对目前Web挖掘中的热点之一——基于Mobile Agent和RDF的Web挖掘进行了分析。本文最后,对Web查询的趋势、研究热点和难点进行了简要的分析和评述。
其他文献
语文是中小学的基础学科之一,既是知识获取的主要途径之一,也是学生融入生活、适应社会的主要载体.读与写作为语文学习的重要组成部分,两者是相辅相成、共同促进的关系,把读
摘要:在小学阶段的数学课堂教学过程中,教师要特别关注小学生的认知特点和学习规律,在教学方法的选用上要充分结合实际教学需求和学生的需求,以便有效激发和培养小学生的数学学习兴趣,使其产生主动参与数学学习的积极性。而趣味性教学方式在小学课堂教学中的应用,恰巧符合了小学生的学习特征,不仅可以实现小学生数学学习兴趣的激发和培养,还可以使小学以快乐和享受的状态在愉悦的氛围中获得学习体验,这对数学高效课堂的构建
随着课程改革的推进,核心素养已经成为初中语文教学中的热点和主要的任务.因此,在日常的教学生活中,老师应该以核心素养为背景,优化教学策略,积极进行课堂的有效创新和优化.
在语文阅读教学活动中,教师要有意识地安排学生进行阅读,多给学生想象的空间,要从多角度启发学生进行阅读等途径构建高效阅读模式,促进学生阅读效率的提升.本文主要基于语文
该文较详细的描述了现行的供水行业在价格形成、运行体制及投资体制等各个方面存在的问题,并力图通过阐述如何建立完善的供水价格体制、如何建立完善的供水运行体制、如何建
经济进步的同时人的思想也在前进,教育已经成为全社会共同关注的题材,这也对教育者提出了更高的要求.特对是对于高中数学而言,内容比较深奥、抽象,因此老师一定要注意培养学
该文研究的主题是中国证券市场的风险实证研究.中国证券市场作为一个新兴发展的市场,对风险的研究尽管有很多,但大多侧重于定性研究,且缺少数学理论作指导.该文利用回归分析
该文主要研究跨国公司在发展中国家人力资源发展中所充当的角色.通过分析从访谈、向中国的跨国公司管理雇员分发调查问卷以及二手获得的资料,认为跨国公司需要对雇员进行技能
从20世纪90年代开始,中国经济不断开放发展,城市化进程不断加快。为了建设更好的基础设施和提供更好的居住环境,部分地方政府,特别是沿海较早开放的省市,政府投融资平台陆续出现。
启发式教学作为一种教学指导思想,注重“启”和“试”相结合,一切教学活动都必须以调动学生的积极性、主动性、创造性为出发点,引导学生主动探索,积极思维,通过自己的活动达