基于遗传算法和后缀树算法的元搜索结果聚类研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:sanmumuren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网技术的发展,网络信息资源越来越多。为了使人们快速得到自己想要的信息,新的信息获取技术-搜索引擎技术应运而生,并得到飞速发展。但要想获得一个比较全面、准确的结果,就必须反复使用多个搜索引擎,不仅浪费时间和网络资源,并且搜索引擎的返回结果多如牛毛。独立的搜索引擎的查询局限性不断突出,不仅为元搜索引擎研究与发展提供了必要性,而且为元搜索引擎的发展提供了可能性。   本文在对独立搜索引擎和元搜索引擎基本原理介绍与分析的基础上,深入地分析了元搜索引擎存在的必要性以及当前存在的不足,重点探讨了元搜索引擎的工作过程中了两个重要问题:元搜索引擎对独立搜索引擎的调度和检索结果的合成。本研究主要内容包括:⑴分析了元搜索引擎存在的必要性。对搜索引擎和元搜索引擎进行了对比分析,介绍了元搜索引擎的原理,分类方法,构成结构,主要技术指标、关键技术和对元搜索引擎的发展趋势的展望。⑵构建了一个利用遗传算法实现元搜索引擎智能调度器模型。对模型的实现过程进行了详细的描述,并通过测试验证了该模型的可行性。⑶构建了一个元搜索引擎结果后缀树聚类分析模型。对模型的构建过程进行了详细的分析,重点是后缀树的构建和短语、分词的处理。通过与其他聚类方法的对比测试,对本文模型进行了分析。   本文设计了一种将遗传算法的思想引用到元搜索引擎对各个独立搜索引擎的调度模型,实现智能调度,根据独立搜索引擎的更新情况,动态地调度独立搜索引擎,对于提高元搜索引擎的响应时间,检索覆盖面,准确率等性能有一定的提高;通过改进的后缀树算法模型对检索结果的聚类分析,再将结果提供给检索用户,可以大大提高元搜索引擎的查询效率和减少用户等待时间。
其他文献
无线传感器网络是由部署在监测区域的大量廉价的微型传感器节点组成的,且由无线通信方式形成的一个多跳的自组织网络系统,它的目的是对网络覆盖区域内的感知对象进行实时的感
在分布式数据库中,系统的性能受查询策略的影响,而一个查询的处理代价通常是由进行通信的信息量来决定。半连接方法可以减少通信数据的传输量。分布式数据库具有并行处理子查
在基于内容的图像检索系统和人脸识别系统中,提取有效的鉴别特征是系统中的关键环节,是为下一步检索和识别的工作奠定基础的重要步骤。本文基于对子空间特征提取方法的深入研
何为数据挖掘?从字面意思理解就是对数据进行挖掘,本质的目的就是从数据库或其它相关信息库的大量数据中,挖掘出能够反映有效知识的数据的过程,是当前非常热门的一个研究领域
自上世纪80年代数据挖掘被提出以来,人们就开始不断研究探索,希望找到高效准确的数据挖掘方法,来帮助解决数据量庞大而计算能力有限这一矛盾。   数据与数据间存在着潜在
随着计算机处理能力和互联网技术的飞速发展,多媒体信息已经广泛地渗透到社会的各个领域中。众所周知,多媒体信息如:音视频、数字图像需要通过网络传输,在传输过程中信息容易
随着网络、图像处理以及通信技术的快速发展,智能视频监控成为计算机视觉领域一个新兴的研究内容,并且在各行各业都得到了广泛的应用,本文选取能够获得360度环境信息的全方位
图像分割是信息技术处理中的一个重要研究领域,也是现在技术研究中的热点和难点。随着现代技术的快速发展,图像分割技术也是快速的发展。但是,因为图像采集过程会受到外界因素的
随着信息技术的飞速发展,互联网上新的网页每天以惊人的速度在增长,这为满足用户检索信息提供了足够大的空间,但是想找到满足需求的信息也越来越成为困扰用户的一个问题。搜
本文首先介绍了移动Ad Hoc网络的基本概念、网络结构特点以及移动AdHoc网络路由协议的特点、分类等,并详细描述了几种典型的无线路由协议:DSDV协议、AODV协议、DSR协议以及TOR