基于Agent的个性化信息服务关键技术研究

来源 :太原理工大学 | 被引量 : 3次 | 上传用户:yinyilin183
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,网上信息资源越来越丰富,网络已成为用户获取信息的必要途径和重要手段,而搜索引擎又成为用户获取信息资源的入口。但由于网络资源信息具有无组织、异构分布和动态变化、结构复杂等特点及用户检索信息时的“信息过载”和“资源迷向”等问题,传统的搜索引擎已无法满足用户的种种需求,用户期盼着一种具备智能性、个性化服务的搜索引擎出现。本文在分析研究国内外搜索引擎技术、个性化信息服务技术及现有搜索引擎不足的基础上,结合人工智能技术的最新研究成果——Agent技术,提出了基于Agent的个性化信息服务的搜索引擎框架模型。在此模型框架中,采用用户兴趣模型库和个性化知识库,多Agent协作等人工智能技术使得搜索引擎比较好地实现了用户个性化信息服务的特点,并以此框架为设计架构,简单地实现了使用Spider程序抓取网页,并对在抓取网页时使用的递归算法做了分析和限制。在个性化信息服务方面基于用户兴趣模型库和个性化知识库采用了“推”(Push)技术,用户(注册用户和非注册用户)在使用搜索引擎时,推荐Agent将用户的偏好(偏好从用户兴趣模型库和个性化知识库中获取)主动“推”送给用户。主要研究工作和结果为:(1)在分析研究Agent技术和现有搜索引擎的技术、体系结构、工作原理、搜索引擎的发展历程、发展趋势及应用现状等的基础上,针对现有搜索引擎的个性化服务、智能性比较差的特点,基于中科院计算所史忠植教授提出的信息搜索引擎结构,在查阅大量文献的基础上,设计了一个基于Agent的个性化搜索引擎框架模型。该模型由多Agent组成,自顶向下分为三层:人机交互层、信息处理层和信息收集层,并对各层中的各Agent功能进行了阐述。(2)研究分析了搜索引擎技术中的中文分词技术,并对正向最大分词算法做了改进(我称它为“正向动态最大匹配”算法),提出了“动态最大匹配”的思想,以减少匹配时循环的次数。实验结果表明,改进后的分词速度相对于正向最大匹配算法和逆向最大匹配算法的速度有明显的提高。(3)在中文分词的“歧义”处理方面,提出了“歧义包容”思想,即将某两种分词(如“正向最大匹配分词”和“逆向最大匹配分词”)的结果做个综合,然后将这一综合的结果交给搜索引擎。(4)设计了Spider收集网页程序,Spider的核心是一个基于关键词及多个关键词对站点进行深度优先搜索、对网页进行广度优先搜索的一个递归过程。搜索结果以Java中的JTree结构显示。为了防止Spider在搜索过程中陷入死循环及内存/堆栈的溢出,笔者采取了一些措施。
其他文献
随着人们对计算机网络的依赖性不断增强,网络安全越来越受到重视。网络中的入侵行为主要是指入侵者对计算机系统资源的非授权访问,可以造成系统数据的丢失和破坏、系统拒绝服务
高校成人高等教育发展迅速,成人高等教育的管理与普通高等教育的管理有一定差别,管理相应灵活复杂。尤其医学院校的成人教育基础课在校本部授课,临床实践课在远程附属医院授课,使
群体运动是自然界尤其是海洋生态系统中最常见的景象之一。无论是在陆地上还是海洋中,群体运动都有一个共同的特点:生物个体的行为相对简单,但当它们集群后,就会表现出复杂的群体
随着计算机的广泛使用和网络技术的迅速普及,出现了大量的信息,在这些信息中既有一股的可公开信息,也有需要保密的重要信息。数据库系统必须保证保密信息的安全存储和访问,如何保
随着科技信息技术的发展,电子政务系统在我国得到了快速的发展。我们利用信息技术生产和搜集数据的能力得到了大幅度的提高,各级政府部门、机构开发出了成千上万数据库,数据呈指
计算机技术、传感器网络与通信技术的高速发展,使得短时间内产生和传输大量数据成为现实,这种大量、快速、无限的数据被称为数据流(Data Stream)。目前,数据流处理技术广泛的应用
随着计算机网络在人们生活中的广泛应用,由网络安全引发的各种问题也越来越普遍,入侵攻击、拒绝服务攻击、网络资源滥用等威胁,为计算机网络带来了很多负面的影响,网络安全技术的
在信息作战条件下,高水平的军事训练是军队取得未来战争胜利的重要保证,先进的训练方式是取得高水平训练成果的关键环节。现代战争的作战样式引发了军队训练方法和形式的深刻变
随着计算机网络的应用规模呈爆炸式增长,互联网和企业内部网络都得到了飞速的发展,如何有效地保证网络的正常而高效地运行,减少由各种网络故障所带来的损失是目前面临的严重问题
纹理合成是当前计算机图形学、计算机视觉和图像处理领域的研究热点之一。本文对基于样图的二维纹理合成技术进行了研究,提出了一些新的观点并对一些经典算法做了一定的改进,同