论文部分内容阅读
摘要:本文在分析Agent技术的含义与基本结构的基础上,探讨了个性化信息推送服务的形式以及在Agent技术下的各种个性化信息推送服务的模式,详细分析了基于Agent技术的个性化信息推送服务的工作原理。最后阐述了服务实现过程中应注意的问题。
关键词:数字图书馆;Agent技术;信息推送;个性化服务
当前,信息技术和网络经济迅猛发展。图书馆为顺应数字发展的潮流,开始从传统图书馆向数字图书馆过渡,服务方式随之发生转变,个性化信息服务逐渐成为新型服务模式的主流。
数字图书馆的个性化信息服务是以用户为中心,根据用户的个性化需求而展开的信息服务,具有很强的针对性和主动性。同时随着读者信息需求越来越专门化,图书馆个性化信息服务也具有了不确定性。因此,图书馆需要不断创新服务环境和方式,为读者提供基于个性化的信息服务。本文正是根据数字图书馆个性化信息服务发展需要,基于已有的数字资源优势和个性化技术发展趋势,研究并构建了“基于Agent的个I生化信息推送服务模型”。该模型从Agent自身特点出发,解析个性化信息推送服务功能,提出了应用Agent技术实现基于数字图书馆的个性化信息推送服务模型。
Agent技术简介
Agent可以理解为一个自包含的程序,能够控制自己的动作与决策。同时也是驻留在环境中的实体,它可以感知环境,并做出反映。Agent的基本结构分为3部分:
(1)信息处理系统。该系统是Agent的行为控制系统。信息处理系统涉及3个环节的活动,即信息的感应、信息的适配、信息的处理。在信息感应环节中,Agent时刻捕捉其所关注的信息状态的出现,并根据其活动类型启动相应的信息适配器工作。在信息适配环节中,Agent通过适配器对获取的相关事件信息进行识别。在Agent的基本结构中,适配器是作为外界与Agent交流信息的接口来使用的。适配器就像Agent的感觉器官一样,通过适配器Agent能够从外界接受信息,并能依靠一定的智能对事件做出反应,并将识别结果提交给相应的信息处理部分,启动相关的信息处理方法并加以执行。在信息处理环节中,Agent通过信息的感应和适配表明了当前信息检索事件的表征状态,然后通过对这些表征状态的处理,使Agent智能化不断发生变化。
(2)引擎模块。该模块是Agent的核心。Agent的引擎种类主要有触发引擎、反射引擎、执行引擎。触发引擎,当出现某些事件时,触发引擎根据操纵事件的规则、执行复杂的推理决定事件的反映。比如,一个传递给A的服务器请求导致消息事件的发生。A的(消息)事件感知将及时检测该事件的发生,从而引发A的(消息)事件适配接收此消息。反射引擎,其作用是检测事件并且反映出Agent现有的状态。执行引擎,信息检索事件发生时能够使用虚拟机系统调用Java或者调用脚本语言解释系统。总的来看,引擎模块主要负责处理人机之间检索信息的互动,具有交互与协调功能。
(3)内部状态集。该状态集是表现Agent当前状态的成分,包括感知器、适配信息、数据库信息。感知器,时刻感应检索信息的出现。适配信息,是对从感知器接受的信息做出反映并提供与其他信息资源的连接,如用户界面信息、连接指引信息等。数据库信息,是为了方便信息的查询与共享使信息以某种标准格式存储在库里。
基于Agent个性化信息推送服务解析
个性化信息推送服务的特征主要表现在两个方面:一是专门化的个人服务,根据每个人的不同需求提供专门的个性化信息服务;二是主动化的信息推送服务,即计算机系统主动地将信息推送给用户的服务。个性化的信息推送服务形式也是多种多样的,主要有3种:定题信息推送服务、热点信息提醒推送服务、web信息挖掘推送服务。
Agent自身的特性决定了其能够被应用于个性化信息推送服务中。Agent的智能性、代理性、交互性、学习性等特性为更全面地体现个性化信息推送服务提供了可能。从个性化信息推送服务特征及服务形式来看,推送技术中最关键的问题就是对信息的分类及整理。而面对巨大的信息量,难以用人工处理信息类型,无法准确地确定推送对象和推送内容。为了实现计算机的自动处理,成功应用个性化信息推送服务,开展基于Agent的个性化信息推送服务模式的研究是十分必要的。这种服务模式是利用智能Agent、数据挖掘和问题过滤与反馈等技术,通过分析用户兴趣,挖掘建立用户模型。图1给出了基于Agent的个性化信息推送服务的概貌。
基于Agent的个性化信息推送服务框架及模型设计
将Agent技术引入数字图书馆中,不仅能根据用户提交的需求信息提供有针对性的信息,而且能对用户感兴趣的信息进行动态跟踪与智能分析,从而更加主动地向用户推送其可能需要的信息。
整个推送服务框架共分4个区:用户区、资源配送区、整合区、服务区(见图2)。用户区负责信息的定制。在用户区中用户接口Agem为用户与个性化信息推送服务系统交互提供了入口,用户通过用户Agent进行系统登陆,并查看系统推送给用户的信息资源。实际上用户区就是一个介入终端。整合区负责按照用户的需要定制个性化信息推送服务并绑定服务接口。整个过程即为服务的编排,其运行机制为:代理Agent接受通过网络传来的用户信息服务请求,搜集整合Agent依据数据库的推理算法构造个性化信息结构,并有选择性地将用户感兴趣的内容来源,依靠主题聚合将Agent聚合到一起,为用户提供多来源的快捷服务。资源配送区是整个框架的核心部分。当经过搜集抽取的信息源经过资源配送区时,首先对搜集抽取的信息源进行再加工和过滤,去除其中和用户兴趣不相关或相关性不大的信息,然后综合利用知识库中的知识及元数据的描述规范来推理和挖掘用户的最终需求。服务区是一个可通过网络寻址的实体集合,它利用底层组件实现服务,包括资源服务以及第三方服务(开放搜索、认证、付费资源等)。
个性化信息推送服务的形式:
(1)定题信息推送服务
定题信息推送服务是根据用户向系统提交的需求信息,定期向用户推送符合用户个性化要求的检索结果的个性化信息推送服务。整个定题信息推送的工作流程如下:用户在向系统提供用户需求信息以及个性化信息后,用户接口Agent将查询发送给搜索引擎,然后将现有搜索引擎的搜索结果与个性化代理Agent进行交互,选择适合的信息服务系统并进行整合,去掉重复查询的结果,统一格式并重新排列,然后回传给定题信息推送系统。当定题服务系统需要进行新的信息推送时,把检索结果由用户接口代理Agent提交给定题信息推送系统并最终返回给用户(见图3)。
(2)热点信息提醒推送服务
热点信息提醒推送服务是数字图书馆根据用户提供的兴趣主题词,定期以电话、短信、邮件等形式向用 户推送符合用户需求的热点信息资源。其在数字图书馆的实现包括以下3个过程:一是定期生成新资源信息库,数字图书馆都有自己的信息资源数据库,应该在此基础上定期生成一个新信息资源数据库,并对用户关心的主题进行抓取。二是对每条新信息数据进行标注,热点信息提醒推送是把用户感兴趣的主题与新的信息资源进行匹配,并通过定制、驻留Agent使信息资源数据库与资源管理Agent实现一个交互运行的配送机制,然后将标注后匹配的信息通过信息过滤Agent进行过滤,为用户提供最准确的个性化信息。三是根据用户个人信息,建立用户信息库,及时将用户感兴趣的热点信息反馈给用户(见图4)。
(3)Web信息挖掘推送服务
Web信息挖掘推送服务是数字图书馆系统对用户在搜索、查询信息过程中产生的使用信息进行分析挖掘,以获取用户的意图,最后将系统中与用户搜索、查询相关的信息发送给用户。Web信息挖掘推送服务是在用户完全不知情的情况下,由系统主动分析用户行为,挖掘用户需求主题,最后根据挖掘出来的信息主动推送给用户。使用Web信息挖掘推送服务关键在于分析用户在Web搜索、查询时的使用信息,以发现用户的个性化需求。Web信息挖掘推送服务与其他推送服务有所区别,它完成的是即时推送,而不是延时推送。其原因在于它是系统主动向用户发送而不是用户向系统索取。因此,它的实现过程是:首先当用户在Web上搜索和查询信息时,智能Agent会主动地根据用户个性化模式的描述,从Web上检索出相应信息并监控信息源的变化,及时传送给Web结构挖掘部件。Web结构挖掘是在WWW的组织结构及引用和被引用间的链接关系中推理知识的过程,通过挖掘这些结构信息,可以更加精确地理解Web内容的相关性及质量。另外通过挖掘Web的结构信息,可以揭示许多蕴涵在Web内容之外的隐含的有用信息,并使其通过通讯结构与信息服务系统进行检索交互,最后将检索结果即时地传送给用户,完成整个Web信息挖掘推送服务(见图5)。
应用模型服务实现过程中应注意的问题
(1)服务整体构架功能模块的划分
在数字图书馆的构架上,更明确地划分其功能,使其每个功能结构都更具灵活性与互操作性。并且能够随着信息技术的不断发展而不断向模型增加新的功能与服务,使模型具有更加良好的可扩展性。
(2)服务的管理
在模型的实际运作中,为了达到预期目的,需要特别重视服务的管理:如更准确地表达资源的内容信息、提高信息的检索精度、处理更多的信息应用格式、协调好各个Agent问的任务协作、提高模型系统运作安全性等。
(3)服务的扩展
Agent技术很重视对服务的扩展,希望能把更多的服务方式整合进Agent服务模型。数字图书馆也应努力推动服务的发展,在建立好推送服务模型后,应随着服务的开展,通过对比不同用户需求、跟踪用户需求的规律,不断发掘用户的真正兴趣并及时改进用户模型。
关键词:数字图书馆;Agent技术;信息推送;个性化服务
当前,信息技术和网络经济迅猛发展。图书馆为顺应数字发展的潮流,开始从传统图书馆向数字图书馆过渡,服务方式随之发生转变,个性化信息服务逐渐成为新型服务模式的主流。
数字图书馆的个性化信息服务是以用户为中心,根据用户的个性化需求而展开的信息服务,具有很强的针对性和主动性。同时随着读者信息需求越来越专门化,图书馆个性化信息服务也具有了不确定性。因此,图书馆需要不断创新服务环境和方式,为读者提供基于个性化的信息服务。本文正是根据数字图书馆个性化信息服务发展需要,基于已有的数字资源优势和个性化技术发展趋势,研究并构建了“基于Agent的个I生化信息推送服务模型”。该模型从Agent自身特点出发,解析个性化信息推送服务功能,提出了应用Agent技术实现基于数字图书馆的个性化信息推送服务模型。
Agent技术简介
Agent可以理解为一个自包含的程序,能够控制自己的动作与决策。同时也是驻留在环境中的实体,它可以感知环境,并做出反映。Agent的基本结构分为3部分:
(1)信息处理系统。该系统是Agent的行为控制系统。信息处理系统涉及3个环节的活动,即信息的感应、信息的适配、信息的处理。在信息感应环节中,Agent时刻捕捉其所关注的信息状态的出现,并根据其活动类型启动相应的信息适配器工作。在信息适配环节中,Agent通过适配器对获取的相关事件信息进行识别。在Agent的基本结构中,适配器是作为外界与Agent交流信息的接口来使用的。适配器就像Agent的感觉器官一样,通过适配器Agent能够从外界接受信息,并能依靠一定的智能对事件做出反应,并将识别结果提交给相应的信息处理部分,启动相关的信息处理方法并加以执行。在信息处理环节中,Agent通过信息的感应和适配表明了当前信息检索事件的表征状态,然后通过对这些表征状态的处理,使Agent智能化不断发生变化。
(2)引擎模块。该模块是Agent的核心。Agent的引擎种类主要有触发引擎、反射引擎、执行引擎。触发引擎,当出现某些事件时,触发引擎根据操纵事件的规则、执行复杂的推理决定事件的反映。比如,一个传递给A的服务器请求导致消息事件的发生。A的(消息)事件感知将及时检测该事件的发生,从而引发A的(消息)事件适配接收此消息。反射引擎,其作用是检测事件并且反映出Agent现有的状态。执行引擎,信息检索事件发生时能够使用虚拟机系统调用Java或者调用脚本语言解释系统。总的来看,引擎模块主要负责处理人机之间检索信息的互动,具有交互与协调功能。
(3)内部状态集。该状态集是表现Agent当前状态的成分,包括感知器、适配信息、数据库信息。感知器,时刻感应检索信息的出现。适配信息,是对从感知器接受的信息做出反映并提供与其他信息资源的连接,如用户界面信息、连接指引信息等。数据库信息,是为了方便信息的查询与共享使信息以某种标准格式存储在库里。
基于Agent个性化信息推送服务解析
个性化信息推送服务的特征主要表现在两个方面:一是专门化的个人服务,根据每个人的不同需求提供专门的个性化信息服务;二是主动化的信息推送服务,即计算机系统主动地将信息推送给用户的服务。个性化的信息推送服务形式也是多种多样的,主要有3种:定题信息推送服务、热点信息提醒推送服务、web信息挖掘推送服务。
Agent自身的特性决定了其能够被应用于个性化信息推送服务中。Agent的智能性、代理性、交互性、学习性等特性为更全面地体现个性化信息推送服务提供了可能。从个性化信息推送服务特征及服务形式来看,推送技术中最关键的问题就是对信息的分类及整理。而面对巨大的信息量,难以用人工处理信息类型,无法准确地确定推送对象和推送内容。为了实现计算机的自动处理,成功应用个性化信息推送服务,开展基于Agent的个性化信息推送服务模式的研究是十分必要的。这种服务模式是利用智能Agent、数据挖掘和问题过滤与反馈等技术,通过分析用户兴趣,挖掘建立用户模型。图1给出了基于Agent的个性化信息推送服务的概貌。
基于Agent的个性化信息推送服务框架及模型设计
将Agent技术引入数字图书馆中,不仅能根据用户提交的需求信息提供有针对性的信息,而且能对用户感兴趣的信息进行动态跟踪与智能分析,从而更加主动地向用户推送其可能需要的信息。
整个推送服务框架共分4个区:用户区、资源配送区、整合区、服务区(见图2)。用户区负责信息的定制。在用户区中用户接口Agem为用户与个性化信息推送服务系统交互提供了入口,用户通过用户Agent进行系统登陆,并查看系统推送给用户的信息资源。实际上用户区就是一个介入终端。整合区负责按照用户的需要定制个性化信息推送服务并绑定服务接口。整个过程即为服务的编排,其运行机制为:代理Agent接受通过网络传来的用户信息服务请求,搜集整合Agent依据数据库的推理算法构造个性化信息结构,并有选择性地将用户感兴趣的内容来源,依靠主题聚合将Agent聚合到一起,为用户提供多来源的快捷服务。资源配送区是整个框架的核心部分。当经过搜集抽取的信息源经过资源配送区时,首先对搜集抽取的信息源进行再加工和过滤,去除其中和用户兴趣不相关或相关性不大的信息,然后综合利用知识库中的知识及元数据的描述规范来推理和挖掘用户的最终需求。服务区是一个可通过网络寻址的实体集合,它利用底层组件实现服务,包括资源服务以及第三方服务(开放搜索、认证、付费资源等)。
个性化信息推送服务的形式:
(1)定题信息推送服务
定题信息推送服务是根据用户向系统提交的需求信息,定期向用户推送符合用户个性化要求的检索结果的个性化信息推送服务。整个定题信息推送的工作流程如下:用户在向系统提供用户需求信息以及个性化信息后,用户接口Agent将查询发送给搜索引擎,然后将现有搜索引擎的搜索结果与个性化代理Agent进行交互,选择适合的信息服务系统并进行整合,去掉重复查询的结果,统一格式并重新排列,然后回传给定题信息推送系统。当定题服务系统需要进行新的信息推送时,把检索结果由用户接口代理Agent提交给定题信息推送系统并最终返回给用户(见图3)。
(2)热点信息提醒推送服务
热点信息提醒推送服务是数字图书馆根据用户提供的兴趣主题词,定期以电话、短信、邮件等形式向用 户推送符合用户需求的热点信息资源。其在数字图书馆的实现包括以下3个过程:一是定期生成新资源信息库,数字图书馆都有自己的信息资源数据库,应该在此基础上定期生成一个新信息资源数据库,并对用户关心的主题进行抓取。二是对每条新信息数据进行标注,热点信息提醒推送是把用户感兴趣的主题与新的信息资源进行匹配,并通过定制、驻留Agent使信息资源数据库与资源管理Agent实现一个交互运行的配送机制,然后将标注后匹配的信息通过信息过滤Agent进行过滤,为用户提供最准确的个性化信息。三是根据用户个人信息,建立用户信息库,及时将用户感兴趣的热点信息反馈给用户(见图4)。
(3)Web信息挖掘推送服务
Web信息挖掘推送服务是数字图书馆系统对用户在搜索、查询信息过程中产生的使用信息进行分析挖掘,以获取用户的意图,最后将系统中与用户搜索、查询相关的信息发送给用户。Web信息挖掘推送服务是在用户完全不知情的情况下,由系统主动分析用户行为,挖掘用户需求主题,最后根据挖掘出来的信息主动推送给用户。使用Web信息挖掘推送服务关键在于分析用户在Web搜索、查询时的使用信息,以发现用户的个性化需求。Web信息挖掘推送服务与其他推送服务有所区别,它完成的是即时推送,而不是延时推送。其原因在于它是系统主动向用户发送而不是用户向系统索取。因此,它的实现过程是:首先当用户在Web上搜索和查询信息时,智能Agent会主动地根据用户个性化模式的描述,从Web上检索出相应信息并监控信息源的变化,及时传送给Web结构挖掘部件。Web结构挖掘是在WWW的组织结构及引用和被引用间的链接关系中推理知识的过程,通过挖掘这些结构信息,可以更加精确地理解Web内容的相关性及质量。另外通过挖掘Web的结构信息,可以揭示许多蕴涵在Web内容之外的隐含的有用信息,并使其通过通讯结构与信息服务系统进行检索交互,最后将检索结果即时地传送给用户,完成整个Web信息挖掘推送服务(见图5)。
应用模型服务实现过程中应注意的问题
(1)服务整体构架功能模块的划分
在数字图书馆的构架上,更明确地划分其功能,使其每个功能结构都更具灵活性与互操作性。并且能够随着信息技术的不断发展而不断向模型增加新的功能与服务,使模型具有更加良好的可扩展性。
(2)服务的管理
在模型的实际运作中,为了达到预期目的,需要特别重视服务的管理:如更准确地表达资源的内容信息、提高信息的检索精度、处理更多的信息应用格式、协调好各个Agent问的任务协作、提高模型系统运作安全性等。
(3)服务的扩展
Agent技术很重视对服务的扩展,希望能把更多的服务方式整合进Agent服务模型。数字图书馆也应努力推动服务的发展,在建立好推送服务模型后,应随着服务的开展,通过对比不同用户需求、跟踪用户需求的规律,不断发掘用户的真正兴趣并及时改进用户模型。