论文部分内容阅读
(扬州大学,江苏扬州 225009)
[摘 要]个性化服务是数字图书馆信息服务的重要特点,本文从数字图书馆的发展阐述个性化信息服务的必然性,并研究个性化信息服务的主要形式和主要模式。
[关键词]个性化服务;数字图书馆;服务模式;信息服务
近年来,随着数字化、网络化的高速发展,以网络为依托的数字图书馆向用户提供了一个开放、分布式的海量信息空间。传统图书馆的单一信息服务模式很难满足数字图书馆时代用户对信息的多样化、个性化需求。因此,迫切需要图书馆能提供新型的、能够根据用户的特点自动组织和调整信息的服务模式,即个性化信息服务模式。
1 个性化信息服务的含义
个性化信息服务是指根据用户提出的明确要求提供信息服务,或通过对用户个性、使用习惯的分析而主动地满足用户的个体信息需求的服务。个性化信息服务与传统图书馆定题服务、重点读者服务不同,它是根据信息用户的兴趣、特点、研究课题或研究方向,向用户提供满足其个性化需求的一种信息服务。它不仅能对用户提出的要求提供最适合的信息服务,还能依据用户个性特征,主动收集用户可能感兴趣的信息,甚至预测用户的个性发展,提前收集相应的信息,最后再以个性化方式显示给用户。它是图书馆信息服务向纵深发展的方向和重要内容。
2 数字图书馆的发展和信息服务个性化转变
数字图书馆在建设的各个阶段中,其研究内容和信息服务方式是不相同的。
2.1 资源数字化阶段
这一阶段的建设内容有数字化对象的选择、数字文献格式标准体系、描述和管理具体数字文献的元数据、数字资源库组织、检索与呈现方法、初步的知识产权管理、数字化工作流程等。目前,许多图书馆、档案馆乃至博物馆的数字化馆藏系统基本属于这一范围。这个阶段的信息服务主要是提供基于某一特定资源的数字信息服务,它是数字信息服务的基础。
2.2 信息集成阶段
这一阶段的主要研究包括分布式系统结构、系统互操作、数字对象与数字对象唯一标识、元数据互操作、数字资源开放链接、分布式开放式使用管理、网络化资源建设和资源组织、以及基于内容和集成的检索技术。这时的信息服务致力于有效利用数字信息环境中各种分布、多样化且往往是异构的数字信息资源,致力于在支持分布的数字信息空间互操作的基础上实施这些系统间的无缝交换和服务集成,并由此形成一种逻辑上的集成信息服务机制。
2.3 用户信息活动阶段
这一阶段数字图书馆的研究范畴涉及数字对象与分布式对象代理技术、动态文献和动态文献集技术、知识组织系统技术、信息协作处理机制、个性化机制、用户信息系统和信息处理流程中数字化信息资源与服务的嵌入与定制机制等。本阶段以用户信息活动作为信息服务的出发点和立足点,信息服务基于用户信息活动而不是信息资源来开展,它为用户提供了一个智能化、个性化的信息服务。
由此可见,随着数字图书馆的不断发展变化,信息服务机制从单一特定数字信息资源系统的服务发展到基于分布数字信息资源系统的集成服务,最后再发展到个性化信息服务。
3 个性化信息服务的主要形式
3.1 个性化推送服务
个性化推送服务即个性化定制服务,指用户按照自己的目的和需求,设定信息的资源类型、表现形式,选取特定的系统服务功能等。其方式大致有两种:一种是提供定制的Web页面、信息频道或信息栏目,实施查询代理服务;一种是基于电子邮件的信息推送,根据用户的定制提供相应的信息栏目,定期或不定期地发送到用户电子信箱。目前应用于数字图书馆的个性化推送服务及推送系统有:国外的如美国康奈尔大学MyLibrary系统,包括Mylinks、Myupdates和My—Contents3项服务内容;国内的如浙江大学图书馆开发的“我的图书馆”系统,包括书签功能、定制图书馆数字资源、最新信息通告、搜索引擎链接、定制Web页面样式等功能。
3.2 个性化推荐服务
个性化推荐服务是一种比较深层次的、主动性和个性化较强的服务方式。它不仅能根据用户的特性提供具有针对性的信息,还能通过对用户专业特征、研究兴趣的智能分析而主动向用户推荐其可能需要的信息。个性化推荐的原理是根据用户模型寻找与用户模型匹配的信息,个性化推荐的实质是一种“信息找人”的服务模式,可以减少用户寻找感兴趣信息的时间,提高用户浏览的效率。国外比较典型的涉及数字图书馆个性化推荐服务的研究项目有:斯坦福大学的LIRA、麻省理工学院的Letizia、加州大学的Syskill&Webert和News—Dude等;国内正在进行这方面研究的有清华大学的Open Bookmark、中国人民大学研发的“数字图书馆个性化推荐系统”等。
3.3 个性化信息检索
个性化检索是指根据用户的需求特点进行检索,并返回与用户需求相关的检索结果,其基本思想就是满足特定用户的特定需求,是一种体现个性化特征、满足个性化需求、培养个性化趋势的信息检索方法。随着数字图书馆中信息量的指数级增长,个性化信息检索越来越受到重视,成为当今数字图书馆信息服务向纵深发展的一个重要内容。
目前,个性化信息检索发展尚未成熟,远没有达到理想的水平。其主要研究成果有:德国NEC研究院提出的个性化元搜索引擎原型系统Inquirus,该元搜索引擎可以根据用户输入的偏好优化查询关键词,并对搜索引擎返回的结果进行排序。在国内,主要是南京大学推出的个性化信息检索智能体DOLTRI—Agent和浙江大学提出的个性化信息检索系统NetLooker等。
3.4 个性化知识决策服务
个性化知识决策服务是利用数据挖掘、知识发现等技术,对有用的信息内容再进行深层次的分析与挖掘,以向用户提供能够用于决策支持、智能查询、科学研究、解决问题的规则和模式。目前,这方面研究仅限于企业知识管理与服务等领域,有关技术还处于探讨与完善阶段。但应该看到,将数据挖掘和知识发现的原理与技术应用于数字图书馆个性化信息推荐系统中,实现数字资源的深层挖掘并提供有效的知识服务,是数字图书馆个性化信息服务的发展趋势。
4 个性化信息服务的关键技术
数字图书馆个性化服务的实现需要综合多种技术,不同的服务形式需要相应的支撑技术。在个性化服务的相关技术中,用户建模技术和个性化推荐技术是研究较多、最为关键的两项技术。
4.1 用户建模 现有的个性化服务系统个数繁多,服务形式也不尽相同,但通过对各种不同的个性化服务系统的分析发现,不同形式的个性化服务系统都可以抽象成一个共同的体系结构,即首先收集用户信息,而后根据用户信息对用户进行建模,进而在构建的用户模型的基础上提供个性化的服务策略和服务内容。因此,用户模型是个性化服务的基础和核心。
个性化信息服务系统是以计算机网络为依托的,服务于系统的用户模型,可计算性是它的基本特征。也就是说,个性化服务系统中的用户模型不是对用户个体的一般性描述,而是一种具有特定数据结构和形式化的用户描述。相应的,用户建模是指从有关用户兴趣和行为的信息(如浏览内容、浏览过程、输入检索关键词等)中归纳出可计算的用户模型的过程。建立模型的方法主要有用户手工定制建模、示例用户建模以及自动用户建模。
4.2 个性化推荐技术
根据实现途径,个性化推荐技术可以分为基于内容的推荐、合作推荐和混合推荐。
(1)基于内容的推荐是指通过比较资源与用户模型的相似程度向用户推荐信息的方式,是目前个性化推荐的主流,典型系统包括斯坦福大学的LIRA、麻省理工学院的Letizia、加州大学的Syskill&Webert等。它较多地应用于文本领域,如浏览页面的推荐、新闻组中的新闻推荐等。基于内容的推荐的缺点是不能为用户发现新的感兴趣的信息,只能推荐与用户已有兴趣相似的信息。
(2)合作推荐与基于内容的推荐不同,合作推荐并不比较资源与用户模型的相似性,而是通过比较用户间的相似性来推荐信息。具有相近兴趣的用户被视为一个用户类。当用户对某信息感兴趣时,该信息就可以推荐给同类的其他用户。其优点是可以发现用户可能感兴趣的新信息,而不局限于用户已经感兴趣的信息。其缺点是如果一个信息没有被同类用户群中的任何用户浏览过,那它就不可能被推荐给该类中的其他用户。
(3)混合推荐是指既通过比较资源与各个用户模型的相似度进行基于内容的推荐,又通过相近兴趣的用户群进行合作推荐的一种推荐方式。清华大学推出了一个混合推荐系统——Open Bookmark,它通过集中管理用户群的Bookmark来实现混合推荐。由于混合推荐可以发挥两种推荐方法的优点,抵销两种推荐方法的缺点,因而具有更好的推荐性能。
[摘 要]个性化服务是数字图书馆信息服务的重要特点,本文从数字图书馆的发展阐述个性化信息服务的必然性,并研究个性化信息服务的主要形式和主要模式。
[关键词]个性化服务;数字图书馆;服务模式;信息服务
近年来,随着数字化、网络化的高速发展,以网络为依托的数字图书馆向用户提供了一个开放、分布式的海量信息空间。传统图书馆的单一信息服务模式很难满足数字图书馆时代用户对信息的多样化、个性化需求。因此,迫切需要图书馆能提供新型的、能够根据用户的特点自动组织和调整信息的服务模式,即个性化信息服务模式。
1 个性化信息服务的含义
个性化信息服务是指根据用户提出的明确要求提供信息服务,或通过对用户个性、使用习惯的分析而主动地满足用户的个体信息需求的服务。个性化信息服务与传统图书馆定题服务、重点读者服务不同,它是根据信息用户的兴趣、特点、研究课题或研究方向,向用户提供满足其个性化需求的一种信息服务。它不仅能对用户提出的要求提供最适合的信息服务,还能依据用户个性特征,主动收集用户可能感兴趣的信息,甚至预测用户的个性发展,提前收集相应的信息,最后再以个性化方式显示给用户。它是图书馆信息服务向纵深发展的方向和重要内容。
2 数字图书馆的发展和信息服务个性化转变
数字图书馆在建设的各个阶段中,其研究内容和信息服务方式是不相同的。
2.1 资源数字化阶段
这一阶段的建设内容有数字化对象的选择、数字文献格式标准体系、描述和管理具体数字文献的元数据、数字资源库组织、检索与呈现方法、初步的知识产权管理、数字化工作流程等。目前,许多图书馆、档案馆乃至博物馆的数字化馆藏系统基本属于这一范围。这个阶段的信息服务主要是提供基于某一特定资源的数字信息服务,它是数字信息服务的基础。
2.2 信息集成阶段
这一阶段的主要研究包括分布式系统结构、系统互操作、数字对象与数字对象唯一标识、元数据互操作、数字资源开放链接、分布式开放式使用管理、网络化资源建设和资源组织、以及基于内容和集成的检索技术。这时的信息服务致力于有效利用数字信息环境中各种分布、多样化且往往是异构的数字信息资源,致力于在支持分布的数字信息空间互操作的基础上实施这些系统间的无缝交换和服务集成,并由此形成一种逻辑上的集成信息服务机制。
2.3 用户信息活动阶段
这一阶段数字图书馆的研究范畴涉及数字对象与分布式对象代理技术、动态文献和动态文献集技术、知识组织系统技术、信息协作处理机制、个性化机制、用户信息系统和信息处理流程中数字化信息资源与服务的嵌入与定制机制等。本阶段以用户信息活动作为信息服务的出发点和立足点,信息服务基于用户信息活动而不是信息资源来开展,它为用户提供了一个智能化、个性化的信息服务。
由此可见,随着数字图书馆的不断发展变化,信息服务机制从单一特定数字信息资源系统的服务发展到基于分布数字信息资源系统的集成服务,最后再发展到个性化信息服务。
3 个性化信息服务的主要形式
3.1 个性化推送服务
个性化推送服务即个性化定制服务,指用户按照自己的目的和需求,设定信息的资源类型、表现形式,选取特定的系统服务功能等。其方式大致有两种:一种是提供定制的Web页面、信息频道或信息栏目,实施查询代理服务;一种是基于电子邮件的信息推送,根据用户的定制提供相应的信息栏目,定期或不定期地发送到用户电子信箱。目前应用于数字图书馆的个性化推送服务及推送系统有:国外的如美国康奈尔大学MyLibrary系统,包括Mylinks、Myupdates和My—Contents3项服务内容;国内的如浙江大学图书馆开发的“我的图书馆”系统,包括书签功能、定制图书馆数字资源、最新信息通告、搜索引擎链接、定制Web页面样式等功能。
3.2 个性化推荐服务
个性化推荐服务是一种比较深层次的、主动性和个性化较强的服务方式。它不仅能根据用户的特性提供具有针对性的信息,还能通过对用户专业特征、研究兴趣的智能分析而主动向用户推荐其可能需要的信息。个性化推荐的原理是根据用户模型寻找与用户模型匹配的信息,个性化推荐的实质是一种“信息找人”的服务模式,可以减少用户寻找感兴趣信息的时间,提高用户浏览的效率。国外比较典型的涉及数字图书馆个性化推荐服务的研究项目有:斯坦福大学的LIRA、麻省理工学院的Letizia、加州大学的Syskill&Webert和News—Dude等;国内正在进行这方面研究的有清华大学的Open Bookmark、中国人民大学研发的“数字图书馆个性化推荐系统”等。
3.3 个性化信息检索
个性化检索是指根据用户的需求特点进行检索,并返回与用户需求相关的检索结果,其基本思想就是满足特定用户的特定需求,是一种体现个性化特征、满足个性化需求、培养个性化趋势的信息检索方法。随着数字图书馆中信息量的指数级增长,个性化信息检索越来越受到重视,成为当今数字图书馆信息服务向纵深发展的一个重要内容。
目前,个性化信息检索发展尚未成熟,远没有达到理想的水平。其主要研究成果有:德国NEC研究院提出的个性化元搜索引擎原型系统Inquirus,该元搜索引擎可以根据用户输入的偏好优化查询关键词,并对搜索引擎返回的结果进行排序。在国内,主要是南京大学推出的个性化信息检索智能体DOLTRI—Agent和浙江大学提出的个性化信息检索系统NetLooker等。
3.4 个性化知识决策服务
个性化知识决策服务是利用数据挖掘、知识发现等技术,对有用的信息内容再进行深层次的分析与挖掘,以向用户提供能够用于决策支持、智能查询、科学研究、解决问题的规则和模式。目前,这方面研究仅限于企业知识管理与服务等领域,有关技术还处于探讨与完善阶段。但应该看到,将数据挖掘和知识发现的原理与技术应用于数字图书馆个性化信息推荐系统中,实现数字资源的深层挖掘并提供有效的知识服务,是数字图书馆个性化信息服务的发展趋势。
4 个性化信息服务的关键技术
数字图书馆个性化服务的实现需要综合多种技术,不同的服务形式需要相应的支撑技术。在个性化服务的相关技术中,用户建模技术和个性化推荐技术是研究较多、最为关键的两项技术。
4.1 用户建模 现有的个性化服务系统个数繁多,服务形式也不尽相同,但通过对各种不同的个性化服务系统的分析发现,不同形式的个性化服务系统都可以抽象成一个共同的体系结构,即首先收集用户信息,而后根据用户信息对用户进行建模,进而在构建的用户模型的基础上提供个性化的服务策略和服务内容。因此,用户模型是个性化服务的基础和核心。
个性化信息服务系统是以计算机网络为依托的,服务于系统的用户模型,可计算性是它的基本特征。也就是说,个性化服务系统中的用户模型不是对用户个体的一般性描述,而是一种具有特定数据结构和形式化的用户描述。相应的,用户建模是指从有关用户兴趣和行为的信息(如浏览内容、浏览过程、输入检索关键词等)中归纳出可计算的用户模型的过程。建立模型的方法主要有用户手工定制建模、示例用户建模以及自动用户建模。
4.2 个性化推荐技术
根据实现途径,个性化推荐技术可以分为基于内容的推荐、合作推荐和混合推荐。
(1)基于内容的推荐是指通过比较资源与用户模型的相似程度向用户推荐信息的方式,是目前个性化推荐的主流,典型系统包括斯坦福大学的LIRA、麻省理工学院的Letizia、加州大学的Syskill&Webert等。它较多地应用于文本领域,如浏览页面的推荐、新闻组中的新闻推荐等。基于内容的推荐的缺点是不能为用户发现新的感兴趣的信息,只能推荐与用户已有兴趣相似的信息。
(2)合作推荐与基于内容的推荐不同,合作推荐并不比较资源与用户模型的相似性,而是通过比较用户间的相似性来推荐信息。具有相近兴趣的用户被视为一个用户类。当用户对某信息感兴趣时,该信息就可以推荐给同类的其他用户。其优点是可以发现用户可能感兴趣的新信息,而不局限于用户已经感兴趣的信息。其缺点是如果一个信息没有被同类用户群中的任何用户浏览过,那它就不可能被推荐给该类中的其他用户。
(3)混合推荐是指既通过比较资源与各个用户模型的相似度进行基于内容的推荐,又通过相近兴趣的用户群进行合作推荐的一种推荐方式。清华大学推出了一个混合推荐系统——Open Bookmark,它通过集中管理用户群的Bookmark来实现混合推荐。由于混合推荐可以发挥两种推荐方法的优点,抵销两种推荐方法的缺点,因而具有更好的推荐性能。