论文部分内容阅读
摘 要 网络信息组织方法——大众分类法,能够弥补在网络信息时代智能化信息处理系统的不足,在网络信息组织工作中加入大众偶然的、非理性的活动,这让网络信息的传播与使用更具个性化,更符合用户需要。现在很多的博客网站、信息服务网站、高校等都会运用到这一技术,为广大用户提供更多具有参考价值的信息标签,方便大家找到更多符合自己要求的信息。当然这种方法也有其自身的优势与不足,但就长远的发展来看,还是值得借鉴的。在信息技术时代的背景下,大众分类法会逐步完善,会更好地服务于更多信息用户。
关键词 大众分类 网络信息组织 标签
中图分类号:G356.6 文献标识码:A
一、引言
随着社会化软件的发展,web2.0的出现让用户的角色发生了改变,信息用户不再仅仅是信息的使用者,更担当起信息创造者的角色。Web2.0的主要特征就是注重用户的交互作用,它的出现给用户带来了真正的个性化、去中心化和信息自主化。 网络中有大量由用户创建的各种信息内容如:创建的网页、图片、链接、音频、视频等。网络用户在不断创造等信息的同时,也需要按照自己的需求,以不同的方式有效地组织各类信息。鉴于此,完全出于个人喜好的标注方式,逐渐成为人们推崇的数字信息组织的主要方式。本文主要阐述大中分类这种web2.0的信息组织与检索方式。
二、大众分类法的概念
(一)大众分类的含义。
网络信息组织不能只依靠计算机自动化处理,也不能完全依靠网络大众偶然的、非理性的信息行为,还需要有网络个体之间的社会性协同机制。Web2.0给网络带来了更加强大的社会性,为网络信息自组织的形成提供了可能性。因此,网络信息自组织存在的条件可以归纳为三个,即:庞杂无序的信息,大量自由个体和自由信息行为以及社会协同机制。大众分类法则是web2.0出现以后,网络信息组织中重要的信息组织分类方式。
大众分类法,也叫公众分类法(Folksonomy)在2004年被Thomas Vander Wal首次使用,由“folk”和“taxonomy”组合而来,并称它为“由下而上的社会分类法”,是“社会创造的典型平面化命名空间”。他还认为Folksonomy包含3个重要组成部分:用户、被描述的资源(具有唯一的标示符,如URL或ISBN)和标识符或标签(用来描述信息资源)。 具體而言,Folksonomy就是网络信息用户对特定信息资源通过添加一个或多个标签来组织网络信息资源的过程, 并最终根据标签被使用的频次选用高频标签作为该类信息类名的方法。
(二)大众分类法的运行机制。
大众分类法便是由用户以协作的方式、为具有协作标注特点的共享信息空间建立的一个概念表述体系,如图1所示。
图1
在支持Folksonomy的网站中,用户可以对自己感兴趣的信息按照自己习惯和喜欢的方式加注标签——Tag,上图中不同的信息用户都可以加注标签,因此会形成标签1、标签2、标签3、标签n。目的是便于自己管理和与其他用户共享资源,由于用户的个性差异,对于同一信息不同的人可能使用相同或不同的标签进行描述,当描述这类信息的某一个或几个使用频次较高时,这里我们假定T3的使用频次c为最高,那么c就被确定为该类信息的类名。可以供其他的社会成员参考和使用。可见,Folksonomy的体系是一种基于用户提交关键字的分类,它反应的是整个社群的群体意识倾向和知识背景。
三、基于Folksonomy的信息组织应用实例——社会化书签Del.icio.us网站
Folksonomy最早应用与社会化书签,并迅速在博客、社区、分享类网站得到广泛应用。
Del.icio.us网站是国外第一个推出Tag标签功能的网站。其注册用户可以将感兴趣的网页保存在Del.icio.us网站上,并对每个网页增加描述性的标签,(如图2)其他有同样兴趣的用户可通过该标签找到此用户保存的网页。
四、大众分类法的特征
由以上Folksonomy的应用实例可以知道,大众分类法是在互联网时代下产生的一种比较新的分类方式,因此与传统分类方式相比,它具有一些特征。
(一)大众分类的优势。
与传统网络信息分类方法相比,大众分类最大的不同之处在于,它并不采用严格的分类标准,其分类全部由用户直接提交,分类的形成过程完全是自发的。大众分类的主要机制基于“开放性元数据标准”和“自然语言社群聚类”。
1、动态性和适应性。
用户一旦有阅读或创建内容和主题的需要,就可以立即创建标签,并保存下来,还可以随着需求的变化做出相应的修改;另外,用户也不需要遵守固定的语法结构,可以用自然语言向大众分类系统中添加词汇,使其能够随着动态的知识环境变化而迅速变化。如此一来,使用频率低的标签就会逐渐淡出人们的视野,而那些使用频率高的标签则会在标签云中以字号变大的形式反映出来。
2、信息的充分共享。
大众分类为用户提供了共享标签的功能,用户既可以自己建立一个标签来标引自己的信息文本,也可以使用别人提供或定义的标签进行标引。任何人对内容进行标注后,他人可立刻看到这些标签,也可以点击这些标签,进而看到更多使用这个标签的信息内容,或是与此相关的内容。用户既能够共享同一标签下的各种信息,也能共享同一信息下的各种标签。
3、多维度揭示信息资源。
大众分类是由自由的信息用户自发的对信息资源加注标签,不同的用户会采用不同的关键词来表达同一主题的信息资源。标签是在对文章进行概括和理解的基础上产生的,是对内容的个人理解上的私人标注,未必针对主题,可能是时间、内容或与文章主题无关的词汇,因此标签的设定要比关键词自由和方便,它可以从多个维度来揭示信息内容。 总之,大众分类法在一定程度上解决了专业人员无力应对庞大数字资源的标引和分类问题,能适应灵活多变的网络信息增长,满足网络信息用户的动态要求,并使得未來对网络信息的分类基于协同机制向着由网络信息发布者、管理者和使用者三方共同承担的方向发展。
(二)大众分类的局限法。
与传统的等级是分类法相比,大众分类目前也存在一定的局限性,具体表现在以下两点。
1、标签的模糊性。
标签的模糊性大众分类是一种基于标签语法层次的简单聚合分类,因此,同一标签可能映射出不同语义的资源,而系统却不能识别出各个语义的不同。这种缺陷在以缩略语作为标签时表现得更加明显,因为有的缩略语能代表几个含义。例如,在Del.icio.US网站中搜索SWIG标签,WIG既可以代表c++程序设计,也可以代表语义网兴趣组织。用户虽然可以找到与检索标签相关的记录,但这需要更多的时间和精力,如果记录的标题模棱两可或有其他标签与记录匹配时,检索过程会更加困难。
2、系统间的交互性很低。
系统间的交互性很低很多网络系统都具有标注资源和分享标签的能力,但是目前各个大众分类系统在语义表达和格式规范上并不一致。例如,有些系统区分字母的大小写,而另一些系统默认为大小写一样,这不仅阻碍了各个系统之间的信息交互和代理软件的自动化处理,同时也引发了一系列检索方面的问题。另外,受语言、文化背景等因素的影响,跨国界、跨文化的大众分类系统之间的交互性更低。
五、大众分类法的发展趋势
公众分类法自2005年初被提出以来受到广泛的关注,并在快速演化和升级,随着大众持续的需求和新的技术手段的加盟,它推陈出新的速度要快于目前元数据,成为目前海量网络资源组织的热点研究方向。
标签正在开始web环境下对信息“分类”的一种革命性的改变,这是一种广大民众参与信息分类的规模化作业。在用户充分参与的前提下,公众分类法可提高知识组织效率,成为网络资源组织和信息检索的重要辅助手段。
六、结语
目前,Folksonomy在对网络信息资源分类中表现出来的优势已经越来越突出。Folksonomy以其非常低的入门门槛,即刻的反馈和异步的交流,动态更新和个性化等特点给用户在标注网络资源方面带来极大便利的同时,伴随而来的其标签的随意性、标签垃圾等问题给用户信息检索带来了难题,尽管有些系统和网站使用推荐标签等标签控制措施,系统却有可能因为对资源内容缺乏全面准确的自动识别而未能推荐出准确的标签,甚至有可能因为推荐的标签不当进而影响到用户使用其他标签进行标注。所以如何在不增加用户使用成本的前提下,应用系统可以采用一定的技术手段,通过与其他信息组织方法相结合或借鉴其他信息组织方法的理念,对Folksonomy进行优化,以改善浏览和检索的效果,提升用户体验,是Folksonomy亟待解决的问题。
(作者单位:雷鸣,湖南工程学院图书馆阅览部;檀朝桂,湘潭大学研究生院)
参考文献:
[1]李镜镜.基于标签的网络Folksonomy研究[J].科技情报开发与经济,2009(31):71-74.
[2]李文举.公众分类法(Folksonomy)基础性理论研究[J].图书馆学研究,2008(9):78-80.
[3]罗昊.博客信息自组织模式研究[J].情报资料工作,2009(5):57-60.
[4]陈洁,司莉.社会分类法(Folksonomy)特点及其应用研究[J].图书与情报,2008(3):27-30.
[5]贺芳.社会分类法(Folksonomy)研究综述[J].网络财富,2009(12):210-212.
关键词 大众分类 网络信息组织 标签
中图分类号:G356.6 文献标识码:A
一、引言
随着社会化软件的发展,web2.0的出现让用户的角色发生了改变,信息用户不再仅仅是信息的使用者,更担当起信息创造者的角色。Web2.0的主要特征就是注重用户的交互作用,它的出现给用户带来了真正的个性化、去中心化和信息自主化。 网络中有大量由用户创建的各种信息内容如:创建的网页、图片、链接、音频、视频等。网络用户在不断创造等信息的同时,也需要按照自己的需求,以不同的方式有效地组织各类信息。鉴于此,完全出于个人喜好的标注方式,逐渐成为人们推崇的数字信息组织的主要方式。本文主要阐述大中分类这种web2.0的信息组织与检索方式。
二、大众分类法的概念
(一)大众分类的含义。
网络信息组织不能只依靠计算机自动化处理,也不能完全依靠网络大众偶然的、非理性的信息行为,还需要有网络个体之间的社会性协同机制。Web2.0给网络带来了更加强大的社会性,为网络信息自组织的形成提供了可能性。因此,网络信息自组织存在的条件可以归纳为三个,即:庞杂无序的信息,大量自由个体和自由信息行为以及社会协同机制。大众分类法则是web2.0出现以后,网络信息组织中重要的信息组织分类方式。
大众分类法,也叫公众分类法(Folksonomy)在2004年被Thomas Vander Wal首次使用,由“folk”和“taxonomy”组合而来,并称它为“由下而上的社会分类法”,是“社会创造的典型平面化命名空间”。他还认为Folksonomy包含3个重要组成部分:用户、被描述的资源(具有唯一的标示符,如URL或ISBN)和标识符或标签(用来描述信息资源)。 具體而言,Folksonomy就是网络信息用户对特定信息资源通过添加一个或多个标签来组织网络信息资源的过程, 并最终根据标签被使用的频次选用高频标签作为该类信息类名的方法。
(二)大众分类法的运行机制。
大众分类法便是由用户以协作的方式、为具有协作标注特点的共享信息空间建立的一个概念表述体系,如图1所示。
图1
在支持Folksonomy的网站中,用户可以对自己感兴趣的信息按照自己习惯和喜欢的方式加注标签——Tag,上图中不同的信息用户都可以加注标签,因此会形成标签1、标签2、标签3、标签n。目的是便于自己管理和与其他用户共享资源,由于用户的个性差异,对于同一信息不同的人可能使用相同或不同的标签进行描述,当描述这类信息的某一个或几个使用频次较高时,这里我们假定T3的使用频次c为最高,那么c就被确定为该类信息的类名。可以供其他的社会成员参考和使用。可见,Folksonomy的体系是一种基于用户提交关键字的分类,它反应的是整个社群的群体意识倾向和知识背景。
三、基于Folksonomy的信息组织应用实例——社会化书签Del.icio.us网站
Folksonomy最早应用与社会化书签,并迅速在博客、社区、分享类网站得到广泛应用。
Del.icio.us网站是国外第一个推出Tag标签功能的网站。其注册用户可以将感兴趣的网页保存在Del.icio.us网站上,并对每个网页增加描述性的标签,(如图2)其他有同样兴趣的用户可通过该标签找到此用户保存的网页。
四、大众分类法的特征
由以上Folksonomy的应用实例可以知道,大众分类法是在互联网时代下产生的一种比较新的分类方式,因此与传统分类方式相比,它具有一些特征。
(一)大众分类的优势。
与传统网络信息分类方法相比,大众分类最大的不同之处在于,它并不采用严格的分类标准,其分类全部由用户直接提交,分类的形成过程完全是自发的。大众分类的主要机制基于“开放性元数据标准”和“自然语言社群聚类”。
1、动态性和适应性。
用户一旦有阅读或创建内容和主题的需要,就可以立即创建标签,并保存下来,还可以随着需求的变化做出相应的修改;另外,用户也不需要遵守固定的语法结构,可以用自然语言向大众分类系统中添加词汇,使其能够随着动态的知识环境变化而迅速变化。如此一来,使用频率低的标签就会逐渐淡出人们的视野,而那些使用频率高的标签则会在标签云中以字号变大的形式反映出来。
2、信息的充分共享。
大众分类为用户提供了共享标签的功能,用户既可以自己建立一个标签来标引自己的信息文本,也可以使用别人提供或定义的标签进行标引。任何人对内容进行标注后,他人可立刻看到这些标签,也可以点击这些标签,进而看到更多使用这个标签的信息内容,或是与此相关的内容。用户既能够共享同一标签下的各种信息,也能共享同一信息下的各种标签。
3、多维度揭示信息资源。
大众分类是由自由的信息用户自发的对信息资源加注标签,不同的用户会采用不同的关键词来表达同一主题的信息资源。标签是在对文章进行概括和理解的基础上产生的,是对内容的个人理解上的私人标注,未必针对主题,可能是时间、内容或与文章主题无关的词汇,因此标签的设定要比关键词自由和方便,它可以从多个维度来揭示信息内容。 总之,大众分类法在一定程度上解决了专业人员无力应对庞大数字资源的标引和分类问题,能适应灵活多变的网络信息增长,满足网络信息用户的动态要求,并使得未來对网络信息的分类基于协同机制向着由网络信息发布者、管理者和使用者三方共同承担的方向发展。
(二)大众分类的局限法。
与传统的等级是分类法相比,大众分类目前也存在一定的局限性,具体表现在以下两点。
1、标签的模糊性。
标签的模糊性大众分类是一种基于标签语法层次的简单聚合分类,因此,同一标签可能映射出不同语义的资源,而系统却不能识别出各个语义的不同。这种缺陷在以缩略语作为标签时表现得更加明显,因为有的缩略语能代表几个含义。例如,在Del.icio.US网站中搜索SWIG标签,WIG既可以代表c++程序设计,也可以代表语义网兴趣组织。用户虽然可以找到与检索标签相关的记录,但这需要更多的时间和精力,如果记录的标题模棱两可或有其他标签与记录匹配时,检索过程会更加困难。
2、系统间的交互性很低。
系统间的交互性很低很多网络系统都具有标注资源和分享标签的能力,但是目前各个大众分类系统在语义表达和格式规范上并不一致。例如,有些系统区分字母的大小写,而另一些系统默认为大小写一样,这不仅阻碍了各个系统之间的信息交互和代理软件的自动化处理,同时也引发了一系列检索方面的问题。另外,受语言、文化背景等因素的影响,跨国界、跨文化的大众分类系统之间的交互性更低。
五、大众分类法的发展趋势
公众分类法自2005年初被提出以来受到广泛的关注,并在快速演化和升级,随着大众持续的需求和新的技术手段的加盟,它推陈出新的速度要快于目前元数据,成为目前海量网络资源组织的热点研究方向。
标签正在开始web环境下对信息“分类”的一种革命性的改变,这是一种广大民众参与信息分类的规模化作业。在用户充分参与的前提下,公众分类法可提高知识组织效率,成为网络资源组织和信息检索的重要辅助手段。
六、结语
目前,Folksonomy在对网络信息资源分类中表现出来的优势已经越来越突出。Folksonomy以其非常低的入门门槛,即刻的反馈和异步的交流,动态更新和个性化等特点给用户在标注网络资源方面带来极大便利的同时,伴随而来的其标签的随意性、标签垃圾等问题给用户信息检索带来了难题,尽管有些系统和网站使用推荐标签等标签控制措施,系统却有可能因为对资源内容缺乏全面准确的自动识别而未能推荐出准确的标签,甚至有可能因为推荐的标签不当进而影响到用户使用其他标签进行标注。所以如何在不增加用户使用成本的前提下,应用系统可以采用一定的技术手段,通过与其他信息组织方法相结合或借鉴其他信息组织方法的理念,对Folksonomy进行优化,以改善浏览和检索的效果,提升用户体验,是Folksonomy亟待解决的问题。
(作者单位:雷鸣,湖南工程学院图书馆阅览部;檀朝桂,湘潭大学研究生院)
参考文献:
[1]李镜镜.基于标签的网络Folksonomy研究[J].科技情报开发与经济,2009(31):71-74.
[2]李文举.公众分类法(Folksonomy)基础性理论研究[J].图书馆学研究,2008(9):78-80.
[3]罗昊.博客信息自组织模式研究[J].情报资料工作,2009(5):57-60.
[4]陈洁,司莉.社会分类法(Folksonomy)特点及其应用研究[J].图书与情报,2008(3):27-30.
[5]贺芳.社会分类法(Folksonomy)研究综述[J].网络财富,2009(12):210-212.