大数据时代下的信息组织与知识组织

来源 :看世界·学术下半月 | 被引量 : 0次 | 上传用户:zhouxiaorong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:大数据背景下,信息组织和知识组织在其研究方法和发展趋势上发生巨大的变化,如何利用好海量复杂的数据成为当下信息组织与知识组织研究的热点。本文通过对信息组织和知识组织的相关内容梳理,结合当前大数据时代特点,分析信息组织和知识组织结合大数据技术所能发挥的新作用,并指出当前信息组织和知识组织所面临的困难与挑战,为现代信息工作者提供一些研究思路和理論支撑。
  关键词:大数据;信息组织;知识组织;知识网络;知识组织系统
  一、相关概念
  (一)信息组织
  人们可以通过各种各样的渠道接触到信息,但这些信息往往是冗杂的、无序的,需要经过加工整理才能被人们所利用,这就是信息组织的任务。信息组织是利用一定的科学方法,通过信息外在特征和内容特征将无序状态的信息转换成有序状态的信息[1]。信息组织一种普遍的社会行为,是信息收集工作下一步的重要工作,为后续信息研究与应用奠定了基础。
  (二)知识组织
  相当于信息组织而言,知识组织更偏重知识挖掘的过程[2]。知识组织最早由英国图书馆学家布利斯在1929年提出,他在《图书馆的知识组织》《知识组织和科学系统》两本著作中从图书馆文献分类的角度描述了知识组织的思想。目前对知识组织的定义尚没有达到统一,图书情报界对知识组织的定义主要有以下几种:①知识组织是指对事物的本质及事物间的关系进行揭示的有序结构,即知识的序化。②知识组织是指对知识客体所进行的诸如整理、加工、揭示、控制等一系列组织化过程及其方法。③知识组织是对知识进行整序和提供,既处理大量的现有知识,又能相对降低存储知识的物理载体的盲目增长以免知识过于分散化。
  二、信息组织与知识组织在大数据环境中的作用
  (一)大数据环境特点
  大数据并非新技术,也不算是新产品,而是新的现象。在大数据时代,信息的规模越来越大,要处理的数据量急剧上升。对于大数据环境特点,不同的研究组织有不同的解读,但一个普遍的认知是:大数据环境具有4V特征,即容量大(Volume)、速度快(Velocity)、种类多(Variety)、价值密度低(Value)[3][4]。容量大指的是大数据环境具有庞大的数据量;速度快可以理解为处理用户数据迅速,延迟小,实时性高;种类多即大数据环境下数据来源广,数据种类与格式已经不局限于结构化数据范畴,还包含半结构化和非结构化数据;由于大数据环境下数据繁杂,包含的对用户真正有价值的数据并不多,因此数据价值密度低是目前大数据环境下最显著的特点。
  (二)信息组织在大数据环境中的作用
  由于大数据环境下的信息量呈指数型增长,人们对获取有价值信息的实时性和准确性要求更高,一方面人们利用智能的终端设备可以获取到以往难以获取的信息,另一方面也存在信息贫乏或者难以获得的现象,形成信息爆炸和信息孤岛并存的局面,因此信息组织工作在这种局面下显得尤为重要。马费成[5] 提到信息组织至少应该在数据分类、描述、约减、评估、交换共享等方面发挥重要作用。
  分类是信息组织的基础性方法。最初用于图书馆的资源分类,例如中国图书馆分类法使得读者得以迅速有效地查阅图书馆相关资源。在大数据环境下,对网络信息的分类应当更加发挥更重要的作用。网络信息分类的对象是数以百万计的网站或是搜索引擎,这些对象几乎包含了人类所能认知的一切知识,由于数据量庞大,因此应当根据数据的序化程度进行分级,序化程度较低的数据,分类的重点在对其描述揭示;序化程度较高的数据,分类重点在于整合和互联。资源的描述通过对信息资源进行特征分析来描述资源的主要内容,但由于网络信息具有极高的自由度和随意性,且信息的来源往往没有真实性保证,因此对网络信息资源的描述方法研究十分必要。目前对网络信息的描述方法主要有MARC、DC、MODS三种[6]。对大数据资源的约减工作与记录描述一样,都是将一次信息转化为二次信息,使得复杂无序的信息约减为简单的替代记录。信息组织还可以通过元数据对大数据资源进行评估与管理,保存信息资源的使用情况,研究人员可以利用这些资源对信息统计分析,对其使用价值和重要性进行判定,并将情况反馈给资源管理者,使其更好地服务用户。此外,信息组织促进大数据资源的交换共享,各个本体都可看作信息系统,各个信息系统之间存在交换与共享,进而创造更大的价值,如我国建设数据统一交换平台,来促进大数据产业发展。
  (三)知识组织在大数据环境中的作用
  传统的社会发展方式依靠劳动资源和资本资源,换句话说谁拥有大量劳动力和生产机器,谁就得以迅速发展。然而,当前的社会是知识经济时代[7],知识作为一种竞争资源可以起到决定性作用,对知识的有效管理以及开发利用已经成为大数据环境下推动产业发展和技术革新的基础性工作[8]。由于大数据环境下知识呈现无序状态,因此对知识的有效管理以促进知识有效利用和传播是知识组织在大数据时代的根本目标。笔者通过研究近十年在中国知网收录的知识组织相关文献,总结出知识组织在当前大数据环境下主要通过构建知识组织系统和建立知识网络来发挥作用。
  1.知识组织系统
  知识组织系统可以理解为对人类知识结构进行表达和有组织地阐述的各种语义工具的统称。作为一种可以有效组织管理知识的框架体系,知识组织系统不仅能够为研究人员提供序化知识,还能够实现对知识的有序化检索与导航,使得知识可以被有效检索和利用。中山大学曹树金教授[9]曾提到知识组织在大数据时代有两个根本任务,其一是从各领域实际需求和实践中出发,概括出一般的、可跨领域的应用知识理论方法;其二是结合用户情景对更细粒度信息单元进行揭示与关联。在此基础上,笔者认为知识组织系统在大数据环境下可以在信息检索和术语服务两个层面发挥作用。知识组织系统可利用叙词表中的概念语义关系为网络信息检索提高其性能,或利用分类聚类体系形成一个信息浏览框架,提供信息的分类导航服务。例如Google学术、知网等学术检索网站;BBS、豆瓣网等主题分类网站。术语服务是知识组织系统网络化的一个有效方法,其主要作用是展示和应用各种类型的知识组织资源,在主题标引、分类以及机器翻译领域发挥着重要作用。   2.知识网络
  知识网络是涉及科学知识生产和传播过程中的相关机构或活动,也可以理解为它是集不同知识要素的共性特征的集合。基于知识网络的知识组织对企业或组织内部的知识创新、实现多模网络知识管理和研究知识扩散路径与规律具有重要作用。基于知识网络的知识图谱构建对精准获取用户需求、规范整合信息资源与提高知识库精准性与智能性提供了有效解决途径。特别是人工智能时代,由于知识图谱逻辑推理性强,可解释性高,具有透明共享和可视化的优势,基于知识图谱的知识组织会有广阔的研究前景。在可预见的未来,知识网络对解决大数据时代信息爆炸危机和提高情报研究效率方面将会提供非常有效的方法。
  三、大数据环境下信息组织与知识组织面临的挑战
  (一)信息组织面临的挑战
  (1)信息组织的作用极易被忽视
  在大数据的应用场景中,大量的数据经过挖掘后可以直接生成供信息工作者使用的情报,并没有经过信息组织过程。同时由于在大数据时代,信息强调实时性,大量的数据还没有经过存储和组织就已经失去了效用。因此,信息组织的作用在大数据环境下显性化,信息组织从数据获取到生产决策方案的过程中的作用被隐藏或忽略。
  (2)信息描述标准的建立存在困难
  大数据环境下,数据和数据载体变得丰富多样化。越来越多的数据来源于科学实验、基因组测试、社交媒体,这些数据表现形式各不相同,由于信息组织需要有上层的统一的描述标准和规范来保证数据组织和描述达到一致,且保证不同标准之间具有关联性,所以建立跨领域和跨数据类型的统一描述标准存在较大困难。
  (3)传统信息组织工具难以适应当前需求
  传统的信息组织工具动态性较差,以往采用的分类法、叙词表或本体这些工具一经建立,再想改动就极其复杂,且更新很慢。大数据环境下的数据量呈指数增长,其数据更新速度极快,因此传统的信息组织工具面临着极大的挑战。
  (二)知识组织面临的挑战
  (1)数据的非结构化
  大数据环境下加速了知识生产建设,知识的多元化进一步促使网络数据库中存在大量的半结构化和非结构化数据。非结构化数据如自然语言文本、多媒體数据等等,由于结构和内涵上的语义不明确,在进行语义分析时往往具有更大的不确定性,这种不确定性的表达在知识组织流程中会影响到知识表示,不利于用户发现和吸收知识。可见传统的关系型数据库和联机检索机制都已经无法胜任,这就对现有的组织方式和检索语言提出了更高的要求,需要创新知识组织方法与技术,高度重视专家团队的参与来提供足够的技术支持进行高质量、高价值的知识交流,对检索语言进行技术改变和应用模式的探索,从而提升知识运动的效率。
  (2)知识用户需求多样性。
  知识组织的最终目的是为提供适度且具有定向性的用户知识服务。知识用户在获取知识的方式和内容是多层次、多角度的,呈现出多样性的特点。长尾理论告诉我们应该重视用户需求曲线中的尾巴部分,要尽可能地实现资源与需求的最大化匹配,实现知识组织效果的最大化。知识用户需求的多样性对知识组织准确性和高效性工作提出了挑战,大数据环境下带来的是传统媒体的新变革和新升级,要求必须改变传统的规范化的知识组织方式,运用大数据进行信息挖掘和个性化知识服务,对用户搜索内容进行自动统计分析,生成偏好设定,有针对性的为每位用户推送与其专业需求相关的知识,从被动服务向个性化主动服务演化,真正地提高知识获取效率。
  (3)知识的碎片化。
  与传统的单一数据库不同,在大数据环境下的知识数据种类繁多,其知识服务主要是平台服务,而信息用户无论是使用微博还是微信等网络平台发布文字、图片、视频等,都呈现出了知识碎片化和关联化的特点,这就对跨平台的知识整合提出了更高的要求。因此,如何使用知识组织方法进行数据融合,利用互联网搭建知识组织平台来揭示显性知识和隐性知识,挖掘知识关联是目前大数据环境下所面临的一大挑战。通过整合与集成知识组织碎片化的问题,来实现知识跨平台组织、共建共享,提高用户知识发现和知识吸收。
  四、结语
  在大数据环境下,互联网的飞速发展推进着信息组织和知识组织的升级与变革,数据在各个层面都加大了开放程度。当今社会对信息知识的灵敏性和精确性的要求越来越高,数据信息知识的互通互联已成为一大趋势,信息组织和知识组织持续发挥着其巨大的作用。随着相关研究的不断深入,无论是制定组织标准还是进行知识集成构建,信息组织和知识组织在大数据环境下都将面临巨大的挑战,如何结合传统的组织方法和技术手段,更加深入系统地研究信息组织和知识组织的组织管理和应用的方法和技术,还有待进一步探索。
  参考文献:
  [1]黄如花.国内外信息组织研究述评[J].中国图书馆学报,2002(01):63-66.
  [2]蒋永福.论知识组织[J].图书情报工作,2000(06):5-10.
  [3]严霄凤,张德馨.大数据研究[J].计算机技术与发展,2013,23(4):168-172.
  [4]陈如明.大数据时代的挑战、价值与应对策略[J].移动通信,2012(17):14-15.
其他文献
摘要:近些年来真人童话电影被不断搬上大荧幕,越来越多的经典故事被改编再改编的上演。然而在电影中始终是好人形象出现的公主们却得不到观众的一味观看,性格迥异气场强大的“毒皇后”们却越发受到观众的喜爱,本文从电影心理学的角度试分析这类童话电影中的继母形象。  关键词:童话电影;继母;毒皇后;情结  随着科技技术的创新和不断发展,越来越多的真人童话电影被搬上大荧幕,观众对于经典的怀旧之情让童话电影的票房水
期刊
摘要:在2019年6月召开的新农科建设安吉研讨会上,提出新农科的建设要服务好脱贫攻坚、乡村振兴、生态文明和美丽中国建设,创新高等农林教育模式,培养创新型、复合应用型、实用技能型农林人才。这是基于自乡村振兴战略提出以来,人才成为产业发展转型的关键,迫切需要提升涉农高校服务“三农”的能力。其中,农产品流通业作为农业转型升级中的重要一环,农产品流通人才的培养尤为关键,作为培养主体的高职院校如何培养高质量
期刊
摘要:范泉先生是一位在中国现代编辑出版界、文学界乃至学术界贡献颇多的著名编辑家,他将一生献给了祖国的编辑出版事业,直至84岁高龄依然在做出版编辑工作。范泉前后七十多年的编辑生涯、诸多的编辑实践活动以及他独特的编辑思想在中国编辑史上理应占有一席之地。深入、系统地研究他的编辑实践活动和编辑思想,对丰富和完善我国编辑出版史研究以及做好当代编辑出版工作有着重要借鉴意义。  关键词:范泉;编辑理念;现实意义
期刊
摘要:美剧《查莉成长日记(Good Luck Charlie)》与国产剧《家有儿女》反映了中美家庭职业观教育的差异:受应试传统和职业偏见的影响,大部分中式家庭教育孩子以利益驱动职业选择,重文凭而轻实践,扭曲或剥夺孩子的兴趣爱好;而大多美式家庭教育孩子根据个性选择职业,鼓励孩子培养兴趣,倡导学习实用技能。据此,针对中国家庭职业观教育的现状,提出“父母职业观调整”、“打开体验”、“保护兴趣”和“实用教
期刊
摘要:吉林省外宣形象作为传播吉林省文化的重要窗口,承载着丰富的内涵,对提升地区实力有着重大意义。对吉林省外宣形象的研究,将为促进各省份间的相互理解起到重要作用。为了增强省内外人民对于吉林省形象的理解。本文将以吉林省形象宣传片为语料,以AntConc 语料库检索以及python代码和Jiaba语料包中的词频统计作为分析手段,从系统功能语言学中的评价理论视角出发,分别对其中的态度资源、介入资源以及级差
期刊
摘要:天气雷达是监测和预警强对流天气的主要工具,通过发射一系列脉冲电磁波,利用云雾、雨、雪等降水粒子对电磁波的散射和吸收效应,来探测降水的空间分布和铅直结构。雷达探测波束在低仰角经常会出现被地物遮挡的情况,导致某些方位探测到的回波会偏弱。多雷达多重覆盖拼图大多数时候可以很好解决这个问题,但是每个关注的区域都做到多雷达覆盖在实际中很难实现,也可能存在某个区域多部雷达波束均受到遮挡的情况。  关键词:
期刊
摘要:本文以中国知网(CNKI)为数据源,对2010-2019年间主题词为“物流法律法规”的文献进行检索和筛选,通过统计分析检出结果,揭示了我国物流法律法规近十年的研究现状和热点内容,从我国物流法律法规的现状、问题、发展建议三个方面进行归纳总结与升华。本文详细剖析我国物流法律法规的现状,在借鉴他国先进立法理念的基础上,提出若干完善我国物流法律法规体系的建议。构建完善的物流法律法规体系,才能为物流业
期刊
摘要:本次课题研究主要目的是深入探讨影视娱乐制片行业管理对影视娱乐工作的主导作用,以及对影视娱乐制片行业管理未来发展的深度反思。通过本次课题研究可以发现,影视作品制片职业管理在影视制片工作过程中的主导作用主要应该是:对电视影片包括纪录片的前期制作起重要领导协调作用、对影片的制作成败与否起重要决定性影响作用、对维护影视作品的生产质量安全起专业监督管理作用;对影视作品制片人的职业反思主要应该包括具有专
期刊
【中图分类号】R473.5 【文献标识码】B 【DOI】10.12332/j.issn.2095-6525.2021.03.001  在我国的慢性病中最为常见的疾病之一是冠心病。为了更好地防治新冠病发作所带来的心绞痛症状,可以使用硝酸甘油片。硝酸甘油片对于许多心绞痛患者来说相当于救命药,许多患者都会随身携带这类药品,硝酸甘油片可以在短时间内减弱心绞痛为患者带来的危害。但目前我国仍然存在大部分患者
期刊
摘要:文学阅读活动具备认知活动的所有特征,是一种典型的认知活动。人类的认知活动必须建立再注意力集中的基础上,而认知活动中注意力的分散不可避免。具备“陌生化”特征的文学文本能够激发读者的注意力,一方面使读者能深入文本的心理氛围和细节之中,另一方面使读者能获得强烈的理智感,这些构成了“陌生化”审美的基础。心理学以科学实证方法建立了自身新的理论体系,获得了独立的学科地位,其发展道路和研究方法对文艺理论的
期刊