基于网络环境下中文叙词表本体知识表示的研究

来源 :决策与信息·中旬刊 | 被引量 : 0次 | 上传用户:lsydyn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文从本体知识表示基础上出发,采用OWL描述本体知识,阐述了OWL语言的描述叙词表的方法及其本体转化的过程,为中文叙词表的网络化和智能化发展提供了技术上的参考.
  基于OWL语言描述网络叙词表的方法
  由于互联网的发展,出现了像谷歌、百度等大型网络搜索引擎,可以通过日志标注来获取用户检索用词的种类频次,叙词表由叙词及叙词之间关系组成,采用参考符号显示并清楚的区分间叙词间基本语义关系,习惯上主要分为3种:①等同关系(Equivalence Relationship)又称同一关系、用代关系,指含义相同或相近的叙词与非叙词之间的关系;②等级关系(Hierarchical Relationship),包含属种、整部和多层级关系;③相关关系(Associative Relationship),又称类缘关系,表示一个概念与另一个概念相关。通过“、代、属、分、族、参(分别以汉语拼音字母首字Y、D、S、F、Z、C表示)”示叙词关系。其中,“Y、D”表示同一关系“S、F”等级关系,“Z”表示一组词中最大的族首词,“C”表示相关关系。在OWL语言中,用类、个体与属性等关系语句描述实体间的关系,用OWL描述叙词间的关系,与(汉表)的叙词关系表示有很多相似的地方和相应的语句。如图1所示。
  (三)相关关系的OWL描述
  基于OWL语言网络环境下本体知识表示
  中文敘词表作为一种规范化词表,在信息结构化检索中起到准确匹配的作用。但同现有的本体相比,中文叙词表更多的面向人而不是面向计算机构建,没有采用计算机形式化语言表述,因而限制其发展。我国专家利用一些本体加以利用构建新的的本体,以寻求语义网环境下的新的发展[4]。
  在OWL知识表示中,首先需要对信息资源和知识资源进行面向对象,抽取对象概念以及他们之间的关系,然后遵循OWL知识表示的语法要求,建立对应的抽类(包括概念、属性、关系等),并将这些类存放在一个OWL类型声明文档中,然后再定义这些类的实例,放到另一个OWL知识文档。有这些OWL文档构成知识库。
  基于OWL环境下网络叙词表本体转化
  当前,本体是图书情报领域的研究热点。英美两国以对其受控词表的编制标准进行了修订等;2005年,美国国家信息标准组织NISO发布了Z39.19的四版Z39.19-2005,而同年英国标准协会(British Standards Instiution,BSI)也发布了BS5723的升级版本。说明国外在这方面的研究已取得了第三阶段,而我国中文叙词表电子化网络化的发展整体水平方面还比较薄弱。总结OWL描述的网络叙词表的本体转换的步骤。
  本体重在概念及其关系的体现,其内在的关系规则在表达不同词之间的等同、从属和相关关系的同时,也提供一种推理的机制。因此,应充分利用叙词表进行本体的构建,将叙词表转化为本体等在网络时代知识组织系统中发挥作用。
  (一)准备阶段
  主要任务是分析叙词表,叙词表的概念模型作为本体转换的背景知识的分析,概念模型和数字模型之间的关系的分析。
  (二)类和属性确定
  从叙词表到OWL的语义转换规范,只有这样才能充分利用现有词表资源进行OWL描述,缩短工作时间,减轻劳动效率。通过一系列准备步骤可以通过建立通用的转化规则映射表来实现。
  (三)描述阶段
  按照前面步骤中确定的关系、类、属性和语法、语义对照表进行表示和描述。
  在转化过程中应该遵循以下规则:使用基于XML的数据类型;尽量保持原始命名;尽量和叙词表的原始结构保持相近;不要转化一些与语义无关的命令信息,避免信息过量。
  (作者单位:新疆石河子大学图书馆)
其他文献
新时代健康产业十年发展历程展览在京开幕本刊讯:为期四天的新时代健康产业十周年庆典活动,7月17日在北京中华世纪坛拉开帷幕。来自全国各地的新时代人欢聚在中华世纪坛广场,
8月4日,青海省国土资源厅召开全省国土资源系统安全生产大检查会,认真贯彻落实全省安全生产视频会精神、省政府办公厅和国土资源部办公厅关于《开展安全生产大检查实施方案的
期刊
摘 要:“没有VP之前”和“VP之前”是汉语中较为常用的表达时间的格式。虽然形式完全相反,但是在一定条件下,两者表达的语义相同,可以互换,而在语用效果方面有很大的不同。本文统计分析了大量语料,分别从语义和语用方面对这两种格式进行考察。认为如果单从语义方面考察,“没有”是羡余成分,删去“没有”对句义不产生影响。从语用方面考察,“没有VP之前”有强调对比和突出条件的语用功能。并结合语料对两者具有同一性
分别在g关于z是凸函数、凹函数和分段线性的情况下证明了g-期望的条件Jensen不等式,并得到g-期望关于常数项的线性性质.最后,运用g-期望和Jensen不等式定义了g-EU效用模型以
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
期刊
将带约束的最大容量路问题扩展到约束条件含固定费用的无向网络的容量扩充问题 ,并给出了强多项式算法 . The constrained maximum capacity problem is extended to the pr
人物:周鸿祎rn时间:2008年7月17日rn地点:北京rn故事梗概:2008年7月17日,曾声称决不进入杀毒市场的周鸿祎食言,奇虎360正式发布“360杀毒”,并再次祭起免费大旗.rn“用户需要
对资源短时占用型作业调度的问题给出了一个数学描述模型,并讨论了该问题求解的时间复杂性.基于该模型提出了对不同情况最佳或近似最佳的实用的联机调度算法,并讨论了这些算
对利用CCD作传感器进行原子光谱分析及图像处理的方法进行了理论和实验研究 ;导出了原子光谱高频噪声判据 ,背景噪声、压缩系数关系判据 ;较精确地测出氢原子巴耳末线系谱线波长及里德伯常数
暴雨,骄阳,热带雨林,崎岖山路,林莽密布。在碎石满布的山坡里闯出一条路,然后又冲进湍急的河流,水花四溅,颠簸然而全神贯注。欣赏它,是一场野性暴力美学的视觉盛宴;驾驭它,深