蒙古语语义知识词典的研究与实现

来源 :内蒙古大学 | 被引量 : 3次 | 上传用户:likezzz21cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
《蒙古语语义知识词典》是一个以蒙语与英语的双语词语所代表的同义词概念集合为描述对象,通过语义关系的组织与联系,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。面向信息处理的蒙古文理论研究和相关的知识库的建设是蒙古文在计算机上得到更广泛的应用的基础。由内蒙古大学研制的“蒙古语语法信息词典”为蒙古文信息处理提供了多方面的词语知识,为蒙古文信息处理建设开了先河,但是“蒙古语语法信息词典”更侧重于对语法信息的描述,远不能满足我们在蒙文信息处理中所需要的知识。本文介绍的“蒙古语语义知识词典”是一部基于语义学研究成果而开发的一部以语义关系为主的语义知识词典。我们的词典与其他词典的区别主要在于,我们对词语的组织不是根据词形或者发音,而是通过词语之间存在着的语义关系将语言学中的词语组织在一起,形成一部具有更高应用价值的知识库。我们设计研究的蒙古语语义知识词典是一个蒙语与英语对照显示的蒙英双语语义词典,参照英语的‘’WordNet”与汉语的“知网”的构建,我们构建了蒙古语语义知识词典的框架,词典内包含的主要的语义关系有上下位关系、部分与整体关系、反义关系、蕴涵关系等,就是通过这些语义关系的联系使我们的词典构成了一个知识网络。本文通过研究语义学方面的知识,了解到其他语种的语义学研究是比较成熟的,语义学的应用是可以扩展的,我们可以将英语与汉语的研究成果转移到蒙古语的语义研究上面来,由于蒙古语与英语的构词形式相似,都是通过字母组成的,所以我们更多的是借鉴了英语的WordNet来研究蒙古语语义知识词典。通过不断的研究我们将完成一部词汇量大概有10万的语义知识库,通过计算机来对我们的词汇库进行管理,本文主要介绍我们对词典库的建设与查询,实现了一部真正的蒙古语语义知识词典,通过以后进一步的完善与扩展,我们相信这样一部完善的蒙古语语义知识词典能够为将来的蒙古语信息处理研究做出贡献的。
其他文献
近年来,随着电子摄影产品的迅速普及,数字图像以惊人的速度涌现在网络上。如何从海量的图像中检索出所需图像成为一个亟待解决的问题。合理的图像标签顺序对图像检索和分析有
数据挖掘(Data Mining)是从存放在数据库、数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解模式的非平凡过程。而关联规则挖掘作为数据挖
因为蛋白质在高温或极端PH值的环境下非常容易失去活性,这就造成了在一些极端环境中进行蛋白质的大规模的生产应用困难的局面,为此,蛋白质在极端条件下的热稳定表象成为了生物物
目前,互联网中越来越多的数据以XML的格式进行传输和操作,XML结构的灵活性使复杂的半结构化数据的交换更加方便。但是,在实际工作中,如传感器噪声数据、信息抽取时包含错误数
高光谱遥感图像具有高维度、高分辨率和高数据量等特点,所带来的问题是信息重叠率高、冗余信息较大、波段间相关性大以及存储数据花费时间较长等。因此,对于涵盖了丰富的卫星遥感成像信息的高光谱图片,选择最有价值的信息显得尤其重要。在整个高光谱图像处理过程中,波段选择成为整个过程的重要环节,也成为了后续处理的必要条件。本文在分析了现有的波段选择算法的基础上,对高光谱溢油图像的波段选择相关技术进行了研究,包括以
通过W3C(万维网联盟,World Wide Web Consortium)组织及工业界和学术界的不懈努力,语义Web形成了由资源描述框架RDF(Resource Description Framework)为核心的多层体系结构。
论文主要针对指令级、线程级并行的限制而展开对多核同时多线程体系结构的深入学习和讨论。通过对多核处理器关键技术、同时多线程处理器体系结构的学习和对gem5处理器模拟器
市场营销中,为了推广某一产品,如何利用有限的资金有效的选择若干个客户来进行产品促销,借助“病毒式营销”(viral marketing)和“口碑效应”(word-of-mouth)的方式来达到产
从振动数据中发现目标的振动特性,有利于识别监控环境中的目标和状态,在安全防御方面有着重要的学术价值和现实意义。本文将数据挖掘技术应用于振动数据的模式匹配研究,在研究和
随着移动通信行业的不断发展和互联网向移动终端的普及,网络和用户对移动终端的要求越来越高。Android是一套真正意义上的开放性的移动设备综合平台,包括操作系统、中间件和关