面向跨语言信息检索的蒙汉语义词典构建

来源 :内蒙古师范大学 | 被引量 : 0次 | 上传用户:chris916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球数字化、网络化的发展,蒙古文网络资源也越来越丰富。然而,蒙古文网络资源中存在编码不统一,无法实现共享等问题,不仅严重阻碍了蒙古文互联网的发展,更是对蒙古文搜索引擎技术带来了挑战。现有的蒙古文互联网搜索引擎还有许多缺陷,同时由于蒙古文网站数量不多,内容单一、更新速度缓慢,致使检索到的有用信息有限。因而蒙古族网络用户查找资源时往往选择其他搜索引擎来查找中文或英文的网站来获取信息。但在蒙古族网络用户构造检索提问式时,受到语言之间差异的影响,很难准确用外语表达自己的需求,从而增加了信息获取的难度。为适应蒙古文互联网发展现状,迫切需要建立一个蒙汉跨语言信息检索系统。蒙汉跨语言信息检索系统能够扩大信息搜索范围,快速获取网上信息,同时也能够很好地缓解民族地区群众上网语言障碍,对促进地区科教文化事业的发展将起到积极作用。在实现蒙汉跨语言信息检索时,可以采用基于机器翻译系统的方法、基于语料库的方法及基于字典的方法,而它们存在着共同缺陷,即在查询转换过程中,只是浅层地进行字符集的转换和匹配,未能达到语义层面上的翻译。为将蒙汉跨语言信息检索提升到语义层面上的翻译检索,亟待需要一个支持蒙汉跨语言信息检索的语义资源。本文的重点是构建面向跨语言信息检索的蒙汉语义词典框架,主要通过以下几个方面的工作来完成。(1)首先以跨语言信息检索为切入点,研究分析了跨语言信息检索的相关理论方法。(2)研究本体技术及其在跨语言信息检索中的应用,为构建面向跨语言信息检索的蒙汉语义词典提供理论基础。(3)采用多语言本体技术构建面向跨语言信息检索的蒙汉语义词典。该方案中充分考虑了语义词典的概念及概念之间关系的表达,并进一步对同义术语语义关系的表达,概念语义相似度的计算及其在跨语言信息检索中的应用进行了深入的剖析和研究。最后以计算机应用技术分支的概念作为领域对象入手,构建了一个实验性的计算机术语蒙汉语义词典。(4)设计并给出了一种基于概念的蒙汉语义词典的查询方法,将查询提升到概念层面,进行语义查询,返回与查询结果具有语义关联(同义、上位、下位等)的相关概念及对应蒙汉术语。本文的工作,不仅丰富了语义词典的构建方法,同时为蒙汉跨语言信息检索提供了基础资源,对蒙古文语言资源建设有促进作用。
其他文献
当今世界,经济全球化进程不断加快,企业面临的竞争压力越来越大,是否能控制好风险是房地产企业竞争成败的关键。目前我国从事房地产开发的企业有9万多家,可以为300多万人提供
随着石油及其产品的大量消耗和储存,由此带来的事故风险隐患也逐渐增多,一旦发生事故,将造成巨大损失,因此研究油罐火灾的燃烧特征规律,探寻防、控油罐火灾的方法就显得十分
<正> 当首长和群众在一起的时候,一个新闻摄影记者该怎样选择自己的镜头!这是我们经常碰到而目前又没有完全解决的一个问题。周总理对这个问题,有多次的指示。让我们来温故而
毛泽东对中国社会主义道路的探索 ,在 5 0年代初到 60年代初 ,主要表现为对中国社会主义工业化道路的探索。中国社会主义工业化道路的实质是重工业、农业、轻工业的关系。从
近几年来,随着移动智能终端和移动互联网技术的不断进步与发展,平面媒体开始进入移动客户端市场,借助移动客户端传播信息,与时俱进。在新媒体时代,平面媒体想要在移动互联时
未来我国市场增量主要来源于二、三线城市。根据石家庄、西宁、普洱三地调查数据提炼出老年人四种消费类型:温饱型老年人消费谨慎,以满足生存需求为目的;小康型老年人的消费
高校承担着培养人才、科技创新和服务社会的重要功能。从目前形势看,它已逐渐成为社会关注的焦点,反映出了高校在推动社会经济发展和科技进步中的决定性作用。高校党的基层组
利用喇嘛教来征服和奴役蒙古人是清历代统治者的一项重要国策。从十七世纪初至二十世纪初近三百年来,他们充分利用喇嘛教征服和统治蒙古的进程有其深刻的历史、政治以及社会
配电网和分布式发电(Distributed generation, DG)相结合被认为是能够节省投资、降低能耗、提高电力系统可靠性和灵活性的主要方式,也是智能电网发展的必然趋势。开关优化配
法官身份保障制度首次确立于1701年英国的《王位继承法》中,在美国的《独立宣言》和《美国宪法》中也均有所体现。随后,大陆法系国家纷纷效仿英美法系国家,也都建立了符合自