一种新的基于中间语义的跨语言信息检索模型

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zhucejuren2011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前的跨语言信息检索能够使用的方法有四种;查询词翻译的方法、文档翻译的方法、中间语言翻译方法和非翻译的方法。该文对这四种方法进行了简要介绍,提出它们的优缺点,并且提出了一种新的非翻译的方法——基于中间语义的方法。我们对提出来的方法进行了TREC跨语言语料库的试验,并且与单语言的信息检索模型进行了比较。试验证明我们的方法具有很好的性能和健壮性。
其他文献
负债是商业银行资金的重要来源,在商业银行经营管理中占有非常重要的地位。商业银行为追求资产的盈利,往往有扩大负债规模的内在冲动。然而,负债并非总是越多越好,适度负债对商业银行的稳健运行具有非常重要的意义,对商业银行三性原则的协调也有非常积极的影响商业银行负债即银行在过去的交易事项中形成的现时义务,履行该义务会导致本行经济利益的流出。商业银行的负债由存款负债、借入负债和其他负债构成,其中存款负债与借入
传统聚类算法通常建立在显式的模型之上,很少考虑泛化模型以适应不同的数据,由此导致了模型不匹配问题。针对此问题,该文提出了一种基于空间映射(Mapping)及尺度变换(Rescaling)的聚
中小企业是我国国民经济发展和社会发展的重要力量,然而中小企业的融资困难一直制约着这支生力军的发展,本文将中小企业知识资产管理与中小企业融资结合起来,试图解决中小企业融资瓶颈问题,探索我国中小企业融资模式。  知识资产管理概述  保罗·罗默教授在上世纪80 年代提出的经济增长四要素理论中认为,知识是经济增长最重要的要素。日本著名管理学教授野中郁次郎( 1995)也曾说:“在一个不确定性是惟一可确定因
知识获取是制约基于语料库的词义消歧方法性能提高的瓶颈,使用等价伪词的自动语料标注方法是近年来解决该问题的有效方法。等价伪词是用来代替歧义词在语料中查找消歧实例的
中科院山西煤化所与美国伊利诺伊大学采用能够响应可见光的立方型高比表面积SiC为载体,利用Au纳米颗粒的表面等离子体共振效应,设计出新型Au/SiC光催化体系,在室温常压和可见光照
随着国内外对西夏研究的不断深入,收藏于世界各地的大批西夏古籍文献通过影印方式陆续出版。如何将这些西夏古籍文献进行数字化、文本化则有着极其重要的意义。首先利用平滑和细化算法对西夏影印文献进行了预处理,然后利用Level set方法对影印文献中的西夏字进行了轮廓提取。Level Set演化函数在空间方向上采用了四阶紧致差分逼近式离散,计算过程中加入了窄带算法及全局优化方法。实验表明,算法在不增加计算时
不少为官者办公室的书橱内,确实放了不少书,有精装版的《官经》、《厚黑学》、《中国历代君臣权谋大观》、《古代帝王驭人术》、《官场文化与潜规则》等等,还有《阴阳风水学》、
毛泽东同志总结和确立的党的群众路线,作为党的生命线和根本工作路线,体现了党的性质和根本宗旨,是毛泽东思想活的灵魂的三个基本方面之一。群众路线坚持得好不好,关系到党在人民
该文介绍了言语信息处理的进展,特别提到汉语言语处理的现状。言语信息处理涉及到言语识别、说话人识别、言语合成、言语知觉计算等。带口音和随意发音的言语识别有力的支持
以芳烃抽余油为加氢原料,高效镍基均相络合催化剂为活性中心,在100 mL固定床加氢装置上进行加氢脱芳反应,考察了工艺条件对镍基均相络合催化剂催化抽余油加氢性能的影响,研究