【摘 要】
:
为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语
【机 构】
:
哈尔滨工业大学教育部-微软语言语音重点实验室
【基金项目】
:
国家自然科学基金资助项目(60736044),国家高技术研究发展计划资助项目(2006AA01Z150,2004AA11701008)
论文部分内容阅读
为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语言本体知识表示,通过典型语料学习,融合了语法、语义、句法等多元信息,建立了源语言本体知识库.在跨语言信息检索的实际应用中,利用本体表示,获得初始的检索文档集,再基于源语言本体知识库,对全部候选文档重新排序,以提高TopN排列的精确度.利用NTCIR-3Workshop中的中英文跨语言信息检索数据集对该语言模型进行了评价,相关实验结果表明,该方法
其他文献
聂危谷,1957年生于江苏扬州。现任南京大学美术研究院教授、硕士生导师,兼任南京博物院特邀研究员。先后毕业于南京师范大学美术学院、中国艺术研究院研究生部、南京艺术学院
为实现污泥的资源化,用微波诱导热解污泥制备污泥吸附剂.采用碘值分析、扫描电镜分析和处理模拟染料废水的方法研究微波功率、投炭量和微波辐照时间对污泥吸附剂吸附性能的影
为了分析热能贮存及太阳能利用中的固液变问题,需要掌握圆管中含有内热源相变介质的凝固规律.采用热传导中的准稳态方法,通过定义无量纲参量对该凝固问题作近似分析,举例说明该近
李正天以象征主义油画闻名于世。其实他还有一绝,那就是用毛笔画猫和熊猫。打倒"四人帮"平反之后的李正天,有空就跑到动物园,他几乎把绝大部时间和精力都放在熊猫馆,看熊猫画熊
根据2012年9-11月在库克群岛(the Cook Islands)海域利用金枪鱼延绳钓调查所获得的共计43个站点的长鳍金枪鱼(Thunnus alalunga)渔获率数据,以及测得的温度、盐度、叶绿素浓度、
传说中的三皇五帝时代造字诸说对于认识和研究象形造字阶段文字发明、使用和美化状况都不失为一个较好的观察点。本文从三个方面展开论述,指出传说时代是古文字的原始发展时
多媒体系统中影响流媒体的QoS有多种因素,将多媒体系统应用建立在RT-CORBA中间件实体上可以较好的保证流媒体QoS.本文采用扩展RT-CORBA的A/V流服务框架,在实时分布式多媒体应