基于网络的跨语言信息检索中OOV译文挖掘研究

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:njxgfd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询翻译是影响跨语言信息检索(CLIR)性能的关键因素之一.查询中未登录词(OOV)译文的挖掘对改进CLIR性能具有重要意义.利用主题词译文查询扩展方法从搜索引擎自动获取有效双语摘要资源;采用频度变化信息和邻接信息从双语摘要资源中抽取多词候选单元,并与常见的基于统计的多词单元抽取方法进行了比较.实验中译文挖掘方法取得了TOP 1包含率62.02%,TOP 10包含率95.35%的效果.
其他文献
湘南伴嫁歌以它独特的艺术个性,植根于中国民歌土壤之中,成为绽放于民歌花海中的一枝奇葩。它分布的中心地域就在现今湖南省南部的郴州市嘉禾县,“嘉禾民歌”也因此而驰名中外。
湘西苗族有语言无文字,千百年来,他们创造了丰富多彩、风味独特、音韵优美的原生态苗歌。湘西原生态苗歌,苗语称作“萨”。它是湘西苗族人民记录历史、传承文明、表达情感的一种
针对差分功耗分析(DPA)攻击的原理及特点,分析了未对齐信号对DPA攻击的影响.论述了现在已知的对未对齐信号的频域和模式识别处理方法,分别分析了它们的原理及优缺点,提出了在时
“良好的开端等于成功的一半”。对于儿童学习钢琴,这句话更能体现其积极意义。儿童在3—7岁正是智力发育的黄金时期。表现出好奇心强、接受新事物快等特点。这时期在大脑中形
UML状态图是UML中重要的建模元素之一,用以描述软件系统的离散行为。完备性和一致性是UML状态图模型最重要的性质之一,是进一步验证模型行为正确性的前提。给出了状态图模型完
为提高分析电磁波在地层媒质中传播特性的准确度和时效性,开发了地层媒质建模和FDTD的并行算法,并将两个过程有机集成形成适用于透地通信电磁场仿真的并行计算系统,在搭建的并行
歌唱祖国,是文艺创作包括歌词的永恒主题,是最响亮的主旋律。我国自抗日战争特别是新中国成立以来,在歌曲(词)创作中,以祖国为题材的作品难以数计,其中最突出的、奉为经典的当数《义
在20世纪的末10年中,由于欧洲和港台通俗音乐的渗透和影响,我国内地涌现出一大批优秀的通俗演唱歌手,如毛阿敏、刘欢、田震等,他们都是国内流行乐坛的常青树。改革开放大大地推动
谈论音乐教育,人们总爱提起某个学校为社会输送了几个音乐人才,某个学校的某某学生在某次演唱演奏会上获奖,但绝不会有人提起某校学生普遍有很高的音乐审美修养,更不会有人想起或