维基百科中翻译对的模板挖掘方法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:fengxiaogang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语翻译对在跨语言信息检索、机器翻译等领域有着重要的用途,尤其是专有名词、新词、俚语和术语等的翻译是影响其系统性能的关键因素,但是这些翻译对很难从现有的词典中获得。该文针对维基百科的领域覆盖率和结构特征,提出了一种从维基百科中自动获取高质量中英文翻译对的模板挖掘方法,不但能有效地挖掘出常见的模板,而且能够发现人工不容易察觉的复杂模板。主要方法包括三步:1)从语言工具栏中直接抽取翻译对,作为进一步挖掘的启发知识;2)在维基百科页面中采用PAT—Array结构挖掘中英翻译对模板;3)利用挖掘的模板在页面中自动
其他文献
针对笼型异步风力发电机,采用扩展卡尔曼滤波器即线性化的滤波算法来估测电机的转子电阻 Rr。该方法通过检测笼型异步风力发电机的定子电压、电流及转速,在线辨识转子电阻,Matla
为适应数字化时代的版权保护与使用,美国著作权集体管理组织——美国版权结算中心(Copyright Clearance Center,CCC)通过提供一系列版权解决方案,以更便捷的授权方式、更强的
目的观察癫痫宁片添加治疗难治性癫痫的疗效.方法35例难治性癫痫,强直一阵挛发作6例,复杂部分性发作12例,部分性发作继发全身发作17例,在应用传统抗癫痫药物的基础上加用癫痫
目的探讨磁共振弥散加权表观弥散系数(ADC)值是否可有效地定量区分正常宫颈、正常宫颈腔分泌物和宫颈癌。方法对经活检或术后病理证实的34例宫颈癌患者及21名正常健康女性行常
随着人民币汇率打破多年的“稳定”升值2%多,不同的企业受影响的程度不同,其中受影响最大的,莫过于出口型企业。这些企业不论是纯贸易企业还是生产企业,都受到较大影响。
采用选择性培养基从新疆塔城区冷却羊肉中分离和初步鉴定出乳杆菌2株、热死环丝菌2株、假单胞菌属和肠杆菌科各3株,葡萄球菌属和酵母菌各1株。假单胞菌属、乳酸菌、葡萄球菌
本文对冷却法测量金属比热容实验的原理和仪器做了简要介绍,并着重对该实验误差的主要来源进行了探讨。
传统载波相位差分算法在形变监测领域适用性不足,实时动态定位(RTK)精度难以满足要求,而载波双差静态相对定位连续解算时形变跟踪性能较低等。针对这些问题,在对动静态算法深
后加式动词,即带有后缀的动词。德州方言里的后加式动词,与北京话相比十分丰富,不少单音节动词能够带上后缀构成新的双音节后加式的合成词,以适应汉语词汇双音化的趋势,同时
根据阳信县1971-2010年的气温、降水、日照时数等有关资料,利用统计特征量值、气候变化倾向率进行分析,结果表明,阳信县年平均气温具有明显的年际、年代际变化特征,并以每10