基于短语结构的树-串汉英对齐模板获取

来源 :中国人工智能学会第十三届学术年会 | 被引量 : 0次 | 上传用户:fdhwangwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种从语料库中自动获取树串对齐模板的方法.该模板基于语言学短语结构,描述了源语言句法树和目标语言串之间的对齐关系.该方法是一种半监督的、基于统计的、数据驱动的方法.初步的试验结果表明,该方法可以得到比较令人满意的效果,且获得的模板可根据解码器的不同而应用到不同的翻译策略中.
其他文献
无线传感器网络通常包含多个感知节点,由于各节点携带能量通常有限,在获取必要的信息的同时,如何延长无线传感器网络的生命期是目前的一个研究热点.当对空间物理环境的状态进行监测时,如某个室内环境的温度和湿度,显而易见,某些传感器节点可以在可容忍的误差范围内良好地表征其柞邻较近的传感器的状态.找到这些传感器节点代表,利用这些传感器节点代表的信息,来获知整个网络的状态,将大大减少整个无线传感器网络的通信和能
动漫角色形象的设计往往被认为是美术设计者的工作,由制片商来决定,设计过程缺乏消费者的参与.为了弥补设计师与消费者对于动漫角色形象的认知差异,提出了基于感性意象的动漫角色形象设计评价方法.研究了动漫角色形象感性意象的认知,建立了消费者与设计师的动漫角色形象感性意象认知匹配模型.而动漫角色形象的哪些因素吸引人,分布在哪些维度上,是研究动漫角色形象感性意象的关键.通过问卷调查和焦点小组等实验方法,提取了
显著边界提取是将图像中平滑连续的物体边界自动寻找出来,它是服务于物体识别的一个初级视觉问题.在没有高层反馈及先验知识引导的情况下,自然界本身存在的一些统计特性,即显著性,有助于确定物体边界.狭长、连续、平滑的曲线往往属于能引起后期注意的物体的边界;短、断续、曲折的曲线通常不代表有意义物体.现有显著边界提取算法绝大部分都可纳入脱离区域概念的基于边连接的理论框架.在此框架下提出了一个基于概率图模型的边
粒子群优化(Particle Swarm Optimization,PSO)算法在优化问题中表现出了良好的性能,但目前还缺乏对粒子自身经验信息和群体经验信息的信息加工机制的深入探讨.经典PSO算法对粒子的自身经验信息和群体经验信息采用完全随机线性加权的加工模式,该模式是否是最佳的信息加工模式?针对该问题,本文采用含参数的FGM Copula连接函数研究粒子对自身经验信息和群体经验信息加工的相关性,
阈值法由于其独特的性质被广泛应用于各种类型的图像分割中,其优点是:计算简单有效,且能进行并行处理.基于人工免疫系统中的克隆选择理论,提出了一种新的最佳熵阈值医学图像分割的方法,新方法中以最佳熵作为亲和度函数,把医学图像分割问题变成一个优化问题,利用克隆算子有效的扩大了搜索的范围,保证了所求解的多样性,从而快速找到最优的分割阈值.我们将新算法应用于MRI图像分割这一挑战性的问题,详细叙述了算法机理,
神经网络可以对非线性系统进行精确的建模,并通过神经网络控制器对有控制要求的非线性系统实行控制.但是传统的神经网络学习算法具有收敛速度慢,效率低的缺点.本文提出了将Levenberg-Marquardt (LM)学习算法应用到神经网络模型的训练,特别是神经网络控制器的建立中,形成了基于Levenberg-Marquardt算法的神经网络自适应内模控制方法.通过与传统神经网络控制方法的比较,本文提出的
主体是人工智能的重要概念,在许多方面得到应用.随着研究深入,人们对主体及系统的性质、功能、特征的理解不断深入.免疫系统是一种具有智能性的生物系统,构成免疫系统的各类分子、细胞等看作兵有特殊功能的主体,免疫系统可以看作是一个复杂的主体系统及网络.免疫系统的组成特性有助于设计新的多主体及系统,多主体也可用于研究免疫系统的功能模型.本文全面回顾了该领域近些年的研究成果,给出了免疫主体的特征及免疫多主体一
本文采用ASO (Alternating Structure Optimization)方法进行了汉语组块分析的研究.ASO算法是最近提出的一种线性多任务的学习算法,通过辅助问题抽取出多任务中的共同结构,来提高分类准确性.基于ASO的汉语组块分析方法是半监督的学习方法,能够利用大量的未标注语料来提高分类器性能.在本文中,我们通过构建一系列的辅助问题,在Chinese Tree Bank语料上,提高
本文综述了常用脑功能成像技术及其在揭示脑的认知机制及规律方面的研究成果.分析和评价了脑功能成像技术在记忆机制、言语产生机制、推理机制、推理与言语关系、顿悟产生机制等认知科学研究中的作用和成果.认为:脑功能成像技术能够在无创条件下了解人在思维和行为过程中脑的功能活动,是目前脑的高级功能研究中最有潜力的一类实验方法.
针对中文语句隶属于类的模糊性,本文提出了一种改进的模糊C均值聚类算法确定多文档集合的潜在子主题.为了减小初值选取不当对模糊C均值算法产生的影响,该方法结合训练阈值的层次聚类算法以及样本密度算法投票生成初始聚类中心,初始化模糊C均值算法的原型矩阵以及划分矩阵,进而聚类生成多文档文摘的子主题.通过对子主题的排序以及文摘句的抽取生成多文档文摘.实验结果表明,采用改进的模糊C均值聚类算法得到的子主题聚类效