【摘 要】
:
机器翻译是自然语言处理的主要分支之一,在促进政治、经济、文化交流等方面起着重要作用.目前汉藏机器翻译质量还有待提高,汉文到藏文的译文中容易出现语法错误,尤其普遍存在藏文虚词的翻译错误.分析汉藏机器翻译译文中的藏文虚词错误类型,并究其自动纠错方法是提高汉藏机器翻译性能最有效的方法.在分析汉藏机器翻译译文中虚词错误类型的基础上,利用大规模藏文文本对Bert进行预训练.然后面向汉藏机器翻译译文中的虚词错误类型,针对性的对Bert预训练模型进行微调,以完成一种面向汉藏机器翻译后处理的Bert藏文虚词纠错模型的训练
【机 构】
:
青海师范大学计算机学院,青海 西宁810016;青海省藏文信息处理与机器翻译重点实验室,青海 西宁810008;青海省藏文信息处理工程技术研究中心,青海 西宁810008;藏语智能信息处理及应用国家重
论文部分内容阅读
机器翻译是自然语言处理的主要分支之一,在促进政治、经济、文化交流等方面起着重要作用.目前汉藏机器翻译质量还有待提高,汉文到藏文的译文中容易出现语法错误,尤其普遍存在藏文虚词的翻译错误.分析汉藏机器翻译译文中的藏文虚词错误类型,并究其自动纠错方法是提高汉藏机器翻译性能最有效的方法.在分析汉藏机器翻译译文中虚词错误类型的基础上,利用大规模藏文文本对Bert进行预训练.然后面向汉藏机器翻译译文中的虚词错误类型,针对性的对Bert预训练模型进行微调,以完成一种面向汉藏机器翻译后处理的Bert藏文虚词纠错模型的训练.经实验,模型的纠错准确率、召回率和F1值分别达95.64%,93.27%,94.44%,表明上述模型的藏文虚词纠错性能较好.
其他文献
根据外骨骼穿戴者的实时运动意图,切换外骨骼机器人的行走步态,是外骨骼机器人研究热点问题之一.针对外骨骼机器人能够根据穿戴者的运动意图控制步态切换问题,提出采集人体表面肌电信号进行解码,通过BP神经网络识别穿戴者的运动意图,实现外骨骼进行步态规划,利用关节角度与足底压力的相关性以及重心轨迹,对所规划的步态的稳定性进行分析,依据不同的运动意图完成步态进行实时切换,验证了基于实时意图识别控制的外骨骼步态切换的可行性.
通信网络数据采集量较大,且重复数据较多,如果直接在原始时序上采集,会导致数据特征观察不清,从而引起采集效率低、精准度不高等问题.为此提出多通道通信网络数据跨层采集时序控制方法.利用免疫遗传算法挖掘通信数据,获取最小支持度与最低可信度的表达式,以此在最大程度上剔除无用信息,实现跨层无冗余数据挖掘.根据数据挖掘结果结合最短路径原则,将数据采集问题转换为最优路径选择问题,通过对通信网络数据目标函数的计算分析采集原理.以上述原理为基础,设计时序控制逻辑,绘制工作时序图,形成时序控制方案.将拥塞度与延时性作为评价指
针对机器人执行器系统强非线性及参数不确定性,提出了一种极限学习机(ELM)自适应误差估计的快速非奇异终端滑模(FNTSM)控制算法.通过使用快速非奇异终端滑模面和输出跟踪结构,同时从闭环系统全局稳定性的角度出发,利用Lyapunov稳定性意义自适应调整ELM的输出权值,给出了闭环稳定性和有限时间收敛性,保证了系统的快速误差收敛特性和高跟踪精度,实现对系统集总不确定性上界的自适应误差估计.提出的控制方法不仅可以实现有限时间误差收敛,而且不需要预知集总不确定性界.仿真结果证明,所提出的控制方法与现有自适应滑模
基于数字样机的分类和研究现状,提出了航天产品性能样机的定义.接着根据性能样机的定义和性质,提出了航天产品性能样机需要进行可信度评估的观点.依据建模与仿真VV&A的标准规范,结合航天产品性能样机的特点和开发过程,提出了适用于航天产品性能样机的VV&A方案,并强调VV&A活动必须贯穿性能样机的整个生命周期.接着对航天产品性能样机的VV&A方案进行了分步骤的详细介绍,分析并提供了可使用的V&V方法.为后续的性能样机VV&A工作的实施和V&V方法的选择与优化奠定了基础.
针对常规PID控制下四旋翼无人机抗干扰性弱的问题,提出了一种集合了常规PID和模糊理论以及神经网络算法的复合控制器.通过将误差信号模糊化输入神经网络进行自适应控制,将角度和角速度误差作为收敛条件,提高了无人机的抗干扰能力以及响应的精确性.同时搭建基于Maxout激活函数的神经网络模型辨识器,实现了对被控模型的精准识别.仿真结果表明,结合模糊神经网络的复合控制器相对于常规PID控制器,无人机抗干扰能力大幅度提升,新的控制方式具有更强的抗干扰性和鲁棒性.
针对传统蚁群算法易陷入局部最优点、收敛速度慢和计算时间长等问题,提出了一种改进蚁群算法.令初始信息素不均衡分布,使蚁群寻找初始点时偏向目标点;根据势场法计算当前节点与目标节点之间的距离来改变启发信息,避免蚁群陷入局部最优点;根据优质蚂蚁更新原则更新全局路径上的信息素,通过自适应来控制信息素挥发因子,从而提高算法的全局性;对第一次规划的路径进行二次规划剔除无效拐弯点.仿真结果表明,改进后算法规划的路径不合理拐弯点更少并且迭代次数明显减少,减少了运行时间,验证了改进后算法的优越性和高效性.
针对影视和游戏行业中的虚拟角色模型的定制和网格变形编辑问题,提出了一种径向基函数的虚拟人体角色网格变形的算法.算法通过增加一定数量的空间离散控制点,快速改变虚拟人体模型的局部形态,从而实现了虚拟角色模型的定制和网格变形编辑.借助这一算法,开发了虚拟角色快速制作原型系统.实验表明,算法和执行流程可以快速批量生产外形各异的虚拟人物角色,并用于具体项目需求中.整个生产过程可以完全通过程序控制完成,也可以引入一定的交互式操作,具有很高的灵活性和稳定性.
在碳中和目标下,二氧化碳捕集、利用与封存(CCUS)技术既是助推我国实现大规模减排的关键技术之一,也是保障能源安全和实现可持续发展的重要手段。本文从扶持政策、主要技术环节、运营模式等方面分析了CCUS的发展现状,并在借鉴发达经济体发展CCUS经验做法的基础上,提出促进我国CCUS发展的对策建议。
目前,基于深度学习的图像目标检测算法已经趋于成熟,但其无法利用视频中独特的时序信息,会使检测精度产生大幅度的下降.为了更好的进行视频目标检测,应当充分挖掘视频图像之间的联系,利用视频中的时序信息.因此提出了基于时序信息和注意力机制的视频目标检测算法(TIAM).算法中加入了运动历史图像,表征视频中的时序信息,并为模型提供目标的运动信息;结合注意力机制,使模型更加关注目标区域,提高了区域特征的代表性.在大规模数据集ImageNet VID上进行实验,验证了算法的有效性,平均精度均值达到了先进水平.