基于近义词扩充的非通用语翻译评估

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:mxhdb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
BLEU算法在用于非通用语翻译质量评估计算时,由于使用范围以及语料采集渠道的局限性等原因,导致难以获得足够规模的高质量非通用语语料作为参考译文,因而会造成在面对同一语义不同表述时BLEU误判低分。为此,该文采用预先对参考译文进行近义词分析提取的方法,扩展生成多参考译文,尽可能覆盖多种翻译的表达。同时设置阈值对提取出的近义词进行筛选,排除低质量近义词,避免因为扩展带来参考译文质量下降,再基于该扩充译文完成非通用语的质量评估。在实验中,以泰语为例,采用GloVe和Word2vec模型分别对语料库进行训练和近义
其他文献
CycleGAN是一种基于生成对抗网络的衍生模型,可以在缺少成对训练图像的条件下实现两个具有不同风格的图像域之间的相互转换。由于收集大量成对的人脸图像和素描图像存在较大的难度,并且针对人脸素描图像生成任务中存在的图像细节模糊和低清晰度的问题,提出一种改进的CycleGAN模型。通过引入基于注意力机制的残差模块,让CycleGAN的生成器模型可以更加有效地学习不同通道特征和人脸图像中不同区域的重要程
区块链作为一种新型的去中心化数据处理协议,其信息可追溯,不可篡改,灾备性能优异,不依赖特定机构背书的特点引起了国内外研究者的广泛关注。受制于网络的物理限制以及软件支持,为了获得较高的性能,传统的区块链算法往往依靠主节点对客户端的消息进行排序、打包和传播,如果主节点被恶意控制则会对系统造成极大危害。针对系统过度依赖主节点的问题,对主流的区块链主节点选举方式以及在系统中的作用进行了深入分析和讨论。从安全性、稳定性、吞吐率等方面详细阐述了不同算法的优点和弊端。在此基础上提出一种利用监督节点进行比较验证主节点是否
为了提高道路环境下目标检测的准确率和实时性,提出一种基于YOLOv3的改进检测算法。通过深度可分离卷积模块减少模型计算量,提高模型的实时性;采用K-Means++聚类算法代替原来的K-Means算法生成本数据集所需的先验锚点框,解决K-Means算法受初始点选取的影响较大,聚类结果不稳定的问题;在YOLOv3的多尺度预测网络中引入SENet(squeeze-and-excitation netwo
稀土离子掺杂Gd2O2S闪烁陶瓷是20世纪80年代以后发展的硫氧化物闪烁体。高密度和高热中子吸收截面的Gd2O2S基质具有高的X射线和热中子阻止能力,稀土离子(Pr3+、Tb3+等)的掺杂使其表现出快衰减或高光产额等特性,在闪烁领域的应用中占据着重要地位。硫氧化合物的组分控制一直是其合成过程中需要解决的关键问题,Gd2O2S材料的高
【摘要】本文对某市全市公安智慧天网视频监控系统技术应用、运行质量跟踪分析,寻找到严重影响智慧天网运行质量的主要因数,提出解决影响质量的策略,合理应用到现实生产场景,在实际运行维护中起到了良好的作用,保证了智慧天网高质量运行。为今后全市智慧天网扩容、改建、新建补点提供了技术参考,更好地协助智慧城市综合管理。  【关键词】智慧天网;运行;质量  中图分类号:TN929 文献标识码:A
针对体域网中多传感设备之间存在不同协议转换的实际需求,设计了一个多元异构传感设备之间数据集成协议转换的网关。该网关由基于ARM Cortex-M3内核的主控模块、基于CC2530的ZigBee模块、Wi-Fi模块、电源模块四个部分组成。首先给出了一种面向体域网应用的系统网关总体设计体系,然后介绍了硬件和软件设计过程,同时阐述了硬件工作原理、网关工作流程和数据上云的过程。最后利用串口调试助手和网络调试助手抓取数据并上传至云平台,对网关的丢包率、延迟等性能指标进行了实验仿真。通过对30轮次多组数据包的实际抓取
频繁项目挖掘是数据挖掘的研究热点之一,若数据集包含敏感信息,不作处理地发布挖掘结果会有隐私泄露的风险。目前已有本地化差分隐私的频繁项目挖掘算法,但还无法满足处理大数据时的实时性和数据可用性要求。针对这些问题,该文提出了一种新的面向本地化差分隐私保护的频繁项目挖掘算法—GFIM(group-based frequent items mining)。该算法把用户随机划分为不相交且大小相等的两组用户,整个运行过程分为两个阶段。第一阶段主要根据全部用户提交的信息挖掘出频繁项目的候选集C,而在第二阶段,两组用户分别
针对命名实体识别方法中语义分析不足及准确率较低的问题,提出一种基于BERT模型的混合神经网络实体识别方法。对命名实体识别研究现状进行了调查与分析,发现现有命名实体识别研究中存在数据分析与特征提取不充分导致准确率较低的问题。利用BERT预训练语言模型动态生成字的语义向量,丰富其文本特征。使用卷积神经网络(convolutional neural network,CNN)模型再次抽取语义特征,实现语义的自动抽取,二者联合作为下一步的输入向量。采用引入注意力机制的双向长短时记忆网络(bi-directional
区块链技术作为数字货币的基础,实现了去中心化环境下的信任建立与价值传递。随着区块链技术在众多应用领域的深入,区块链所承载的数字资产呈现多元化、复杂化,信息数量的急速增长对区块链的性能提出了更高的要求。采用多链、跨链等技术的主从多链模型,缓解了传统单链模型的性能瓶颈,但现有的共识机制无法适用于主从多链。为此提出一种包含个体共识机制与元共识机制的集成共识机制,确保主从多链模型的区块安全性验证。利用并行的多种共识机制作为个体共识机制,保证了主链在处理从链交易时的高效性。主链中的元共识机制对个体共识的结果进行验证
孔轴配合常见于工业制造业的生产活动中,实现装配自动化、提升装配效率需要以视觉监视技术作为支撑。该文提出一种基于双目图像融合的孔轴配合间隙监视技术。通过融合双目视觉系统在两个视角下拍摄的孔轴配合图像,可以有效解决单视角下的图像遮挡和视场受限问题,从而有效消除视场盲区。虚拟交线指的是轴件与圆孔支撑平面之间的交线,该交线在图像上并不可见。在获得双目融合图像后,通过构造并提取图像中二次曲线相切不变量,结合