【摘 要】
:
电商产品翻译系统的训练存在两个主要的问题:电商领域训练数据稀缺和电商产品描述文化风格差异较大.为此,通过获取大量的电商产品数据信息作为训练语料,并利用基于无监督领域适应的混合训练和文化风格区分的方法改善电商产品翻译系统的性能.具体地:一方面将基于外领域数据训练得到的翻译系统应用于电商领域单语数据得到伪平行语料,使用伪平行语料进行混合训练进一步得到新的模型;另一方面给不同语言的电商数据添加对应的文化风格区分标记,在训练过程中告诉模型当前数据的所属类别,根据类别信息获取相应的文化风格区分特征向量,从而提高电商
【基金项目】
:
国家自然科学基金(61673289)。
论文部分内容阅读
电商产品翻译系统的训练存在两个主要的问题:电商领域训练数据稀缺和电商产品描述文化风格差异较大.为此,通过获取大量的电商产品数据信息作为训练语料,并利用基于无监督领域适应的混合训练和文化风格区分的方法改善电商产品翻译系统的性能.具体地:一方面将基于外领域数据训练得到的翻译系统应用于电商领域单语数据得到伪平行语料,使用伪平行语料进行混合训练进一步得到新的模型;另一方面给不同语言的电商数据添加对应的文化风格区分标记,在训练过程中告诉模型当前数据的所属类别,根据类别信息获取相应的文化风格区分特征向量,从而提高电商
其他文献
磁共振成像作为一种无放射性和非侵入性的医学成像技术,能够提供多对比度及软组织图像,现已成为临床诊断中不可或缺的工具.但是,磁共振成像时间长一直是领域内的难点问题.欠采样和并行成像是加速磁共振成像的有效方法.为快速重建高质量图像,合适的算法和模型至关重要.借助稀疏重建方法能够从欠采样的少量数据中恢复出完整的图像.
语义角色标注旨在标注出句子中所有与谓语相关的语义成分,是进行语义分析的基础和关键技术.使用传统的机器学习方法进行语义角色标注,需要人工设定特征,特征稀疏且工作繁琐沉重,同时传统方法对句法解析精度有较高要求,所以语义角色标注发展缓慢.针对上述情况,采取基于双向长短时记忆(BiLSTM)网络-注意力机制(attention)-条件随机场(CRF)模型进行汉语语义角色标注,同时尝试针对性引入其他资源优化模型性能.在训练阶段,将词性、依存句法特征以及短语结构句法特征组成的多线索特征组共同送入模型.经过多组对照实验
研究了一类具有时变时滞的复值神经网络的概周期解,利用Banach空间中的不动点定理、指数型二分性以及分析技巧,获得了该类复值神经网络概周期解的存在性、唯一性及一致稳定性的新结果.最后,通过实例验证了所得结果的有效性和可行性.
俄狄浦斯是索福克勒斯的戏剧《俄狄浦斯王》和《俄狄浦斯在克洛诺斯》的主人公。他从一出生就无形中踏上被安排好的命运之路。尽管他曾努力与神谕抗争,但终究输给了命运。自盲双目的俄狄浦斯随后流落到雅典小城克洛诺斯,他说服国王忒修斯让自己留下,并最终无疾而终,死于克洛诺斯女神的圣地。本文以俄狄浦斯之死为切入点,结合法国哲学家阿尔贝加缪的哲学随笔《西西弗斯神话:论荒谬》,对俄狄浦斯之死做出全新的阐释,从俄狄浦斯的死亡中探索荒诞世界的生存价值,并揭示出放弃对神的信仰,以“人”为本的生活哲理。
誉满全球的经典名著《简·爱》是英国维多利亚中期杰出女作家夏洛蒂·勃朗特声名鹊起之作。本文从精神生态学的视角,对小说中男主人公罗切斯特的形象进行解读,详细分析其精神生态失衡与恢复平衡的表现,揭示其精神从堕落到复归的发展轨迹,探讨其形象的精神生态意义,以启发当代人们自觉维护精神生态的健康,打破精神困境,实现自我身心的和谐,推动人与自然和谐共生、人与人和谐相处的社会建设。
作为专门用途英语的一个重要分支,科技英语以其独特的语言特征和风格引起广泛关注,成为促进国际间技术交流和合作不可或缺的工具和手段。以美国石油学会2011年发布的第九版套管和油管规范(API 5CT Ninth Edition)为语料,主要从词汇、语法、篇章结构三个层面详细分析了科技英语所具有的代表性语言特征,进而探讨了科技英语在经济、社会、语言学等领域所具有的独特价值。该研究深化了人们对科技英语的认知,丰富了语言价值理论。
为降低成本并获得永磁同步电动机的精确转子位置,提出了一种基于改进型滑模观测器和速度外环滑模控制器的永磁同步电机无位置传感器矢量控制策略.基于基波数学模型构建闭环控制系统,引入饱和函数和锁相环对传统滑模观测器进行优化,提高转子位置及转速的检测精度.针对实际系统中速度外环采用比例积分(PI)控制器易受系统参数变化、负载扰动以及外界干扰影响的问题,设计了滑模控制器增强系统的鲁棒性.仿真和实验结果表明:改进后的系统有效地提升了系统检测精度,且速度外环的滑模控制相比于PI控制具有更好的动态性能.
传统的C均值聚类算法是一种硬划分聚类方法,对初始聚类中心的设置敏感,具有聚类中心趋同性问题.为了克服该问题,模糊C均值(FCM)聚类算法被提出.然而,FCM中模糊隶属度的拖尾和翘尾特征却带来了新的问题:一方面,聚类结果更易受噪声和离群点的影响;另一方面,数据簇的可分性下降,聚类结果泛化性差.针对这些问题提出了一种新的具有自适应性的模糊聚类算法,该算法采用正则化技术与软阈值法,模糊隶属度具有明显的稀疏性结构特征;引入了虚拟类,有效降低异常点与离群点对聚类结果的影响,并且解决了FCM所存在的翘尾问题,提高数据
针对视频经过编解码传输后时延测量效率低、误差大、成本高、无法在线无损监测等问题,提出并实现一种能在线无损监测视频时延的精确测量装置.该装置的硬件由现场可编程门阵列(FPGA)与处理器组成,其中FPGA负责计算量大的视频采集与散列编码,处理器负责散列特征匹配并计算出视频时延.在算法上利用视频帧散列特征提取匹配原理进行视频时延的实时测量.测量结果除了在装置上可显示外,还可以通过网页或屏幕信息显示(OS
通过分析面向定制需求的配置方案对产品族绿色性能和总成本的影响,提出综合考虑绿色性能和通用性成本的产品族配置设计方法.基于模块实例绿色性能评价指标体系,应用专家打分法与模糊层次分析法(FAHP)计算模块实例的绿色性能;结合典型产品变型需求与客户定制需求,考虑自制模块实例的学习效应和外购模块实例的规模效应,计算特定时期内产品族的总成本;以定制产品绿色性能最优化和产品族总成本最小化为目标,应用遗传算法求解帕累托最优方案集,并根据企业经营策略选择最优配置方案;以电动剪刀产品族为实例的验证结果显示所提配置设计方法的