基于工作者特征模型的众包翻译任务分配方法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:juyexia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着互联网、计算机性能和自然语言处理能力的逐步成熟,通过全球互联网平台,汇集尽可能多的工作者加入工作队列,并辅助以算法的分析和流程的自动控制,实现众包任务付出更低的成本并取得更好的结果,成为一个研究的热点,这也是群智协同计算的重点研究内容。在众包协同翻译中,众包工作者的筛选和质量控制是快速取得较好翻译结果和控制成本的关键。如何快速精准的分配任务,以及如何对翻译文本进行质量把控,将作为重点内容进行研究。本文以泰语与汉语互译为例,研究基于工作者特征的众包翻译工作者筛选模型构建方法,并进而设计完成一个基于协同计算的众包翻译系统模型和框架,对关键技术和模块进行实现,最后使用实验检测的方式对筛选模型和质量评价做可行性分析。在任务分配方面,本文通过层次分析法(AHP)建立工作者筛选模型,并据此发现最合适的工作者和任务的动态匹配,与基于历史信息的分配方式相比,解决了“冷启动的问题”,模型在初期可以根据初始数据进行工作者和任务的客观分配,在模型后期,随着工作者信息的不断反馈,使得分配效果更加显著。在译文质量控制方面,本文采用基于BLEU改进算法对泰语进行质量评估,其中通过分词技术和同义词替换,使得该评价算法在评估泰语中灵活性和准确性有了明显提升。在最后,将工作者筛选模型和译文自动评估技术充分应用到众包翻译系统中,有助于快速甄别工作者,并获取更高质量的工作结果,解决一方面依托专业翻译成本过高,而另一方面依托机器翻译又质量太低的问题。
其他文献
中缅原油管道(缅甸段)的自动控制系统采用SCADA系统,它是以计算机处理器为核心采集管道沿线阀室、场站工艺参数以及运行设备等数据,监视和控制工艺流程和设备运行状况等。管道的调控中心设立在缅甸的曼德勒郊区,通过对管道全线的统一监视、控制和管理,实现管道的安全、平稳、高效运行。SCADA系统的自动化程度,可达到现场无人操作的水平。各站场、阀室分别设SCS站控系统和RTU监控系统,SCADA系统将生产运
目的观察中药薰洗对下肢动脉硬化患者导致麻木症状的临床疗效。方法选取我院2016年1月~2017年6月收治的患者100例随机分为两组,对照组50例采用动脉硬化一般护理常规,即根据中
嫁接可以改良葡萄品种,提高葡萄栽培效益,而且大树嫁接的当年就有一定的产量。在庭院葡萄栽培中,嫁接改良品种是比较常用的一种方法;在葡萄根瘤蚜发生的地区,嫁接是葡萄栽培
本文基于对地方院校英语专业学生的问卷调研数据,从认知视角了解学生对英语课堂多模态教学的了解情况。调研结果表明:绝大多数学生认可和赞同英语课堂运用多模态教学,较传统
媒介人力资源有其自身的特殊性,这种特殊性是由其行业、组织及产品的特殊性决定的。媒介人力资源管理只有从管理对象的特殊性出发,才能在管理上有针对性地工作并取得成效。
电加热器在各行各业的生产中大量使用,本文对电加热器在运行中的影响因素、运行不稳定、电加热器的种类和设计选型以及常见故障的处理方法进行了论述。
目的观察萎胃汤治疗幽门螺旋杆菌(HP)阳性慢性萎缩性胃炎(CAG)的临床疗效及安全性。方法选取2017年12月—2018年12月收治的100例Hp阳性CAG患者作为研究对象,随机分为对照组和
明代驿递机构由驿站、递运所与急递铺三部分组成。急递铺作为三大驿递机构之一,专司公文递送,密布于各省的府州县之间,在政治、经济、军事、文化等领域都发挥着重要作用。其在江西地区亦是如此。因江西特殊的地理位置,故其急递铺的设置、分布等皆有其自身独有的特点。江西地区急递铺分布数量众多,所辖一十三府共约有896处,密布于辖属各府州县。其多置于道路要冲,而在僻地亦有分布,铺铺连接成线,交织成一张巨大的交通网,
随着人们生活水平的提高,人们对于食品安全和环境污染问题愈加重视。然而近年来由于生物毒素污染而导致的各种事故层出不穷。生物毒素已经严重威胁人们的饮食卫生和生存环境
<正>在营销升级的时代背景下,产品正在朝向体验型消费方向转型,消费者从接受者变成了创造者,触媒场景由单数变成多个。如何找到自身定位,如何构建品牌营销体系考验着每一家企