基于术语自动抽取的科技文献翻译辅助系统的设计与实现

来源 :延边大学 | 被引量 : 0次 | 上传用户:tyybj2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技文献是科研工作者了解和研究最新科技动态和新技术的重要信息来源,因此多语种科技文献的共享平台对于不同国家科研工作者之间相互了解科研工作进展和共同促进科技创新方面有着重要的意义。科技文献翻译的主要难点之一就是不同领域科技文献中专业术语的翻译,准确定位并按统一规则翻译专业术语是科技文献翻译工作的重要步骤和内容。为此,本学位论文针对中韩科技信息综合平台设计了翻译辅助系统。该系统在新录入科技文献中自动获取新术语且进行标记,并通过辅助译文生成系统快速地生成翻译工作者所选术语的译文、相似译文和翻译历史纪录,从而让非专业领域翻译工作者也能够高效地完成科技文献的翻译工作。首先,设计并实现了结构特征与互信息相结合的术语自动抽取算法。该算法将已有科技文献中的关键词作为领域术语进行分词并分析获得相关领域术语的组词特征(词项数量和词性组合)。利用这些组词特征构建筛选模板和停用词模板,并对新输入的科技文献进行筛选以获取候选术语,再使用互信息评估组成候选术语的相邻词项间的组词稳固程度,最终根据所设定的阈值确定候选术语是否应处理为专业术语。其次,将已有术语、抽取到的新术语、术语译文和历史翻译记录等信息存储到系统数据库中形成术语数据库。术语数据库包含所有术语的相关信息,翻译工作者可通过翻译辅助系统和术语搜索功能快速地获取到所选术语的所有相关信息。最后,设计并实现了翻译辅助系统。该系统包含针对翻译工作者的用户接口,翻译工作者可通过该接口获取已有术语的译文信息、新术语的相似译文信息和译文记忆库为基础的历史翻译数据。该系统根据相似度算法将翻译工作者获取到的辅助译文信息进行排序,能够让翻译工作者快速地找到匹配的翻译结果,从而提高翻译工作效率。测试结果表明,本论文设计的术语自动抽取功能和辅助译文生成功能达到了预定的设计目标,术语自动抽取算法召回率达到61.8%,结合优化方法进行优化后达到66.9%,提高了 5.1%;辅助译文生成平均响应时间为0.031秒,MRR为0.951,测试结果满足用户需求。
其他文献
新一轮课程改革的实施,加强了教育对能力培养的重视,也更加关注城乡间的各种差异。化学是一门与空间能力密切相关的学科,已有的相关研究结果表明:空间能力与学生的化学学习成
教师是课程改革顺利进行的重要因素,“二期课改”中高中政治教师适应状况直接影响着高中思想政治课程改革的推进。本研究以上海市ZB区高中政治教师为研究对象,运用问卷调查法
随着《大国崛起》节目的播出和中国经济与社会的迅速发展,大国意识迅速成为一个时代热门话题。中华民族的复兴,需要国民拥有开放负责的大国意识,而中学生是未来建设有中国特
绿色消费是当今社会的一大热点话题。推广绿色消费对建设新农村具有重大意义,绿色消费意识和观念是新农村建设中农民消费模式转变的思想基础,绿色消费是新农村建设的强大推动力
日前,作为网络游戏行业主管部门,文化部首次发布了《2009年中国网络游戏市场白皮书》。据《2009年中国网络游戏市场白皮书》统计,2009年一年当中网络游戏用户规模猛增到了1.0
通过实地观测,计算出宝积山矿区古构速应力场(中生代)主压应力方向为 N45°E;现今构造应力场主压应力方向为 N37°E.研究表明,测区构造形迹是受陇西系顺时针向旋扭应力场控制
介绍了氟盐脱芯法和碱溶液腐蚀脱芯法在氧化铝基陶瓷型芯脱芯技术中的应用.阐述了碱溶液腐蚀脱芯法中高压射流脱芯法、压力扰动脱芯法、高温高压脱芯法的工艺特点及研究现状,
《警察和赞美诗》是高中阶段外国小说的最后一篇课文,作为高三的教学,要求我们既要扣住该文的特点,上好新课,又要以此为小结,把握鉴赏外国小说的技巧、方法。而明点、定位、比较归
6月11日至12日,建设部组织召开了建筑师、工程师注册制度研讨会。侯捷、叶如棠、许溶烈和人事部副部长张汉夫同志出席了会议,参加会议的还有国务院有关部委办的同志和部体改
以南宁城市轨道交通2号线为例,依据能耗分析,主要从牵引耗电和通风空调系统两大方面采取节能设计.从设置节能坡、采用再生制动吸收装置、使用变频技术等方面采取节能措施,达