基于边界感知的复杂名词短语的识别和转换研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:ljzhangxy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了改善专利机器翻译中复杂名词短语的翻译效果,提出了一种基于规则的复杂名词短语识别和转换方法。通过分析汉英复杂名词短语的语义块和组合单元,利用边界感知策略,抽取汉语语言特征词,为汉语复杂名词短语中组合单元边界识别编制了57条识别规则,设计了合并策略,得到汉语复杂名词短语的形式化结构。通过对比汉英复杂名词短语的差异,确定了汉英复杂名词短语的转换策略。最后,将识别规则、合并策略和转换策略应用到一个机器翻译系统中。测试结果表明,所提方法可以有效地实现复杂名词短语的识别和转换,提高专利文本中复杂名词短语的机器翻译效果。
其他文献
背景:目前获取原代皮质神经元和星形胶质细胞的方法很多,传统方法通常是分别获取这两种细胞,但实验方法过于繁琐且浪费实验材料。找到一种简单、经济、可行并同时提取这两种细胞的培养方法尤为重要。目的:观察同时提取培养SD乳鼠大脑皮质神经元及星形胶质细胞的效果及注意事项。方法:选用出生24 h内的SD乳鼠,用体积分数为75%乙醇浸泡消毒,待乳鼠昏迷后断脊处死,沿乳鼠颈部用剪刀离断头颅并放入装有高糖DMEM的
<正>2022年,党的二十大顺利召开,“十四五”规划施行进入关键阶段。这一年,在文化产业、传媒产业、科技产业的相关政策和管理文件,也对传媒业的发展带来了重要的影响。持续推进内容体系化精品化建设内容建设是全媒体传播体系建设的根基,更是体系价值实现的重要载体。在2021年国家强化内容导向、扶持重大题材的良好基础上,本年度的系列政策坚持拔高内容建设标准,更为深入地推进各内容赛道精品化发展。同时,在内容形
期刊
20世纪90年代起,我国学术界开始构筑“中国边疆学”的探索,30多年来取得积极进展又存在争鸣、分歧。当前,中国边疆学作为“具有重要现实意义的新兴学科和交叉学科”,其学科体系、学术体系、话语体系建设已具备“天时”“地利”“人和”的有利条件,今后一定时期将以中国边疆历史自主知识体系为基础,构建中国边疆学自主知识体系;加快构建学科体系,努力成为“新兴交叉学科”的一级学科;多学科融合,多机构合作,协同攻坚
目前,农业领域种质资源数据的共享管理工作大多采用中心化的数据共享模式,存在数据泄露、易篡改等问题。根据区块链技术具备的去中心化、安全可靠、防篡改的特点,提出一种基于区块链的种质资源数据安全共享系统,采用以太坊框架设计基于区块链的种质资源数据安全共享系统模型,针对用户身份数据和种质资源数据提出“IPFS+区块链”的链上链下协同存储模型,使用非对称加密技术确保种质资源数据安全性和用户身份数据隐私性,通
本文在乡村振兴战略背景下,以东莞市“美丽乡村”建设工程项目佛子凹村为研究对象,秉承“开发与保护”的设计原则,以人为本,因地制宜地结合当地莞邑文化特色,挖掘潜在的景观资源和人文内涵,在尊重村落原始格局的前提下,提取特色文化符号,从广场景观、建筑景观、街巷景观三个方面进行景观改造,建设具有独特魅力的村镇景观,为传承中华传统文化与建设美丽乡村提供思路和借鉴。
<正>2022年11月24日至25日,自治区地方志办领导先后到组织关系所在党支部以及联系指导党支部开展学习宣传贯彻党的二十大精神专题党课宣讲。11月24日,自治区地方志办党组书记、主任、学习宣传贯彻党的二十大精神工作领导小组组长梁金荣到组织关系所在地情信息部党支部及联系指导的市县志工作部党支部作学习贯彻党的二十大精神专题党课宣讲。梁金荣从如何看、怎么办两个方面对党的二十大精神进行了系统阐释,
期刊
<正> 文献中关于蜜蜂采集棉花的花蜜和花粉的材料常相矛盾。有些作者(C·K·茨岡可夫—1953)竟作出了这样的结论:认为蜜蜂不仅不采集棉花花粉,甚至在离开田野之前要落到植物上,仔细田地把落到茸毛上的花粉从身上清除掉。由于这个问题在文献材料中的矛盾,我们在阿捷尔拜疆共和国
期刊
阐述物联网技术设计了一款智能液压控制系统,结合ZigBee无线传感网及继电器控制,实现了工业锅炉的液压检测,以低功耗网关为核心控制器,通过移动平台实时监控锅炉液压状态,异常情况下自动发送报警信息,能够智能地对各种突发情况下锅炉液压临界液面进行处理。