化合物名称中译英自动翻译系统的研究

来源 :第九届科学数据库与信息技术学术讨论会 | 被引量 : 0次 | 上传用户:q80602655
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
尽管现在有各种专业的化学词典可供化学工作者查询化合物中英文名称,但是如果不了解构词规律和命名方法,即使是具有一定英语基础的化学工作者,要把化学物质的中文命名翻译成英文以作学习工作交流之用,当名称复杂而繁多的时候,也会感到困难.本文研究了使用计算机翻译化合物中文名称的方法,实现了化合物名称中译英自动翻译.该系统根据化合物中文命名习惯和IUPAC系统命名法则,建立一套完整的翻译规则,针对各种不同类型的中文化合物名,分析并识别其各个名称片段组成,通过优化整合,最终得到化合物的英文名称.数据测试表明该系统能够较好地完成翻译,对常见化合物名称翻译成功率达95%以上.
其他文献
本文采用了一种新的方法对MOL格式化学结构进行压缩,同时使用改进的VF2算法来进行化学子结构检索以解决化学数据库检索和存储问题.
工业生物技术数据系统与知识环境建设针对中国工业生物技术领域的数据资源,开展调查研究,整合和集成工业生物技术研究必须的生物实物资源信息、专利信息、文献情报、产品信息、企业信息、政策等信息,建立综合知识仓库、开发智能检索引擎和信息化协同工作环境;针对若干科研人员的个性化需求,开展最新发展态势和核心关键技术信息的定制信息服务.将虚拟实验室和网格技术运用到科研活动中,是e-Science概念在工业生物技术
资源唯一标识符作为互联网环境下资源组织管理的基础设施,具有对数字资源对象进行标识定位和组织管理等功能.本文从科学研究信息化的角度出发,介绍了科学数据资源唯一标识符(SDBI)的研究背景和应用模型,分析了SDBI系统的框架结构,总结了目前的应用情况并提出了下一步的工作目标.
本文阐述了利用数据库及其软件技术对国家天文台兴隆观测基地的60/90cm施密特望远镜,进行远程观测web系统及其用户管理数据库的设计和开发,包括系统的需求分析和功能实现,体现了数据库与科研实践结合的强大优势和良好的发展前景.
本文通过对基于角色的访问控制系统的介绍和分析,使读者领悟到该模型的一般原理,并通过实例详细阐述了一种基于角色与权限控制相结合的权限管理系统的策略与实现技术.该技术在材料数据库应用系统中已被采用.材料数据库应用系统是中科院科学数据库及其应用系统项目的子项目.该系统的权限管理要求是依据《中国科学院科学数据库数据共享办法(试行)》制定的.
本文通过使用数据库触发器、SQL脚本,自动建立和维护元数据,同时形成数据索引表,从而实现多库联合自动发布.
测试是开发过程中一个关键的部分,直接关系着系统的质量.本文分析了B/S结构web应用系统中的主要测试工作、测试方法以及相应测试工具的优势,以HXMT协同工作平台为例,设计并实现了其测试方案,着重于功能测试和性能测试,对测试结果进行了归纳总结.
SRB(Storage Resource Brokcr)是美国圣地亚哥超算中心(SDSC)开发的一个数据网格中间件及其相关的工具系统,本文介绍了其发展历史及其目前在世界范围内的应用情况,对SRB的体系结构和关键技术进行了深入的分析,并结合实际的工作需求,构建了一个基于SRB的数据网格试验环境,最后探讨了未来的工作方向
本文简要介绍了化合物谱图检索系统的研究开发背景.主要描述了研发过程中系统架构设计以及对谱图数据的内容解析、匹配检索算法等几项关键技术的研究与实现,重点对JCAMP文件解析和匹配检索算法进行了描述.最后简要概括了系统初步实现的功能,以及此技术的广阔发展前景和尚待解决的问题.
知识本体是对概念体系的明确的、形式化、可共享的规范说明.基于知识本体来对专业知识进行表示和描述建立的专业领域知识库,在知识自动获取与处理方面,有着独特的优势.本文以植物分类学为例,基于来源于《中国植物志》的基础数据库,形成基于本体的知识库系统,从而应用于构建植物分类智能辅助系统中.这种方法的探讨将进一步促进计算机智能处理系统在科学数据库和e-Science建设方面的应用.