CCD构造模型及VACOL辅助软件的设计与实现

来源 :第一届学生计算语言学研讨会 | 被引量 : 0次 | 上传用户:laoye1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作者依据自己在北大计算语言所CCD(Chinese Concept Dictionary)项目的工程实践,提出了CCD的构造模型.该模型强调双语词典(Bilingual Lexicon)构造中的继承(Inheritance)和转换(Transformation)的思想,希望从现有WordNet的英语单语词汇语义信息出发,通过词典编篡者的翻译和可视化操作(Visualized Operations),逐步实现由WordNet到CCD的计算性转换(Computational Transformation),自然地得到一个汉英对应的双语语义词典,从而大幅度提高此类词典编篡的质量和效率.针对该构造模型,作者设计并实现了一个可视化的辅助词典构造软件VACOL(Visualized Auxiliary Construction of Lexicon),该软件目前在计算语言所已得到大规模的应用.作者阐述了VACOL软件的设计原理,对其中涉及的一些关键算法和技术,如WordNet词汇语义信息抽取、数据敏感的树结构建立及其可视化操作等,也简要做了介绍.
其他文献
本文介绍一种与CFD相结合的,用于混流式水轮机转轮形状设计的最优化算法--多目标遗传基因算法(MOGA).这种系统能够根据目标函数自动生成优化的转轮形状.此系统已经应用到比转速为80mkW的混流式水轮机转轮的设计中,分别取三个工况点的水力损失为目标函数,通过优化能够获取具有不同水力性能的优化转轮.从对这些转轮的模型试验结果来看,优化的转轮在宽广的运行区域内,水轮机效率有了很大的提高.
本文介绍了WFB-800发电机-变压器组继电保护装置在三峡右岸电站大型水轮发电机组上的应用,介绍了如何实现双套主保护、双套后备保护、双套异常运行保护的配置方案,并论述了在实现主保护时应用的一些新技术,以及针对一些特殊保护所采用的实现方法.
油中溶解气体分析(DGA)是油浸电力设备常规使用的重要监测手段.近年来发展的在线溶解气体分析技术与以往的离线溶解气体分析相比有许多新的特点,本文通过对三峡水力发电厂在线溶解气体数据的分析、应用,揭示了在线数据高采样频率所显示的特点;通过实例阐述了利用在线溶解气体数据对充油电力设备维护的辅助决策作用;阐述了利用在线数据建立变压器产气数学模型,对变压器的状态进行数学分析的方法.
电力标准化工作是电力工业重要的技术基础,对规范电力工业的技术行为、保证安全经济运行、保护环境、推动技术进步、促进企业管理水平的提高起到积极的作用.本文介绍了电力标准化的管理体制,归纳总结了电力标准化工作所取得的成绩,阐述了电力标准化工作在水电建设中的作用,提出了"十一五"期间水电标准化工作目标.
本文介绍了ABB公司的SMTS RT型便携式同步电机实时仿真器,它基于笔记本计算机,是一个功能强大的工具,用于AVR设备实时测试时,可进行下列工作:1)励磁设备的实时稳态和暂态测试;2)人员培训;3)AVR,限制器和PSS行为的预估研究;4)研发.仿真器包括所有与同步电机相关的元件,如调速器、轴负载(电动机方式下)、单元变压器、精简电网、灭磁电阻、励磁系统、旋转励磁机和静止励磁机等.
厂坝铅锌矿选矿工艺经过10年的研究与生产实路,实现了铅锌完全分离,产出了单一铅精矿和锌精矿。多次改进工艺流程,提高了精矿质量,达到了锌精矿SiO含量小于4℅的要求。从而产生显著的经济效益。文章就提高铅锌回收率的相应对策以及工艺的发展趋势提出若干建议。
未登录词的识别一直是汉语分词研究的焦点和难点,本文通过对各类未登录词的用字频率及上下文进行了详细地分析,提出一种基于混合策略的未登录词识别方法.实验表明,该方法对于多种未登录词的整体识别取得了较好的结果.
本文全面总结了语料库的几种数据管理方式,分析了各自的长处和不足,可以供语料库建设研究者参考.本文还提出了开发通用语料库管理系统的思想,讨论了通用语料库管理系统应该具备的功能,设计了通用语料库管理系统的体系结构,这种设计思想对于其他的文本数据库的建设也有实际意义.
本文以《现代汉语新词语信息电子词典》的已有成果为基础,以大规模真实语料的统计数据为依据,用统计数字来描述动词的各项语法属性,说明新词语动词的特点.
本文简要介绍了R.C.Schank的动态记忆结构,详细阐述了HNC语境的定义及HNC语境的三要素:领域、情景和背景,并且给出了HNC语境形式化表述的具体例子和方法,最后通过对比动态记忆结构和HNC语境,指出了两者的异同.