【摘 要】
:
在深入分析同指消解技术难点的基础上,结合多语种同指消解的特殊要求,该文提出了一个多语种同指消解模型.该模型使用了基于规则分析技术的规则消解法和基于语料库统计学方法
论文部分内容阅读
在深入分析同指消解技术难点的基础上,结合多语种同指消解的特殊要求,该文提出了一个多语种同指消解模型.该模型使用了基于规则分析技术的规则消解法和基于语料库统计学方法的显著因子消解法,规则消解法可以将具有基本确定性的同指关系迅速消解出来,而显著因子消解法可以将规则消解法不能很好处理的同指现象利用统计学的方法消解出来.二者互相补充,相辅相成.本模型创新性体现在多个方面,如在构建先行语集合上具有一定的扩展性,保证了系统的健壮性;由于同指规则的使用,系统在某些情况下可以不进入显著因子消解过程,直接由规则消解过程即可得到先行语,提高了系统的效率;显著因子权值的获取采用了基于语料库的机器学习的方法,避免了手动赋值的主观性和盲目性.在多语种同指消解模型的基础上,该文详细描述了中英文同指消解系统的设计和实现;这个过程很容易就可以扩展到其它语种设计和实现上.在规则消解过程中使用基于Prolog语言的规则表示形式,规则可以独立程序进行添加、修改和删除,使该同指消解系统具有很好的可维护性和可扩展性.从该算法目前取得的一些初步的结果看来,这是行之有效的.最后总结了本多语种同指消解模型的优点、不足,提出了进一步改进和完善的方向.
其他文献
该课题主要致力于数据仓库实视图维护算法及其应用的研究,主要的研究工作和创新成果可概括为以下几个方面.第一,提出了基于Agent和基库的三层数据仓库体系结构.该课题针对传
移动代理是一种新的分布式计算模式,安全是其必须解决的重要问题。本文针对基于Java移动代理系统的主机安全问题,提出一种解决方案。该解决方案从保护主机和保证移动代理合法性
翻译系统采用基于统计和使用语义交集的方法,充分利用各种统计的方法和语义的方法所得到的信息来完成WORDNET节点翻译. 电子词典是机器翻译的基本模块之一.通过把通常的电子
进化算法是模拟生物自然进化过程的一种随机搜索方法,遗传规划是进化算法的一个重要分支。近几年的研究和应用十分广泛,主要在机器人路径规划、符号回归和机器学习等方面。
该文基于分布式虚拟现实技术,分析其构成要素,结合Java API,采用C/S结构,提出了基于VRML的多用户共享虚拟环境,该原型系统具有初步的场景状态的一致性维护和多用户协同感知功
该文以数据聚类技术为主要研究对象,在分析原有聚类算法存在的不完善之处的基础上,采用了计算智能中一些先进的算法对模糊聚类问题进行了优化研究,提出了多种混合聚类算法,取
该文分为两大部分,第一部分是语音评估产品的评估算法和应用系统,第二部分是产品评测方法.第一部分对语音评估系统作了深入的分析,将其分为评估算法和应用系统,评估算法属于
该文简单介绍了网络管理系统、IPv6协议和SNMP协议,对RMON规范进行了系统的分析,并研究和探讨了在IPv6环境下,支持RMON v1/v2规范的代理软件的实现.该项目以支持IPv4/IPv6双
该文介绍了嵌入式系统的基本概念、系统组成、应用开发和未来的发展趋势.着重论述了基于嵌入式实时操作系统uC/OS-Ⅱ的TCP/IP协议栈中IP、ARP和UDP三个模块的研究与实现,并引
为了科研和教学的需要,同时为了完成上海市教委基金项目,我们自主开发了简单实用的EDA平台,作者完成的是VHDL语言在寄存器传输级的开发工具—VHDL-R语言的编译模拟系统.作者