基于NN-LSVM的日语依存关系解析

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户：sunyanzi168168168

【摘要】

：

日语依存关系解析是基于日语依存文法,确定句子中各个文节间的依存关系.为提高解析精度,提出一种基于NN-LSVM对大规模训练语料进行修剪的日语依存关系解析方法:使用LSVM和NN

【作者】

：

周惠巍李巍黄德根

【机构】

：

大连理工大学计算机系,大连,116024

【出处】

：

全国第八届计算语言学联合学术会议

【发表日期】

：

2005年期

【关键词】

：

日语依存关系解析训练语料依存文法训练样本精度京都大学解析方法语料库解析器修剪分类测试

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

日语依存关系解析是基于日语依存文法,确定句子中各个文节间的依存关系.为提高解析精度,提出一种基于NN-LSVM对大规模训练语料进行修剪的日语依存关系解析方法:使用LSVM和NN删除对分类没有作用的,甚至起反作用的训练样本,再经训练得到解析器.用京都大学语料库进行测试,结果表明在解析精度和解析速度上均得到一定的改善.

其他文献

Windows平台下朝鲜文输入法实现详析

目前计算机已经成为我们工作、学习、娱乐的必备工具,而输入法是我们使用计算机所必须要接触的部分.如果输入法设计得当,那么必将提高计算机的使用效率和人机交互的友好性.本

会议

平台朝鲜文输入法计算机输入码序列人机交互分析方法友好性娱乐学习效率设计键盘工具

基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析

词表对于中文信息处理等领域具有重要的价值和意义.作者对从2002年10种主流报纸中提取的两个词表(流通度表和使用度表)前3000词语进行了比较,如果把使用度词表作为初表,对比

会议

现代汉语基本词汇先验集的考察分析研究

基本词汇是词汇的核心,是汉语教学、语言本体研究及信息处理领域的基础.当前对基本词汇的研究还远远不够,还没有一个现实存在的基本词汇集,更没有对其量化测定的手段,本文介

会议

汉语教学基本词汇先验集语言本体研究自动提取信息处理量化测定动态流通词汇研究语料库计算机词汇集特性考察基础

高频最大交集型歧义字段问题研究

交集型歧义是中文分词的一大难题,建立大规模高频最大交集型歧义字段(MOAS)的数据库,对于掌握其分布状况和自动消歧都具有重要意义.本文采用全切分方法,在4亿字人民日报语料

会议

相似词及其在计算机辅助校对系统中的应用

统计方法在自然语言处理的多种应用中取得了令人瞩目的成果,但数据稀疏问题限制了应用系统性能的提高.把统计单位由词提升到词类有助于缓解数据稀疏问题,但是传统的词类体系

会议

英汉双语自动对齐混合算法

本文根据现有对齐算法,提出了二次对齐思想,并重新修改了句子对齐评分规律,更好的把基于长度和基于词典的算法结合起来,同时优化了一些辅助算法,使计算效率和实用效果都达到

会议

英汉双语句子对齐辅助算法同时优化实用效果计算效率修改了思想评分规律词典长度

一种基于suffix arrays的快速翻译方法

面向限定领域的特定任务翻译服务,在有限资源的掌上电脑(PersonalDigitalAssistant,PDA)上实现快速语音翻译这一实际问题,本文提出了一种基于suffixarrays数据结构的快速翻译

会议

多策略机器翻译系统IHSMTS中类比译文构造算法

译文生成是任何机器翻译系统所要解决的重要问题之一,也是机器翻译的最终目的.从本质上来讲,不管采用何种翻译方法,译文生成都要完成两个任务:一是源语与目标语之间的句法结

会议

基于HMM的短语翻译对抽取方法

在基于语料库的统计翻译方法中,基于短语的统计翻译与基于单个词的统计翻译相比可以更好地处理句中词语之间的关系,从而有效地提高机器翻译系统的性能.在基于短语的统计翻译

会议

短语翻译对自动抽取翻译方法统计机器翻译系统性能双语语料词语对齐处理语料库词对齐知识量具基础策略

简明状态句及其汉英句类和句式转换

无谓语动词句(无动句)的理解和处理历来是汉语自然语言处理的一个难点,基于动词中心论的语言学理论对于无动句的描述和解释是非自足的.HNC理论定义了四组无特征语义块句类(无

会议

简明状态句汉英句类汉语自然语言处理语言学理论特征语义块动词中心论语义结构描述句式转换翻译探讨动词句谓语解释机器规律

基于NN-LSVM的日语依存关系解析

与本文相关的学术论文