日语依存句法分析技术研究

被引量 : 1次 | 上传用户:jiachengpu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日语依存关系解析是日语句子解析的一项基本技术,主要基于日语依存语法来确定句子中文节与文节间的依存关系。句法分析是进行语义分析等深层自然语言处理的首要基础,是诸多自然语言处理应用系统不可或缺的一个重要环节。依存关系解析在机器翻译、信息抽取、自动问答等领域有着重要的应用。目前对日语依存解析的相关研究,重点都集中在对学习框架的修改上,机器学习算法大多采用支持向量机或其他基于边界和记忆学习的方法。条件随机场作为一种优秀的序列标注器,在序列标注方面有着出色的表现,被成功地运用在自然语言处理的任务中,并取得了很好的效果,但是在日语依存关系解析方面,却未见相关的报道。本文采用层叠组块算法和条件随机场相结合的方法进行日语依存关系解析,融入丰富的上下文信息,从整句的角度给予每个标注单元一个最优的标注结果。在日本京都大学文本语料库(Version 4.0)上的实验结果表明,该方法在不使用动态特征的条件下,依存正确率和句子正确率分别取得了很好的效果。规则方法作为统计方法的有益补充,仍被广泛的用于自然语言处理的诸多领域中。传统的规则获取是根据知识工程师的经验和知识手工编写,完全依赖于编写规则的知识工程师的语言知识,获取规则集合需要大量的人力和物力。针对传统的获取规则方法的不足,本文采用了基于条件随机场的错误驱动机制,将条件随机场的一次识别结果作为特征加入到条件随机场二次识别的特征模板中,利用统计方法来自动学习其中的错误规律,训练得到机器识别模型并进行纠错,在上述的语料库上的实验结果表明,该方法进一步提高了依存关系解析的效果。
其他文献
在以生产性方式保护非物质文化遗产的过程中,应合理界定地方政府行为,探求其在传统政绩观下的政策制定和执行,确定新理念指导下的本土立场和概念,避免非遗开发保护中因无法形
<正>5月17日,中国工业大奖第三届表彰大会在北京人民大会堂举行,新疆天业集团董事长吴彬代表新疆和兵团工业企业,在首都走上降重盛典的颁奖台,捧取了被誉为中国工业"奥斯卡"
利用福建省34个县(市、区)的林下经济实地调研数据,分析了福建省林下经济各类型以及各模式的效益情况,并对各模式的风险情况进行了评估,研究了福建省林下经济的开展和林农选择林下
"一中心四平台"体系可解决各类空间、立面、街面的"城市病"。在闹市,还在为停车泊位、寻找厕所烦恼吗?还在为突发事件忙乱成一团吗?在浙江省杭州市,"智慧城管"让这些燃眉之急都成过往
本文以重庆港寸滩集装箱码头结构为原型,通过对结构进行模型破坏试验研究以及三维数值分析,进一步研究了结构的水平承载破坏模式、水平集中力分配系数以及结构水平极限承载力
城市方面,在大规模快速的设计建造过程中,尽管为都市提供了许多环境优美、外形美观的住宅建筑,但很少考虑住宅建筑与人在时间里的关系。建筑因功能的老化不断被翻新,很大程度
为了扩展光学相控阵的角度扫描范围,研究了偏振双折射棱镜结构对角度放大性能的影响,分析了限制放大倍数和光束偏转效率的主要因素,并提出了相应的优化设计方法。研究结果表
学术界大都认为老舍早期小说《小铃儿》的主题是“宣扬爱国主义”。本文以文本细读为基础,从文化社会学角度探讨老舍有意忽略这篇小说的真实原因,剖析作品中流露出的满族情结
依据刑法学界通说,"牟利目的"是贩卖毒品罪的主观方面的必备因素。这一结论虽有其文义解释的根据,但从贩卖毒品罪所保护的法益角度考量,不宜将"牟利目的"界定为"贩卖毒品罪"
在日新月异的市场经济环境下,企业的发展面临着诸多挑战。企业从激烈竞争环境中脱颖而出,就必须重视企业发展的凝聚力。所以企业的凝聚力是企业持续发展的基石。作者通过搜寻