《人民日报》标注语料的初步统计分析

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户：racerdan

【摘要】

：

本文介绍了作者在人民日报标注语料库分析上的一些经验,提供了相关的研究结果.采用统计技术对熟语料库进行研究,其目的是为了汉语的自动分析.统计结果表明,即使语料标注经过

【作者】

：

郭慧志刘华谢学敏张普

【机构】

：

北京语言大学应用语言学研究所,北京,100080

【出处】

：

全国第八届计算语言学联合学术会议

【发表日期】

：

2005年期

【关键词】

：

人民标注语料语料库技术自动分析统计学习方法语料库分析语料标注统计结果统计技术人工干预汉语词类研究语言学权益经验

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文介绍了作者在人民日报标注语料库分析上的一些经验,提供了相关的研究结果.采用统计技术对熟语料库进行研究,其目的是为了汉语的自动分析.统计结果表明,即使语料标注经过了人工干预,其标注不一致的现象仍然是存在的,而这主要是由于现代汉语词类研究这一传统语言学的难点造成的,采用统计学习方法进行自动分析只是权益之计,基于语料库技术对词类进行深入研究将是今后努力的方向.

其他文献

配价语法与词汇-语法

本文讨论配价语法与词汇-语法理论上及方法论上的异同并通过个案示例指出词汇-语法能为描写语言学和计算语言学相结合提供一个有效的平台.

会议

配价语法与词汇描写语言学计算语言学语法理论方法论平台

创新实现跨越发展科技提升保障能力——庆祝中国人民解放军建军80周年卫生装备建设成果撷萃

劈去朝露,沐浴荣光,我们的队伍向太阳。1927年南昌城头的一声枪响,伟大的中国人民解放军在号角声中宣告诞生。80年过去,弹指一挥间。光荣的人民军队在不断壮大中用忠诚和热血

期刊

中国人民解放军卫生装备南昌城弹指一挥人民军队劈去保障能力号角声筑起卫勤准备

名词短语:槽类型与定语类型和中心词语义类型对应关系

论文考察了名词短语中槽关系类型与定语类型的对应、槽关系类型与做中心词的名词的语义类型的对应,并讨论了各对应关系的特点和趋势.论文认为这些对应的特点和趋势可以为建立

会议

名词短语槽类型定语类型中心词语义类型特点和趋势关系类型论文对应关系处理模型计算机考察基础

词汇-语法理论在汉语研究中的适用性

为了适应信息时代的需要,国际上的语言研究越来越强调词汇主义,即句法研究要落实到词项上.对词项的句法个性进行描述,体现在由词入句时的分布特征和变换特征所整合而成的组配

会议

组合中文词义消歧

本文介绍了一种新的组合词义消歧法,该算法利用两种基本的分类算法构造了一个二级分类器.在Senseval3中文词汇样本任务的训练语料上进行了比较评测,结果表明,该组合分类器的

会议

组合分类器中文二级分类器训练语料算法性能算法利用算法构造词义消歧参数设置上下文鲁棒性样本选择评测词汇窗口

基于语境计算模型的词义消歧

本文提出相对词频的概念,据此建立起语境计算模型,利用歧义字段前后语境词语相对词频信息对多义词进行消歧.以"黄色"和"黄金"为例进行实验,封闭测试精确率分别达到99.41％和98.

会议

语境计算模型相对词频精确率试验结果歧义字段测试后语境多义词证明信息实验黄金概念方法词语

情境描述的构建方法研究

情境描述是基于情境的词汇语义学的核心和基础.本文首先介绍了我们构建情境描述的基本准则,然后通过"符合"情境的构思过程提出了情境提炼的基本方法,最后介绍了我们设计的情

会议

情境描述构建词汇语义学支撑平台语义词典认知图式认知过程开发平台基本准则基本方法资源设计人工基础构思

著名经济学家张曙光建议发行社会保障特别国债

阻碍当前经济复苏的关键在于人们的预期看淡,而预期不稳又与大批职工下岗待业使收入预期降低、社会保障和医疗制度改革使支出预期增大有关。 1999年计划增发3165亿国债。如

期刊

医疗制度改革张曙光收入预期职工下岗经济学家启动消费乘数基金管理国有企业社会保障基金

汉语人称代词消解的前端处理

本文讨论了汉语人称代词消解的前端处理所需要解决的两大问题:(1)潜在先行语的识别和捆绑处理(2)人称代词和先行语语法角色的识别.提出可能成为先行语的名词短语的捆绑算法以

会议

汉语人称代词消解先行语语法角色捆绑算法识别前端处理名词短语分析算法测试结果手工

基于Unicode编码的维、哈、柯文软件用户界面组件研究和实践

一个好的应用程序不仅要有强大的功能,还要有美观实用的用户界面.界面设计不仅是编程的问题,也需要一定的美学修养.本文基于Unicode编码的软件开发技术的研究基础上,对维、哈

会议

编码软件用户界面界面组件应用程序美学修养开发技术界面设计界面技术继承关系功能析出基础构建方法编程

《人民日报》标注语料的初步统计分析

与本文相关的学术论文