浅析句群划分的基本依据

来源 :北京师范大学,中科院声学研究所 | 被引量 : 0次 | 上传用户：yxzapricot

【摘要】

：

语言知识处理的新发展为语言研究提出了新的要求，为了能够更准确地获取语义内容，句群研究显得尤为关键。本文结合HNC(概念层次网络)的相关理论，从句群中各个句子之间的语义关系出发，探寻汉语句群在语言概念空间中的组合原则及表达特点，得出划分句群的依据，为HNC篇章处理中的语境单元萃取环节探索道路。文章最后按照不同的语义组合规则，对句群的分布情况进行了统计，以验证所得的句群划分依据。

【作者】

：

吴晨张全

【机构】

：

中国科学院研究生院北京 100039;中国科学院声学研究所北京 100080 中国科学院声学研

【出处】

：

北京师范大学,中科院声学研究所

【发表日期】

：

2005年1期

【关键词】

：

汉语句群语境单元 HNC理论组合原则

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于隐马尔可夫模型的咳嗽声识别研究

本文通过对咳嗽声特性的分析,首先利用短时过零率和短时能量对咳嗽声进行端点初步检测,然后提取咳嗽的Mel频率倒谱系数作为特征参数,使用隐马尔可夫模型进行训练,建立咳嗽模板库。对所获得的234个样本进行训练和测试性识别,其中78个为训练样本,两组咳嗽测试样本和两组声音测试样本各为39个,识别系统把测试组咳嗽正确识别率为85.53％,把测试组声音错误识别为咳嗽的概率为7.89％。实验证明,通过将咳嗽声的

会议

语音识别咳嗽模型实验语音学数理语言学

HNC的字知识库

字知识库是汉语理解处理不可缺少的资源,HNC的字知识库以描述汉字的动态组合知识为中心内容。HNC字知识库内首先定义了单用系数和组词系数来描述汉字的组合能力,然后具体描述汉字的组合知识。对汉字组合知识的描述有两个方面,一是跟什么样的概念或词语组合,二是组合之后的结果是什么。如果组合之后形成能充当特征语义块的词语,那么就要描述其句类和相应的句类知识。字知识库的建设需要跟词语知识库和小专家库的建设密切配

会议

汉字知识库概念层次网络句类知识词语组合

普通话水平测试等级标准的声学研究和数据库建设

1994年10月国家三部委颁布了《关于开展普通话水平测试工作的决定》和《普通话水平测试等级标准(试行)》，有关部门发布了《普通话水平测试大纲》。通过几年的实践，《普通话水平测试等级标准(试行)》经国家语言文字工作委员会再次审定作为部级标准，于1997年12月5日正式颁布。作为国家的一个法定的标准，只有“语音标准”、“语调自然”、“表达流畅”、“发音基本标准”、“发音不到位”、“动程不够”、“调值不

会议

普通话水平测试等级标准声学数据数据库建设语音标准

基于大规模日志分析的网络搜索引擎用户行为研究

用户行为分析是网络信息检索技术得以前进的重要基石,也是能够在商用搜索引擎中发挥重要作用的各种算法的基本出发点之一.为了更好的理解中文搜索用户的检索行为,本文对搜狗搜索引擎在一个月内的近5千万条查询日志进行了分析.我们从独立查询词分布、同一session内的用户查询习惯及用户是否使用高级检索功能等方面对用户行为进行了分析.分析结论对于改进中文搜索引擎的检索算法和更准确的评测检索效果都有较好的指导意义

会议

网络信息检索搜索引擎用户行为点击信息日志分

基于树核函数的实体关系抽取方法研究

实体关系抽取是信息抽取中的一个关键任务,其目的是找出文本中实体对之间的语义关系。本文阐述了一种改进的基于树核函数的实体关系抽取方法,在路径包含树的基础上,加入了与实体相关的语义信息,并对原有的树进行裁剪,消除一些冗余结构。在ACE 2004语料上进行实验,性能有了明显的提高,F值达到了71.99％。

会议

文字处理语义分析树核函数数理语言学

基于构成模式的汉语机构名识别

汉语机构名识别是现代汉语未登录词识别中最难实现的一项,至今未能找到十分令人满意的解决方法。本文提出了一种基于构成模式的汉语机构名识别方法，其基本思想是根据机构名的构成模式,建立模式的转移矩阵，在转移矩阵的基础上用自动机算法实现中文机构名的自动匹配。

会议

汉语处理中文机构名机构名识别数理语言学

中文信息处理技术和成果在对外汉语教学中应用初探

21世纪是信息社会，时代呼唤和要求我们讨论和创建新的教学模式和手段，更好地实现教学的现代化、数字化，发挥多媒体技术在教学中的作用。伴随着计算机技术、网络技术等的迅速发展，汉语热的兴起，对外汉语教学事业在信息社会也面临着新的机遇和挑战。本文将探讨中文信息处理方面的技术和成果如何在对外汉语教学中发挥其作用，为改变旧有的教学方式、模式服务。

会议

对外汉语教学中文信息处理教学模式网络教学

台湾泰雅语的语言流失、转移与振兴——以新竹尖石水田部落为例

台湾南岛语保存了早期南岛语的特征,在南岛语族谱的位置最高,非常接近原始南岛语,在南岛语研究中有无可取代的重要地位。然而这样珍贵、重要的文化资产却在快速的消失中,由于台湾过去‘独尊国语’的语言政策,导致台湾原住民语严重地流失并转移至强势语言。我们亟需对此现象作深入的调查研究,分析语言流失与语言转移的现象及成因,并积极思考语言振兴之道。本文选择位于台湾北部、与现代文明接触较为频繁的泰雅语,以尖石乡的水

会议

汉语方言台湾南岛语语言文化语言流失

必然类语气副词的范围与限定

语言的基本功能是描述我们对客观世界的认识和调节我们的人际关系。客观世界是无限的，而我们对客观世界的理解和认知却是有限的，当我们用语言来再现对客观世界的认识和理解时，就会想方设法在言语表达中加上我们的主观判断、态度或情感。当我们想对自己讲的命题成功性和有效性作出确定性判断时，就会采用必然语气。本文对语义框架的确立进行介绍，简述了词语用法范围的界定。笔者试图对“必然、势必、一定、必定、准保”的语义结构

会议

语气副词语义结构现代汉语词语用法范围界定

复句静态本体模型初探

目前，中文信息处理在字和词两个层面上的研究已经出现了一批较为成熟的实用技术。在此基础上，中文信息处理的研究应该上升到面向短语和句子的层面上，并进一步提升到汉语言文字的网络信息处理上。中文信息处理所面临的已经是句法、语义、语用、篇章等深层次问题，而这在我国目前却还是明显的弱项，严重制约了中文信息处理应用系统的研究。本文在我们独立研制的大规模复句标注知识库的基础上，从中文信息处理所面临的句法、语义、语

会议

复句本体模型小句本体元模型中文信息处理语义网元模型

浅析句群划分的基本依据

与本文相关的学术论文