【摘 要】
:
通过对包含 5573个汉语句子的语料文本中的最长名词短语的分布特点的统计分析 ,提出了两种有效的汉语最长名词短语自动识别算法 :基于边界分布概率的识别算法和基于内部结构
【机 构】
:
智能技术与系统国家重点实验室!北京100084; 清华大学计算机科学与技术系!北京100084;
【基金项目】
:
国家自然科学基金! (No.6 970 5 0 0 5 );中国博士后科学基金! (No.970 0 5 )资助
论文部分内容阅读
通过对包含 5573个汉语句子的语料文本中的最长名词短语的分布特点的统计分析 ,提出了两种有效的汉语最长名词短语自动识别算法 :基于边界分布概率的识别算法和基于内部结构组合的识别算法 .实验结果显示 ,后者的识别正确率和召回率分别达到了 85.4 %和 82 .3% ,取得了较好的自动识别效果 .关键词 最长名词短语 ,边界识别 ,句法分析 .
其他文献
<正>一、企业并购财务风险的界定关于企业并购的财务风险,已有多种定义。赵宪武认为,企业并购财务风险是指并融资以及资本结构改变所引起的财务危机,甚至导致破产的可
目的筛选膀胱尿路上皮癌与癌旁组织中差异表达长链基因间非编码RNA(long intergenic noncoding RNA,lincRNA),并探讨其可能作用机制。方法收集2011-01-04-2011-02-18中山大学孙
<正>世界上有多少头牛,说法不一。据苏联《国外农业》杂志1983年第5期报导,目前世界上约有1,332,200,000头牛,而据《国际农业杂志》1983年第2期版载,有1,020,000,000头。其中
现代音乐美学不仅关注音乐作品本身,也渐渐开始研究音乐表演艺术。一个音乐作品被表演出来,不可以简单看出重现,更是一种新的创作,要经过演绎者、编剧人的几度揣摩与表现,变
<正> 过去20年,登革出血热(DHF)已成为流行病学、病毒学和免疫学研究的重要课题。其病因及免疫机理在发病机理中可能起何种作用,也成为争论的焦点。本文评述目前关于这个问题
介绍了酸奶的营养保健作用,搅拌型酸奶的生产工艺及储藏试验。
<正> 递推法是组合数学中的一个重要解题方法,许多著名问题(如menage问题、更列问题、跳蛙问题等)用递推法来解显得精巧简捷。鉴于这一方法在升学和竞赛中应用越来越广泛,掌
词汇习得直接影响了学生的二语学习。囿于语言环境的不足,二语学习者在其二语词汇的习得过程中,往往会有意无意地借助于母语的词汇概念知识,通过对非英语专业的学生在其二语
中国家具市场的竞争,归根结底是品牌的竞争。品牌直接决定市场。品牌发挥出巨大功能,必将刺激、驱动家具行业加快“品牌运动”。中国优秀家具企业已经悄悄地开始自我觉醒和自
社会性别概念产生于西方女性主义运动,是基于性别角色概念和女性主义概念而发展起来的。伴随着社会性别概念内涵的历史变迁,对它的测量也经历了性别角色理论和女性主义理论两