汉语最长名词短语的自动识别

来源 :软件学报 | 被引量 : 0次 | 上传用户：ylm1982123

【摘要】

：

通过对包含５５７３个汉语句子的语料文本中的最长名词短语的分布特点的统计分布，提出了两种有效的汉语最长名词短自动别算法；基于边界分布概率的识别算法和基于内部结构组合的识别算法

【作者】

：

周强孙茂松

【出处】

：

软件学报

【发表日期】

：

2000年2期

【关键词】

：

最长名词短语自然语言处理汉语自动识别 Maximal noun phrase boundary identification syntax parsi

【基金项目】

：

国家自然科学基金! (No.6 970 5 0 0 5 ),,中国博士后科学基金! (No.970 0 5 )资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

通过对包含５５７３个汉语句子的语料文本中的最长名词短语的分布特点的统计分布，提出了两种有效的汉语最长名词短自动别算法；基于边界分布概率的识别算法和基于内部结构组合的识别算法。实验结果显示，后者的识别正确率和召回率分别达到了８５．４％和８２．３％，取得了较好的自动识别效果。

其他文献

网络环境下海量信息的局部模式提取方法

海量信息的模式提取是网络环境下海量信息集成研究的难点.给出了一种新的局部精确模式提取及其增量保持方法,通过探测目标集的路径距离,利用Hash类及其路径距离操作,将模式的

期刊

半结构化数据模式提取数据模型信息集成INTERNETglobal information semistructured data extracti

拉格朗日插值公式的一个应用

我们知道，二次函数ｆ（ｘ）＝ａｘ２＋ｂｘ＋ｃ的拉格朗日（Ｌａｇｒａｎｇｅ）插值公式是ｆ（ｘ）＝ｆ（ｘ１）·（ｘ－ｘ２）（ｘ－ｘ３）（ｘ１－ｘ２）（ｘ１－ｘ３）＋ｆ（ｘ２）·（ｘ－ｘ３）（ｘ－ｘ１）（ｘ２－ｘ３）（ｘ２－ｘ１）＋ｆ（ｘ３）·（ｘ－ｘ１）...

期刊

拉格朗日插值公式中学数学教学

凸多面体的快速形态和算法

在研究传统形态算法的基础上 ,将凸多面体的形态和算法简化为面与面的形态和 ,结合三维物体的法矢球模型 ,引入参考平面的概念 .参考平面将三维空间的凸多边形分解成两部分 ,分别计算对应的两部分的形态和 ,并去掉重复边和面 .提出一种凸多面体的快速形态算法 ,与传统方法相比 ,该方法简单、直观 ,算法效率可提高 6～10倍 .实验证明 ,该方法是可行的、有效的

期刊

凸多面体参考平面计算机图形学快速形态机算法convex polyhedron morphologic addition fast algorithm

基于细节迁移的快速外存模型简化方法

现有的快速外存模型简化方法一般是对模型进行近似均匀采样 ,无法根据细节分布对模型进行不同程度的简化 ,从而对于细节分布非均匀的模型失真较大 .给出一种快速的外存模型简化方法 ,用于对无法一次装入内存的大型几何模型进行简化 ,大大改善了细节分布非均匀的模型的简化结果 .该方法首先均匀采样 ,对外存模型快速生成初始简化模型 ,生成的同时计算原模型特征的统计信息 ,然后依此对初始简化模型进行细节迁移和局

期刊

外存模型简化细节定位细节迁移计算机图形学outofcore simplification detail positioning detail shi

H／PC语音压缩与重放的实现

提出了一种适合于纯软件H/PC语音压缩与重放的高音质、低复杂度的5kbps语音编码器—— PS-ACELP(pre-search algebraic-code-excited linear-prediction).这个编码器的语音质

期刊

H/PC低复杂度语音压缩语音编码器语音通信Bit error rateComputational complexityComputer softw

输运现象中的“2λ^—”佯谬

期刊

输运现象“2λ^-”佯谬热学教学分子碰撞平均自由程输运过程

成教学生论文写作的优势、困难及解决方法

期刊

论文写作成人教育毕业设计