汉语最长名词短语的自动识别

来源 :软件学报 | 被引量 : 0次 | 上传用户:ylm1982123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对包含5573个汉语句子的语料文本中的最长名词短语的分布特点的统计分布,提出了两种有效的汉语最长名词短自动别算法;基于边界分布概率的识别算法和基于内部结构组合的识别算法。实验结果显示,后者的识别正确率和召回率分别达到了85.4%和82.3%,取得了较好的自动识别效果。
其他文献
海量信息的模式提取是网络环境下海量信息集成研究的难点.给出了一种新的局部精确模式提取及其增量保持方法,通过探测目标集的路径距离,利用Hash类及其路径距离操作,将模式的
我们知道,二次函数f(x)=ax2+bx+c的拉格朗日(Lagrange)插值公式是f(x)=f(x1)·(x-x2)(x-x3)(x1-x2)(x1-x3)+f(x2)·(x-x3)(x-x1)(x2-x3)(x2-x1)+f(x3)·(x-x1)...
在研究传统形态算法的基础上 ,将凸多面体的形态和算法简化为面与面的形态和 ,结合三维物体的法矢球模型 ,引入参考平面的概念 .参考平面将三维空间的凸多边形分解成两部分 ,分别计算对应的两部分的形态和 ,并去掉重复边和面 .提出一种凸多面体的快速形态算法 ,与传统方法相比 ,该方法简单、直观 ,算法效率可提高 6~10倍 .实验证明 ,该方法是可行的、有效的
现有的快速外存模型简化方法一般是对模型进行近似均匀采样 ,无法根据细节分布对模型进行不同程度的简化 ,从而对于细节分布非均匀的模型失真较大 .给出一种快速的外存模型简化方法 ,用于对无法一次装入内存的大型几何模型进行简化 ,大大改善了细节分布非均匀的模型的简化结果 .该方法首先均匀采样 ,对外存模型快速生成初始简化模型 ,生成的同时计算原模型特征的统计信息 ,然后依此对初始简化模型进行细节迁移和局
提出了一种适合于纯软件H/PC语音压缩与重放的高音质、低复杂度的5kbps语音编码器—— PS-ACELP(pre-search algebraic-code-excited linear-prediction).这个编码器的语音质
作为一种应用系统从位于Internet上的远程服务结点获取数据和计算性服务并进行集成处理的机制,Internet市场受到了广泛重视。该文给出了一种基于扩展标记语言的Internet市场服务描述方式,它较好地权衡了
复合函数在构造初等函数方面起着重要作用,它也是高等数学中的一个重要概念。理解并掌握好这一概念是学好微分与积分运算的关键。本文将由两个函数构成的复合函数的概念推广到