以“的”字结构为核心的最长名词短语识别研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:bianhao9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以"的"字结构为核心的最长名词短语是汉语最长名词短语的一个特殊子类。以该短语的自动识别为基础重新分化了汉语MNP的识别任务。在考察其结构和分布特征的基础上,提出"先识别右边界,识别成果参与左边界识别"的策略,并使用边界分布概率模型分治了左右边界。实验基于85万字的新闻语料上进行训练,并在42万字的同质语料上进行了开放测试,取得了80.63%的正确率和75.68%的召回率。
其他文献
期刊
已有的本体复合映射算法中,绝大部分都只能发现基于字符串比较的简单类型的复合映射,查准率和查全率不高。提出一种基于结点间包含关系和等价关系发现复合映射的方法。实验证
织物的剪切性能受到纱线和多种织物结构参数的影响,为了科学地设计织物剪切性能,提出了织物剪切性能预测的一种新方法-支持向量机,用它来表达织物剪切性能与织物结构参数之间
此清翁同毹(1830—1904年)两副楷书《劝课寄怀七言联》轴(图3、4)不同于上述各例中一件是真迹,另一件是复本的情况,这两副署名翁同簌的对联都是真迹(图5、6)。但据了解,翁同簖仅写过一
针对K-均值聚类算法对初始值敏感和易陷入局部最优的缺点,提出了一个基于自适应杂交差分演化模拟退火的K-均值聚类算法。该算法以差分演化算法为基础,通过模拟退火算法的更新
深入分析基于差别矩阵的属性核快速更新算法——FUAC后,指出引起该算法空间复杂度高的原因,在此基础上提出了一种不存储差别矩阵的改进核增量式更新算法,主要考虑对象动态删
法国浪漫主义绘画在世界画坛中具有举足轻重的地位。法国画家籍里柯(Theodore Gericault,1791-1824)是当之无愧的先导,也是浪漫主义绘画的奠基人。他于1819年创作的油画《梅
提出了一个Vague 集之间的相似度量公式,例子表明该公式的分辨力是较强的。在潜艇威胁等级判断中的应用进一步表明这个公式是实用的。
以“哈尔滨讲坛”讲座为例对图书馆巡回讲座的实践情况进行探讨,对存在的问题进行了分析,提出了可持续发展策略。
针对同时存在基数评价信息与序数偏好的情形,考虑每个属性下的决策者权重,为图书供应商选择建立混合型多属性群决策模型。对定性和定量属性分别用0-1规划和线性加权和法求出