基于最短路径的二元语法中文词语粗分模型的研究

来源 :现代计算机 | 被引量 : 0次 | 上传用户:Mike_sun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词语粗分是分词后续处理的基础和前提,直接影响到分词系统最终的准确率和召回率。针对目前常用分词方法单一使用时存在的不足.综合机械分词的高效性和统计分词的灵活性,设计一种基于最短路径的二元语法中文词语粗分模型。实验结果表明,此粗分模型无论在封闭测试和开放测试中,还是在不同粗分模型对比测试和不同领域的开放测试中,都有较好的句子召回率。
其他文献
室内蠕变试验多采用分级加载的方式,如何使分级加载蠕变试验结果转换成分别加载的曲线更趋合理,是研究蠕变特性和建立蠕变模型的关键问题。通过对黄石、漳州、青岛地区软土采
学界对否定现象和否定范畴的研究成果颇多,但仍然有一些基本现象有待解释。现代汉语降格否定是汉语否定范畴的次范畴之一,降格否定在构成类别、内部结构、语义性质、表达功能
党的“十六大”确立2020年全面实现小康社会的发展目标,到2020年实现GDP翻两番,2010年实现第一个翻番。铁矿石作为国民经济发展的基础原料之一,对于像我国这样正处于工业化全
熟悉种类做到“三会”——谈化学用语的复习湖北常福生化学用语是化学上用以表示物质的组成、结构以及物质变化规律的符号和图式,化学用语是化学基本概念的重要组成部分,是初中
<正>香港导演王家卫曾经说过:"对我来说,电影总是光影与声音,而音乐正是声音的一部分。"又说,"音乐,不啻是气氛营造的需要,也可以让人想起某个年代。"一向,王家卫的电影音乐
以东北红豆杉树叶为原料,采用正相色谱和反相色谱法分离提纯了紫杉醇和三尖杉宁碱。反相色谱中使用了一种新颖的高分子填料。东北红豆杉枝叶经过一次正相色谱分离后,再经两次
近年来,网络语言越来越受到大众的追捧,这种新兴语言正以病毒式的传播速度渗透在人们的语言使用中。在此过程中,网络语言的语言模因逐渐显示出来,更加表现为一种修辞模因。不
经济全球化的今天,企业之间的并购已经从国内走向国外,并购事件也愈来愈频繁,各种各样的信息充斥着并购过程,使得并购难度加大。本文以X公司并购Y公司的案例入手,分析信息不
目的探讨舒芬太尼用于全身麻醉在老年高血压病人的麻醉诱导及气管插管过程中对血流动力学变化的影响。方法选择择期行腹部手术、ASAⅡ级老年高血压病人36例,术前均经过正规服