基于“动态流通语料库”进行“有效字符串”提取的初步研究

来源 :全国第六届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:lgmdjsb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了“有效字符串”的概念,试图找到从大规模中提取这种字符串的新方法.主要是以“流通度”理论为核心,通过对语料进行周遍切分并辅以“复合词典系统”,计算字符串的“流通度”.最终得到一个能够动态更新的词表.目前的方法还是试验性的,并且借鉴了前人丰富优秀的研究成果.
其他文献
n-gram作为语言处理模型已经广泛应用于语音识别系统中,但处理结果中经常出现错误.本文指明影响语音识别错误产生的主要因素,制定了基于概念层次网络(简称HNC)句类分析技术的
随着我国经济的迅速发展,人们对于土地的利用频率也开始增强.就当前我国土地利用情况来说,为了使土地利用的更加合理,需要相应的部门去进行总体的规划,保证土地的利用率.本文
房屋建筑工程施工中,混凝土是一种极为重要的原材料,其整体性能十分优越,但使用期间不可避免的会出现裂缝问题,,这对于建筑工程的整体质量有着非常不利的影响.所以,在今后的
近一年来我们测试了国内外一些主要的英汉/汉英机器翻译系统,对它们的译文质量进行了较细致的分析,目的是探讨机译研究的真正的现状,寻求未来研究的突破口.从分析中我们愿意
为什么现在的蚊子变得这样厉害,用多种杀虫剂也灭不了?杭州市疾病预防控制中心日前完成的一项研究课题,揭开了杭州蚊子“多药不倒”的内幕———蚊子体内逐渐产生出一种抗药
本文主要论述岩土工程勘察基础技术的研究分析探讨,仅供参考!
通过首字hash在词典中查找单词是汉语计算中很常用的一种算法,但该方法有明显的缺陷.本文提出两字hash算法,在相同的空间占用下,查找效率有很大的提高,而且hash表大小可以自
建筑工程的渗漏问题是现在的工程项目经常出现的问题,降低了建筑工程的运营质量,在严重的情况下还会引发安全事故,是一项较为严重的项目质量问题.因此,在今后的项目建设中,需
当今社会经济发展迅速,社会对于工程建设的需求与日剧增,而岩土工程施工因其大多工序在地下进行,隐蔽性强;岩土地形多样,施工方式复杂,施工难度较大;施工选址对于环境要求苛
本文以河南省机西高速纤维毯防护边坡工程为例,探讨了有机肥、配方肥料、普通肥料的施用量确定方法,并且对每种肥料的利弊进行了分析,可以为高速公路边坡生态恢复工程提供施肥技