求解中文分词中新词发现问题的遗传模拟退火算法

来源 :云南大学 | 被引量 : 0次 | 上传用户:littleshrimp1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着中文地位的提高,自然语言处理中的中文处理技术也变的越来越多重要。中文自动分词作为中文处理技术的核心基础更是得到众多的学者的重视和研究,其中主要是针对歧义识别和未登录词识别(即新词发现)两个问题。目前已有较多学者和专家提出了一些解决方案,但是至今为止依然存在需要解决的问题。  针对中文自动分词存在的相关问题,本文利用遗传算法的并行操作和全局收敛性的特性,结合模拟退火算法的局部收敛性,提出了遗传模拟退火算法,包括相关编码及生存策略、动态交叉和变异因子、多次升温及记忆函数控制策略等。该算法设计求解了新词发现问题,并针对新华舆情监测系统进行相关设计应用。该算法用模拟退火算法解决了遗传算法中存在的“早熟”问题和进化后期收敛速度问题;用遗传算法解决了模拟退火算法缺乏全局性搜索的能力,使其在当前的解空间中可展开多处局部搜索,从而较好地搜索了整个解空间。最终算法充分发挥了遗传算法的快速全局搜索性能和模拟退火算法的局部搜索能力,既提高了搜索精度,又改善了进化后期效率,有效地解决了新词发现问题。最后通过实验分析与新华舆情监测系统中的实际应用,对算法的性能及效率进行有效的验证。  本文主要创新点有:  1、有效地结合了遗传算法与模拟退火算法;  2、将遗传模拟退火算法应用到中文分词中的新词发现求解;  3、提高新华舆情监测系统中的新词发现的效率和准确率。
其他文献
该文深入讨论了Microsoft公司的基于WindowsNTServer和Backoffice的Intranet解决方案.该文的结构如下:第一章引言,第二章Intranet进行了简单介绍,第三章对Microsoft公司的基
怪波在非线性动力学中具有很高的研究价值,在海洋、大气、金融等方面有很多的应用,是当今数学物理界研究的热点.怪波是一种新的非线性现象,与孤立子很类似,是一种特殊的孤立波解.
班级是每个学生在校生活的“家”,它是学生实现成长和社会化的重要基础。如何对班级进行有效的管理,让班主任外在的“不管”形式真正实施了内在的“管”的实质。本文主要结合自
在电力系统中,配电变压器是必不可少的设备之一,而且数量多,应用非常广泛。所以配电变压器在配电网中的功率损耗成为了不可忽视的问题。随着社会的发展,节能减排越来越成为社会关注的焦点,实现可持续发展也成为我国经济发展的重中之重。实施配电变压器经济运行有利于降低配网损耗,减少运维成本,从而提高企业的经济效益。因此,配电变压器的经济运行的研究已经成为了社会发展的重要课题。本文以双绕组配电变压器为依据,在变压
学位
本文通过对荣华二采区10
期刊
本文主要研究了时滞的非自治的反应扩散方程的解、正向吸引子和反向吸引子的存在性:{(θ)u/(θ)t-△u+αu2p+1=f(t)+h(t,ut)在(τ,T)×Ω中div u=0在(τ,T)×Ω中u=0在(τ,T)×Γ
该文提出了一种表示三维实体的新的边界表示法,它是在多边形平面法的基础上为每一个实体定义一个物体坐标系,并且此实体与其物体坐标系相对静止,对物体的移动,旋转、缩放等变
学位
超级电容器作为一种新型电荷储能元件,具有大容量、大电流快速充放电、寿命长和无污染等特性。这使其在能量储能和回收方面有着广阔的应用前景。但是由于对超级电容器内部特性
学位
该文围绕智能控制系统研究实现,深入研究了其中的几个关键技术和产施策略并进行了应用实践,并介绍了作者研究发的交流异步电动机变频调速系统的总体结构、功能特点及实现技术