论文部分内容阅读
IB方法是基于信息论的数据分析方法,该方法通过信息压缩与信息保存之间的平衡处理,有效地解决了复杂优化问题中算法精度和效率之间的折衷问题,并在此基础上形成了多个IB算法。其中,连续优化算法sIB是较好的一个IB算法,但该算法存在运行效率低、优化不充分等问题。 本文针对sIB算法中存在的上述问题,采用变异方法,提出了isIB算法。该算法在随机的sIB算法多次深度优先搜索形成的初始解空间的基础上,通过多次局部范围的广度优先搜索,拓展了有效的搜索空间,进而获得了更优的解。本文通过20NG中9个文本数据集上与sIB算法的对比实验验证了该算法的有效性:在从实验中获得的有效变异率的基础上,isIB算法在效率和精度都优于sIB算法;实验得到了获取更优解时的最佳优化次数;随着优化次数的增加,算法精度的提高幅度逐渐减小,这说明该算法是收敛的。算法求解过程也说明了蒙特卡罗方法在复杂优化问题中的重要作用。 求解复杂优化问题相应的高效算法能够提高人们处理问题的效率。本文提出的isIB算法能够应用于信息检索,通过关键词等方式更有效地搜索有用信息。由于IB方法已在诸多领域得到成功的应用,本文提出的isIB算法同样可以应用到图像处理等其它实际问题中,这说明算法研究具有广泛的现实意义。