论文部分内容阅读
随着因特网技术的广泛应用,因特网上Web信息资源呈指数级增长,传统的搜索引擎正面临巨大的挑战。各类专业搜索引擎应运而生并受到广泛关注。网络蜘蛛搜索策略问题的研究,对专业搜索引擎的应用与发展具有重要意义。本文主要从机器学习的角度,围绕提高搜索效率的问题,采用巩固学习(Reinforcement Learning,RL)的方法,对专业搜索引擎网络蜘蛛的搜索策略进行了深入研究。 本文首先介绍了巩固学习的基本概念和网络蜘蛛搜索策略的研究进展,在分析和比较现有专业搜索引擎网络蜘蛛搜索策略的特点和优缺点的基础上,归纳了提高搜索效率的几个关键因素。 本文针对提高网络蜘蛛的学习效率问题展开研究,提出了一种基于隐偏向信息学习的巩固学习模型并改进了SARSA算法。改进算法的主要思想是,通过学习环境状态中的隐偏向信息,动态调整巩固学习代理体的搜索策略,以减小搜索空间,提高学习效率。针对“推箱”任务的实验表明该算法具有良好的性能。在此基础上,本文提出了一种基于隐偏向信息学习的网络蜘蛛学习算法,实验表明,该算法可以明显提高网络蜘蛛的学习效率。 针对传统的网络蜘蛛存在链接价值评价标准单一的问题,本文提出了一种基于巩固学习的启发式网络蜘蛛模型,新模型将立即回报价值和未来回报价值结合,用于计算链接的综合回报价值。为解决对立即回报价值和未来回报价值信任度的权衡问题,本文引入了价值置信函数的概念,提出了基于未来回报信度递减的启发式搜索算法,该算法的主要思想是将两类评价标准的优势相结合,以提高整体的搜索效率。针对于实际环境的搜索测试表明,新算法在性能上优于传统的网络蜘蛛搜索算法。 为了进一步提高网络蜘蛛的搜索效率,本文对网络蜘蛛搜索策略中存在的探测与发掘的权衡问题进行了研究,结合模拟退火的思想,提出了一种基于模拟退火的启发式搜索算法。该算法的主要思想是避免网络蜘蛛陷入局部最优解。针对于实际环境的搜索测试表明,新算法在整体性能上明显优于传统的网络蜘蛛搜索算法。 最后,本文将提出的算法和技术相结合,实现了一个基于巩固学习的计算机相关论文专业搜索引擎网络蜘蛛系统原型。