论文部分内容阅读
机器学习的哲学探索是指研究机器学习中的一系列基本问题,包括对机器学习的基本看法、归纳的哲学问题、概然性的清晰表述、可学习性问题、知识发现等等。本论文主要是通过分析机器学习的研究前沿及其两大核心领域就这些问题展开讨论。机器学习的研究前沿和演化路径对于形成关于机器学习的基本看法起了关键性的作用。本文选择《机器学习》(Machine Learning)和《机器学习研究》(Journal of Machine Learning Research)期刊作为样本,运用CitepSpaceⅡ软件绘制出的知识图谱显示出:机器学习研究的前沿领域可以概括为“增强学习”、“分类技术”、“基于模型的聚类算法”、“泛化错误分析”、“数据挖掘”等有内在联系的九个知识群。对知识图谱的解读,进一步揭示出机器学习研究的前沿演化路径:增强学习是在人工智能中的行为主义研究范式基础上发展起来的一个相对独立的研究区域;数据挖掘是以“分类技术“为核心向“计算学习理论”和“分类算法的改进”两个方向演化。相应地,由机器学习的科学前沿引出了机器学习的哲学前沿问题。机器学习的可能实现途经把归纳问题、概然性的清晰表达、演绎推理的经验基础、可学习性等问题结合在一起。机器学习的预设性前提是:存在着具有足够逻辑功能的通用机器,能够模拟所有的逻辑规律。在此基础上,机器学习系统可以通过两种互补的途经得以实现:演绎推理学习和归纳统计学习。演绎推理模式,由于其推理规则具有拟经验性,可以把假说和经验数据输入系统之中,通过溯因法等得到新的知识或者使系统性能得到改善。归纳统计模式使得归纳问题重新彰显出来,概然性与统计学联结在一起,配以简单性原则信念,使得机器能够从复杂的假说空间中确定一个假说,并且使可学习性问题能够清晰地表述出来,从而能够获得新的知识。“发现的逻辑”是科学哲学中的一个重要论题。机器学习的功能是知识发现,知识发现是通过学习算法实现的。虽然机器学习算法的构建过程仍然存着一些难以理解的认识论问题,但是机器学习的算法解析过程揭示出知识发现过程可能是一个非线性的混沌过程,是确定性与随机性的统一。具体来说,知识发现是一个准周期的过程;混沌吸引子能够使相互竞争的研究模式殊途同归;初始观点的微小差异可以引起知识结构的巨大分岔;知识发现的确定性与常规科学相对应,而随机性则可能孕育着科学革命。由此,知识体系可能存在有混沌吸引子,并且具有一种分形结构特征的自相似性;其发现过程存在着一些基本规则和步骤。最后,把本论文的研究过程综合到一起,构建出一幅机器学习哲学体系框图,并且把机器学习的科学前沿和哲学问题综合在一起加以讨论,分析两者的区别与联系,以及相互之间的影响和促进。