论文部分内容阅读
机器学习(Machine learning,ML)已经被广泛用于研究各类复杂系统,包括经典相变、量子相变以及拓扑相变等多体问题。得益于不断更新的算法以及硬件算力的提升,在统计物理中,最先进的机器学习技术能够处理大数量级的数据集,其对于识别相变有很优秀的表现能力。ML方法能够识别物质的相,对于不同位型的数据进行聚类、分类、抽取临界值以及通过物理手段获得相关临界指数。本论文主要运用机器学习中的监督、无监督和半监督学习方法研究了非平衡相变中的吸收相变,它们是一元随机过程-有向逾渗(Directed percolation,DP)和二元反应扩散过程(Pair contact process with diffusion,PCPD)。非平衡相变中依然存在很多未解决的问题,比如某些模型的解析解或者普适类的划分。DP普适类是非平衡相变中已知的最重要的普适类,但时至今日其(1+1)维解析解仍然没有得到。以PCPD模型为例,其普适类问题依然是一个很有争议的课题,目前学界对其暂无定论。近来,随着ML方法在统计物理领域的广泛运用,这使得我们将目光聚焦在ML研究非平衡相变上。在研究相变位型的时候,ML在小尺寸情况下也是适用的。首先,本论文研究了监督学习(Supervisedlearning)(1+1)维和(2+1)维情况下DP的临界值、空间和时间关联指数和特征时间。过往的ML方法主要在于平衡相变(如Ising模型,Potts模型,XY模型等),这里则是多出一个时间维度的非平衡相变,结果显示神经网络能够成功预测DP模型的空间和时间关联指数。不仅如此,监督学习方法也可以学习并预测不同尺寸模型从活跃相到达吸收相所经历的特征时间tc,并且测试精确度在百分之九十以上。从整个ML的过程以及结果来看,在相同条件下,(2+1)维DP可得到更高的测试精确度,这也侧面说明低维情况下涨落对于系统的模拟结果影响较大,而较高维度模型所产生的位型数据则可以减小这一影响。在(1+1)维DP中,可以将不同时间步的位型图组合成平面位型图,神经网络可以很好的识别其趋势,在(2+1)维情况下本文的处理方式是将三维数组转换为二维数组,然后再输入神经网络,结果显示神经网络依然能够检测其趋势并识别这种复杂模式。在对PCPD的监督学习中,文章提出了一种精确的数值计算数据坍塌(data collapse)拟合优度的方法,这种方法能够有效避免以往视觉上的裸眼观察。同时,本文也对小尺寸PCPD的ML和蒙特卡洛(Monte Carlo,MC)结果进行了对比。结果显示,机器学习结果在空间关联指数的数值表现上更加稳定。因此我们认为这能够为PCPD的标度性质提供一些参考。其次,本论文也用无监督学习(Unsupervised learning)研究了非平衡相变模型,比如探测临界值和相关临界指数。本文主要对DP和PCPD这两个不同普适类的非平衡相变模型实施了无监督学习,包括主成分分析(Principal component analysis,PCA)和自编码(Autoencoder)两种方法。结果发现,这两种无监督ML方法都能够对模型的原始位型进行聚类表示和给出合理的临界值预测。这意味着不管我们的非平衡晶格模型是一元的还是二元的随机过程,不管其中是否包含粒子的扩散运动,PCA和卷积自编码神经网络都能够捕获位型的本质信息以及其变化趋势。无监督学习被重视的另一个重要原因即是它能够在不需要标签的情况下抽取位型的特征信息,这个优势使得无监督学习能够作为监督学习的预处理并为其提供可靠的标签信息。所以,监督学习和无监督学习的有效结合能够从数据中获得更多的有用信息。不仅如此,本文也使用一种无监督学习方法(自编码神经网络)对几类晶格相变模型进行了深入的研究。这些相变模型包括平衡相变中的逾渗模型,也包括非平衡相变中的DP模型和PCPD模型。对于平衡相变,我们选择的学习对象为二维晶格,非平衡相变则为(1+1)维情形。自编码学习之后的结果显示,如果该相变的序参量可以表示为粒子密度,即晶格占有点除以总晶格大小,则自编码网络的单个潜在变量即为与序参量呈正相关的量。这里,逾渗模型产生了与其他模型不一样的结果,因为其序参量是与团数目密度相关的量而非粒子密度。所以自编码网络不能够提取逾渗模型原始位型的临界值。受此启发,我们对逾渗模型的位型进行了特征工程-选择最大团,然后将原始位型对应的最大团进行自编码学习。通过这种方式的无监督学习是可以预测逾渗模型的临界点的。另外,本文也对PCP模型挑选其对粒子位型、对PCPD则选择全粒子位型进行自编码学习,也得到了相对准确的临界点信息。由此我们证明了自编码神经网络的单个潜在变量并不一定能够表示相变模型的临界性质,除非其序参量能够用粒子密度表示。如果模型的序参量不能用总粒子密度表示,则需要通过学习特征工程选取与序参量相关的位型来获得临界点的信息。此外,文章也运用了迁移学习(Transfer learning)实施相变研究,它属于一种半监督学习。对于研究对象中的逾渗和DP模型,假设只知道它们位型中的少部分是拥有标签的。通过一种叫做域对抗自适应的训练方法,被称作DANN(Domain adversarial neural network),能够得到两种模型的合理的临界点以及相关临界指数。域对抗自适应既能够完成像无监督学习那样抽取临界点的功能,也能够完成像监督学习那样通过重标度得到关联指数的功能。另一个重要结果是,本文发现域对抗自适应这种迁移学习方法也是有一定条件限制的。要想运用这种方法准确得到临界点信息,输入位型应该和序参量有关联。DP模型的序参量就是粒子密度,其原始位型能够很好地表现它,所以使用迁移学习能够得到很好的预测结果。但是对于点逾渗模型来说,其序参量是与逾渗团相关的量,因此我们只能通过特征工程选择与逾渗团相关的位型进行迁移学习。结果发现挑选最大团的位型能够在很大程度上表征逾渗团的信息,这也使得迁移学习能够有效运行。通过运用ML方法对一元和二元反应扩散过程的学习,本文得到了很多有意义的结果。在小尺寸情况下,相比于传统的MC模拟,ML有着不错的表现。随着算法和算力的不断更新,ML在统计物理中将会有更加优秀的表现。