论文部分内容阅读
逻辑推理一直以来都是人工智能领域的一大研究难点,其需要事先定义一些推理模式。但在无先验知识的前提下,逻辑推理研究极易陷入困境。且就人类而言,虽拥有一定的逻辑推理能力,可以利用数学背景知识进行推理学习,但若在无先验知识的前提下,直接挖掘隐藏在复杂数据中的逻辑关系时,也无法很快找到内部的逻辑关系,甚至无法进行逻辑模式推理。针对当前研究领域中的不足,本文提出了纯数据驱动的逻辑学习,目的在于能够让计算机在无先验知识的前提下自主学习数据中的逻辑模式。而序列逻辑学习作为逻辑学习的代表性任务,如何准确地分析和预测序列成为一个研究热点。本文以视觉数字序列为例来探索利用纯数据驱动的方法挖掘隐藏在数据中逻辑关系的可行性,主要研究内容如下:(1)针对本文提出的图像数字序列逻辑学习任务和基于任意位置图像序列预测任务,分别构造了两个大型数据集,为后续实验开展提供数据支撑。每个大型数据集均根据其解决方案的不同分为4种不同的类型,分别为:‘Linear’序列、‘Multiplication’序列、‘Fio’序列和‘Nested’序列。且数据集包含各种图像序列,所有图像均进行了归一化处理,都是图片大小为15×85且右对齐的黑白图像,每张图像设置的最大位数为10位,且可以为正数或负数。(2)传统序列解决技术是基于已知的数字含义,并通过诸多背景知识等来构建模式,然后预测后续数字。但对于未知的数字和规则而言,传统技术将很难起到作用。针对未知的数字和规则的模式构建问题,本文提出了一种图像数字序列逻辑学习任务。并在四种典型的深度神经网络上进行测试(MLP、LSTM、CNN-MLP、ResNet),让计算机在不知道图像包含的内容信息及图像间关系的前提下,自主学习推理图像序列间的内在逻辑模式,从而对图像序列的后续内容进行预测。结果表明:本文提出的方法在一定程度上可以解决未知的数字和规则的模式构建问题。(3)现有关于数字序列预测问题的研究多是在以预测后续数字为研究目的。然而,任意位置序列的预测无论是对于人类还是人工智能领域,亦或是生产生活都有着极大地意义和应用价值。如智力测试、游戏预判、密码学加密解密等。本文针对任意位置的序列预测问题进行实验研究,而不再局限于单一地对后续图像内容进行预测,本文通过设计加框空图像对图像序列的位置进行缺失限定,而非采用传统的独热编码,提供了一种关于图像序列位置标签嵌入的新思路。特别地,本文提出了一种由6层卷积层构成的简单卷积神经网络模型(S-CNN),采用3×5的卷积核大小,将基于深度学习的序列逻辑学习任务与光学字符识别(OCR)的感知识别任务相结合。并在六种典型的深度神经网络上进行测试(MLP、LSTM、CNN-MLP、ResNet18、ResNet34、S-CNN),实验结果表明,除‘Multiplication’序列外,在其余类型的数据集上均取得良好的效果,证明所提模型在一定程度上对于预测任意位置图像序列的可行性,进一步验证了以视觉数字序列为例来探索利用纯数据驱动的方法挖掘隐藏在数据中逻辑关系的可行性。本文以视觉数字序列为例来探索利用纯数据驱动的方法挖掘隐藏在数据中逻辑关系的可行性,为序列预测研究提供了新的思路与方向。针对传统序列预测方法存在的不足进行分析研究,从两种不同的角度设计了序列逻辑学习任务。进一步验证了逻辑学习研究的可行性,这在逻辑学习领域有一定的研究意义及应用价值。