基于强化学习的聚类算法及其应用研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:loverzhouweia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算技术的进步和发展,各行业每天都会产生成千上亿的数据和信息。为了有效地利用隐藏在这些数据中的信息,数据挖掘技术应运而生。如在工业生产领域,光伏产业近些年呈现迅速发展趋势,太阳能电池凭借其较高的性价比在光伏市场占据主导地位,多晶硅是太阳能电池一种主要材料,多晶硅材料生产过程中会产生大量的生产数据,如何充分利用这些数据挖掘有用信息指导生产是本项目研究重点。聚类分析作为数据挖掘领域的一个研究热点,可用于对无标签数据按照数据分布规律进行类簇划分。本文将聚类分析用于多晶硅生产数据配料方案选择,以实现在成百上千种原料数据中找出成本低廉,经济效益较高的原料配比方案。聚类分析的主要目的是将数据划分为多个类簇,使不同类簇中样本间的相似程度尽可能小,而相同类簇中样本间的相似程度较大。其中,基于划分的聚类算法由于其简单、高效、易于实现和扩展且计算复杂度接近线性而在生活中得到广泛应用。经典的基于划分的聚类算法包括K-means、K-means++和FCM等算法。这些算法灵活简单、算法收敛速度快且较容易扩展新的功能,但是也存在较多不足之处,如初始聚类中心的选择对算法结果影响较大,此外算法运行过程中以样本之间的欧式距离判定相似程度,难以利用算法迭代过程中产生的信息,一定程度上降低了算法的运算速度。针对已有的基于划分的聚类算法对初始聚类中心较为敏感的缺陷,以及算法迭代过程中以欧式距离划分样本所造成的时间复杂度较高的问题,本文提出了一种基于强化学习的聚类算法(Reinforcement Learning Clustering,RLC)。该算法不需要通过随机选择进行聚类中心的初始化,在聚类任务中引入了强化学习的奖惩机制,通过建立Q表存储算法运行过程中智能体(Agent)学习到的“知识”,通过Agent选择行为的方式代替了计算欧式距离的过程,提升算法的运行速度。使用K-means、K-means++、FCM以及RLC算法在10个小规模数据集上进行实验,结果表明RLC算法具有较高的聚类准确率以及较好的聚类性能。相对于经典的聚类算法,RLC算法虽然具有一定优势,但对于小规模数据集,该算法的运行时间较长。为了解决该问题,本文进一步提出了一种基于DPRI(Discretized Pursuit Reward Inaction)的单行为强化聚类算法(Single Behavior Reinforcement Clustering,SBRC)。该算法引入了DPRI的离散化奖励技术,同时去除了RLC算法中各行为累积奖励之和为1的约束,算法运行过程中只对Agent所选行为的累积奖励进行更新,其余Agent未选择行为的累积奖励则不更新,进一步减少了算法的运算量。SBRC算法中将贪婪系数设置为一个随迭代次数增加而增大的动态值,使之得到更加稳定的聚类结果。在RLC算法实验所用数据的基础上进一步添加两个中规模和一个大规模数据集对SBRC算法进行性能分析。实验结果表明,与RLC算法相比,SBRC算法在具有较高准确率同时,对小规模数据集的处理速度得到显著提升,处理中规模和大规模数据时具有更大的时间优势。多晶硅生产工艺复杂,工序繁多,其产品质量受多种因素共同影响。工业生产领域常使用物理和化学等方法对多晶硅生产流程和原料的化学成分进行分析以提高产品的质量,并未考虑生产成本的问题。多晶硅实际生产过程中原料种类和配比方案复杂多样,使用传统的分析方法难以从中找出成本低廉,经济效益较高的原料配比方案。本文以上述创新算法为关键技术,将聚类算法用于多晶硅生产数据原料配比方案选择,提出采用聚类算法对多晶硅生产数据进行分析的创新思路,根据少子寿命值等指标从不同类簇中找出经济效益较好的原料配比方案。同时采用DB指数和轮廓系数指标进行评价,结果表明,本文提出的算法具有较好聚类效果,可用于多晶硅实际生产过程中原料配比方案选择。
其他文献
在智慧矿山的建设进程中,对综采工作面进行监测有着至关重要的作用。综采工作面虚拟监测系统作为远程监测探索研究的一项重要内容,能够实现对综采工作面设备及环境的全局实时监测,但目前的研究更重视技术的突破和功能的叠加,而忽略对人机交互的探索,致使系统的识别效率低,易用性和易学性差,甚至存在功能残缺、容错性低的问题,从而导致系统用户体验不佳。本文通过交互设计的理论和方法对虚拟监测系统的交互逻辑和界面视觉进行
随着信息时代的到来,在人机交互中产生了大量的文本,音频,图像等非结构或半结构等形式存储的数据。其中文本数据居多,为了有效的提取文本中有价值的信息供人们使用,实体识别和关系抽取技术是自然语言处理领域的两项基本任务,旨在帮助人们挖掘出文本中具有实体意义的名称及其之间存在的关系,这对构建领域知识图谱,智能问答系统等具有重要的意义及价值。传统的关系抽取任务将实体识别和关系抽取分成两个独立的子任务,没有考虑
随着智能机器人技术的蓬勃发展,复杂场景下的定位与建图对传感器的要求也越来越高。根据不同传感器的特性,在应对不同场景时可以选择相应的传感器:单纯采用视觉传感器对场景的纹理特征以及运动速度有一定的限制,但是视觉传感器可以提供丰富的场景信息。双目立体相机既可以解决单目相机没有尺度的问题,又可以避免RGBD相机在室外被光照干扰的问题。GPS(Global Position System)可以实时获取自身的
物联网(Internet of Things,Io T)作为推动信息技术发展,加快产业更新的关键性技术,它通过无处不在的传感器节点,将人与物,物与物有机的关联起来,物品之间通过射频识别(Radio Frequency Identification,RFID)技术的桥梁实现自动识别。随着共享经济和物流快递行业的迅猛发展,碎片化的海量订单推动着仓储管理行业向自动化,智慧化发展。大型智慧仓储不仅要录入商
在女性患癌人群当中,乳腺癌是最常见的癌症,是威胁女性生命健康的重要因素之一。有研究表明,乳腺癌的早期发现可以有效提高患者的治愈率,并且患者的五年生存率也会大大提高。因此乳腺癌的早期筛查对于患者后续的治疗有着重要的意义。医学影像是乳腺癌早期筛查的重要手段,其中乳腺钼靶图像具有成像清晰、成本低以及灵敏度高的优点,是最常用的筛查手段。医生通常需要依靠大量的临床经验来做出诊断,但对于钙化病灶而言,由于其较
随着深度学习技术在计算机视觉方面的发展,常见的视觉识别任务,例如图像分类,目标检测和语义分割等迅速达到成熟。实例分割作为一种重要的图像理解方法,旨在找到图像中所有实例并且对实例进行像素级分类,兼具目标检测和语义分割的功能。尽管如此,实例分割仍然不足以对复杂的周围环境进行全面理解,例如当物体之间存在相互遮挡关系时,实例分割技术仅仅能够识别和分割可见像素部分,对于物体被遮挡部分无法做出预测。然而,人类
随着周围神经组织工程学的发展,可生物降解材料的研究具有广阔的应用前景。壳聚糖(Cs)由于其与糖胺聚糖相似的化学结构而成为神经组织工程的候选者,但由于缺乏弹性和柔韧性,经常需要与其他材料组合使用。许多天然材料也可以用于构建神经支架,例如透明质酸(HA),明胶(Gel)和胶原蛋白(Col)。通常,这些材料不适用于单独制备神经支架,因为它们很难成型,并且它们的水溶性决定了它们长时间不能在组织环境中保持单
近年来,随着人工智能技术的发展,越来越多人开始关注智能阅卷方面的研究。现阶段的自动评分系统对于客观题如判断题、选择题以及填空题等固定答案的题型能够做出精准的评分,但对于主观题来说,目前主要是以人工评阅为主,并且在评阅主观题试卷时,可能会受到个人情绪、卷面排版以及身体劳累的影响评阅试卷的客观性和工作效率,因此主观题评分系统的研究对于智能化教育具有重要意义。本文提出基于中文分词和文本相似度的主观题评分
随着科技的发展,智能设备给日常的工作和生活带来了巨大改变,语音发布命令指挥机器成为更快捷更方便的沟通方式。语音作为人与人之间,以及人与智能设备之间普遍使用的信息交流方式,是一种不可替代且极其方便的媒介。然而,在日常生活、语音识别、军事通信中,总是存在各种各样的背景噪声,严重干扰正常的生活以及通信,影响听众接收到的语音内容。语音增强的主要目的是减弱和抑制背景噪声对目标语音的干扰,使听众可以享受到高质
随着我国经济快速的发展和科学技术的进步,农业生产作业从农业机械化生产正在逐步过渡到农业智能化生产,其中农业装备智能化机器人是智慧农业生产过程中最重要的一环。番茄作为农业作物,在我国具有极大的栽培面积和消费市场,其中温室番茄种植由于其种植条件可控,成为农业智能化机器人研究对象。利用深度学习计算机视觉算法,通过大数据训练可准确的识别出预设的目标,实现端到端的检测。本文研究基于深度学习的温室番茄植株多目