论文部分内容阅读
机器学习是人工智能领域一种重要的方法,能对杂乱无章的数据加以分析并能得到蕴含的知识。聚类算法是机器学习中典型的无监督学习,在现实世界中已有诸多成功应用,但传统聚类算法大多认为不同类簇是对整个数据集的划分,而实际应用中,数据元素与类簇之间关系并不是简单数据元素归属于一个类簇的情况,针对这种更为复杂的情形,本文设计了新的算法模型并将其应用于实际的推荐场景。本文围绕区间集粗糙集理论与聚类算法进行研究,首先对区间集粗糙集进行定义,对其结构和性质展开分析和研究;然后重点研究将区间集粗糙集在规则形状下聚类的K-means和不规则形状下聚类的密度峰值算法,建立粒计算框架下粗糙集机器学习中聚类算法方面的模型,并且进行区间集粗糙集聚类推荐系统的设计与实现。本文基于粗糙集和机器学习中聚类算法,主要做以下的工作:1.详细描述区间集粗糙集理论:从区间集视角对粗糙集进行研究。这些理论将区间集和粗糙集相结合,既利用区间集的区间表示,又利用粗糙集近似集表示的思想。在该模型上研究其代数性质和基本结构,并对其不确定性度量和属性约简进行研究。2.提出一种基于区间集粗糙集聚类算法(ILRSKM):通过区间集粗糙集对K-means进行改进,对类簇在区间集粗糙集理论下进行上、下近似划分,充分利用类簇边界不确定性度量信息进行类簇分类,得到了较好的聚类效果。3.提出一种基于区间集粗糙集密度峰值聚类算法(ILRSDPC):通过区间集粗糙集对密度峰值聚类的研究,对类簇在区间集粗糙集理论下在不确定性边界聚类,并取得了较好的聚类效果。4.设计并实现基于区间集粗糙集的推荐应用系统:将区间集粗糙集和K-means以及DPC聚类算法在分布式环境下,首先通过爬虫算法进行推荐前端网站的搭建,进而对用户产生的学习行为数据进行采集,通过网络传输到推荐模块,将聚类算法在此推荐场景进行了应用研究。本文将区间集粗糙集理论应用到聚类算法的改进中,并将其在实际应用推荐场景中进行了研究,该研究成果具有较大的应用空间。