基于约束的中垂面相似度准则及其应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:oracle_1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘和机器学习的基于距离的各种技术中,例如基于距离的聚类和基于距离的分类,如何度量数据间的相似性已经成为了一项基础任务。对于某一具体问题,采用合适的相似性度量,会使问题得到更有效的解决。越来越多的研究表明,通过对成对约束(正约束和负约束)的充分利用,从而得到与问题相匹配的相似性度量,能够大幅度的提升算法性能。目前基于约束的相似性度量研究主要是基于约束的距离度量学习,通过对约束信息的利用,学习一个距离度量矩阵,然后再进行分类或者聚类。本文通过对成对约束尤其是负约束的挖掘,提出种新的基于约束的相似性度量,主要创新和研究工作总结如下(1)通过对最近邻准则和支持向量机的分析,从中提取出中垂面的概念;从负约束对中挖掘出中垂面,提出一种基于约束的中垂面相似度准则,并在人工数据集上对如何计算相似度做了示例。(2)将基于约束的中垂面相似度准则应用于聚类任务中,提出基于约束的中垂面相似度聚类算法MPHS (Mid-Perpendicular Hyperplane Similarity)。分别在数据集线性可分和数据集线性不可分两种情况下进行聚类,提出多个具体算法。在多个UCI标准数据集和多个图像数据集上的实验表明,MPHS算法与所对比的算法在性能上有很大的提升。(3)通过在半监督聚类学习中引入集成学习的思想,提出了基于约束的中垂面相似度聚类集成算法。算法通过对约束的集成,有效的提高了在多个UCI标准数据集和多个图像数据集上的聚类性能。(4)将基于约束的中垂面相似度准则应用于分类任务中,提出了基于约束的中垂面相似度分类算法。在得到相似性矩阵后,分别应用最近邻算法和支持向量机进行分类,得到相应的分类算法mphs-1nn和mphs-svm。同时将集成学习的思想考虑到分类任务中,得到对应的集成学习算法mphs-Inn-bagging和mphs-svm-bagging。在多个UCI标准数据集上的实验结果验证了所提算法的有效性。
其他文献
如今,镜头规划技术的研究及应用越来越多,本文设计并实现了一个基于知识的智能的镜头规划系统,并将其运用于三维虚拟场景的自动漫游。本文依次讲述镜头知识的表示方法、镜头
人脸识别一直是学术界和工业界的研究热点。尽管在过去几十年内,研究人员提出了一系列的人脸识别方法。但是由于姿态、表情、光照等外部因素的干扰,这些方法始终不能取得很好
随着信息时代的到来,网络技术己经广泛渗透到各个领域。它在向人们提供前所未有的便利通信的同时,也对信息的安全存储和传输提出了更高的要求。信息隐藏技术作为传统的加密技术
应用层组播(Application Layer Multicast, ALM)是组播通信的一种,是在终端系统实现的由单一或多点主机通过传统的单播连接向群组主机发送数据报的一种组播方式。因未改变传
半监督降维是近年来半监督学习领域的研究热点之一。当今流行的半监督降维方法可以分成三类:基于类别标号的方法、基于成对约束的方法和基于其他监督信息的方法。其中,成对约
目前,人脸识别技术已经被应用于我们的日常生活当中的某些领域,但是该技术在手机端身份验证和支付这些场景中的应用还没普及,一方面是由于人脸识别准确度面部姿势、光照、表
信息的爆炸式增长,使得信息检索系统成为用户查找信息的主要工具。如何使检索系统理解用户的搜索意图,找到符合用户要求的数据,将相关度高的检索结果排在前面推荐给用户,成为
服务质量路由(QoSR)是一种基于网络可用资源与用户请求的QoS要求进行路由的机制,它是一种的动态路由协议。QoSR的目标就是为每一个用户发送的QoS连接请求,找到满足其QoS要求
组播是一种高效的信息交互模式,其可以降低网络传输时延并能达到较高的可扩展性。很多网络应用都使用了组播技术,如数字媒体分发、股票行情服务、电视和网络广播付费、视频会
近年来,全球经济持续高速增长,引发了能源消费的大幅度增加,世界各国的能源消费结构都倾向于煤炭的消费。这导致了煤碳开采力度的大幅度增加。但是在超能力开采煤矿的过程中,