基于加权集成Nystr?m采样的谱聚类算法研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:coophui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谱聚类算法是近年来数据挖掘领域的研究热点,它基于谱图理论,有效地解决了很多实际问题。但在谱聚类的过程中,特征分解的计算复杂度通常为O(n~3),限制了谱聚类算法在大规模数据中的应用。Nystr?m方法利用数据集中的一小部分抽样点,进行近似计算,逼近真实的特征空间,有效地解决了谱聚类在大规模数据上时间和空间开销的问题。针对现有的Nystr?m方法在谱聚类应用中存在聚类效果不稳定、样本代表性弱的问题,提出一种基于加权集成Nystr?m采样的谱聚类算法。首先,对数据进行整体权重评估,利用统计杠杆分数区别数据间的重要程度,得到反映样本重要性的权值矩阵,这种加权方法能在数据分布中找出具有影响力的数据点,保证了样本核矩阵中数据点的差异性和有效性。其次,基于权重采用加权K-means中心点采样算法得到多组具有代表性的采样点,获得与数据分布相似的样本点矩阵,使用这些具有高代表性的样本点进行Nystr?m近似计算,得到的近似核矩阵的特征向量更接近于真实的特征向量值。再次,引入集成框架,利用集成框架并行运行多次Nystr?m方法构建多个近似核矩阵。最后,利用岭回归方法确定混合权重,将各个近似核矩阵加权求和,生成最终近似核矩阵,产生比标准Nystr?m方法更准确的低秩近似。UCI数据集对比实验表明本文算法具有较好的聚类性能,更适合解决集成聚类框架下的数据聚类问题。该论文有图7幅,表7个,参考文献58篇。
其他文献
大数据背景下,海量信息带来的信息过载问题日益严峻,如何高效快速地为用户寻找到满足需求的资源,已成为当前亟待解决的问题。推荐系统作为解决上述问题的重要工具,得到了学术界和工业界的广泛研究和应用。目前如何为用户提供更加个性化的建议是推荐算法的主要研究目标,协同过滤算法作为推荐领域中最经典的算法之一,通过具有相似喜好的用户群组为目标用户进行个性化推荐。然而伴随着数据量的不断增大,传统的协同过滤算法存在数
记忆整合,指通过整合两个或多个独立但是相关的知识片段来实现知识的自我生成。以往已有研究证明这一方式的现实性和有效性。总结以往研究发现,首先,无论国外还是国内,大多数
无线移动通信系统不断发展,朝着多种工作模式、高速率的方向演进。功率放大器是通信系统射频前端的重要部件,其宽带性能和高效率性能是实现高速率通信和绿色运营的基础。J类功放是近些年来出现的一种新型功放,其谐波控制原理和连续工作模式理念,给功放设计带来了新的思路。总结当前J类功放的研究,得到如下背景要点:(1)大多研究集中在通过改进J类功放的匹配网络结构实现效率的提升,而对J类功放的高效率与波形关系的研究
独立保函作为对外贸易、国际投资、工程承包等领域的重要金融工具,在国际贸易中的作用日益突出。司法实践中,法院审理保函欺诈纠纷案件时,能够适用的法律依据仅有2016年颁布施行的《最高人民法院关于审理独立保函纠纷案件若干问题的规定》。该规定虽然填补了此前独立保函的概念、适用范围、欺诈的类型等方面的法律空白,但我们难以在上述司法解释框架内解决其所涉及的所有法律问题。理论界和实务界对于保函欺诈纠纷案件所涉及
反向散射通信(Backscatter)是一种不需要电源的低功耗通信技术,以环境中常见的电磁波作为载波传输发送信号,例如WiFi、ZigBee、蓝牙信号,可以实现随时随地的通信,在物联网领域被广泛应用。但现有的反射通信系统大都节点规模较小,不适用于普通的室内办公场景,且节点的维护成本也比较高。为了解决这些问题,本文针对室内场景设计了一种基于反向散射通信的无源物联网通信系统,该系统由发送端、多个通信节
在计算机技术和人工智能技术大发展的背景下,智能机器人作为计算机与人工智能交叉学科的产物,取得了长足的发展,从实验室走向了实际应用中。其中监所机器人是智能机器人走向实际应用的典型案例,监所机器人可以代替民警不间断地在夜间完成高强度且重复性高的巡检工作,并且可以避免由于民警疲劳、违规巡视等因素造成的安全事故。机器人完全代替民警完成巡逻检测等工作,也对机器人本身提出了较高的要求。首先,机器人运行的环境为
代偿取回权指当取回权标的物被非法转让或灭失时,该财产的权利人有权取回其对待给付财产或补偿金。因代偿取回权与赔偿请求权存在重大差别,故代偿取回权的行使更能公平保护财产权利人的正当权益。我国现行《企业破产法》没有规定代偿取回权制度。2013年最高人民法院颁布的《关于适用<中华人民共和国企业破产法>若干问题的规定(二)》虽然在第二十九条至第三十一条规定了代偿取回权的行使,但是仍然存在适用范围
根据新版高中课程标准中“以学生发展为本”的要求,高中数学课程不断地改革,课堂教学模式由传统的讲授式逐渐过渡到师生互动式,但是在转换的过程中发现一些问题,这些问题导致课堂教学难以达到预期效果。因此本研究将PBL(Problem-Based Learning)教学模式与高中数学教学相结合,致力于在高中数学课堂教学中提高学生的综合能力和数学素养。通过问题情境下教学,提高学生发现问题和解决问题的能力,注重
事件因果分析任务是对已发生事件间的因果关系进行判断,分析某事件对其他事件发生的影响程度,从而挖掘事件间的因果关系,进行事件预测。由于传统事件推理及事件预测方法仅针对特定场景的事件,导致其应用场景有限,难以泛化到一般事件,且方法本身难以扩展。围绕该问题,本文引入事态信息的概念,设计了基于循环神经网络的事件因果分析及事件预测模型,在推理时加入对因果关系中动态性与时变性的理解,强化了事件因果推理能力。通
作为微波平面传输线的重要类型之一的共面波导,备受各国学者的关注,然而有限金属厚度共面波导的研究仅限于理论研究,实际方面的研究非常空白,且目前介电测试技术广泛应用于工