【摘 要】
:
为了在只有少量已知标记的数据集中获得较好的聚类效果,提出了一种基于图收缩的半监督聚类算法。首先将整个样本空间中的数据表达为一个带权图,再根据给出的must-link约束,对
【机 构】
:
华南理工大学计算机科学与工程学院,惠州学院计算机科学系
【基金项目】
:
国家自然科学基金(61170193)资助
论文部分内容阅读
为了在只有少量已知标记的数据集中获得较好的聚类效果,提出了一种基于图收缩的半监督聚类算法。首先将整个样本空间中的数据表达为一个带权图,再根据给出的must-link约束,对图进行边收缩的修改,进而增强must-link约束。在此基础上引入图拉普拉斯算子,结合cannot-link约束将样本空间投影到一个特征子空间。最后在子空间上进行聚类分析。实验结果表明,该方法不仅提高了对复杂数据的聚类结果,而且在约束对数量较少时也能获得较好的结果。
其他文献
跨时钟城(ClockDomainCrossing,CDC)设计和验证是soC系统芯片设计的关键问题。讨论了异步FIFO的模型检验方法,利用模型检验工具SMV,建立了异步FIFO的有限状态机模型,使用时序逻辑LT
加群Zp+上离散对数问题在公钥密码系统分析中具有非常广泛的应用。研究一种加群Zp+上离散对数问题的DNA计算算法。算法主要由解空间生成器、并行乘法器、并行加法器、解转换器
在网络带宽不对称的移动实时环境中,数据广播是一种有效的数据访问方式。针对这种网络特性,分析了现今已经存在的某些广播调度算法。针对UFO算法,分别提出了SBS算法和CRS算法
针对仿真系统概念模型开发中存在的模型重用性不高和缺乏管理等问题,提出了元概念模型(Meta Concep-tual Model,MCM)的概念,以实现更高层次上的概念模型抽象。将本体思想引入MC
国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量,同时对实时性要求较高。如果缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使
在实际应用中,传统多目标演化算法面临着高维多目标优化问题。针对这一缺陷,提出正交E占优(Orthogo-nality E-dominant,OE)策略。在OE策略的理论优越性设计的基础上,改进了当前
针对基于SMC构件模型的软件系统静态、运行态和动态抽象建模问题,提出由XML元语言定义和表达的体系结构描述语言——SMC/ADL。该语言从选取系统建模元素的类型、实例和实例行
为了克服二维Shannon熵阈值法的缺陷,提出了一种使用矩不变法来调整二维直方图斜分Shannon熵的阈值分割方法。首先将二维直方图斜分原理运用到两种Shannon熵阈值法中,然后利用矩不变法从两种熵阈值法获取的阈值中选择最佳阈值,并提出二维直方图斜分Shannon熵阈值法的一般递推算法,最后将二维直方图分布特性与这种算法有机结合得到新型快速的递推算法。实验结果表明,提出的方法不仅分割效果优于当前
布尔可满足性问题(Boolean Satisfiability Problem,SAT)是逻辑学的一个基本问题,也是NP-hard问题。调查传播算法(Survey Propagation,SP)是求解SAT的一种非常高效的算法,但SP在
图像检索中很多时候会出现相关反馈提供的标注样本数不足,从而导致监督学习方法面临过适应问题的困扰。提出一种能有效使用未标记数据的半监督新型算法:近邻保留回归算法,它通过使已标记数据的观测误差函数最小化,来选择综合性能最好的回归函数,以兼顾图像的语义特征及图像空间的几何结构,并解决过适应问题。实验结果证明,算法能有效提高图像检索系统的性能。