【摘 要】
:
聚类结果的有效性由结构有效性、算法有效性和先验知识有效性3个方面的因素决定.忽略先验知识和假设结构的有效性孤立地提升聚类算法的有效性很可能产生无效的聚类结果.现有聚类方法通常只是简单地导出假设结构下最优的聚类结果,并交付用户,缺乏对聚类结果的自省能力.实际上,聚类方法是一个不断迭代优化的过程,包括对训练数据拟合度和假设结构的迭代优化.基于上述的考虑,提出以聚类结构的鲁棒性作为聚类结果有效性的衡量指
【机 构】
:
北京大学信息科学技术学院智能科学系,北京,100871;中国矿业大学计算机学院,徐州,221116
论文部分内容阅读
聚类结果的有效性由结构有效性、算法有效性和先验知识有效性3个方面的因素决定.忽略先验知识和假设结构的有效性孤立地提升聚类算法的有效性很可能产生无效的聚类结果.现有聚类方法通常只是简单地导出假设结构下最优的聚类结果,并交付用户,缺乏对聚类结果的自省能力.实际上,聚类方法是一个不断迭代优化的过程,包括对训练数据拟合度和假设结构的迭代优化.基于上述的考虑,提出以聚类结构的鲁棒性作为聚类结果有效性的衡量指标,并将鲁棒性评估有机地整合到聚类算法的迭代优化过程中,提出一种面向结构鲁棒性的迭代聚类方法框架.此外,依托该框架下设计并实现了SROC聚类算法,通过对模拟数据和真实文档数据的聚类实验,例证了方法有效性.
其他文献
水中塔吊基础在实际施工中受水位变化影响较大,施工较为不便.以实际工程为背景,对水中承台钢管桩格构塔吊基础的结构形式、设计计算、施工控制等进行阐述分析.结果表明:此类塔
本文以贵阳站无柱风雨棚改造工程为载体,开展大跨度钢结构的拼装、运输、焊接、吊装及涂装等施工技术研究,成功地解决了大跨度钢构件在既有线条件下施工复杂,安全隐患大的施工难
<正>SDRAM (Synchronous Dynamic Random Access Memory) is applied to data acquisition control system for the national great science project HIRFL-CSR. But SDRAM h
容量限制的弧路径规划问题(Capacitated Arc Routing Problem,CARP)属于弧路径问题的一种,此类问题是在弧路径规划问题(Arc Routing Problem,ARP)的基础上对服务车辆添加容量
近日,芯禾科技宣布其三维全波电磁场仿真软件IRIS已通过GLOBALFOUNDRIES的22FDX工艺技术认证。该认证能确保设计人员在IRIS中放心的使用GLOBALFOUNDRIES22FDXPDK工艺文件进行
访问模式是用户沿URL超链寻找和浏览网页规律的总结,发现用户访问模式对于帮助用户快速到达目标页面,进而实现搜索引擎的个性化导航具有重要意义.目前虽有一些挖掘用户访问模式
随着无线通信技术以及全球定位技术的发展,位置相关的查询处理及基于位置的信息服务技术已经成为一个热点研究领域.作为支持位置相关查询的一项关键技术,位置相关数据的处理
宋代书坊业上承唐代印刷品的产生,下启明清成熟发展,在书坊一千三百多年的历史长河中处于兴盛阶段,在科技进步惠及大众过程中起着重要作用。书坊业之所以能在宋代得到发展是