【摘 要】
:
减少算法参数对聚类效果的影响,是聚类分析技术需要解决的一大难题.提出与离群点识别方法相结合以弥补聚类技术不足的新思路.在提出基于公共近邻的离群点概念之后,给出一种借
【机 构】
:
吉林大学计算机科学与技术学院,长春,130012
【出 处】
:
2005第一届中国分类技术与应用研讨会(CSCA)
论文部分内容阅读
减少算法参数对聚类效果的影响,是聚类分析技术需要解决的一大难题.提出与离群点识别方法相结合以弥补聚类技术不足的新思路.在提出基于公共近邻的离群点概念之后,给出一种借助离群点信息自动停止聚类过程的聚类算法,该算法只需一个参数,参数的恰当取值范围可以依据识别离群点的情况确定.算法兼具处理类别属性和数值属性数据的能力.在分析过新算法一些特点后,用6个数据集测试新算法的效果,并与多种聚类算法进行对比,实验结果验证了新算法的优势。
其他文献
聚类有效性问题是判断聚类结果优劣的关键问题,如果初始聚类数选取得不合适,会使聚类结果与数据集的真正结构不相符,从而导致聚类结果产生较大的差异性.针对模糊C-均值(FCM)
目的:探讨自发性气胸的误诊原因. 方法:对我院2002~2004年收治的自发性气胸病例进行回顾性分析. 结果:我院呼吸内科2002年1月~2004年12月三年间共收治自发性气胸病例56例,其
在机器学习和数据挖掘领域中,分类器通常设计为最小化测试样本的错误率,然而这只有在所有错误具有相同的错误分类代价时才有意义.在现实问题中,不同情况下的错误往往具有不同
概念漂移(conceptdrifts)是流数据分类所面临的一个重要问题.当前解决该问题的主流方法是将训练数据分割成数据块,并使用集成学习(ensemblelearning)方法进行分类.但是,这些
SETRED是一种结合了数据审计技术的半监督学习算法,它利用局部割边权统计量分布来协助过滤在自我训练中可能被学习器错误标记的无标记样本.对采用精确计算局部割边权统计量分
所谓处方药即是由医师签发的处方 ,并在医师的监护下所使用的药。而非处方药以下简称“OTC”。“OTC”是英文“Over The Counter”的缩写 ,意思为“在柜台上买得到的药”。一
近年来,芦笋木蠹蛾发生逐年加重,面积逐年扩大,已成为山西省永济市芦笋产业持续发展的重要障碍因素。通过人工模拟观察、田间系统调查、灯光诱杀和大田普查,对芦笋木蠹蛾的形
设计了多Agent系统的排队算法,包括多Agent同步休假M/M/c排队算法;多Agent异步休假M/M/c排队算法;多Agent系统中部分服务台同步休假M/M/c排队算法,多Agent系统中部分服务台异
近年来,图模型领域的研究取得了瞩目的进展.其中,贝叶斯网络作为一个描述、学习、计算复杂条件下概率分布的决策分析工具被应用到众多领域.在模式识别领域,图模型的方法已经
环丙沙星 (CPFX)为细菌 DNA旋转酶抑制剂 ,对革兰氏阳性、革兰氏阴性细菌均有很好的作用 ,对革兰氏阴性细菌尤为敏感。1 剂型1眼用药剂 :3%环丙沙星滴眼剂适用于治疗角膜溃