模糊聚类有效性研究

被引量 : 0次 | 上传用户:sunx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储了海量数据。数据作为信息的主要载体在当今信息化社会中扮演着重要的角色。人们希望计算机帮助我们从海量数据中提取有趣的知识、规律或高层信息,帮助我们基于丰富的数据作出决策,由此产生了数据挖掘,并得到广泛的研究。数据挖掘的其中一个重要分支是聚类分析。聚类是指根据“物以类聚”的原理,将样本聚集成不同的组,使同一个组的样本之间应该彼此相似,而不同组的样本之间应足够不相似。传统的聚类对数据的划分比较严格,具有“非此即彼”的性质。然而,许多客观事物具有“亦此亦彼”的性质,比较适合“软”划分,将模糊集理论引入聚类分析,这种软划分具备了较强的理论基础,模糊聚类分析由此产生了。聚类是一种无监督的分类,需要预先设定一些参数,尤其是聚类数c和模糊因子m。评估数据集的模糊划分是否符合客观事实,这属于模糊聚类有效性问题。对模糊聚类来说,有效性问题又往往可以转化为最佳类别数c的决策问题。经典的Xie-beni指标Vxie存在着两个缺点,有几位研究者对它进行了改进,但是仍然存在各自的不足。本文仔细研究了他们各自的优缺点,继承了其思想,并重点分析了模糊因子m对FCM类型算法及有效性函数判断能力的影响。同时考虑模糊因子m和聚类数c的变化,引入两个惩罚函数,分别克服指标Vxie存在的两个缺点,提出了一种改进的模糊聚类有效性函数Vnew。并根据数学分析中一元函数和多元函数的极限的相关知识,在理论上证明了该指标的有效性。通过分析各指标函数的表达式可知,指标Vnew的时间复杂度较小。Wu等首次将紧凑度、重叠度和分离度三者相结合,提出有效性指标Vcso,并给出了重叠度的定义。本论文分析了该重叠度定义中的主观性较大,会影响到指标Vcso的稳定性和评价聚类有效性的准确性。接着,本文重点研究了隶属矩阵中各元素的几何意义,从c-模糊划分矩阵出发,给出了重叠度新的定义,并结合例子给以详细分析,证明了该定义的可行性。另外,考虑了模糊因子m对指标可靠性的影响,延续有效性指标Vcso的思想,提出一种新的结构化的模糊聚类有效性指标Vcso-new。
其他文献
随着经济全球化发展的深入,各国相继制定了专利战略以及专利权保护制度,并且不断提高其专利信息分析的能力。美国的专利分析主要采用商业模式,通过专利信息情报公司建立高附加值
本研究尝试通过沙盘游戏疗法,重建福利院孤残学生内心秩序,缓解由于依恋剥夺、早期父母亲密关系缺失而造成的心理问题。结果显示,沙盘游戏作为一种专业的心理治疗技术,由于非语言
<正>嫩黄的丝瓜花爬上墙头,古朴的民房掩映在竹林中,连片的荷叶布满湖面……走进山东省临沂市费县许家崖乡村风情休闲区,自然风情浓浓地围绕在游客周围。杨树沟、八里庄、北
期刊
研究背景与目的:右心功能评价在小儿先天性及后天获得性心脏病的诊疗中具有非常重要的价值。组织多普勒成像(tissue Doppler imaging, TDI)是近年来发展起来的超声新技术,心肌
葡萄果实柔软、皮薄、多汁,不耐贮运。在贮藏保鲜过程中,极易发生腐烂、落粒、失水、褐变等现象,这给鲜食葡萄的发展带来极大困难。果实采后品质变劣和生理衰老是影响果实贮
类风湿关节炎是一种常见病,同时也是一种常见的多发病,病人随着病情的进展可致关节畸形,重者甚至导致致残。探讨类风湿因子(RF)分型定量检测对类风湿关节炎(RA)诊断、治疗以
以白及为试材,采用Li-6400便携式光合仪,研究比较了白及在6月份、8月份及10月份的光合日变化。结果表明:白及光合速率日变化曲线都有午休现象,其中6月份的光合速率最高,9:00
近年来,我国经济迅猛发展,重工业生产导致空气中大气颗粒物含量剧增,大气污染严重,全国各大城市雾霾天气频发,严重影响居民的生活,对居民身体健康产生极大的危害。该研究阐述
文章介绍了在唐山中厚板PHC管桩穿过砂夹层施工时采用开口桩尖法、腔内取土法和引孔法等辅助措施的施工技术,通过精心设计及精心施工,既保证了施工质量、安全要求,同时还加快