一般分布式与区间型符号数据的动态聚类分析研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zhaochunyang2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的高速发展带来了数据的极大丰富,然而传统的聚类分析技术在面对如此庞大的样本空间时存在着局限性。符号数据分析产生于上个世纪80年代,它是针对海量数据进行知识发现和规律挖掘的一套理论方法。聚类作为一种解释复杂数据关系的技术在符号数据分析领域有着广泛的应用。但现有符号数据聚类分析的研究大多假设个体在区间内服从均匀分布,这往往并不符合实际情况。针对此问题,本文对一般分布的分布式符号数据和区间型符号数据动态聚类方法展开研究。首先给出了两种常用的符号数据的定义——分布式符号数据和区间型符号数据,随后对分布式符号数据的聚类分析进行了一些探索性研究,包括分布式符号数据的形成,一般分布情况下的距离度量,以及动态聚类算法等。以鸢尾属植物数据集为例,将其分组形成符号对象,并在其上进行动态聚类分析研究,以说明本算法的实用性。考虑区间数所包含个体的分布信息,基于Hausdorff距离提出了一种新的多维区间型符号数据距离度量。基于此,给出一般分布的区间型符号数据动态聚类算法。通过随机模拟试验对文中方法进行有效性评价,结论表明,在各种实验设计的条件下,考虑一般分布的动态聚类算法有效性均优于均匀分布假设下的动态聚类算法。最后将文中方法应用于汽车的聚类分析,进一步体现了文中方法在解决实际问题中的优势。本文针对多维分布式符号数据和区间型符号数据分别提出了动态聚类算法,并运用聚类有效性指标对其评价。应用研究结果表明,无论对于分布式符号数据或是区间型符号数据,本文所提出的一般分布的前提条件下的动态聚类分析方法较之均匀分布假设下的传统方法更有效也更客观。
其他文献
在沿海港口经济开放的背景下,大连旅行社得到了前所未有的发展,但在发展中也存在着这样和那样的问题。针对这些问题,在总结其发展过程中所出现的问题的基础上,提出了一些解决
目的探讨基于口腔pH值监测选择口腔护理液进行口腔护理对急性白血病化疗后口腔黏膜炎的影响。方法采用随机数字表法将60例急性白血病化疗的患者分成观察组和对照组各30例,对
随着中国社会的代际更替,“90后”已成为当下中国大学生群体的重要组成部分。“90后”的生长环境深受市场经济思潮的影响,加上近三十年来中西方文化对中国社会的交错冲击,使
采用自编的中小学生教养方式评价问卷和中小学生心理健康状况测查问卷测查了526名特殊家庭和510名普通家庭的中小学生及其教养人,旨在探讨特殊家庭教养人的教养方式及其与子
碳酸二甲酯(DMC)是一种无毒的环境友好型绿色化学品,可用作羰基化、甲基化和甲氧基化等试剂,其应用越来越引起人们的重视,具有广阔的市场前景。以CH3OH、CO和O2为原料的甲醇
为使大跨度组合梁斜拉桥的结构性能更优,以某(80+290+768+70+70+70+60)m双塔双索面半飘浮体系混合梁斜拉桥方案为背景,从主梁断面型式、主梁参数(梁高、断面面积、桥面板厚度
细胞凋亡是真核生物中保守而重要的细胞死亡机制,与癌症、艾滋病等多种疾病密切相关。与酵母菌这一细胞凋亡模式生物相比,丝状真菌凋亡研究起步较晚但具有其独特的优势。近年
构建稳定、高素质的师资队伍关系到整个自闭症康复事业和各类自闭症康复机构的发展。本文以很少关注的机构教师为对象,通过对自闭症机构教师的职业背景、职业感知和职业技能
以蚕豆(Vicia faba)为材料,利用激光共聚焦显微技术和分光光度技术,结合药理学实验,探讨硫化氢(hydrogen sulphide,H2S)和过氧化氢(hydrogen peroxide,H2O2)在茉莉酸(jasmoni
作为一种新型的教学资源,微课在中国教育信息化背景下被引入,并迅速发展。与传统的课堂教学相比,微课具有短小精悍,灵活性和针对性强,更容易使学生的个性化学习得到满足的特