【摘 要】
:
聚类是数据挖掘中重要的功能算法,其主要的功能是发现数据中潜在的知识.目前文献发表的聚类算法多数仅限于处理单一数值型数据或者分类型数据,其主要原因是含有多种类型的混
【基金项目】
:
国家自然科学基金资助项目(61170130)
论文部分内容阅读
聚类是数据挖掘中重要的功能算法,其主要的功能是发现数据中潜在的知识.目前文献发表的聚类算法多数仅限于处理单一数值型数据或者分类型数据,其主要原因是含有多种类型的混合型数据间的相似性很难度量.本文提出了一种混合数据相似性度量方法:对于分类型属性,利用互信息构建贝叶斯信念网络,利用贝叶斯信念网络构建关系层次,继而为层次附上距离,形成关系层次距离,而对于数值型属性则利用标准化的曼哈顿距离来度量其相似性,最后结合分类型属性与数值型属性来对整个数据集进行相似性的度量.在此基础上,设计实现了用于混合型数据聚类算法CR
其他文献
本文就煤矿电气自动化控制系统的优化设计进行了论述。
肾病综合征(nephrotic syndrome,NS)是肾小球疾病中的一组临床症候群,是免疫介导性炎症疾病,临床表现为大量蛋白尿、低白蛋白血症、水肿,伴或不伴有高脂血症。该病具有病程长
介绍了国内外水性醇酸树脂改性的研究进展和近年的研究热点,重点介绍了以丙烯酸、苯乙烯、聚氨酯等改性水性醇酸树脂,以及用几种单体共同改性水性醇树脂等,还介绍了用无机纳
湿地植物是水陆交错带中生态系统的一个重要组成部分,尤其是湿地植物的根系或根孔是该生态系统中物质传输不为人见的"高速公路",系统中部分水分和养分的变化会很快地通过根系
<正>目的:研究大黄素对多药耐药白血病细胞株K562/Adr(KAR)增殖、凋亡的影响及探讨bcr/abl、mdr-1基因在其中的变化。方法:应用四甲基偶氮唑蓝(MTT)比色法、DNA片段化分析及T
以语域理论为基础,从话语范围、话语基调和话语方式三个方面结合语篇的意义系统分析筷子兄弟《父亲》的歌词文本,探讨歌曲《父亲》在大众中受欢迎的理据。
村姑摇身一变成了窈窕淑女.泰国菜如今已跃升为世界级名菜,诱人处是其酸、甜、辣,尤其辣味往往教人辣不欲生,却又欲罢不能……美味“泰”棒了,今日起陪你吃香喝辣尽享美食!曾
在车用液力缓速器的研制中,采用逆向工程技术对液力缓速器的关键零部件叶轮进行设计分析。使用三维激光扫描设备和逆向工程软件,通过数据采集、数据处理、模型重建等过程,获
近年来,环保产业发展迅猛,作为与环境保护与经济发展有着休戚相关的新兴产业,在社会上引发了越来越多的讨论与关注。与其它发达国家或地区相比,中国现阶段在资源、环境方面面