基于加权向量提升的多尺度聚类挖掘算法

被引量 : 0次 | 上传用户:lqy760305
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining,DM)是从包含相对复杂结构的海量动态数据库中提取潜在的、未知的、和有用知识的过程[1],因此也被称作数据库中的知识发现(KnowledgeDiscovery in Database,KDD)。聚类[2]作为数据挖掘领域中的重要研究内容得到了长足的发展,聚类主要实现以下目的:将数据集中的对象分成若干类簇,以达到类簇内对象尽可能相似,而类簇间对象尽可能相异。目前有关聚类挖掘的研究已基本成熟,而当前社会是一个“跨界”的社会,将聚类挖掘技术应用于其它学科越来越受到学者们的重视,而多尺度科学[3,4]作为一门新兴学科,其相关研究也变得炙手可热,将聚类挖掘同多尺度科学结合起来实现多尺度聚类挖掘变得越来越重要。目前,多尺度聚类挖掘有了一定的研究进展,如学者孙庆先将多尺度的数据挖掘归纳为三种途径[4]:在挖掘前将单一尺度的数据转换成多个尺度的数据,然后对多个尺度的数据分别进行挖掘,即实现数据的多尺度转换;在挖掘算法中引入调节尺度用的操作部件,以控制挖掘出知识的尺度;将挖掘出的单一尺度的知识转换成多个尺度的知识,即完成知识的多尺度转换。通过前两种途径可以很容易地实现多尺度挖掘,但遇到的一个严重的问题就是需要在每一个尺度上应用挖掘算法。途径3还很少有人研究,本文对本途径进行探索,提出了一种新的算法,以解决前两种途径的多尺度聚类挖掘中所遇到的问题。本文的主要工作内容如下:提出了一种基于向量的多尺度表示方法。尺度存在于各种类型的数据库中,而不同类型的数据,其尺度的表达方式也不同,为尺度大小的比较、尺度转换工作带来了不便。本文基于向量的思想将不同数据类型的尺度表示成统一的向量形式,以方便尺度间的比较、转换操作,并为本文算法的提出奠定了基础。提出了一种基于加权向量提升的多尺度聚类挖掘算法,来完成在不同尺度上聚类的目的。算法的基本思想即是多尺度挖掘的第三种途径:首先,该算法选定一个基准尺度,并在该基准尺度上应用聚类挖掘算法以获取该尺度上的聚类结果;其次,对于用户感兴趣的其它尺度,通过应用尺度转换机制将基准尺度上的聚类结果反演出目标尺度的聚类结果,进而完成多尺度的聚类挖掘。将本文提出的算法应用于H省流动人口分析当中,进一步验证了本文算法的可行性和有效性。实验表明,该算法是可行和有效的,其聚类结果可以为相关领域的决策者提供科学的指导依据。
其他文献
对高血压经多种方法治疗无效的情况下,据英M.J.戴维斯《冠状动脉疾病彩色图谱》阐述的动脉硬化成因,依据中药免疫药理知识,用黄芪、枸杞子、女贞子、白芍、甘草、制首乌、丹
目的:观察中药配合奥泰灵在治疗膝关节骨关节炎的疗效。方法:采用中医辨证配合奥泰灵,与中医辨证对比观察其临床疗效。结果:中医配合奥泰灵比单用中药和单用奥泰灵其疗效均有
"火郁发之"是《内经》治疗大法之一。其意即通过因势利导来宣泄郁热,透邪外出,从而达到气机开合升降协调,恢复阴阳平衡的目的。笔者认为,临证在运用清热泻火、清热养阴的同时
稀疏网络的传统链接预测准确率低,为了捕捉稀疏网络节点间建立链接的可能性,提出基于节点间最短路径的最简子图概念。最简子图反映了节点间的拓扑紧密关系,在采用node2vec节
近几年来,报纸频频出现有关中小学生因心理健康问题而出现过激行为事件的报道。青少年自杀现象日益突出,且自杀者年龄越来越低龄化。目前统计数据显示,我国青少年的心理亚健康问
在工业化、城市化、全球化进程迅速推进的今天,人类文明飞速发展,与此同时,环境问题不断暴露,历史学者学者不断从自身研究的角度出发,关注环境问题,支持蓬勃发展的环境运动。环境史
目的:观察归芪建中汤加减配伍灯火灸治疗糖尿病胃轻瘫的临床疗效。方法:将62例糖尿病胃轻瘫患者随机分为2组:治疗组(n=30)给予归芪建中汤加减配伍灯火灸治疗,对照组(n=32)给
目的评价持续椎管引流治疗腰椎术后脑脊液漏的疗效。方法 2007年1月至2012年1月我科共治疗腰椎术后出现脑脊液漏19例,均行持续椎管引流治疗,切口愈合前应用抗生素预防感染并
《伤寒论》中有不少方剂,是寒凉药与温热药同时使用",寒温并用"是张仲景用药的一大特色。论述《伤寒论》中方药寒温并用的配伍目的,并略举数例分析其配伍机理。
近年来,语言在国际关系中的重要作用逐渐引起人们的兴趣和关注,出现国际关系研究的“语言转向”。这一学术转向的意义在于,它试图探索国际关系中的人和事件如何在语言的作用