一种改进的基于密度的半监督聚类及其在测井岩性识别中的应用

来源 :中国地质大学(北京) | 被引量 : 0次 | 上传用户:qinzi9509
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的高速发展,数据的规模呈现爆炸式增长。从错综复杂的数据中挖掘出有价值的信息具有巨大的实际意义。聚类算法作为机器学习领域中的一类重要方法,被广泛应用于数据分析与挖掘中。DBSCAN算法是一种典型的聚类算法,以数据密度为度量,可以识别数据集中任意形状的类及噪音点。但是,算法在聚类过程中使用固定的参数聚类,对于非均匀密度的样本的聚类效果会大打折扣。本文以DBSCAN算法为研究对象,针对其对聚类参数敏感、在处理非均匀密度数据集时效果不理想等问题进行研究,提出了改进方法V-DBSCAN算法。V-DBSCAN可以更好的适合非均匀密度聚类。该算法的主要思想是先找出高密度的类簇,然后改变参数值继续聚类,发现较低密度的类簇。不断改变参数的值,这样不同密度的类簇就会被区分。在不断的聚类过程中也伴随着类簇的合并。这时加入半监督的学习方法,用已知点的标签信息或者约束信息实现已生成的类簇的合并,提高合并过程的速度和精度。同时,建立了R树索引,以提高程序的运行效率。由于地质储层数据的复杂性,传统的测井岩性识别方法效果并不理想,所以将本文改进的方法运用在岩性识别上,作为改进的算法的实际应用检验。实验在测井岩性识别上运用了V-DBSCAN算法,采用了三种不同的距离与K-means,KNN和NBC算法做比较,分析了这四种算法在岩性识别的准确率上的差异,实验结果说明了该算法应用在测井数据的岩性识别的准确性高于其他算法,证明了V-DBSCAN能较好地应用于测井岩性识别。
其他文献
常染色体隐性遗传性多囊肾病(ARPKD),发病率较低,多发于新生儿期和婴儿期,其致病基因为多囊肾/多囊肝病变1基因(PKHD1)。ARPKD的发病机制目前尚不十分清楚,治疗原则主要是控
目的观察人参醇提物对糖尿病小鼠的治疗作用,并探讨其可能机理。方法采用多次小剂量腹腔注射链脲佐菌素方法制备糖尿病小鼠模型,用人参醇提物连续治疗14天。结果病理形态学观
<正> 老母猪肉不易煮烂,不好吃,人们是不乐意买的,现介绍鉴别方法如下: 一看肉皮老母猪肉皮厚质硬,肉皮上的毛孔又深又大。二看乳头老母猪的乳头又粗又长,有很多皱褶,乳管粗
大火草(Anemone tomentosa(Maxim.)Pei)别名野棉花、土白头翁、大头翁(陕西),是毛莨科银莲花属多年生草本植物。大火草的药用部位为根和茎,常用于治疗各种疮疖痈肿、疟疾、咳
知识经济对教育的影响源于知识经济下知识观的变革以及知识经济对人们智力发展水平提出的普遍要求。知识经济对教育的根本影响表现在对教育价值的影响。在探讨知识经济对教育
简要介绍了水下管道电磁法探测系统的主要设备、技术指标及检测方法。并结合探测实例对该种探测技术及设备进行了总体评价。
<正>中国科学院沈阳科学仪器股份有限公司,以真空技术为基础,面向高端科研仪器、半导体、太阳能、LED等高科技、新材料、新能源领域,以装备制造为主业,成为集研发、生产、销
会议
文中分析了大学生创新能力的特点和制约因素 ,阐述了培养大学生创新能力的方法和途径 ,提出大学生创新能力培养是高校教育改革重要内容 ,只有不断探索 ,勇于实践 ,才能培养出
盐度是南海物理环境的重要组成部分之一。盐度变化对南海的水动力环境有重要影响。当水动力环境改变时,南海的环流会发生相应的改变,从而对中国气候产生影响。因此,研究南海盐度
患者,男,21岁,主因反复发热6d于外院入院。入院前6 d,患者无明显诱因出现发热,最高达39.5℃,伴有上腹痛,腹胀,呼吸急促,鼻出血,在当地诊所以"胃肠性感冒"治疗后效果不佳。为求