【摘 要】
:
典型的K-means算法利用手肘法选择合适的K值在实际项目中应用的较多,但是手肘法获取K值自动性低,以及面对海量数据的处理,效率上也有待提高。提出利用手肘法关系图初始点和末
论文部分内容阅读
典型的K-means算法利用手肘法选择合适的K值在实际项目中应用的较多,但是手肘法获取K值自动性低,以及面对海量数据的处理,效率上也有待提高。提出利用手肘法关系图初始点和末尾点连接的关系直线,求K值范围下直线y值与误差平方和的最大差值的方法,最大差值对应的K值为手肘法的最优肘点,由于手肘法需要多次迭代以及数据集稠密度对关系图的影响较小,提出利用数据集预抽样并且将程序部署在spark平台之上的方式自动获取手肘法的肘点K值,这样不仅根据此方法自动获取K-means最优K值而且提高了大数据集的处理效率。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
地图作为和书籍一样的物质和精神产品,是人类物质文明和精神文明的突出表现。本文分析了地图产品的潜在功能,并对地图通过精神消费而产生的转化进行了探讨
以栉孔扇贝(Chlamysfarreri)为对象,研究了其不同组织对氟苯尼考的蓄积与消除规律。氟苯尼考对栉孔扇贝的96h半致死浓度LC50为213.1mg·L-1,安全浓度为21.3mg·L-1。将栉
目的:观察电针长强穴对血管性痴呆(VD)大鼠学习记忆能力及海马CA1区细胞凋亡的影响。方法:将水迷宫筛得的60只雄性大鼠按照随机数字表分为空白组9只、假手术组9只和手术组42
长链烯酮是一类组成丰富且受到广泛研究的生物标志物,已成功应用于古海洋环境重建工作。近来海洋和湖泊的沉积物、颗粒物以及相应的母源藻类培养实验的研究结果都显示,除U^K3
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技