基于核密度估计的K-means聚类优化

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:fbyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-means聚类算法作为一种经典的聚类算法,应用领域十分广泛;但是K-means在处理高维及大数据集的情况下性能较差。核密度估计是一种用来估计未知分布密度函数的非参数估计方法,能够有效地获取数据集的分布情况。抽样是针对大数据集的数据挖掘的常用手段。密度偏差抽样是一种针对简单随机抽样在分布不均匀的数据集下容易丢失重要信息问题的改进方法。提出一种利用核密度估计结果的方法,选取数据集中密度分布函数极值点附近的样本点作为K-means初始中心参数,并使用核密度估计的分布结果,对数据集进行密度偏差抽样,然后对抽样
其他文献
许多农村学校里都有留守儿童,其中不少孩子不能享受正常的家庭氛围,缺少亲情的温暖,学习成绩也不理想。要想改变这种状况,我认为除了需要教师和家长对这些孩子给予更多的关心帮助
把教育职能放在首位促进图书馆事业发展周世群广西区党校图书馆当前我国图书馆事业的困窘状况即令人揪心,也使人困惑。图书馆人在扼腕叹息,我余,正苦苦寻觅事业低落的原因。实际
利用OECD行业数据库和中国国家统计局发布的投入产出表,结合国际标准产业分类(ISIC Rev3.1),编制了中国2005年非竞争型投入产出表。依据IPCC碳排放计算方法,利用所编非竞争型投
针对智能变电站通讯技术应用中存在的问题,结合智能变电站通讯技术的特点,预计其发展方向,对通信组网方式,包括PTP+E1组网方式、B码+El组网方式等,做了简单的论述。智能变电站未来的
我国的境外经贸合作区对于推动国内企业对外投资有着重要的意义,政府采取了一系列措施以促进其发展,而对外援助(ODA)在此过程中未能得到重视。事实上,对外援助作为一种有效的政策
对两年来上海市国产非特殊用途化妆品网上备案申请及完成情况进行了汇总,归纳了备案中存在的主要问题,并对后续提高网上备案工作有效性提出了一些建议和措施。
我国的自然资源物权体系中存在诸多缺陷。《物权法》的颁布,对于自然资源物权体系的许多方面都有不同程度的完善。
人工智能与多媒体结合的产物———数字视频入侵式报警系统本刊讯北京高特实业公司研制开发的数字视频入侵式报警系统在安全防范领域产生很大的影响。近日,该系统的主要研制人
采用氩弧熔炼后热处理方法制备了 PtBi金属间化合物材料.采用循环伏安法和旋转圆盘电极进行电化学性能测试.通过在 0.5 mol· L-1 H2SO4+ 0.25 mol· L-1 CH3OH溶液