基于数据集属性相似性的聚类算法推荐

来源 :南京大学学报(自然科学) | 被引量 : 0次 | 上传用户:soul678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由No Free Lunch理论可知,没有一种聚类算法可完美的解决所有问题。算法推荐是解决此问题的一种有效手段,其核心是数据集相似性的度量。因此提出了一种计算数据集相似性的新方法,通过提取能揭示数据集内在分布和结构的几种属性,然后计算数据集几个属性间的距离,从而得到相似性的度量。首先选择了统计特征向量和二值化向量,然后对数据集进行划分,并计算划分中点到中心点的距离和点对之间的 robust path‐based距离得到数据集的紧凑性和连接性。再通过BP网络训练得到4个属性的参数,进而得到了数据集的相似性度
其他文献
日本著名作家志贺直哉以其惊人的驾驭语言的才能和独特的写作风格,创立了日本文坛上独树一帜的志贺文学,而被誉为“小说之神”。志贺的文学创作经历了充满对立到最终调和的过
当前,农民增收问题已经成为整个中国社会关注的焦点问题,是全党及各级政府工作的重中之重。2010年伊始,中央政府就以“一号文件”的形式再次强调农民增收问题的重要性。实质
恐怖主义的蔓延,给国家和人们带来了灾难,各国都在积极制定和完善本国的反恐立法来预防和打击恐怖主义犯罪。德国作为欧盟重要的一员,在反对国际恐怖主义斗争中发挥着重要的
葛缕子(学名Carum carvi L)属伞形科,英文名为“Caraway”,别名为藏茴香。其籽主要含挥发油(3%~6%),主要用于药用和食品添加剂。该植物为多年生草本,分布于西亚、欧洲及我国的
<正>在线教育和线下教育的财务结构完全不同,在线教育是先投入,巨额的投入,至于产出,还得看你对学生学习体验的了解程度。"沪江网校我们已经持续投入3亿元人民币,未来3年时间
期刊
为了解决能源危机问题、实现可持续发展、构建绿色环保社会,世界各国都在积极开发利用太阳能资源。太阳能的利用已经渗透到社会各方面,但太阳能利用效率低这一问题一直影响和
随着遥感数据的社会化服务需求日益增长,如何以Web的方式向用户提供专业遥感影像处理及应用的产品服务成为一个研究的热点问题。本文基于Web RS概念,以及先进的网络技术与并
广西三江侗族自治县当代民间绘画是以农民为创作主体,吸收了侗族刺绣、剪纸、服饰等民间传统美术的表现手法,借鉴了一些专业美术的技法,创作出的具有构图大胆、造型夸张、色
<正>长庆油田公司第一采油厂杏河作业区杏04井区党支部紧密围绕原油生产建设这一中心工作,以"服务中心、创建和谐"为工作主题,按照选配一个好书记、建设一个好班子、带出一支
人力资源信息化管理说的是把电脑与网络技能作为前提,把信息管理当作方向,把程序与网络化业务看作重点,借助先进的管理原理与方式创建一种新种类的人力资源管理模块,对取得人