【摘 要】
:
聚类分析是数据挖掘领域中最重要的任务之一,目前许多聚类算法已经被成功应用到图像聚类、文本聚类、信息检索、社交网络等领域.但面对结构复杂,分布不均衡的数据集时,确定数
【机 构】
:
重庆大学 计算机学院,重庆400044重庆电子工程职业学院 软件学院,重庆401331;重庆大学 计算机学院,重庆400044;重庆大学 软件理论与技术重庆市重点实验室,重庆400044;重庆大学 计
论文部分内容阅读
聚类分析是数据挖掘领域中最重要的任务之一,目前许多聚类算法已经被成功应用到图像聚类、文本聚类、信息检索、社交网络等领域.但面对结构复杂,分布不均衡的数据集时,确定数据集的最佳聚类数目显得尤为困难.因此,本文针对结构复杂、分布不均衡的数据集提出了一种启发式最佳聚类数确定的方法.首先,构建随机游走模型对数据集中的点进行重要性排序,通过k-最近邻距离图谱确定重要数据点的个数,由此排除噪声点和不重要的点对类之间以及类内密度变化的影响.其次,通过设计的启发式规则(k-最近邻链间距和k-最近邻链最近邻间距)构建决策图确定最佳聚类数目并识别出聚类代表点.最后,通过最近距离传播算法进行聚类.实验表明该方法可以快速准确地找到最佳聚类个数,同时,本文提出的聚类算法与流行的聚类算法相比取得了比较好的聚类结果.
其他文献
1 基本情况rn宣威市位于云南省东北部,是云南省最大的农业县级市,总面积6 069.88km2,有耕地面积14.5万hm2,总人口142万人,其中农业人口127万人,山区、半山区占全市面积的95%,
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
High-strength pipeline steel and large diameter line pipes are often used to increase the capacity of transportation and reduce the cost associated with the con
1 种植大户购买“白皮袋”种子问题逐年严重——“白皮袋”立案查处难rn随着农业经营方式的转变,家庭农场、专业大户、合作组织等新型经营主体蓬勃发展,农业生产模式面临大转
Strain ageing in steel was first observed during the 19th century when the maximum load carrying capacity of a test piece was increased after it had been retest
1基本职责根据《农作物种子质量检验机构考核管理办法》(2007年12月6日农业部第15次常务会议通过农业部令第12号发布)的要求,各种子检验机构在质量体系文件中明确了业务室的
因多种因素影响,目前种子行业产能过剩、品种数量多与种子需求绝对数量相对减少的结构性矛盾仍然十分突出,种子行业已经进入了一个需求发展相对缓慢、企业呈现多级分化的时期
本试验通过改良DNA快速提取方法及采用PCR扩增剂,建立了PAGE检测平台下纪元128、京单128、郑单958品种进行二重PCR扩增的有效SSR引物组合,并对样品SSR纯度检测和与小区种植鉴
河北省是京津冀协同发展的最大受益者,想问题、作决策、办事情,都要协作共赢,在推动国家战略实施中实现自身发展,河北现代种业要以此为契机,全面实现河北现代种业跨越式发展.
目的:探讨原发性系膜增牛性肾小球肾炎(MsPGN)细胞周期素依赖蛋白激酶抑制剂p16INMK4a在肾小球和肾小管间质的表达分布及意义.方法:采用非生物素免疫组化二步法检测36例MsPGN