【摘 要】
:
针对不均匀数据集的抽样问题,已有随机抽样算法、基于固定网格划分的单维度算法、基于可变网格划分的单维度算法,但仍无法更好地反映数据分布特征问题。在数据挖掘的实际应用
【基金项目】
:
2014云南省科技厅基金项目(2014RA051)
论文部分内容阅读
针对不均匀数据集的抽样问题,已有随机抽样算法、基于固定网格划分的单维度算法、基于可变网格划分的单维度算法,但仍无法更好地反映数据分布特征问题。在数据挖掘的实际应用中,数据规模越来越大,数据类型也越来越复杂,存在系统整体开销大、时间运行成本高等问题。提出并实现了基于不均匀数据的密度偏差抽样改进算法(IDDS),通过引入网格单元密度和三角函数,从而达到较好的密度偏差抽样效果。实验结果发现,IDDS算法抽样效果更好,提取的样本质量更高,有效保证了不均匀数据的分布特征。与原始的密度偏差抽样算法(DDS)相比,应用
其他文献
目的对心理干预儿童哮喘的疗效进行Meta分析,了解心理干预对儿童哮喘的作用,为制定有效的哮喘干预措施提供科学依据。方法检索2000~2015年Pub Med、重庆维普(VIP)、清华同方(CNK
视网膜血管分割算法是自动视网膜疾病筛查系统主要部分。视网膜血管检测在医学诊断上应用日益广泛,对糖尿病、青光眼等病状有较精确的诊断。提出一种新的全卷积神经网络视网
这几年,我们经常谈论的一个话题是:国有大中型企业能不能搞好搞活?对这个问题,泰川机床集团有限公司董事长赵贤哲有句颇含哲理的话:“不能怪太阳太偏心,自己要挪个位置,主动从阴坡走
"不只是新课文要认真去读,老课文在备课时也要重新读。"对比研读两个版本的老课文,在横向对比中关注内容调整点。通过层层对比,领悟编者的变动意图,发掘老课文的核心教学价值
形式化方法在软件开发过程中一直扮演着重要角色。由于其建立在严格的数学基础之上,因此开发成本较高。为了解决开发成本问题,将软件开发整体分为形式化开发集合类和非形式化
随着我国网络技术快速发展,智能手机的普及,不断扩大了我国互联网用户规模,逐渐产生了手机客户端、微信以及微博等新媒体传播渠道。全媒体时代,自媒体和多媒体信息传播相互融
微博的普及导致微博平台数据量日益增长,因此从海量微博中快速准确地为微博用户推荐好友成为了巨大挑战。用户的社交网络和微博文本在一定程度上体现了用户的价值观和兴趣爱
文章分析了知识管理在企业战略决策中的作用,并结合战略决策的特点讨论了如何借助系统动力学分析方法实现基于知识的战略决策.
中学作文教学中的宏观扩展与微观把握程国生(湛江师院附中湛江524048)作文无疑是语文综合能力的集中表现,无论是词句、文体、结构等知识要点,还是观察、思考、表达等运用能力,巨细无遗地