【摘 要】
:
两阶段抽样算法从海量数据集中抽取样本数据用于数据挖掘,当数据集规模过大时算法效率偏低,当数据集规模过大且为稀疏数据集时抽样精度偏低。本文改进了传统两阶段抽样算法,提出
【基金项目】
:
湖北省自然科学基金资助项目(2006ABA082)
论文部分内容阅读
两阶段抽样算法从海量数据集中抽取样本数据用于数据挖掘,当数据集规模过大时算法效率偏低,当数据集规模过大且为稀疏数据集时抽样精度偏低。本文改进了传统两阶段抽样算法,提出新的抽样算法EAFAST,可自适应地调节算法参数,而且能充分利用历史信息进行启发式搜索。实验证明,EAFAST算法可同时提高算法效率和抽样精度,弥补了传统算法的不足。
其他文献
随着网络技术的飞速发展,网络世界的信任危机日益暴露并愈发严重.儒家倡导的诚信观念要求人们真实不欺,诚实守信.儒家的诚信精神同样是网络世界的生存之基,只有遵从诚信原则,
背景:先天性巨结肠又称希尔施普龙病(Hirschsprung’s disease,HSCR),是丹麦医生Hirschsprung于1886年首次描述。发病率约1/5000活产新生儿,HSCR的病因是的远端肠壁内无神经节细胞,其病理生理机制是由于肠神经系统(ENS)缺失,而没有神经介导的推进运动模式,导致远端肠段处于痉挛狭窄状态,近端结肠蓄便、积气继发扩张和肥厚渐渐造成了巨结肠病变。HSCR的主要症
口语能力是语言综合能力的重要标志。缺乏学习策略是影响学生提高日语口语能力的重要因素之一。文章分析了日语口语学习中的记忆策略、认知策略、情感策略、社交策略的作用。
翼腭窝是位于颞下窝内侧、眶尖后下方的狭小骨性间隙 ,窝内有重要的血管、神经结构通过 ,并与颅内外多个腔和窝相通。由于其位置特殊 ,解剖结构复杂 ,许多起源于鼻腔、眶、鼻
历时5年的中欧甘肃基础教育项目于2006年底结束,项目为甘肃省农村中小学教师和校长搭建的688个集学习、研讨、交流、合作等功能为一体的平台——教师学习资源中心也伴随着项目
近年来,由于音频和视频等实时多媒体业务的爆发式增长,Internet面临越来越严重的QoS问题。现有网络采用的是“尽力而为”的发送机制,不能为业务提供足够的QoS保证。IETF在大
为实现寒冷地区冬季施工中混凝土内部结构发展的无损监测,研究两种坍落度、两种防冻剂的混凝土在标准养护条件、恒负温养护条件及自然变负温养护下动弹性模量随龄期的变化规律
本文主要论述了在初中英语教学中怎样运用归纳法,培养学生的归纳能力,从而达到使学生变被动学习为主动学习。
为探索不同种植密度对大蒜独头蒜率的影响,有效降低种植成本、提高生产效益,依托国家特色蔬菜产业技术体系,在云南洱源县右所镇松曲村开展大蒜密度种植试验,设667m^2种植8.5
“华商之源,通达商丘。”商丘,自古便是“通达”之地。$$玄鸟生商、王亥兴商、商汤都商。商丘是三商之源、华商之源和商文明之源。早在夏、商时期,商丘及中原地区已经是全国重要