Data Mining with R

来源 :第一届中国R语言会议 | 被引量 : 0次 | 上传用户:z1750691
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  The name "Data Mining",commonly used to describe a style of data analysis that makes a virtue of exploratory approaches,emerged from the computer science community.In a recent book,Ken Berk describes it as a "muscular " version of EDA (Exploratory Data Analysis).Statistical Learning and Machine learning draw from similar streams of ideas,and have similarly strong connections into computer science,but may pay more attention to the literature and traditions of probability theory and of theoretical statistics."Analytics",focusing on applications in business and commerce,is another name that has come into wide use in recent years. This talk will offer a statisticians view of these different names for data analysis,with their differences in style,concepts,terminology and notation.It will comment on the challenges and innovations that they have fostered.It will comment on common deficiencies in the frameworks of understanding and theory,arising in part from limited attention to insights from the statistical tradition.It will comment on key ideas.Finally.it will comment on what R offers to these diverse communities.in specific analysis tools,as a unifying framework for development of new abilities,and as a means of access to a wide range of methodologies.
其他文献
分析了与特高压电网接入相关的福建500kV电网送受电能力,以及特高压电网接入对福建500kV电网暂态稳定性、小扰动稳定性和短路电流等的影响以及福建电网的适应性.研究计算结果
设备巡视是变电站运维工作的重要工作之一,是运维人员了解监测设备健康水平的重要手段.传统的人工巡检方式随着无人值守模式的推进,其巡视工作量增大、效率低、恶劣天下巡视
建筑信息模型(BIM)是以三维数字技术为基础,集成了建筑工程项目中各种相关信息的工程数据模型.本文首先介绍了BIM技术的基本理念和主要应用范围,以及在电力工程中的应用现状.
分布式电源的建模及微电网的控制策略是当前的研究热点,针对模式转换下分布式电源接入微电网控制策略选择的研究较少.孤岛和并网模式下应选择不同的控制策略,同时在一个微电
将故障位置作为已知条件看待并引入参考点与之匹配的思想基础上,构建了一个和双曲正切函数具有相同幅相特性的测距函数.基于此幅相特性,提出一种同杆双回线非同步故障快速定
介绍了支柱瓷绝缘子超声波检测法和振动声学检测法的特点.设计相关试验,比对支柱瓷绝缘子检测超声波法与振动声学法典型案例,分析两种方法对不同缺陷的检测灵敏程度,提出振动
会议
  This paper gives a technical introduction to the history of R.
  本研究利用R中的TOPMODEL包和RHydro包在流域水文表而分析的基础上对其水文过程进行模拟,设置是否进行凹陷点填允处理来考察其对地形指数等水文响应单元的影响,并对流域
  R是一门用于统计计算和作图的语言,受S语言影响发展而来.R语言最初由新西兰奥克兰大学统计系的Robert Gentleman和Ross Ihaka合作编写.自1997年开始,R语言开始由一个核心