论文部分内容阅读
● R软件介绍
R是一套完整的数据处理、计算和制图软件系统,它是免费的自由软件,有UNIX,Linux,MacOS和Windows版本,都可以免费下载和使用。R具有丰富的资源,在官方网站上可以下载安装程序,各种外挂程序和帮助文档;具有良好的扩展性,用户可以编写函数或者程序包,可以方便地载入程序包,如常见的图形包graphics、统计包stats等。
1.界面介绍
R软件界面简单,由操作界面和输出界面组成,如图1所示。
2.工具栏和菜单栏介绍
菜单栏包括文件(输入R代码、建立新的程序脚本、打开程序脚本、显示文件、载入工作空间、保存工作空间、载入历史、保存历史、改变当前目录、打印、保存文件、退出等),编辑(复制、粘贴、选择一切、清除控制台、数据编辑器等),其他(中断目前的计算、缓冲输出、列出目标对象、删除所有的目标对象、列出查找路径),程序包(载入程序包、设定CRAN镜像、选择存放处、安装程序包、更新程序包等),帮助(控制台、关于R的FAQ、手册、R函数<文本文件>、查找帮助,html帮助、R主页等)。
工具栏主要是把一些常用的菜单命令做成按钮。
● 制作各种统计图
R是“命令行”驱动软件,即输入命令,即可得到相应的结果,功能非常强大,绘制统计图是其主要功能之一。教师只要掌握几个命令即可绘制所需的统计图。下面用R命令制作中学阶段常见的统计图。
1.制作扇形统计图
例1:已知某市2012年3月份晴天12天,阴天11天,雨天8天,用扇形统计图描述天气构成。利用R软件制作扇形统计图的命令如下:
x<-c(11,12,8)
y<-x/sum(x)
names(y)<-c(“cloudy”,”sunny”,”rainny”)
pie(y,col=c(“green”,”red”,”brown”))
程序段的第一行是把数组(11,12,8)赋值给x,第二行sum(x)是计算数组中数字和,x/sum(x)计算的x的构成,第三行给每一个构成赋名,第四行是制图命令行,其中函数pie( )为制作扇形统计图命令,需要的参数为两个,第二个参数为扇形图每个部分的颜色。
2.绘制散点图
例2:在某地区的12~30岁居民中抽取10个样本,其身高和体重如下:
绘制散点图命令如下:
c(143,156,159,172,165,171,177,161,164,
160)->x
c(41,49,61,79,68,69,74,69,68,54)->y
plot(x,y)
plot( )函数具有丰富的作图功能,既可以作散点图,也可以作某个给定函数在某一区间的函数图像。输入help(plot)命令,弹出帮助文档窗口,对plot函数的详细的用法进行说明。当样本数据量较少时,可以从控制台直接输入,当样本数据量较大时,可以从外部txt文件读取。
3.绘制茎叶图
对于没有分段的数据可以用茎叶图展示它们的特征,从数据的茎叶图可以看出数据的分布形状及数据是否对称,是否集中分布等特征。
例3:下面是某市2012年7月11日至2012年8月1日空气中可吸入颗粒物的监测数据。(85 85 66 71 62 52 55 59 52 62 59 70 80 96 97 94 62 51 57 67 96 93)
其图示如图2,命令如下。
c(85,85,66,71,62,52,55,59,52,62,59,
70,80,96,97,94,62,51,57,67,96,93)->klw
stem(klw)
如果规定0~50之间为优,51~100之间为良,101~150之间为轻度污染,则能够轻易从茎叶图中获得有多少天空气质量为优,多少天为良,多少天空气轻度污染等信息。
4.绘制直方图
R软件绘制直方图的命令为hist( ),其中直方图中纵坐标有两种形式,其纵坐标分别为频数和频率,横坐标表示各段的端点。
例4:下面是某城市公共图书馆在一年中通过随机抽样调查得到的60天的读者借书数,数据如下(已经从小到大排列),绘制直方图。
213 230 239 289 291 301 308 310 311 312 318 318 337 343 344 348 349 351 360 362 368 372 374 379 383 385 390 393 396 399 400 404 406 425 429 430 436 438 440 441 444 446 450 453 456 458 471 473 475 483 484 495 498 498 521 524 549 556 568 584
类似地,把60个数组成的数组赋值给某个变量,然后使用绘制直方图命令hist( )绘制直方图。命令如下:
u<-c(213, 230, 239, 289, 291, 301, 308, 310, 311, 312, 318, 318, 337, 343, 344, 348, 349, 351, 360, 362, 368, 372, 374, 379, 383, 385, 390, 393, 396, 399, 400, 404, 406, 425, 429, 430, 436, 438, 440, 441, 444, 446, 450, 453, 456, 458, 471, 473, 475, 483, 484, 495, 498, 498, 521, 524, 549, 556, 568, 584)
hist(u)
运行上述两行后在输出界面会出现如图3所示,其纵坐标默认为频数(frequency),分成()=8个区间段,其中为样本量。
绘制直方图时,一般用阴影填充每个小矩形,如果对应的命令为hist(u,density=20),则其中20表示阴影线的密度,数值越大,阴影越密。同样还可以设置矩形的填充颜色。
在绘制直方图时,根据需要纵坐标有时为“频率(density)”,其对应的命令为hist(u,prob=TRUE),如下页图4所示。还可以把每个区间的样本数量显示在对应的矩形上,对应的命令为hist(u,labels=TRUE)。
hist( )函数中有很多可选参数,既可以设置图形横轴和纵轴表示的实际意义的文本标题及整个图形的标题,还可以根据需要设置分段的个数。参看更多的帮助,可输入命令help(hist),即可获得hist( )函数的帮助文档。
● 与统计有关的计算
1.计算平均数
如例3中klw的平均值,其命令为:mean(klw),结果显示为:[1]71.40909。
2.计算标准差
计算klw的标准差,其命令为:sd(klw),结果显示为:[1]16.36465。
3.计算方差
计算klw的方差,其命令为:var(klw),结果显示为:[1]264.5390。
4.计算一元线性回归方程
如求例2中数据的回归直线,其命令为:
x<-c(143,156,159,172,165,171,177,161,
164,160)
y<-c(41,49,61,79,68,69,74,69,68,54)
lm(y-x)
其显示结果为:-119.13 1.12。
即一元线性回归直线为y=1.12x-119.13。
● 结语
使用专业统计软件R可以进行各种统计计算和制作统计图,既形象又直观。熟练掌握R,教师可以花更多的时间进行数据分析,让学生体会数据中蕴含的信息。
R是一套完整的数据处理、计算和制图软件系统,它是免费的自由软件,有UNIX,Linux,MacOS和Windows版本,都可以免费下载和使用。R具有丰富的资源,在官方网站上可以下载安装程序,各种外挂程序和帮助文档;具有良好的扩展性,用户可以编写函数或者程序包,可以方便地载入程序包,如常见的图形包graphics、统计包stats等。
1.界面介绍
R软件界面简单,由操作界面和输出界面组成,如图1所示。
2.工具栏和菜单栏介绍
菜单栏包括文件(输入R代码、建立新的程序脚本、打开程序脚本、显示文件、载入工作空间、保存工作空间、载入历史、保存历史、改变当前目录、打印、保存文件、退出等),编辑(复制、粘贴、选择一切、清除控制台、数据编辑器等),其他(中断目前的计算、缓冲输出、列出目标对象、删除所有的目标对象、列出查找路径),程序包(载入程序包、设定CRAN镜像、选择存放处、安装程序包、更新程序包等),帮助(控制台、关于R的FAQ、手册
工具栏主要是把一些常用的菜单命令做成按钮。
● 制作各种统计图
R是“命令行”驱动软件,即输入命令,即可得到相应的结果,功能非常强大,绘制统计图是其主要功能之一。教师只要掌握几个命令即可绘制所需的统计图。下面用R命令制作中学阶段常见的统计图。
1.制作扇形统计图
例1:已知某市2012年3月份晴天12天,阴天11天,雨天8天,用扇形统计图描述天气构成。利用R软件制作扇形统计图的命令如下:
x<-c(11,12,8)
y<-x/sum(x)
names(y)<-c(“cloudy”,”sunny”,”rainny”)
pie(y,col=c(“green”,”red”,”brown”))
程序段的第一行是把数组(11,12,8)赋值给x,第二行sum(x)是计算数组中数字和,x/sum(x)计算的x的构成,第三行给每一个构成赋名,第四行是制图命令行,其中函数pie( )为制作扇形统计图命令,需要的参数为两个,第二个参数为扇形图每个部分的颜色。
2.绘制散点图
例2:在某地区的12~30岁居民中抽取10个样本,其身高和体重如下:
绘制散点图命令如下:
c(143,156,159,172,165,171,177,161,164,
160)->x
c(41,49,61,79,68,69,74,69,68,54)->y
plot(x,y)
plot( )函数具有丰富的作图功能,既可以作散点图,也可以作某个给定函数在某一区间的函数图像。输入help(plot)命令,弹出帮助文档窗口,对plot函数的详细的用法进行说明。当样本数据量较少时,可以从控制台直接输入,当样本数据量较大时,可以从外部txt文件读取。
3.绘制茎叶图
对于没有分段的数据可以用茎叶图展示它们的特征,从数据的茎叶图可以看出数据的分布形状及数据是否对称,是否集中分布等特征。
例3:下面是某市2012年7月11日至2012年8月1日空气中可吸入颗粒物的监测数据。(85 85 66 71 62 52 55 59 52 62 59 70 80 96 97 94 62 51 57 67 96 93)
其图示如图2,命令如下。
c(85,85,66,71,62,52,55,59,52,62,59,
70,80,96,97,94,62,51,57,67,96,93)->klw
stem(klw)
如果规定0~50之间为优,51~100之间为良,101~150之间为轻度污染,则能够轻易从茎叶图中获得有多少天空气质量为优,多少天为良,多少天空气轻度污染等信息。
4.绘制直方图
R软件绘制直方图的命令为hist( ),其中直方图中纵坐标有两种形式,其纵坐标分别为频数和频率,横坐标表示各段的端点。
例4:下面是某城市公共图书馆在一年中通过随机抽样调查得到的60天的读者借书数,数据如下(已经从小到大排列),绘制直方图。
213 230 239 289 291 301 308 310 311 312 318 318 337 343 344 348 349 351 360 362 368 372 374 379 383 385 390 393 396 399 400 404 406 425 429 430 436 438 440 441 444 446 450 453 456 458 471 473 475 483 484 495 498 498 521 524 549 556 568 584
类似地,把60个数组成的数组赋值给某个变量,然后使用绘制直方图命令hist( )绘制直方图。命令如下:
u<-c(213, 230, 239, 289, 291, 301, 308, 310, 311, 312, 318, 318, 337, 343, 344, 348, 349, 351, 360, 362, 368, 372, 374, 379, 383, 385, 390, 393, 396, 399, 400, 404, 406, 425, 429, 430, 436, 438, 440, 441, 444, 446, 450, 453, 456, 458, 471, 473, 475, 483, 484, 495, 498, 498, 521, 524, 549, 556, 568, 584)
hist(u)
运行上述两行后在输出界面会出现如图3所示,其纵坐标默认为频数(frequency),分成()=8个区间段,其中为样本量。
绘制直方图时,一般用阴影填充每个小矩形,如果对应的命令为hist(u,density=20),则其中20表示阴影线的密度,数值越大,阴影越密。同样还可以设置矩形的填充颜色。
在绘制直方图时,根据需要纵坐标有时为“频率(density)”,其对应的命令为hist(u,prob=TRUE),如下页图4所示。还可以把每个区间的样本数量显示在对应的矩形上,对应的命令为hist(u,labels=TRUE)。
hist( )函数中有很多可选参数,既可以设置图形横轴和纵轴表示的实际意义的文本标题及整个图形的标题,还可以根据需要设置分段的个数。参看更多的帮助,可输入命令help(hist),即可获得hist( )函数的帮助文档。
● 与统计有关的计算
1.计算平均数
如例3中klw的平均值,其命令为:mean(klw),结果显示为:[1]71.40909。
2.计算标准差
计算klw的标准差,其命令为:sd(klw),结果显示为:[1]16.36465。
3.计算方差
计算klw的方差,其命令为:var(klw),结果显示为:[1]264.5390。
4.计算一元线性回归方程
如求例2中数据的回归直线,其命令为:
x<-c(143,156,159,172,165,171,177,161,
164,160)
y<-c(41,49,61,79,68,69,74,69,68,54)
lm(y-x)
其显示结果为:-119.13 1.12。
即一元线性回归直线为y=1.12x-119.13。
● 结语
使用专业统计软件R可以进行各种统计计算和制作统计图,既形象又直观。熟练掌握R,教师可以花更多的时间进行数据分析,让学生体会数据中蕴含的信息。