统计绘图新帮手

来源 :中国信息技术教育 | 被引量 : 0次 | 上传用户:hgra_1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  ● R软件介绍
  R是一套完整的数据处理、计算和制图软件系统,它是免费的自由软件,有UNIX,Linux,MacOS和Windows版本,都可以免费下载和使用。R具有丰富的资源,在官方网站上可以下载安装程序,各种外挂程序和帮助文档;具有良好的扩展性,用户可以编写函数或者程序包,可以方便地载入程序包,如常见的图形包graphics、统计包stats等。
  1.界面介绍
  R软件界面简单,由操作界面和输出界面组成,如图1所示。
  2.工具栏和菜单栏介绍
  菜单栏包括文件(输入R代码、建立新的程序脚本、打开程序脚本、显示文件、载入工作空间、保存工作空间、载入历史、保存历史、改变当前目录、打印、保存文件、退出等),编辑(复制、粘贴、选择一切、清除控制台、数据编辑器等),其他(中断目前的计算、缓冲输出、列出目标对象、删除所有的目标对象、列出查找路径),程序包(载入程序包、设定CRAN镜像、选择存放处、安装程序包、更新程序包等),帮助(控制台、关于R的FAQ、手册、R函数<文本文件>、查找帮助,html帮助、R主页等)。
  工具栏主要是把一些常用的菜单命令做成按钮。
  ● 制作各种统计图
  R是“命令行”驱动软件,即输入命令,即可得到相应的结果,功能非常强大,绘制统计图是其主要功能之一。教师只要掌握几个命令即可绘制所需的统计图。下面用R命令制作中学阶段常见的统计图。
  1.制作扇形统计图
  例1:已知某市2012年3月份晴天12天,阴天11天,雨天8天,用扇形统计图描述天气构成。利用R软件制作扇形统计图的命令如下:
  x<-c(11,12,8)
  y<-x/sum(x)
  names(y)<-c(“cloudy”,”sunny”,”rainny”)
  pie(y,col=c(“green”,”red”,”brown”))
  程序段的第一行是把数组(11,12,8)赋值给x,第二行sum(x)是计算数组中数字和,x/sum(x)计算的x的构成,第三行给每一个构成赋名,第四行是制图命令行,其中函数pie( )为制作扇形统计图命令,需要的参数为两个,第二个参数为扇形图每个部分的颜色。
  2.绘制散点图
  例2:在某地区的12~30岁居民中抽取10个样本,其身高和体重如下:
  绘制散点图命令如下:
  c(143,156,159,172,165,171,177,161,164,
  160)->x
  c(41,49,61,79,68,69,74,69,68,54)->y
  plot(x,y)
  plot( )函数具有丰富的作图功能,既可以作散点图,也可以作某个给定函数在某一区间的函数图像。输入help(plot)命令,弹出帮助文档窗口,对plot函数的详细的用法进行说明。当样本数据量较少时,可以从控制台直接输入,当样本数据量较大时,可以从外部txt文件读取。
  3.绘制茎叶图
  对于没有分段的数据可以用茎叶图展示它们的特征,从数据的茎叶图可以看出数据的分布形状及数据是否对称,是否集中分布等特征。
  例3:下面是某市2012年7月11日至2012年8月1日空气中可吸入颗粒物的监测数据。(85 85 66 71 62 52 55 59 52 62 59 70 80 96 97 94 62 51 57 67 96 93)
  其图示如图2,命令如下。
  c(85,85,66,71,62,52,55,59,52,62,59,
  70,80,96,97,94,62,51,57,67,96,93)->klw
  stem(klw)
  如果规定0~50之间为优,51~100之间为良,101~150之间为轻度污染,则能够轻易从茎叶图中获得有多少天空气质量为优,多少天为良,多少天空气轻度污染等信息。
  4.绘制直方图
  R软件绘制直方图的命令为hist( ),其中直方图中纵坐标有两种形式,其纵坐标分别为频数和频率,横坐标表示各段的端点。
  例4:下面是某城市公共图书馆在一年中通过随机抽样调查得到的60天的读者借书数,数据如下(已经从小到大排列),绘制直方图。
  213 230 239 289 291 301 308 310 311 312 318 318 337 343 344 348 349 351 360 362 368 372 374 379 383 385 390 393 396 399 400 404 406 425 429 430 436 438 440 441 444 446 450 453 456 458 471 473 475 483 484 495 498 498 521 524 549 556 568 584
  类似地,把60个数组成的数组赋值给某个变量,然后使用绘制直方图命令hist( )绘制直方图。命令如下:
  u<-c(213, 230, 239, 289, 291, 301, 308, 310, 311, 312, 318, 318, 337, 343, 344, 348, 349, 351, 360, 362, 368, 372, 374, 379, 383, 385, 390, 393, 396, 399, 400, 404, 406, 425, 429, 430, 436, 438, 440, 441, 444, 446, 450, 453, 456, 458, 471, 473, 475, 483, 484, 495, 498, 498, 521, 524, 549, 556, 568, 584)
  hist(u)
  运行上述两行后在输出界面会出现如图3所示,其纵坐标默认为频数(frequency),分成()=8个区间段,其中为样本量。
  绘制直方图时,一般用阴影填充每个小矩形,如果对应的命令为hist(u,density=20),则其中20表示阴影线的密度,数值越大,阴影越密。同样还可以设置矩形的填充颜色。
  在绘制直方图时,根据需要纵坐标有时为“频率(density)”,其对应的命令为hist(u,prob=TRUE),如下页图4所示。还可以把每个区间的样本数量显示在对应的矩形上,对应的命令为hist(u,labels=TRUE)。
  hist( )函数中有很多可选参数,既可以设置图形横轴和纵轴表示的实际意义的文本标题及整个图形的标题,还可以根据需要设置分段的个数。参看更多的帮助,可输入命令help(hist),即可获得hist( )函数的帮助文档。
  ● 与统计有关的计算
  1.计算平均数
  如例3中klw的平均值,其命令为:mean(klw),结果显示为:[1]71.40909。
  2.计算标准差
  计算klw的标准差,其命令为:sd(klw),结果显示为:[1]16.36465。
  3.计算方差
  计算klw的方差,其命令为:var(klw),结果显示为:[1]264.5390。
  4.计算一元线性回归方程
  如求例2中数据的回归直线,其命令为:
  x<-c(143,156,159,172,165,171,177,161,
  164,160)
  y<-c(41,49,61,79,68,69,74,69,68,54)
  lm(y-x)
  其显示结果为:-119.13 1.12。
  即一元线性回归直线为y=1.12x-119.13。
  ● 结语
  使用专业统计软件R可以进行各种统计计算和制作统计图,既形象又直观。熟练掌握R,教师可以花更多的时间进行数据分析,让学生体会数据中蕴含的信息。
其他文献
中国计生委10月19日在北京公布“中国流动人口发展报告2016”,报告指出,中国流动人口数量达2.47亿人,占总人口的18%,相当于每6人中就有1名是流动人口。  报告分析,未来5至15年中国人口流动迁移态势及相关影响,也认为人口流动迁移规模仍将持续增加,但成长放缓,波动性增强;人口流动整体趋于稳定化、家庭化,定居意愿普遍增加。  规模庞大的人口迁移流动已成为影响中国经济社会发展尤其是区域经济社会
【本刊讯】安徽日报报业集团高度重视学习实践活动的新闻宣传工作,坚持“两手抓”,一手抓自身的学习实践活动不断深入,一手抓学习实践活动的新闻宣传浓墨重彩。自活动开展以来,集团各媒体认真组织,精心策划,采取多种形式,认真做好学习实践活动的宣传报道,为学习实践活动营造了良好的舆论氛围。  10月16日,省学习实践科学发展观活动新闻宣传通气会后,集团各媒体迅速传达了会议精神和段敦厚、臧世凯等省委领导的讲话精
编者按:2004年,伴随着山东、海南、宁夏、广东四省区高中新课程改革大幕的拉开,信息技术等“非主流学科”是否应该纳入高考考查范畴成了人们讨论的重点。近年来,海南、山东、江苏、浙江等省陆续将信息技术学科以不同的考查形式,逐渐纳入高考考查内容之列。这为一线的信息技术学科教师带来希望的同时,也带来了相应的困惑。本期特别关注,我们把目光聚焦到以山东、海南、江苏三省为代表的信息技术课教师的身上,听一听他们对
很久很久以前的一个夜晚,看加西亚·马尔克斯的《一桩事先张扬的凶杀案》,夜不能寐。  总觉得奇山怪水,天荒地谬:既然事先人人都知道一缸杀人鸡血正在翻滚,为什么没人能站出来止沸?  但总以为是小说。小说家言,姑妄信之?然事实证明,生活中的暴虐乖张,的的确确甚于小说。  谓予不信,且看南京——朗朗乾坤,清平世界,爱心邻里,尽责警员,看上去都不希望惨剧发生,但是,居然会听任两名女童在众目睽睽之下,活活饿死
一、教材变化及新增内容分析    财务成本管理包括两部分,第一部分是财务管理(一到十章),第二部分是成本管理(十一到十四章)。通过历年考试可以看出,财务成本管理的考试具有考核全面、计算量大、试题灵活、结合实际等特点。财务成本管理属于五科中难度较大,通过率较低的一门,近五年财务成本管理科目的全国合格率分别为:2005年的合格率为13.92%,2004年的合格率为12.61%,2003年合格率为10.
4月8日至5月6日,《江淮时报》连续推出11篇的“垓下古战场遗址之争”系列报道,就宿州市灵璧县和蚌埠市固镇县对“垓下古战场”的属地之争进行了全方位报道,引起蚌埠、宿州两市及专家、学者的广泛关注,并引发了有关部门“如何科学保护、合理开发历史文化遗迹”的深入思考,取得良好的社会效果。  聚焦热点,正确引导。这组系列报道站在“大文化”的高度,对传统文化与当前的社会经济发展的碰撞,进行透视和剖析。通过对这
围绕着这个小镇图书馆的,是一派融洽的和谐社会氛围。杜威的到来固然增加了温馨气氛,但这毕竟只是“外因”。没有人的“内因”作为基础,一只小猫不可能感动世界。    猫是灵异的小动物,它们能够在第一次遇见一个人的时候就知道此人是不是喜欢猫,对喜欢猫的人就亲近,对不喜欢猫的人就疏远。而且,说句笑话,似乎全中国、全世界的猫都是如此。我和我女儿都是喜欢猫的人,我在北京的朋友家甚至公司里遇见的猫,全都和我亲近友
【摘要】频频爆发的突发事件给人们生活带来了极大恐慌,而媒体突发事件报道的功能发挥程度的好与坏对于整个社会的稳定和良性发展都是非常重要的。在这方面,中国既有成功的经验,也有失败的教训。本文试从“三鹿奶粉”事件谈起,对比我国突发事件报道的发展变迁,剖析我国突发事件报道进步的原因,并对我国大众媒介突发事件报道的未来发展提供一些可行性建议。  【关键词】突发事件报道 媒体 “三鹿奶粉”事件    今年9月
【关键词】突发事件 舆论引导    在公共突发事件中,根据国家、公众利益和受众的接受心理,对受众进行正面的引导,弱化负面新闻信息的负效果,化解负面新闻信息传播中的消极作用,是值得我们关注和解决的现实问题。  一般地说,突发事件发生时,媒体的积极作为主要是传播信息以矫正视听、沟通互动以疏解民声、设置议题以引导舆论。本文将以各大媒体对“三鹿奶粉事件”的报道为文本,来探讨突发事件中负面新闻信息传播中的舆
近几天,小林身上出现了不少红色斑块,并伴有瘙痒。她仔细回想,最近并没有接触容易引起过敏的物品,只是就寝前曾服用过安眠药。医生告诉她,身上的斑块很可能就是由安眠药引起的药疹,必须马上停药。小林不禁有些疑惑,以前也间断地服用过安眠药,这一次已经服用3天了,而且用量也比较小,为什么到今天才出现药疹呢?  药物过敏反应是指用于预防、诊断、治疗的药物通过静脉注射、肌肉注射以及口服用药等途径进入机体后,所引起