一小时向非程序员介绍 R 编程语言_光环大数据培训

来源:互联网 由 光环IT学院 贡献 责任编辑:王小亮  
http://hadoop.aura-el.com

一小时向非程序员介绍 R 编程语言_光环大数据培训

(1)下载R和RStudio

我对RStudio的印象不错,对于初学者来说,它既方便又很有帮助,对专业人士也很有用。尤其对于初学者:鼠标指向-点击式(point-and-click)的选项非常棒,工作区面板对于建立起对R环境的概念也非常有用。我甚至都不用再花精力向我妹妹介绍R默认的集成开发环境——我马上就让她下载了RStudio,不过你仍然需要下载普通版的R。下载之后,我意识到r-project.org网站真应该在设计上进行大修整,因为:(a)它不够漂亮(b)如果你不知道什么是“CRAN镜像”,下载R将是一件容易把人搞糊涂的事。

(2)控制台和脚本

准备好之后,我们做的第一件事就是在控制台中键入如下两行代码:

123> x =7> x +9[1] 16

这并非纯粹的“Hello World”,但它阐明了一些概念,比如”赋值”、”变量”和”求值”[注2]。

接着,我让妹妹在一个R脚本文件中保存了上面那两行代码(我认为,在初学者开始使用一门语言时就教会他们如何正确地把代码保存在脚本文件中是非常重要的)。然后,我教她怎么用Cmd-Enter组合键(译者注:这是Mac OS的键位。在PC中,对应的组合键是Ctrl+Enter)在控制台中执行代码。

在解释这些内容的过程中,我意识到”控制台”和”脚本”这类术语比较晦涩,所以我尽可能给出它们的明确的定义。我也不得不小心地使用那些含义确切

http://hadoop.aura-el.com

的词而非”REPL”或”prompt”这类词汇

(3)注释

1# 注释特别重要,所以我们学习了它

(4)图形

脚本、注释和控制台可能有点儿枯燥,所以到了这一步,该是从图形中寻找点儿乐趣的时候了!这是我们绘制的一张图:

12x =rnorm(1000, mean =100, sd =3)hist(x)

教我妹妹理解这段代码涉及解释什么是函数(因为rnorm和hist都是函数)、什么是函数的实参,以及为什么你可以通过名字引用实参却不一定非得这样做。

我还教她怎么保存一个图形——借助图形窗口中方便的“Export”按钮,在RStudio中保存图形非常容易。

(5)获得帮助

我认为,“获取帮助”是这类快速入门过程中需要掌握的最重要的概念。显然你不可能在一个小时之内学会一切,所以,你真正需要的是当你用到时可以查找到相应信息的工具。下面是我介绍的语法:

123

4# 如果你知道函数名,但不知道怎么使用?chisq.test# 如果你知道要做什么,但不知道函数名

??chisquare

http://hadoop.aura-el.com

考虑到查函数文档对非程序员来说不太容易,这本来或许不是一个正确的策略。我考虑过强调google技巧的重要性(我在研究生院学到的最有用的东西),或者介绍StackOverFlow和R-help,但最后还是决定讲解官方的文档系统。”在R中我该怎么做X这件事”是初学者最常见的问题之一,我认为这个问题的答案可能应该是”使用函数Y( )”——所以重要的是能够搞清楚如何使用函数Y( )。

在我看来,初学者最常见的另一个问题是”我遇到了出错信息Z,怎么修正它?”。为解决这个问题,我演示一些常见的错误(对象未找到,意外的常量,等等)并解释了它们的含义。

(6)数据类型

查看帮助文档让我想起文档中经常会提及某个函数的实参必须是某个特定的类型,因此我们或许应该讨论一下数据类型。我介绍了:

向量

123

4

5

6

7

8

http://hadoop.aura-el.com

9

10# 字符串向量> y =c(“apple”, “apple”, “banana”, “kiwi”, “bear”, “strawberry”, “strawberry”)> length(y)

[1] 7

# 数值向量

> numbers =rep(3, 99)

> numbers

[1] 33333333333333333333333333333333333333

[39] 33333333333333333333333333333333333333

[77] 33333333333333333333333

矩阵

123

4

5

6

http://hadoop.aura-el.com 7

8

9

10

11

12

13

14

15

16

17

18

19

20

以下内容为系统自动转化的文字版,可能排版等有问题,仅供您参考:

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 一小时向非程序员介绍 R 编程语言_光环大数据培训

(1)下载 R 和 RStudio

我对 RStudio 的印象不错,对于初学者来说,它既方便又很有帮助,对专业 人士也很有用。尤其对于初学者:鼠标指向-点击式(point-and-click)的选项非 常棒,工作区面板对于建立起对 R 环境的概念也非常有用。我甚至都不用再花精 力向我妹妹介绍 R 默认的集成开发环境——我马上就让她下载了 RStudio,不过 你仍然需要下载普通版的 R。下载之后,我意识到 r-project.org 网站真应该在 设计上进行大修整, 因为: (a)它不够漂亮 (b)如果你不知道什么是 “CRAN 镜像” , 下载 R 将是一件容易把人搞糊涂的事。

(2)控制台和脚本

准备好之后,我们做的第一件事就是在控制台中键入如下两行代码: 123> x =7> x +9[1] 16

这并非纯粹的 “Hello World” , 但它阐明了一些概念, 比如” 赋值” 、 ” 变量” 和”求值”[注 2]。

接着,我让妹妹在一个 R 脚本文件中保存了上面那两行代码(我认为,在初 学者开始使用一门语言时就教会他们如何正确地把代码保存在脚本文件中是非 常重要的)。然后,我教她怎么用 Cmd-Enter 组合键(译者注:这是 Mac OS 的键 位。在 PC 中,对应的组合键是 Ctrl+Enter)在控制台中执行代码。

在解释这些内容的过程中,我意识到”控制台”和”脚本”这类术语比较晦 涩,所以我尽可能给出它们的明确的定义。我也不得不小心地使用那些含义确切

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 的词而非”REPL”或”prompt”这类词汇

(3)注释 1# 注释特别重要,所以我们学习了它

(4)图形

脚本、注释和控制台可能有点儿枯燥,所以到了这一步,该是从图形中寻找 点儿乐趣的时候了!这是我们绘制的一张图: 12x =rnorm(1000, mean =100, sd =3)hist(x)

教我妹妹理解这段代码涉及解释什么是函数(因为 rnorm 和 hist 都是函数)、 什么是函数的实参,以及为什么你可以通过名字引用实参却不一定非得这样做。

我还教她怎么保存一个图形——借助图形窗口中方便的“Export”按钮,在 RStudio 中保存图形非常容易。

(5)获得帮助

我认为, “获取帮助”是这类快速入门过程中需要掌握的最重要的概念。显 然你不可能在一个小时之内学会一切,所以,你真正需要的是当你用到时可以查 找到相应信息的工具。下面是我介绍的语法: 123

4# 如果你知道函数名, 但不知道怎么使用?chisq.test# 如果你知道要做什 么,但不知道函数名

??chisquare

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

考虑到查函数文档对非程序员来说不太容易, 这本来或许不是一个正确的策 略。我考虑过强调 google 技巧的重要性(我在研究生院学到的最有用的东西), 或者介绍 StackOverFlow 和 R-help,但最后还是决定讲解官方的文档系统。 ”在 R 中我该怎么做 X 这件事”是初学者最常见的问题之一,我认为这个问题的答案 可能应该是”使用函数 Y( )”——所以重要的是能够搞清楚如何使用函数 Y( )。

在我看来,初学者最常见的另一个问题是”我遇到了出错信息 Z,怎么修正 它?” 。 为解决这个问题, 我演示一些常见的错误(对象未找到, 意外的<X>常量, 等等)并解释了它们的含义。

(6)数据类型

查看帮助文档让我想起文档中经常会提及某个函数的实参必须是某个特定 的类型,因此我们或许应该讨论一下数据类型。我介绍了:

向量 123

4

5

6

7

8

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

9

10# 字符串向量> y =c( “apple” , “apple” , “banana” , “kiwi” , “bear” , “strawberry”, “strawberry”)> length(y)

[1] 7

# 数值向量

> numbers =rep(3, 99)

> numbers

[1] 33333333333333333333333333333333333333

[39] 33333333333333333333333333333333333333

[77] 33333333333333333333333

矩阵 123

4

5

6

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

7

8

9

10

11

12

13

14

15

16

17

18

19

20

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

21> mymatrix =matrix(c(10, 15, 3, 29), nrow =2, byrow =TRUE)> mymatrix[,1] [,2]

[1,] 1015

[2,] 329

> t(mymatrix)

[,1] [,2]

[1,] 103

[2,] 1529

> solve(mymatrix)

[,1] [,2]

[1,] 0.1183673-0.06122449

[2,] -0.01224490.04081633

> mymatrix %*%solve(mymatrix)

[,1] [,2]

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com [1,] 10

[2,] 01

> chisq.test(mymatrix)

Pearson’s Chi-squared test with Yates’continuity correction

data: mymatrix

X-squared =5.8385, df =1, p-value =0.01568

数据框(dataframe) 123

4

5# 设置工作目录 setwd(“~/Documents/R_intro”)# 读入一个数据集

wages =read.table(“wages.csv”, sep =”,”, header =TRUE)

就这样,我们借助实例讨论了一些数据类型,并顺带着学习了其他一些重要 的内容,像怎么确定向量中元素的个数、什么是工作目录,以及怎样读入数据文 件。

(7)探索性数据分析

一旦你读入了一个数据集,事情就开始变得有趣了。我们从中学习了一大堆

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 东西,像怎么做基本的表格、遇到缺失数据如何处理,以及怎么拟合一个简单的 线性模型。这部分的内容相当有趣,以至于我妹妹开始主导学习过程了:不再是 我说“我要教你如何做什么” ,而是她主动问“嗯,我们能画一个散点图吗?” 或“你觉得我们可以把最优拟合直线放到那个图上吗?”我真为此而感到高兴— —我希望这意味着她已全身心投入并乐在其中。 123

4

5

6

7

8

9

10

11

12

13

14

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

15

16

17>

names(wages)[1]

“edlevel””south””sex””workyr””union””wage””age”[8] “race””marital”

> class(wages$marital)

[1] “integer”

> table(wages$union)

notunion member union member

43896

> summary(wages$workyr)

Min. 1stQu. Median Mean 3rdQu. Max.

0.008.0015.0017.8226.0055.00

> nrow(wages)

[1] 534

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

> length(which(is.na(wages$sex)))

[1] 0

> linmod =lm(workyr ~ age, data =wages)

> summary(linmod)

我们还进一步学习了图形,像怎么作出好的直方图,以及怎么在回归直线上 叠加散点图。 123hist(wages$wage, xlab =”hourly wage”, main =”wages in our dataset”, col =”purple”)plot(wages$age, wages$workyr, xlab =”age”, ylab=”years worked”, main =”age vs. years

worked”)abline(lm(wages$workyr ~ wages$age), col=”red”, lwd =2)

好了,时间到。

我遗漏了些什么?哪些事能做得更好?我事后想到的有:

· 用[]取子集. 这是个关键知识点。它可以应用于我所介绍的所有数据类 型,而且极为有用。我真希望当时有时间让我妹妹做一个,比如只包含女性的工 资直方图

· 编程相关的东西:循环、if 语句、用户自定义函数,等等。不过我觉得 不教这些东西也没问题——考虑到受众, 我是把 R 当作一个数据分析环境而非一 种编程语言来教授。

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com · 保存.rda 文件和/或工作区

· 安装和载入包

· 其他数据类(比如列表)

· 其他(更好的?)帮助资源/提示/技巧

最后一点感想 总的来说,在一小时内介绍 R 让我收获了乐趣,而且我认为(希望?)我妹妹 也是如此。临别时我又给了她一些资料:这个,这个和这个,这些资料我都不是 非常熟悉——但我知道,要想能够用 R 分析实际数据,所需的时间远大于在我这 儿的一个小时。我相信我已经覆盖了大部分基础知识,我妹妹也觉得这对她非常 有帮助。我很乐意听各位来谈谈你是如何应对”一小时内向非程序员介绍 R”这 个挑战的。

为什么大家选择光环大数据!

大数据培训、 人工智能培训、 Python 培训、 大数据培训机构、 大数据培训班、 数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请大数据 领域具有多年经验的讲师,提高教学的整体质量与教学水准。讲师团及时掌握时 代的技术,将时新的技能融入教学中,让学生所学知识顺应时代所需。通过深入 浅出、通俗易懂的教学方式,指导学生较快的掌握技能知识,帮助莘莘学子实现 就业梦想。

光环大数据启动了推进人工智能人才发展的“AI 智客计划” 。光环大数据专注国内 大数据和人工智能培训,将在人工智能和大数据领域深度合作。未来三年,光环大数据

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

将联合国内百所大学,通过“AI 智客计划” ,共同推动人工智能产业人才生态建设,培 养和认证 5-10 万名 AI 大数据领域的人才。

参加“AI 智客计划” ,享 2000 元助学金!

【报名方式、详情咨询】 光环大数据网站报名:http://hadoop.aura-el.com 手机报名链接:http:// hadoop.aura-el.com /mobile/

光环大数据 http://hadoop.aura-el.com


  • 与《一小时向非程序员介绍 R 编程语言_光环大数据培训》相关:
  • 一小时向非程序员介绍 R 编程语言
  • 为什么R是你下一个要学的编程语言_光环大数据培训机
  • 哪种编程语言最令人讨厌_光环大数据培训
  • 让程序员感到崩溃的10种编程语言_光环大数据 Py
  • 大数据培训_关于Supervisor的简单介绍_光
  • python培训课程_人工智能编程语言_光环大数据
  • 光环大数据分享常用的大数据处理编程语言
  • 什么是适合初学者的编程语言_光环大数据 Pytho
  • 各种编程语言的深度学习库整理_光环大数据 Pyth
  • JavaScript 函数式编程介绍_光环大数据培
  • 本站网站首页首页教育资格全部考试考试首页首页考试首页职业资格考试最近更新儿童教育综合综合文库22文库2建筑专业资料考试首页范文大全公务员考试首页英语首页首页教案模拟考考试pclist学路首页日记语文古诗赏析教育教育资讯1高考资讯教育头条幼教育儿知识库教育职场育儿留学教育高考公务员考研考试教育资讯1问答教育索引资讯综合学习网站地图学习考试学习方法首页14托福知道备考心经冲刺宝典机经真题名师点睛托福课程雅思GREGMATSAT留学首页首页作文
    免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.xue63.com All Rights Reserved