R erloop.R既是一种环境也是一种语言。它是免费的软件编程语言和软件环境,用于统计计算和图形。R语言广泛使用统计学家和数据矿工,用于开发统计软件和数据分析,但难以学习也是臭名昭着的。但是在正确的指南中,您可以在没有时间使用概率分布的正确解释,假设检测,创建线性模型,线性回归,逻辑回归,异常模型等的正确解释。为什么r值得学习?R是非常通用的,当涉及到数据挖掘和分析时,它涵盖了一整套统计技术和算法。它基本上是一个集成的软件套件,包装和数据,允许您执行统计分析和数据挖掘;并创建复杂的图形。

加入Jagannath Rajagopal,统计预测分析师,作为他回顾主题的难度递增顺序,从数据/对象类型和操作,导入到R,循环和条件。他的R课程简介将在任何时候都可以让您了解r几乎没有近90个视频和140多个举行的行使问题,超过10章。有兴趣学习更多吗?以下是他的一个介绍性章节的成绩单,它定义了R及其函数。

讲座记录:

大家好!在本章中,我们将学习一点R语言。我们会看到它的一些特征。我们将会听到R在现实世界中被用于研究、数据分析和数据挖掘的一些领域。最后,我们将回顾一些可用的资源,包括R项目和互联网上的资源。

好的,R是什么?R既是一种环境也是一种语言。从某种意义上说,它是一个软件、软件包和数据的集成套件,基本上使R语言成为可能。R语言又允许你执行统计分析和数据挖掘;如使用概率分布、假设检验、创建线性模型、线性回归、逻辑回归、异常模型等技术。R是非常通用的,当涉及到数据挖掘和分析时,它涵盖了一整套统计技术和算法。

R允许您创建复杂的图形-您可以生成简单的一维图形,或者您可以使用R创建更复杂的二维或高维图形。您也可以查看R项目网站R-project.org。它对R语言有更全面的描述,也有正式的定义。

那么R有哪些特征呢?R是一种表达式语言。它允许您执行现场分析以及创建程序。这是什么意思?比如说,有一个25个数字的数据集,你想要了解一些关于这些数字的统计数据,也就是平均值和价差。你可以用R进行两种处理,如果你想一次性得到平均值和差值,你可以取数据集,将其赋给R中的一个向量,然后让R来计算平均值和标准差。或者,如果您想要一种更可重复的方法,即希望将多个数据集传递给一个函数或程序,并一次又一次地扩展我前面提到的统计数据,那么您就需要创建一个程序。

在这种情况下,程序可以确定以向量作为输入和输出的平均值和标准差。R让你两者都能做到。R是高度可扩展的。它的可扩展性来自两个方面。首先,有统计包,包括给R项目的和由用户贡献的。我们可以使用大量的算法、函数和技术,这使得它具有很高的可扩展性。函数本身可以在其他函数中调用,在R中定义和设计函数的方式中,如果一个函数的参数是嵌套的,则可以在另一个函数中调用该函数的参数。这一点,加上我们拥有的所有软件包,使R非常强大,能够执行广泛的任务和技术。

R有几套公开的现实世界数据。现在,当我学习语言时,这对我来说很有用。当我在脚本中创建例程和函数时,我希望某些数据进行测试,这些数据集会非常方便。

我们再来讨论一下R的可扩展性。R语言的基本功能是通过base、Stats、Graphics等包实现的。当您在计算机上下载并安装该语言时,您会发现自动安装并加载了这些软件包。CRAN是一个全面的R档案网络,它提供给你几个软件包,比如Mass和Lettice。当你在电脑上下载并设置R时,这些软件包已经安装,但没有加载。这些是可选的。当你想要与这些相关联的功能时,你可以去打开它们,它就可用了。

有一系列贡献包。我提到在前一张幻灯片中。这些可供您使用。当您下载r并将其设置在计算机上时,它们不会安装,因此您必须进入R并安装它们。安装它们后,如果要使用它们,您也必须加载它们。所有此其中所有此其中的全部列表都可以在Cran R项目网站上获得。

我提到过几次R有多强大,有多少技术,有多少范围和功能可以为你做。另一方面,与其中一些相关的文档可能不如其他的好。特别是对我来说,当我在看贡献者的包时,我并不清楚这些包是什么,它们做什么,在什么情况下我将使用它们,以及我将如何使用它们。这些东西,在某种程度上,你需要自己摸索。如果您是一个介绍用户,甚至在某种程度上是一个高级用户,您将发现您仍然可以使用该软件附带的包来完成许多工作。如果您想使用这些其他软件包中的一些,那么您就必须摸索一下如何使用它们。

我想说的另一件事是,社交媒体中有很多聊天,博客,云中,关于顶级r包等。谷歌感觉免费。稍后,我也将展示围绕包裹的讨论和哪些人很受欢迎。

让我们快速进入R软件并查看包裹。当我加载r时,这个窗口会出现。如果我想查看我已经拥有的软件包,我会转到软件包菜单并查看包管理器。正如我之前提到的那样,这里有一系列包装。其中一些已经加载,以及数据集,图形,方法,统计数据,等等。这些是您的基础包,这些是基本的R语言。

我可以通过加载诸如质量的包来扩展。现在到了贡献的软件包 - 如果您转到包安装程序,我可以找到一系列全系列包存储库,如果我在那里获取包中的包列表,请在此处列出了很多包。列表只是继续前进。就像我之前提到的那样,对我来说并不完全清楚,只是看这个特定包的所作所为,为什么应该使用它,我会关于输入和输出数据。

这是R包。我也提到了社交媒体的帖子,所以等一下。这是Linkedin上的一个讨论。有一个问题是关于最好的包装是什么。你可以看看这个。url就在这里。你也可以找到它当你谷歌“最好的R包。”清单出现了。看看。有很多关于流行软件包的评论,您可以从这里得到良好的感觉。

-数据。R环境提供了一套完整的数据集,这些数据都是公开可用的真实世界数据。这里列出了一些例子。此外,如果你想获得其他数据集,你可以去梳理所有的数据库,大学,赌博机构,人口普查委员会等等。这里列出了其中一些和url。请随便去看看。

我想快速地给你们展示一些数据当你下载R并在你的电脑上设置它的时候就已经安装好了。我会给你们看一些例子。

所以回到R.如果我点击数据管理器,它会提出数据集。作为一个例子,这是我的最爱之一。这是有关花卉,他们的花瓣和长度集的数据。进一步沿着课程,当我们正在调查统计和一些图形时,我将反复使用这一点。

当我单击数据集时,数据集的描述下面关闭。数据格式,列,等,也可以在那里解释。

下一个!到目前为止的一些应用——我在这里有一些关键词,这些是R使用的领域。但实际上,如果需要分析数据,R通常会在那里找到归宿。我要做的是,我有三到四个研究的例子。我想快速地向你们展示一下人们正在做的事情。

第一个 - 这是r的遗传学的一个例子。作者正试图在某些物种中显示称为基因抑制的难题。因此,他所做的就是使用条形图来表明,在这些物种中,与其他基因相比,特定基因被选择性地抑制,而不会进入太多细节。

另一个例子,这个来自天文学和核物理。暗物质——这是一个研究的例子,作者绘制了暗物质对星系的影响。再一次,不用太多的细节-正如你可以看到的图表,小的白色斑点是星系,而蓝色后面的星团,代表暗物质。

本研究是关于码率的。它是由不同级别的学生给出的评分结果是一个方框图,用户创建它来显示不同级别的学生对相同代码片段给出的评分。

就像我说的,非常多样化。我给你们展示了三个完全不相关的区域但是R在所有这些不同的区域都找到了归宿。

现在来看R资源。我最喜欢的博客是R-bloggers.com。我们快去看看吧。R-bloggers.com是一个博客聚合器。这是所有R博客的集合。你也可以看到这个博客列表。就像任何优秀的博客聚合器一样,它会按时间倒序列出来自不同博客的博文。我可以去看看这个。它会让你对人们用R做的不同的事情有一种感觉。

Linkedin群组,我有几个名字。我之前展示的关于顶级R包的Linkedin帖子是针对统计计算组的R项目的。去吧,看一看,加入这些团体,参与,贡献。

最后,R资源。所以标准的R项目,有很多很多的信息。R手册,我建议你下载并使用它们。他们是一个很好的基础和参考,在未来的任何时间点,你想去和学习。你应该去拿那些文件。

这将我们带到本章的末尾。问题?注释?使用论坛。下次见!

今天就在这门课程中学习R语言的交互使用和编程的核心基础!

r的顶级课程

R水平1 -数据分析与R
R-Tutorials培训
4.5 (2349)
R数据预处理和数据管理-塑造您的数据!
R-Tutorials培训
4.5 (532)
畅销书
R Programming A-Z™:R For Data Science With Real Exercises!
吉尔埃梅亨科,辉煌队
4.6 (39,196)
畅销书
数据科学与机器学习训练营与R
何塞波罗拉
4.6 (12881)
R编程:数据科学R高级分析
吉尔埃梅亨科,辉煌队
4.7 (6789)
R编程统计和数据科学2021年
365个职业,365个西蒙娜(365团队)
4.5 (2982)
使用r的数据分析统计
Sandeep库马尔
4.6 (1395)
数据分析中的统计模型应用
密涅瓦辛格
4.4 (1167)
畅销书
数据挖掘与R:从初学者到高级!
杰弗里Hubona博士。
4.3 (375)
统计数据水平
Bogdan Anastasiei.
4.3 (280)
RIDYVERSE报告和EXCEL用户的分析
乔纳森尼尔
4.5 (534)
畅销书

更R的课程

学生还学习

赋予你的团队。引领行业。

使用Udemy for Business订阅在线课程库和数字学习工具。

请求演示