[R VS Python的 - 这是最好的?
如果你正在读这篇文章,我想你,就像许多其他的数据科学家,正在琢磨这在学习编程语言着手。无论你是否有其他的编码工具的经验或没有,这两个单独的功能,包括库和包最初可能令人望而生畏的庞大的阵列,但不用担心,我们在这里帮助!
没有令人吃惊的是,R和Python都拥有各自的优势,为众多应用,并在其全球社区的专业人士被广泛使用。本文将帮助你决定哪些有合适的工具来您去。
首先,很可能是个好主意,重新审视正是你想要在你的数据科学方面使用的编程语言是什么。For example, a data scientist working predominantly on genetics research may find themselves among those using R (as it’s highly used across genetics and popular with bioinformaticians), whereas someone working on models for image analysis, say an employee at Tesla creating self-driving car technology, might find themselves working with people who prefer Python, due to its sophisticated image manipulation tools. Ultimately, it’s still your choice, and while it would usually never be a good philosophy to just blindly do what everyone else is doing, do take the time to discover why these professionals are preferring certain languages. It is important to be able to “speak” the same language as your future peers.
最后更新2020八月
学习编程R和r工作室。数据分析,数据科学,统计分析,封装,功能,GGPLOT2 |通过Kirill Eremenko,SuperDataScience团队
探索课程谁在使用R和什么是它的目的是什么?
r为最初创建作为统计计算的平台,托管所有的经典试验,时间序列分析,聚类等。它有一个大的社区数据矿工,这意味着大量的访问包,都来自R开发者和用户。在图形方面有包和层的用于绘图和分析的曲线图,如GGPLOT2众多。重要的是,R已经出现到新型人工智能现场提供神经网络,机器学习和贝叶斯推理工具,并与包装等深学习作为MXNet和TensorFlow兼容。你可以阅读更多有关这些在这里有用的R封装快速列表。
这似乎R有不仅数据科学家,但主要统计人员和有关领域需要的数据操作(例如那些在医药,金融,和社会科学)的固体以下。对于我们的数据科学家,找到一个广泛使用的程序是很重要的;我们希望能够尽可能多学科的一门语言尽可能内说话,使我们的研究结果容易翻译。
谁使用Python,什么是它的目的是什么?
在球场的另一边,Python是全线程序员和开发人员的优秀工具。无论是开发用于模拟生物分子或提供防垃圾邮件软件算法,你会在家里使用其界面和功能阵列发现自己。在1989年发布,它引述是最显著通用的面向对象的编程语言之一。Python有间新的程序员(其中数据科学家),这当然意味着用户和麻烦射手的丰富的社区的不断普及。
同样,在人工智能的热门话题,Python是也是最流行的选择;它具有机器学习,神经网络和Tensorflow工具。此外,覆盖一些更一般的目的,它的用户从库中受益如NumPy的进行统计分析,熊猫为数据准备和seaborn用于产生曲线。
řVS的Python:限制
为了更有趣的部分:他们怎么每场比赛吗?揭开局限性早期可能是咨询的最重要的部分之一。Speaking from experience, jumping from using Matlab where there is an enormity of online support (and usually some wonderful person who’s written an exact code for your needs), to labVIEW where there was little to no online presence, I know the sensation too well of panicking and being unable to solve that bug and becoming frustrated at not having considered these obvious potential limitations.
一些需要考虑的一个数据科学应用的主要事情是:
- 处理速度(你会使用大量的数据?)
- 在线社区(它确实是宝贵的,为我节省了很多次)
- 陡峭的学习曲线(多少时间和耐心,你有专攻前/你已经学会了编程,并更好地学习一门新的语言?)
- 友好的用户界面(你熟悉的编程或做你喜欢的东西容易想象和漂亮吗?)
- 广泛使用的语言(你有没有穿过田野和他们的语言考虑了将来的连接?)
让我们来看看这些题目了每个票价。
处理速度:
R为被认为是慢的。它需要它的对象存储在物理内存,这意味着试图利用大数据时,它不是一个很好的选择。话虽这么说,更快的处理器减少这种限制,有各种包在那里工作重点是解决这一点。然而,Python是更适合于大型数据集和更快的加载大型文件的能力。
在线社区:
正如我所提到的,两个R和Python有广泛支持的支持网络,为您接触到,这是有帮助的宝贵来源,这些错误你刚才似乎无法轻易解决。
陡峭的学习曲线:
这可能或可能不被认为是R的限制,但是它的陡峭的学习曲线是由于其为统计人员广泛功率。由该领域的专家开发的,R是一个不可思议的工具,但你付出的代价为这个与你的时间的初始投资。在另一方面,Python是为它的易用性和它的相对无障碍的新程序员非常有吸引力。
这两个程序会要求你熟悉的术语可能看起来最初令人生畏和混乱(如“包”和“库”之间的区别),与设置了具有R上的优势在用户方面的Python-friendly experience, again a link to R being developed by statisticians and based heavily on its mature predecessor, S. Although, Python will be unrelentingly strict with users on syntax and refuse to run if you haven’t met easily-missable faults (though these do enhance user experience in the long run as it makes us better, neater code writers). R has the lovely attribute in relation to its many academic users of providing the user with lots more control over design for their graphics, allowing various display exports and formats. Importantly, both are interpreter-based and it has been found, in relation to other languages (such as C++), that this makes spotting bugs so much easier.
友好的用户界面:
Rstudio被广泛认为是最喜欢的平台中的R接口,一旦你开始使用它熟悉自己,你就会明白为什么是这种情况。它归类为一个集成开发环境(IDE),并包括用于直接执行与策划,支持betwayapp下载安装交互式图形,调试以及工作区管理的所有功能代码控制台,请参阅RStudio IDE功能对于更详细的指南。
Python的主人许多集成开发环境的选择。这样做的好处是,它提供了一个很好的机会,让你选择一个根据你的背景,感觉熟悉。例如,从计算机科学背景的人,Spyder的是一个清楚的喜爱。然而,在该领域的初学者找到PyCharm方便和直观。
被广泛使用的:
我们已经谈到了这个话题,我想强调,这是主观的,以你选择的领域。如果你正朝着学术界,金融,医疗卫生等领域倾斜,R最有可能是更广泛地说,你会想利用这一点。然而,那些你感兴趣的软件开发,自动化,机器人或者,可能会发现自己沉浸在Python社区。betwayapp下载安装
řVS的Python:优点
R:
- 一个很好的选择,如果你想操纵数据。它拥有超过10,000包数据扯皮其CRAN。
- 您可以使美丽的,出版质量的图形很容易;r可让用户改变图形的美学和用最少的代码,一个巨大的优势超过其竞争对手定制。
- 也许它最有力的工具是它的统计模型,并为数据科学家的统计工具,并成为这一领域的先驱,由有经验的程序员首选。
- 用户可以从它的接口到GitHub的大平台,有利于及时发现和分享更好的软件。
蟒蛇:
- 这是非常方便和直观易学,适合初学者(不像R,Python的是由程序员开发的,它的易用性使得它最喜欢的全线大学)。
- 这是吸引广大用户,创造更多的学科开源语言之间不断增长的社会和加强沟通。
- 严格的语法将迫使你成为一个更好的编码器,书写更紧凑,清晰的代码。
- Python是在处理大数据集的速度更快,可轻松加载文件,使之更适合于大数据处理程序。
考虑到这一切,选择开始与高度语言取决于你从它想要的东西。如果你是那种数据科学家是谁擅长统计分析,或者你的研究工作,你可以求R最适合你的。不过,如果你是谁的人认为自己在多个学科分支,你可以利用Python的通用性和多样化的网络。您也可以同意,这将有利于你最终都学(至少足以能够读取对方的语法)当你知道每个为各自的长处。这无疑将在着陆就业方面打开更多的门对你来说,更重要的是,给你的清晰度决定要采取什么样的职业发展道路。但是,不要被淹没;学习第二语言会比第一个更容易!毫无疑问你会发现您感到兴奋开启了一个全新的社会沉浸你成长为一个数据科学家。
祝你好运和快乐编码!