弗兰克·凯恩

数据科学和机器学习都是密切相关的领域,所以在这方面什么叫专家还有些困惑。作为求职者,你是寻找数据科学家的职位还是机器学习工程师的职位?数据分析师有何不同?机器学习科学家怎么样?或者做机器学习工程师乔布斯被归为一个更普通的软件工程师?

行业就像你一样困惑,雇主之间的一致性很少有关他们称之为这些角色。但有一些新兴趋势我们可以试图分解。

机器学习,数据科学和深度学习与Python

2021年4月最后更新

  • 111讲座
  • 初级水平
4.6 (24834)

完整的动手机器学习教程与数据科学,Tensorflow,人工智能和神经网络|作者:Sundog Education作者:Frank Kane

探索课程

什么是数据科学家?它和机器学习科学家有什么不同吗?

让我们从定义雇主所说的“数据科学家”开始。在亚马逊(Amazon)和微软(Microsoft)搜索当前的职位空缺可以发现,它们都在寻找同一类型的人。

例如,以下是一个典型的亚马逊数据科学家职位的招聘要求:

让我们将其与同一家公司的机器学习科学家进行比较:

这些职位的要求是相似的,但它们在一些重要的方面也是不同的。这两个职位都需要博士学位教育;如果你想称自己为“科学家”,这是意料之中的事。这里的招聘经理都在寻找有学术研究背景的人。ML科学家角色甚至专门寻找您的出版记录。我惊讶地发现亚马逊在寻找学者;在数据科学和机器学习领域于2013年蓬勃发展之前,他们更看重求职者的行业经验,而不是炫酷的学位(当时我是亚马逊的一名高级经理)。至少在某些部门,这种情况似乎正在改变。

两种立场都涉及从原始数据中提取意义,但不同之处在于他们的关注点。

数据科学家使用现有工具、数据库和脚本分析数据。他们使用SQL、R、SAS、Matlab、开源分布式系统以及Spark、Elasticsearch、Hadoop、Pig和Hive等编程语言。他们处理大规模的数据分析;了解机器学习只是一种“拥有”的品质。数据科学家应该知道如何用R或Python编写脚本,但他们不一定非得是软件工程师。

相比之下,机器学习科学家的作用需要更强大的软件工程技能。他们希望“强大的软件开发技能”,以及在Java或C ++中编写代码betwayapp下载安装的能力是一个基本的资格。他们正在寻找可以开发新工具和系统的人(在这种情况下,与自然语言处理和语音识别有关)。它们不仅仅是寻找可以使用现有工具来分析数据和从中提取意义的人。

等等,一位机器学习科学家听起来很像机器学习工程师!

一般来说,我们将“机器学习工程师”描述为专门研究机器学习或人工智能的软件工程师。ML工程师首先是软件开发人员,其次是机器学习专家。为了说明这一点,让我们看看微软对机器学习工程师的要求:

实际上,在这个清单中并没有太多关于机器学习的内容!它甚至在“首选资格”部分才被提及。

你也没有看到的是在学术或研究背景中明确关注。这项工作是针对建立大型系统的经过验证的绩效记录的人,而不是专注于理论的人。这是机器学习“工程师”和机器学习“科学家”或数据科学家的主要区别。

最大的科技雇主历史悠久,重点关注招聘人才软件工程师。他们认为,一个很好的软件工程师足够聪明,可以独立学习额外的技能(也许使用Udemy!)。他们希望员工在长期运行中可以建立公司需求的任何东西 - 即使它不涉及机器学习。

有时候,招聘经理选择的职位只是他们的战略选择。在这种情况下,似乎他们真的在寻找一个更通用的软件工程师——但招聘经理可能只是试图避免与其他招聘经理竞争“软件工程师”职位。通过将这个角色称为“机器学习工程师”,他们可以区分他们的帖子,并吸引对机器学习感兴趣的人。

一些“机器学习科学家”角色可能发生同样的事情。“科学家”标题对一些申请人呼吁,可能会使一些候选人适用于“科学家”角色而不是“工程师”角色,即使它们是相似的。即使在艰苦的经济中,才华横溢的软件工程师也很难找到,招聘经理将使用他们可以吸引他们的任何技巧。

而数据科学家的角色听起来很像数据分析师!现在我真的很困惑。

从历史上看,数据分析师主要从事关系数据库和电子表格的工作。他们的工作是收集数据,将其可视化,并将其呈现给使用它来做业务决策的人。

最近,数据分析师一直试图与更有利可图的数据科学家标题重新命名。差异是微妙的,即一些较小的雇主可能会聘请数据分析师作为数据科学家,因此有时这项工作有时。

我认为数据分析师就是正在接受培训的数据科学家。数据分析师主要使用数据库、数据仓库、电子表格和Tableau等高级工具来分析数据。数据科学家有更强的统计背景,可以使用更高级的工具,如R或Matlab来编写分析脚本。对于数据分析师来说,学习数据科学技能是一种自然的发展过程,但就目前而言,它们是不同的职业。

例如,让我们看一份亚马逊的数据分析师职位描述:

值得注意的是,我只能在印度找到数据分析师角色。在其他地方,亚马逊正在寻找数据科学家。该帖子与我们所考虑的数据科学家和机器学习科学家的主要区别是所需的教育程度。学士学位是分析师的唯一要求,而不是博士学位。对工具的关注也不同 - 数据分析师应该知道如何使用Microsoft Office和SQL,但是知道R,Python或MATLAB不需要。

然而,他们正在寻找能成为数据科学家的人。他们更喜欢接触过R和Python的人,对于这个职位来说,计算机科学或工程学位和数学学位一样有价值。数据分析师和数据科学家的区别在于,数据科学家会写代码,他们要找的是有潜力实现这一飞跃的人。

工资有差别吗?

由于人们使用这些头衔的方式不一致,所以很难从平均工资数据中解读出什么。但Glassdoor提供了这些不同职位的报告薪酬数据。

一个清晰的一件事是“数据分析师”被广泛认为是比数据科学家,ML工程师或ML科学家更初级的初级职位。机器学习工程师和机器学习科学家报告了相同的工资,因此GlassDoor似乎认为这些标题可互换。这些标题的使用情况由公司各种各样地不同;亚马逊并不雇用“机器学习工程师”,但他们雇用“机器学习科学家”和“软件工程师”。有时它只是在个人公司在内部对工作的分类方式中的怪癖。

软件工程师的薪水比数据科学或机器学习专业的人要低(92000美元,而平均11.4万美元)。这种说法可能有失偏颇,因为自称“机器学习工程师”的人可能比入门级软件工程师更有经验。事实上,许多被贴上“软件工程师”标签的工作可能涉及到相当多的数据科学和机器学习,如果他们是在一家日常处理这些领域的大公司。

但无论你自称是数据科学家、机器学习工程师,还是机器学习科学家,你的薪水都是相当的。

那么,我应该找什么工作呢?

你可以用下面的维恩图来简化问题:

如果您理解统计、数据分析和可视化、脚本语言(如Python或R),并可以使用一些高级工具(如Matlab),但您不认为自己是一个软件工程师,您正在寻找一份数据科学家的工作。

假设你是一名软件工程师,拥有构建大型分布式系统的背景,并且在此过程中学会了机器学习和数据科学。在这种情况下,你正在寻找机器学习科学家或机器学习工程师的工作。

该图确实在数据科学和机器学习之间的差异上进行了光泽,但数据科学家倾向于这些日子倾向于了解机器学习,反之亦然。

要找到最好的工作,你不应该只局限于这些条件。许多涉及机器学习的有趣工程工作仍然属于“软件工程师”的范畴。如果你只搜索一个“机器学习工程师”的头衔,你会错过很多真正涉及机器学习工程的软件工程职位。如果你搜索这个特定的头衔,你几乎会被亚马逊拒之门外,亚马逊把他们称为“机器学习科学家”。将你的搜索范围扩大到任何标题中有“机器学习”的工作——你可能会发现一些被其他求职者忽略的好机会!

机器学习中的顶级课程

机器学习:初学者的基本介绍
Bluelime学习方案
4.2 (212)
机器学习,数据科学和深度学习与Python
《Sundog Education》作者:Frank Kane, Frank Kane
4.6 (24834)
DP-100:使用Azure机器学习的A-Z机器学习
Jitesh Khurkhuriya, Python,数据科学和机器学习A-Z团队
4.5 (3602)
畅销书
数据科学的机器学习概论
大卫的情人
4.4 (9172)
机器学习实验和工程与DVC
米哈伊尔·罗日科夫,马塞尔·达Câmara里贝罗·丹塔斯,艾丽·奥布莱恩
4.4 (52)
Python中的贝叶斯机器学习:A/B测试
懒惰的程序员。
4.6 (4457)
畅销书
Python中的无监督机器学习隐马尔可夫模型
懒程序员团队,懒程序员公司。
4.6 (2931)
评价最高
数据科学:Python中的有监督机器学习
懒程序员团队,懒程序员公司。
4.6 (2197)
Python的集合机器学习:随机森林,adaboost
懒程序员团队,懒程序员公司。
4.7 (1508)

更多机器学习课程

机器学习的学生也会学习

让你的团队。领导行业。

使用Udemy for Business订阅在线课程库和数字学习工具。

请求一个演示

弗兰克凯恩课程

终极实践Hadoop:驯服你的大数据!
《Sundog Education》作者:Frank Kane, Frank Kane
4.6 (23,857)
畅销书
Apache Spark与scala - 用大数据的手!
《Sundog Education》作者:Frank Kane, Frank Kane
4.6 (13205)
畅销书
用Spark流媒体和Scala流媒体大数据-动手
《Sundog Education》作者:Frank Kane, Frank Kane
4.6 (2983)
机器学习,数据科学和深度学习与Python
《Sundog Education》作者:Frank Kane, Frank Kane
4.6 (24834)
用Apache Spark和Python驯服大数据 - 手上!
《Sundog Education》作者:Frank Kane, Frank Kane
4.5 (10,370)
用MapReduce和Hadoop驯服大数据-动手!
《Sundog Education》作者:Frank Kane, Frank Kane
4.6 (2,590)
畅销书
用AWS Lambda构建一个无服务器应用程序-动手!
弗兰克凯恩,布莱恩·泰德丁的晒街教育
4.6 (1605)
Elasticsearch 6 and Elastic Stack - In Depth and Hands On!
《Sundog Education》作者:Frank Kane, Frank Kane
4.8 (2301)
利用机器学习和人工智能构建推荐系统
《Sundog Education》作者:Frank Kane, Frank Kane
4.3 (1731)
畅销书
自动驾驶汽车:Python中的深度学习和计算机视觉
Sundog Education by Frank Kane, Frank Kane, Dr. Ryan Ahmed, Ph.D., MBA, Mitchell Bouchard
4.2 (779)
终极非官方Udemy在线课程创建指南
《Sundog Education》作者:Frank Kane, Frank Kane
4.9 (178)
AWS认证数据分析专业2021 -动手!
弗兰克凯恩,斯蒂芬马雷克的Sundog教育|AWS认证解决方案架构师&Developer Associate,Frank Kane
4.5 (6838)
畅销书

弗兰克凯恩课程