机器学习工程师vs数据科学家:名字中有什么?
数据科学和机器学习都是密切相关的领域,所以在这方面什么叫专家还有些困惑。作为求职者,你是寻找数据科学家的职位还是机器学习工程师的职位?数据分析师有何不同?机器学习科学家怎么样?或者做机器学习工程师乔布斯被归为一个更普通的软件工程师?
行业就像你一样困惑,雇主之间的一致性很少有关他们称之为这些角色。但有一些新兴趋势我们可以试图分解。
什么是数据科学家?它是否与机器学习科学家不同?
让我们从定义雇主所说的“数据科学家”开始。在亚马逊(Amazon)和微软(Microsoft)搜索当前的职位空缺可以发现,它们都在寻找同一类型的人。
例如,以下是一个典型的亚马逊数据科学家职位的招聘要求:
让我们将其与同一家公司的机器学习科学家进行比较:
这些职位发布中的要求是相似的,但它们在一些重要方面也不同。这两个开口都在寻找博士学位教育;如果你想打电话给自己一个“科学家”,那通常会被预期。这里的招聘经理都在寻找有学术研究背景的人。ML科学家角色甚至专门寻找您的出版物记录。我很惊讶地看到亚马逊寻找学术界;在2013年数据科学与机器学习领域起飞之前,他们在候选人中的幻想学位上强烈更喜欢行业经验(我是亚马逊的高级经理)。至少在某些部门,这似乎变化。
两种立场都涉及从原始数据中提取意义,但不同之处在于他们的关注点。
数据科学家使用现有工具、数据库和脚本分析数据。他们使用SQL、R、SAS、Matlab、开源分布式系统以及Spark、Elasticsearch、Hadoop、Pig和Hive等编程语言。他们处理大规模的数据分析;了解机器学习只是一种“拥有”的品质。数据科学家应该知道如何用R或Python编写脚本,但他们不一定非得是软件工程师。
相比之下,机器学习科学家的作用需要更强大的软件工程技能。他们希望“强大的软件开发技能”,以及在Java或C ++中编写代码betwayapp下载安装的能力是一个基本的资格。他们正在寻找可以开发新工具和系统的人(在这种情况下,与自然语言处理和语音识别有关)。它们不仅仅是寻找可以使用现有工具来分析数据和从中提取意义的人。
等等,一位机器学习科学家听起来很像机器学习工程师!
一般来说,我们将“机器学习工程师”描述为专门研究机器学习或人工智能的软件工程师。ML工程师首先是软件开发人员,其次是机器学习专家。为了说明这一点,让我们看看微软对机器学习工程师的要求:
实际上,在这个清单中并没有太多关于机器学习的内容!它甚至在“首选资格”部分才被提及。
你也没有看到的是在学术或研究背景中明确关注。这项工作是针对建立大型系统的经过验证的绩效记录的人,而不是专注于理论的人。这是机器学习“工程师”和机器学习“科学家”或数据科学家的主要区别。
最大的科技雇主历史悠久,重点关注招聘人才软件工程师。他们认为,一个很好的软件工程师足够聪明,可以独立学习额外的技能(也许使用Udemy!)。他们希望员工在长期运行中可以建立公司需求的任何东西 - 即使它不涉及机器学习。
有时,招聘经理选择的职称只是他们的战略选择。在这种情况下,他们似乎真的正在寻找更普遍的软件工程师 - 但招聘经理可能只是避免与其他招聘经理竞争为“软件工程师”职位。通过呼叫此角色是“机器学习工程师”,他们可以区分他们的张贴并吸引对ML感兴趣的人。
一些“机器学习科学家”角色可能发生同样的事情。“科学家”标题对一些申请人呼吁,可能会使一些候选人适用于“科学家”角色而不是“工程师”角色,即使它们是相似的。即使在艰苦的经济中,才华横溢的软件工程师也很难找到,招聘经理将使用他们可以吸引他们的任何技巧。
而数据科学家的角色听起来很像数据分析师!现在我真的很困惑。
从历史上看,数据分析师主要从事关系数据库和电子表格的工作。他们的工作是收集数据,将其可视化,并将其呈现给使用它来做业务决策的人。
最近,数据分析师一直试图与更有利可图的数据科学家标题重新命名。差异是微妙的,即一些较小的雇主可能会聘请数据分析师作为数据科学家,因此有时这项工作有时。
我认为数据分析师作为培训的数据科学家。数据分析师主要使用数据库,数据仓库,电子表格和高级工具,例如Tableau来分析数据。数据科学家具有更强的统计背景,可以使用更高级的工具,如R或MATLAB等脚本他们的分析。对于数据分析师来学习数据科学技能的自然进展,但现在,他们是独特的职业。
例如,让我们看一份亚马逊的数据分析师职位描述:
值得注意的是,我只能在印度找到数据分析师角色。在其他地方,亚马逊正在寻找数据科学家。该帖子与我们所考虑的数据科学家和机器学习科学家的主要区别是所需的教育程度。学士学位是分析师的唯一要求,而不是博士学位。对工具的关注也不同 - 数据分析师应该知道如何使用Microsoft Office和SQL,但是知道R,Python或MATLAB不需要。
然而,他们正在寻找可以成为数据科学家的人。他们更喜欢在r和python涉及的人,计算机科学或工程学位与数学的学位一样有价值。数据分析师和数据科学家之间的差异是数据科学家可以编写代码,他们正在寻找有可能使这种飞跃的人们。
薪水有差异吗?
由于人们使用这些头衔的方式不一致,所以很难从平均工资数据中解读出什么。但Glassdoor提供了这些不同职位的报告薪酬数据。
一个清晰的一件事是“数据分析师”被广泛认为是比数据科学家,ML工程师或ML科学家更初级的初级职位。机器学习工程师和机器学习科学家报告了相同的工资,因此GlassDoor似乎认为这些标题可互换。这些标题的使用情况由公司各种各样地不同;亚马逊并不雇用“机器学习工程师”,但他们雇用“机器学习科学家”和“软件工程师”。有时它只是在个人公司在内部对工作的分类方式中的怪癖。
软件工程师的薪水比数据科学或机器学习专业的人要低(92000美元,而平均11.4万美元)。这种说法可能有失偏颇,因为自称“机器学习工程师”的人可能比入门级软件工程师更有经验。事实上,许多被贴上“软件工程师”标签的工作可能涉及到相当多的数据科学和机器学习,如果他们是在一家日常处理这些领域的大公司。
但是你是否称自己是一个数据科学家,机器学习工程师或机器学习科学家,你的薪水将是可比的。
那么,我应该找什么工作呢?
你可以用下面的维恩图来简化问题:
如果您了解统计数据,数据分析和可视化,诸如Python或R等脚本语言,并且可以使用Matlab等一些高级工具,但您不认为自己是软件工程师,您正在寻找数据科学家工作。
假设您基本上是一个软件工程师,其中包含建立大型,分布式系统的背景,并且您已经设法沿途学习机器学习和数据科学。在这种情况下,您正在寻找一台机器学习科学家或机器学习工程师工作。
该图确实在数据科学和机器学习之间的差异上进行了光泽,但数据科学家倾向于这些日子倾向于了解机器学习,反之亦然。
要找到最好的工作,您不应该仅限于这些条款限制搜索。许多迷人的工程就业涉及机器学习的仍属于标题“软件工程师”。如果您只搜索“机器学习工程师”标题,您将错过许多软件工程位置,真正涉及机器学习工程。搜索特定的标题几乎将你锁定亚马逊,在那里他们称之为“机器学习科学家”。通过标题中的“机器学习”的任何工作拓宽您的搜索 - 您可能会发现其他候选人忽视的一些很棒的开口!