数据科学职业:数据分析师vs.数据科学家
21个国家中最抢手的资源圣世纪是数据。分析数据可以让企业、政府、机构和个人在我们日益复杂、相互联系的世界中做出更明智的决定。现在收集的数据比人类历史上任何时候都要多。这些数据大部分还没有被分析过。
对数据专家的需求继续以惊人的速度增长。自2012年以来,数据分析工作的数量增长了650%。美国劳工统计局估计这已经结束了到2026年,将创造1150万个新的数据工作岗位。
随着数据领域的发展,许多新的工作和职位如雨后春笋般涌现。你可能听说过的两个工作头衔是数据科学家和数据分析师。虽然它们听起来很相似,但它们之间有区别。要胜任这些职位,你需要具备什么样的技能、教育背景和经验?每一份工作你的期望薪资是多少?继续往下读吧!
数据分析师的角色职责
a的主要责任数据分析师就是从数据中得出见解。他们使用的过程有三个阶段:提取,操纵,演讲。分析师查询数据,将其扭曲成适合分析的形状,然后给出他们的结论。熟练的数据分析师既要具备技术技能,又要有商业头脑。他们不仅需要知道如何处理数字,而且需要这数字以及它们对业务的意义。他们的目标是解释为什么和如何简单而有效。
在提取阶段,分析师获得来自一个或多个来源的数据集。这可能涉及获取特定格式的文件,如CSV、XLSX或JSON。它可能涉及通过指定正确的筛选器组合来查询数据库以获得正确的数据。它可能涉及加入来自不同来源的多个数据集放在一起。
在操纵阶段,分析师一向或形状将数据转换成适合于计算的格式。计算没有有涉及复杂的统计操作。例如,业务涉众可能只需要记录的计数或数字的平均值,就可以做出明智的决定。数据分析师试图回答这样一个问题:“我如何将数据调整成正确的形状,以便揭示其隐藏的含义?”
在演讲阶段,数据分析师决定用数据“讲故事”的最佳方式。有时,这就像向利益相关者提供一个确定的数字一样简单。其他时候,它可能涉及从一个更大的数据集中创建一个包含重要行的子集的电子表格。在某些情况下,您可以包括可视化辅助工具,如柱状图、饼图或直方图。撇开媒介不谈,分析师寻求的是现在结论咄咄逼人地。
在Udemy工作的数据分析师可能会回答这样的问题:
- 上个月每个类别中最畅销的五个课程是什么?
- 去年所有摄影课程的平均收入是多少?
- 学生平均完成课程的百分比是多少?
数据分析师可以使用各种技术,包括:
- 图形电子表格应用程序,如微软Excel或谷歌表
- 通用编程语言,如Python、Java或Scala
- 统计编程语言,如R
- 计算环境,如MATLAB或SAS
- 像熊猫这样的数据分析库
- 关系数据库管理系统,如Postgres或MySQL
- 数据可视化软件,如Tableau或Power BI
随着数据分析师积累经验,他们会学习哪一个工具最适合每一项工作。很少有一个“完美”的解决方案。相反,每种工具都有自己的优点和缺点。
数据科学家的角色职责
数据分析师和数据科学家的主要区别在于后者构建预测模型。数据分析师的目标是理解什么有发生了。数据科学家试图预测什么将发生。
在数据科学生态系统中有几个专门的领域。例如,机器学习关注教学基于经验的计算机识别模式。在Udemy这样的网站上,机器学习模型可以根据你已经购买的课程来预测哪些课程会吸引你。
另一个例子是自然语言处理哪一个专注于编程计算机来处理和理解书面文本和人类语言。在Udemy的网站上,NLP模型可以通过识别人类交流中的常见模式自动生成视频字幕。
数据科学还有其他专业,包括人工智能、深度学习、云计算等等。
数据科学家建立预测模型基于现有数据。这项额外的要求需要额外的技术技能。数据科学家的背景可能包括以下经验:
- 软件开发、程序设计betwayapp下载安装和计算机科学
- 数学,统计和复杂代数
- 物理或金融等专业领域
数据科学家可能比数据分析师拥有更广泛的技术经验。他们可能与:
- 分布式处理解决方案,如Spark或Hadoop
- 像TensorFlow或PyTorch这样的机器学习软件
- 云存储解决方案,如AWS、GCP或Azure
数据科学家可能会发现工程数据工作要求中的职责。数据工程师建造的管道收集和商店数据。他们必须考虑以下问题:
- 数据将被存储在哪里?
- 我们要如何连接它?
- 数据的大小是多少?
- 什么是适合这种规模的软件解决方案?
- 数据是如何存储的?
- 哪些细节可以丢弃?
- 哪些细节必须修改?
- 哪些细节可以保留在原来的格式中?
某些职业为角色定义了具体的界限。例如,耳鼻喉科医生是诊断耳、鼻、喉疾病的医生,而足科医生是治疗足部和脚踝疾病的医生。每个医生都有自己的专业领域。
数据世界的流动性要大得多。如果你搜索“数据”类的工作,你会发现除了数据工程师、数据架构师、大数据开发者、统计学家和商业智能分析师等头衔之外,还有数据分析师和数据科学家的职位。
这些角色的职责重叠不同的市场、不同的公司、不同的团队都有差异。在面试数据职位时,求职者应该询问他们的团队将处理什么类型的项目。在两个不同的公司中,“数据科学家”可能意味着完全不同的东西。
工资和教育
这个职业搜索引擎确实估计数据科学家的平均教育水平在当今市场上是最高的。75%的数据科学家拥有高级学位(硕士或博士)。数据分析师获得此类学位的可能性只有一半。因此,数据科学家的进入门槛要高得多。也就是说,随着高等教育的发展,从数据分析师到数据科学家的职业转变是一种常见的职业路径。
由于劳动力短缺、需求高、角色的复杂性增加以及雇主对高等教育的期望,数据科学家通常比数据分析师挣得多。
职业评论网站Glassdoor估计美国数据分析师的平均年薪为62,453美元。每个市场的工资都不一样。例如,加州旧金山的数据分析师的平均工资是84658美元但只有52939美元在俄克拉荷马城。
相比之下,美国数据科学家的平均工资是113309美元。数据科学家入门级的平均工资是95000美元,这是美国所有职位中最高的入门工资。如果我们在城市之间做一个类似的比较,旧金山的数据科学家预计可以做140897美元而俄克拉荷马城的数据科学家可以预料90512美元。
即使考虑到市场差异,这两种角色之间也会出现明显的薪酬差距。这种差距反映了数据科学家通常拥有更高的学历和技术技能。
总结
我们都做过一些数据分析或者我们生活中的数据科学,而我们自己却浑然不知。也许你已经计算过你的每月开支来计算你的开支预算。或者,你可能会根据你最喜欢的运动员过去的表现来预测他们的表现。
在这些情况下,我们使用数据观察什么发生了并对其进行预测将会发生。数据分析师和数据科学家在他们的日常工作中做着同样的事情,但他们对技术和统计的了解要多得多。有Udemy上有许多技术课程如果您有兴趣了解更多关于他们使用的工具。祝您在数据之旅中好运!