为什么每个组织都需要数据分析师

  如今,当组织需要从数据中获得一些见解时,他们首先倾向于寻找数据科学家的帮助。但这真的是一个更好的选择吗?人们需要了解数据科学家和数据分析师的角色有何不同,以及为什么希望聘用数据分析师。

  聘用数据科学家还是数据分析师

  那么,数据科学家和数据分析师之间的区别是什么?这些角色的定义可能有所不同,但通常认为数据科学家结合了三个关键学科的知识——数据分析、统计、机器学习。机器学习涉及到数据分析的过程,以学习和生成分析模型,这些模型可以对看不见的数据执行智能操作,并且人为干预最少。有了这样的期望,很明显具有这三方面技能的数据科学家也越来越受到企业的青睐。

  但是,数据科学家在这三个方面的表现都是完美的吗?更重要的是,所有这些角色都需要类似的技能吗?或者说数据分析师和机器学习工程师使用的技能和方法是完全不同的吗?

  事实上,这些专家的方法确实有很大不同。谷歌公司首席决策科学家Cassie Kozyrkov对这种差异提供了一个精辟的解释。她声称,组织的数据分析师是为了提供快速的结果,例如分析数据中有趣的相关性。

  为了满足决策者对快速和简短答案的期望,数据分析师使用相应的编码风格——使用更少的代码行,并为管理者生成易于理解的相关矩阵。机器学习工程师有一个完全不同的编码风格,他们的目标是建立一个完美的模型,这通常需要很多时间。

  统计学家也无法提供快速结果,他们会说,“等等,我们无法从这些数据中得出任何因果关系。我们甚至不知道其结果是否具有统计意义!”是的,有时组织需要擅长统计数据的统计学家或数据科学家来回答这类问题。但是真的需要知道这些答案才能了解数据中的相关性吗?

  实际上没有。在获得数据分析师的初步结果后,组织应聘请领域专家,他们可以决定哪些已识别的模式对业务确实很重要,值得进一步调查。人们可能已经看到数据分析师在某些情况下比数据科学家更令人满意。但现在需要澄清数据分析师应该具备哪些技能来满足决策者的需求,并成为组织的资产。

  组织真正需要什么样的数据分析师?

  数据分析师在组织中的主要作用是通过识别数据中有趣且重要的模式,并提供隐藏在大量表格、图表和日志文件中的快速答案来帮助决策者。简而言之,如果领域专家发现这些领域很重要,数据分析师会确定统计人员和机器学习工程师需要注意的领域。

  因此,人们希望在数据分析师中看到以下品质:

  •讲述数据故事:优秀的数据分析师可以阅读数据,并围绕数据讲述故事。数据专家从不超越数据,总是提供多种可能的解释。

  例如,他们可以说:“我们在Facebook上推出一个广告活动后,我们似乎获得了更多的潜在客户。这可能是关于此活动有效性的信号,但潜在客户数量的增长也可能是由季节性变化引起的。需要进行更深入的分析。”

  •数据可视化技能:创建具有视觉吸引力、具有意义、易于解释的图形的能力对数据分析师也非常重要。其故事总是受益于出色的可视化,这使得决策者的工作变得更加容易。

  •技术专长:专业数据分析师可以使用电子表格为组织提供隐藏在数据中的洞察力。但是,为了提供快速的结果,并创建专业的可视化,数据分析师通常需要电子表格之外的技术专业知识。

  因此,人们期望数据分析师熟悉Python编程语言,并熟练使用Tableau或Microsoft Power BI等工具。

  •针对速度优化的编码样式:组织不需要数据分析师具有与软件工程师或机器学习工程师相同的编程技能。数据分析师应该知道如何使用Python清理数据,如何执行数据分析,以及如何使用清晰的可视化和表格来呈现信息。

  网上有一些很好的课程可以培训这些技能。此外,数据分析师应该熟悉为数据分析创建的最流行的数据包,并使用这些数据包以最有效的方式分析数据。

  •领域专业知识:并非所有公司都需要数据分析师的领域专业知识,但这绝对是专业数据分析师的一项关键优势技能。换句话说,如果有人想成为最好的数据分析师,他们应该熟悉某个领域。这种技能将帮助他们区分对业务真正重要的模式和不值得数据专家和决策者花费时间的发现。

  既然人们知道什么样的数据分析师可以成为组织的宝贵资产,那么总结一下人们对优秀数据分析师的期望,以及为什么每个组织都需要这样的专家。

  每个公司都需要数据分析师

  如果组织的管理者做出数据驱动的决策,那么该组织肯定需要数据分析师。组织希望招募具有上述技能的优秀专家,他们可以:

  •收集正确的数据。

  •清理数据。

  •执行数据分析。

  •使用精美且有意义的可视化来呈现信息。

  •发现数据中有趣的模式,并提供可能需要统计人员和机器学习工程师进一步关注的见解。

  •执行分析时,优先考虑对业务更重要的区域。

  总而言之,优秀的数据分析师是决策者的主要助手,他们将数据转化为有意义的故事,快速回答疑难问题,并推动组织业务朝着正确的方向发展。

用户喜欢...

为什么集成前端和后端数据至关重要?

对于许多企业而言,尽管拥有一流的架构,但他们公司的前端和后端仍然是整个企业的两个独立的部分。前端是客户交互的地方,与后台的集成很少,甚至没有集成,后台是系统运行和数据存...


年薪百万的机器学习专家,为什么不产生价值?

Part 1 一个朋友的企业,他们招聘了 2 名机器学习方向的数据科学家,加起来年薪百万。 但一段时间的蜜月期后,他们...


python中理解字符串和编码为什么这么难

在学习python2的时候,字符串和编码可以说是最让人困惑的知识点,假如知其然而不知其所以然,则在后续的写代码和学习...


企业实施大数据的五大关键(更新版)

文 | 傅志华 刚刚过去的2016年,是大数据从概念到务实落地的一年。在过去的一年内,互联网行业、电信行业、金融行...


为什么说 Storm 比 Hadoop 快?

文 | 杨晓青  张云聪 “快”这个词是不明确的,专业属于点有两个层面: 1.时延 , 指数据从产生到运算产生结果的...


为什么谷歌云没有亚马逊云做得好?谷歌如何才能赶超亚马逊?

其实今天要讲得不那么偏技术,但是我觉得对于做技术的同事来讲,听一听产品和市场方面的知识也是有帮助的。...


为什么外资云厂干不过本地云厂

文 | Tony Qu 注:Neuzilla作为一家云咨询厂和行业解决方案厂我需要对客户负责,我不可能把不可靠的云推荐给客户,那...


为什么大数据工程师会在2017年越过越滋润?

身为数据极客,在2017年应该能感觉很幸福。 去年,我们曾经问过大家“大数据还是个值得关注的大事吗?”,并注意...


为什么如此难用?Hadoop的12个技术痛点

一位专业软件顾问长时间使用Hadoop后,发现有12件事影响了Hadoop的易用性。IT经理网...


倒闭,卖身,离职,为什么房产中介行业很“难熬”?

房产中介是一个大行业,但是行业发展多年,依然“不性感”,缺乏科技感,大部分玩家普遍缺乏对新技术的探索与...


为什么大数据应用公司这么贵?

大数据应用是整个数据产业的核心,也是企业级客户真正愿意为大数据业务买单的原因。本文主要通过对大数据应用...


大数据行业图谱三:大数据公司为什么贵,哪些大数据公司容易突围?

在大数据应用这个细分市场,最大两类玩家是大型互联网企业和大型集成商,他们的实力远远超过市面上这些做大数...


中国为什么没有7-11?

①不是实体企业不行了,而是你的实体企业不行了;② 铃木的5大零售哲学;③7-11单店的经营效益全球第一,单店平...