数据科学家最需要的技能

  数据科学家是当今科技组织中最受追捧的角色之一,并且薪酬不断上涨。在一些IT组织中,首席信息官可能只有雇用一名数据科学家的预算。所以在招聘数据科学家的时候,可能会希望他像摇滚明星多才多艺,令人关注。

  但是当数据科学家进行面试时,应该具备的一项关键技能可能在提交审查的简历上并不能看到。这不是熟悉Python或R或Spark或其他一些新技术或平台,也不是了解最新的机器学习方法或新算法;也不是从头开始编写人工智能算法,或在几分钟内分析数TB的数据的能力。

  虽然这些知识非常重要,但它们不是软技能。事实上,使数据科学家成为摇滚明星的一项技能根本不是技术,而是所谓的软技能:沟通能力。

  在创建一些疯狂的机器学习系统来构建推荐引擎时,企业正在面试的数据科学家可能是世界上最聪明的人之一,但如果他们没有这种软技能就很难取得成功。他们将会遇到一些困难,无法充分挖掘他们的潜力。

  其“战略”是什么?当企业传达输出/结果时,数据科学家需要能够讨论的不仅仅是标准信息(错误率/指标等)。他们还需要能够达到关键的“W”点:什么,为什么,何时,何地,以及是谁。他们必须能够清楚地定义他们做了什么,为什么这样做,他们的方法何时起作用(或者不起作用),他们的数据来自何处,以及谁将受到他们所做的影响。如果他不能以一个外行能理解的方式简洁地回答这些问题,那么就是一个失败的数据科学家。

  两个现实世界的例子

  有两个例子可以帮助了解出色的数据科学家(即沟通良好的人)和一个不那么出色的数据科学家之间的区别,例子提供了两者的背景知识,让企业自己决定聘请哪一位数据科学家。并假设这两位数据科学家都在同一个组织工作。

  第一位数据科学家:

  她从事数据科学工作已经四年。她在数据探索、功能工程、机器学习和数据管理方面拥有丰富的经验。在她的职业生涯中,她实施了多个需要深入研究大型数据集的项目,在分析过程中她使用不同的系统、平台和语言。

  对于她所从事的每个项目,她都会在笔记本上留下评论、想法、变化以及她正在做的事情的理由,毕竟她是一名科学家。当她向团队成员和管理层提供更新时,她不仅仅关注数据,还关注数据能够传达的内容。她对自己的所有工作都作了详尽的描述,并详细说明了为什么事情是按自己的方式进行的,以及潜在的变化可能如何影响她工作的结果。

  对于项目“总结”文档,她提供了一个执行摘要,其中包含许多直观的描述,简要描述项目、她所做的工作、为什么这么做,做了什么、她认为可以做什么来改进事情,以及如何改进项目。除了执行摘要之外,她还提供了一份详尽的报告,描述了整个过程,其中包含多个附录和解释性陈述,供那些想深入了解项目的人使用。当人们选择人们从事他们的项目时,当他们开始谈论团队成员时,想到的人第一个人就是她。

  第二位数据科学家:

  他从事数据科学工作已经四年多(比第一个人多了一个月)。他的技术背景非常专业,他是团队中算法和编程语言的“专家”。考虑很全面,能解决很多困难。他在项目上非常成功,并受到全公司人士的青睐。

  当他在项目上工作时自行其事,很少记录做了什么,以及为什么选择。例如,如果同事问他为什么在一个项目中选择随机森林而不是支持向量机时,他会告诉,“因为它工作得更好”,但他无法解释其“更好”的含义。虽然很少有人反对他在项目上的选择,他的工作也很少受到质疑,也没有人质疑他的技术,但同事总是在项目中/项目后质疑“他在做什么?”“他做了什么?”这样的问题。

  对于结果的记录和呈现,他将预期的基本报告与适当的信息放在一起,而人们总是有问题向他请教。但在考虑新项目时,他通常会排在最后,因为同事评价说,和他一起工作并不知道他在做哪些事情。

  那么会选谁?

  假设人们知道这两位哪一个是出色的数据科学家。虽然第二人在技术上比第一人更精湛,但他的沟通技巧有点落后。第一个人是每个人在组织中提供“最佳”数据科学成果的人。而沟通就是差别。第一位数据科学家不仅能够完成技术工作,还能以组织可以轻松理解的方式分享成果。

  当企业想聘请数据科学家时,通常会招聘擅长沟通或有能力提高沟通技巧的人。此外,作为一个组织,如果想成为一个优秀的数据科学和分析公司,就必须拥有良好的沟通文化。

用户喜欢...

大数据对投资和金融世界的影响

大数据对投资的影响是巨大的,并将改变金融世界和人们的投资习惯。 传统上,投资世界是平淡无奇的,并且具有排他性。投资工具彼此之间差别不大,最低资本要求意味着投资也只能供给少...


到底要不要使用数据库即服务(DBaaS)?

随着云计算的快速发展,越来越多的企业希望从顶层框架入手,探索整体数据架构中的更多可能性,DBaaS(亦称泛数据库类服务)就是PaaS 层的一个重要分支。那么,DBaaS到底是什么?适用于哪些应...


英特尔助力阿里云创造世界纪录 加速大数据计算创新突破

在2019年云栖大会上,英特尔与阿里巴巴共同宣布,在国际大数据性能基准测试TPCx-BB[1]中,由英特尔支持的阿里云MaxCompute以100TB的数据规模创造世界纪录。TPCx-BB是目前业界最全面的端到端大数...


大数据如何改变社交媒体营销

如今,大数据在市场营销中发挥重要作用,并以许多方式正在改变社交媒体营销。 大数据是近年来促进营销领域的最令人印象深刻的技术进步之一。虽然在某些圈子里,大数据已经成为一个流...


区块链如何改变大数据行业?

很多人都听到过大数据这个术语,它可能出现在与科技行业相关的视频中,也可能出现在人们的办公室里。大数据是2019年的热门话题之一,每个技术爱好者都在讨论它带来的变化和影响。 大数...


应该在云中存储大数据的5个理由

如果不确定如何正确存储大数据,则应该将大数据存储在云中。 信息存储只能通过位于隐蔽位置的传统远程服务器来完成的日子已经一去不复返了。如今采用云端存储数据,其中信息和数据以...


从云计算大数据等方面建立评价体系

中国生产力学会承办的第十九届世界生产力大会将于2019年11月16日至18日在中国成都召开。来自世界不同的国家或地区的工商界领袖、政界人物、行业管理者、生产力科学领域专家学者等相关人...


人工智能和大数据存在什么隐患?

从数据稀缺到现在有大量的数据,近年来,可用的数据量呈指数级增长,大数据变得无处不在。这是由于数据记录设备数量的巨大增长,以及这些设备之间通过物联网连接。似乎每个人都有收...


谷歌宣布在芬兰增资6亿欧元扩建数据中心

新华社赫尔辛基9月20日电美国谷歌公司20日在芬兰首都赫尔辛基宣布,未来两年内将在欧洲各地大幅增加投资,其中6亿欧元(1欧元约合1.1美元)明确用于扩建在芬兰的数据中心。 谷歌首席执行官...


谷歌将追加投资30亿欧元扩大欧洲数据中心

谷歌公司CEO皮查伊今天在芬兰举行的新闻发布会上宣布,谷歌将追加投资30亿欧元扩大欧洲数据中心。 谷歌的这一投资计划包括对芬兰哈米纳数据中心追加投资6亿欧元,使得该公司在哈米纳数...


百度视频8月影视大数据报告 国产片势头强劲

8月,影视剧延续暑期的热度。国产片势头强劲,《哪吒之魔童降世》、《烈火英雄》等影片热度持续飙升;电视剧也很丰富多彩,都市家庭、古装、奇幻等题材的多部高口碑、高热度剧相继登场...


上海市大数据中心与顺丰速运上海公司昨日签署合作框架协议

上海市大数据中心与顺丰速运上海公司昨日签署合作框架协议,今后一网通办服务中,用户在物流寄送方面除了现有的邮政EMS,还可以选择顺丰。上海市委常委、常务副市长陈寅等见证签约仪...


中国电信在宁夏建大型数据中心 总投资额达10亿元

据悉,9月19日上午,在中卫市西部云基地内,中卫市2019年第三季度重大项目集中开工现场推进会正式召开。本次集中开工的项目共有38个,投资总额在55亿元。其中有22.8亿元投资将计划在年度...


促进电子邮件营销转换的5个大数据策略

采用大数据可以显著改进和增加电子邮件营销转换率。企业在电子邮件营销方面可以尝试大数据策略。 大数据几乎在数字营销领域的每个方面都发挥着至关重要的作用,企业可以使用大数据来...


中国大数据市场保持稳定增长

咨询机构IDC最新发布的报告预测,2019年,大数据与商业分析解决方案全球市场的整体收益将达到1896.6亿美元(约合人民币13495.1亿元),这一数字相比2018年增长12.1%。在2019年~2023年的预测期内,全...


贵州大学迎新首次使用大数据

拍张全家福 9月16日,贵州大学迎来了来自全国各地的9436名本科新生,其中包括了7600余名00后小萌新,1800余名90后萌新。迎新现场,由学长学姐们组成的迎新志愿者,从接车、报到、办理入住手...