为什么大数据创业很艰难且不赚钱?你需要同「死亡数据轮」作战

大数据

作者:Brian Balfour, Reforge. 本文为36大数据独译,译者 刘露曦

下图为“死亡数据轮”:

大数据

“死亡数据轮”

阶段1: 数据不会一直保持不变->阶段2: 数据变得毫不相干->阶段3: 人们会失去信心->阶段4:人们将减少使用数据

如果“死亡数据轮”的以上四个阶段你看起来很熟悉,并不是你一个人这么认为,我估计任何公司三分之二的数据经过这四个阶段后都会变成无效数据。

这将会产生麻烦。因为数据在自身的增长过程和人的心态中都起着关键的横向作用。没有质量好的数据,一次合理的实验周期就不可能运行。

今天,我将阐述看上去良好的数据却在使用中经常导致失败的4个原因,以及你可以为此做些什么。

问题1:项目心态与流程心态

大多数想要更加认真对待数据的公司将数据视为一个项目:这个项目有一个明确的开始和一个明确的结束。

当你将数据视为一个项目时,你将获得“死亡数据轮”。

项目掩饰:当某些时候有人发现一组看起来像不正确的数据。由于他们不相信这组数据是正确的,所以他们会停止使用该数据。因为没有人在使用数据,所以数据不会持续-这将会导致更多对数据的不信任。

在上述情况下,把数据视为一个项目去处理是错误的。实际上,类似于构建产品,数据是一个持续的,永无止境的项目。

数据作为产品

大数据

阶段1:数据收集->阶段2:衡量数据输出的影响->阶段3:从什么是数据或者数据未被使用中学习

你的数据需要在一个持续的过程中进行完善和更新,原因如下:

1.你的产品会改变

产品的功能在这个过程中将会持续改变。随着产品功能的发展,你的数据也需要保持同步更新,否则数据将变得无关紧要或者数据会存在缺陷,人们将失去对数据的信任,将导致“死亡数据轮”继续下去。

2.你会改变对业务的了解

数据应该引导你产生对业务的事项进行排序的见解:优先考虑某些事项,其它事项随后考虑。

Andrew Chen说:“你的数据和关键绩效指标应该是对你的策略的反映。”就是说你的策略会随着时间的推移而变化,追踪和分析则需要随着策略的发展而变化。

3.新的答案揭露出新的问题。

你从数据中获得新的洞察力,打开了新问题的大门。因为你有新的问题,所以你需要更新你的指令和分析。这个过程“完成”了,也就是说你要了解过程中每一件关于你的用户,产品和渠道的事情。

4.休息没有意义

这很简单。

因为数据不会终结。

人们会花更多的时间分析使用哪些工具来处理数据,而不是去调整和更新数据。

项目心态是隐藏在数据背后的一种心态,并且该心态会与“首次做我就必须要做正确”的心态相联系。该心态的问题在于:如果你没有完美的数据处理工具,最终你对数据的分析会以分析瘫痪结束。

如果你将数据视为一个持续的过程,数据将不会被定义结束。随着新需求的出现,你将会更容易的陷入到重复处理数据的过程中。

你该怎么办

你应该为数据收集和分析分配专用资源,而不是去使用一个一次性的,只基于该项目能使用的数据方法。

公司发展的早期阶段,分配专用资源可能是工程师或项目经理需要花时间去做的一件事。无论花费多少小时(即使仅仅花了一点儿时间),该步骤都是他们作为工程师和项目经理应该做的所有事情中的关键部分。

公司发展的后期阶段,你很可能需要专门的团队来维护数据流程,包括构建和维护数据基础架构,以及促进数据的使用。

重要的是你要记住,数据处理进展顺利不仅仅是依靠指令来完成。你需要做的其他工作是同组织内的数据消费者建立信任。你至少需要在一些报告中花时间来验证这些数据,并与你周围的更大的团队进行合作,以确保他们了解并信任他们所看到的数据。

如果他们不信任这些数据,他们就不会使用这些数据。

问题2:激励的偏离

用户喜欢...

技术牛逼也要懂点社交:数据科学家公司生存指南TOP30秘诀

作者:SeattleDataGuy 数据科学家老司机的30个经验之谈,教你如何在公司内获得认同,带你绕过他们曾经踩过的坑。 作...


20个数据可视化工具点评

第一部分:入门级工具 1.Excel Excel的图形化功能并不强大,但Excel是分析数据的理想工具,上图是Excel生成的热力地图...


商机 | 大数据/政务云采购清单 招标7起,最高招标价为2089.41万(9.2-9.5)

文 | 36大数据 奥兰多 一、政府、企事业单位大数据/政务云中标成交清单,一共8起,最高成交价为1388.89万 二、政府、...


华为轮值CEO郭平:将长期投入公有云 不靠用户数据变现

作者:郭晓峰 在今日举行的华为 2017 全联接大会上,华为轮值 CEO、副董事长郭平表示,华为承诺长期投入公有云建设...


大数据让人开始怀疑人生

《 大数据时代》,维克托·迈尔·舍恩伯格、肯尼思·库克耶著,盛杨燕、周涛译,浙江人民出版社 一年多前听说了...


在 Airbnb 使用机器学习预测房源的价格

作者:Robert Chang 位于希腊爱琴海伊莫洛维里的一个 Airbnb 民宿的美好风景 简介 数据产品一直是 Airbnb 服务的重要组成...


「数据爆炸」预示着网络舆情分析也正式步入大数据时代

随着计算机技术和人工智能的不断发展,大数据时代的网络舆情分析备受关注。目前,在网民数量直奔8亿的大环境下...


MongoDB数据库遭大规模勒索攻击,被劫持26000多台服务器

刚刚曝出的大新闻,MongoDB数据库叕被攻击了。就在上周末,三个黑客团伙劫持了MongoDB逾26000多台服务器,其中规模最...


大数据处理框架的类型、比较和选择

前言 说起大数据处理,一切都起源于Google公司的经典论文:《MapReduce:Simplied Data Processing on Large Clus...


七牛大数据平台的演进与大数据分析实践

图 1 大数据生态体系 看着图 1 大家可能会感到熟悉,又或者会觉得部分有些陌生,这是一张汇集了目前大数据生态下...


HiTSDB 时序数据库技术架构和产品解析

作者:场景研读 摘要: 8月24日阿里云数据库技术峰会上,来自阿里数据库事业部高级专家钟宇带来HiTSDB 时序数据库...


通过数据分析提高企业销售成功率,GetAccept获160万美元种子轮融资

GetAccept的联合创始人Mathias Thulin非常熟悉销售们面临的一个个常见问题:他们和潜在客户聊得非常好,也能马上用邮件...


大数据早报:谷歌重返中国组建团队 天猫发布大闸蟹消费趣味数据报告(9.5)

数据早知道,上36dsj看早报! 来源36大数据,作者:奥兰多 『谷歌』谷歌重返中国组建团队? AI项目在中国开启招聘...


深度学习可视化工具大盘点

深度网络对机器学习研究和应用领域产生了巨大的影响,与此同时却无法很清晰地解释深度网络的来龙去脉。人们一...


数据中心基础架构标准化能否彻底改变超大规模IT部署?

作者:武晓燕 在日益紧密联系的经济发展中,IT基础设施正在进行重大改造以满足行业需求。 随着日常负载需求的增...


营销转数据,两年半到P7,我都做了哪些事儿?

作者:李宁 缘起 标题含义:传统行业的三年管培后,2014.12转型做数据,先后经历艾瑞、携程,于2017.9入职eleme的新零...