紫数网专访丨海云数据冯一村讲述可视化分析的现在和将来

锵锵锵锵~紫数君的专访特稿又来啦。这一次我们请到了海云数据的 CEO 冯一村先生。

海云数据是中国大数据可视分析领域的领导者,艺术背景出身的冯一村先生是如何让艺术和技术完美结合的?他对于可视化分析领域又有着怎样的判断?跟着紫数君一起来看看吧~

紫数网我们循序渐进,先问一个常见的问题。您是怎么理解大数据的?您认为大数据的核心是什么?

冯一村:我认为大数据是个名词。大数据是很宽泛的,有技术领域的,也有智能硬件的,包括 IoT、人工智能等等都离不开大数据的知识和建设。所以我认为大数据更像是一种思维能力。过去,我们并不是没有数据,也不是这几年才有数据,从信息建设以来我们就已经有信息数据了,只不过我们的数据量、数据质量和对数据的理解都只存在于那个阶段。

举一个比较形象的例子吧。就像是盲人摸象。在过去,我们通过数据,了解到的可能只是一个象腿,可能还摸到了象鼻子和象尾巴。因为只看到了这么多,思维和理解就停留在大象的某个部分;当看完整个大象可能又是另外一个概念。实际上,当数据量越来越大的时候,有一天我们会发现,我们看到的大象可能并不是大象,而是一个动物园。视角越来越高,我们对大数据的理解也会越来越高;思考的内容不一样,对事物的理解也就不一样了。

紫数网:基于您这样的理解,您是怎样定位海云的呢?

冯一村:海云的定位主要还是基于可视化分析一直深入下去。大数据领域,或者说人工智能领域已经来了,但是它太宽泛了,一家公司很难做到面面俱到,也不符合一个优秀公司的商业模式,不能构建。对海云来说,最重要的是可视分析如何变现和价值逻辑的实现。

紫数网:您在去年年初说过“上半场是让机器来学习,下半场要让人来学习”,站在现在的高度,您对这句话有什么新的理解吗?

冯一村:现在再来看这句话和当时的理解很不一样了。那个时候人工智能非常火,但是人们对它的理解很浅显,但实际上它是一个基础套着一个基础的。

现在说人工智能也好,物联网也好,虽然大家的关注点都在这一块,可真正赚钱的还是数据公司。因为它有滞后期,一方面是市场的滞后期,另一方面因为有了人工智能的诉求,大数据才会起来。而且现在大家都发现了大数据的价值了,还发现之前的基础做得不够好,所以现在力争要打通信息孤岛等问题。

可视分析和人工智能是一个环节上的应用,这个环节是什么呢?就是要解决人工智能领域上的特定分析的特定算法,解决特定问题。人工智能只能针对一个问题去解决问题,没有办法去做综合性(数据维度在三、四十个维度以上)的决策。面对复杂的场景和复杂的问题,还是需要靠人的智慧来解决这些难题。这个时候机器解决不了这些问题的时候,自然就形成了一个与数据交互的逻辑,需要靠人的智慧去理解数据。

今天再看这句话,我对它的新的解读可能是:人的理解都是宽泛性的东西,每个人的理解都是不一样的,每个人都有自己擅长的知识,然而这个知识细分就会放进整个业务的每个节点里面,而这个节点就是会用人工智能来代替的某一个点。

像海云发布的唇语识别也是这样的。唇语识别是一项集机器视觉与自然语言处理于一体的技术。唇语识别系统使用机器视觉技术,从图像中连续识别出人脸,并提取此人连续的口型变化特征,随即将连续变化的特征输入到唇语识别模型中,识别出讲话人口型对应的发音,从而计算出可能性最大的表达语句。

但是,成熟的唇语识别系统需要建立在大量人脸特征样本的基础之上,通过带记忆的深度神经网络才能保证结果的最大准确性。鉴于人种的生物特征以及语言特征区别,国外的系统并不能照搬照抄,因此海云数据携手重庆公安研究所开始了中文唇语识别系统的研发。

紫数网:能请您为我们详细的介绍一下海云数据的唇语识别技术在公安领域是如何应用的吗?

冯一村:其实不完全应用在公安领域,盲人的教育事业、远距离分析以及医学都可以得到应用。

国外现在已经有了对唇语进行身份识别的技术:因为每个人的嘴型是不一样的,所以说话时的唇部动作别人很难模仿,以此作为生物识别的特征之一。所以唇语识别技术的应用是非常宽泛的。当然,坦白地说,对于海云而言,我们也的确是看中了它在公安领域的应用。

紫数网:我们是不是可以理解为,唇语识别是图像识别的进一步发展?

冯一村:没错,它可以应用到很深入的人工智能相关领域,需要大量的机器学习和深度学习才能实现。

紫数网:大家都知道您之前是艺术出身,您是怎么想到从从事艺术,转到从事媒体行业,又转到自己开办这样一个技术要求高的公司?

冯一村:艺术是我很早以前的工作,也算是我的个人爱好。转行到媒体,简言之就是不想卖画为生,因为卖画为生自己会很痛苦,就去媒体工作了。在媒体工作一段时间之后,感觉自己的性格不太适合做这个,所以离开了。

紫数网:现在很多行业都在运用可视化,您认为可视化这个领域最终会发展成什么模样?或者说您最终的发展目标是什么?

冯一村:可视化这个行业有它自己的发展方向和目标,但它不是海云的发展目标。

可视化分为几个递进的阶段,有数字可视化、数据可视化、可视分析和人工智能分析,这些都有可视化的应用。数字可视化不是海云的强项,因为数字可视化指的更多是像水晶石这类公司,用 3D 的技术打造类似游戏的效果,但并不是真实的数据,更像是动画片。

海云专注于可视分析。可视分析是基础分析之上的一种方式,所以海云会更接近业务。我们选择公安、航空这样的领域为切入点,而不是像金融、环保之类的行业,是因为可视化这个领域太宽泛了,必须要选择一两个点去落地,而且必须跟可视化本身可以产生很深的交流。海云的产品跟业务就有非常深入的交流。

海云有一个五年目标,就是在多个市场、多个行业形成矩形阵。多个市场指的是至少在中国市场和美国市场占有一席之地;多个行业指的是公共安全行业、航空行业、港口行业、交通行业,我们会在多个行业去验证这个产品是成熟的、可用的。这些是海云在五年内的目标。

紫数网:听说海云也加入了智慧城市项目,您认为未来智慧城市的方向主要集中在这些方面?

冯一村:智慧城市我们也有,智慧城市的概念更大,跟大数据一样,也很虚;同时也很难,为什么难?因为很难选好自己要做的领域。海云在智慧城市这个领域,主要是在公安、交通、居民融合、智慧旅游,还包括部分的电子生物。

在欧美市场我们专注于航空和港口这两方面。港口这方面,比如说船舶的调度。船舶进港是有涨水期和降水期的,也有天气因素,比如暴风,各种各样的因素综合在一起。所以其实港口调度的过程是很麻烦很复杂的,我们现在就是在帮港口做这样的事情。

紫数网:那您觉得在2017年数据可视化在行业里会向着哪个方向继续迈进?

冯一村:我认为在分析这个领域最值得关注。

以海云数据为例,我们从简单到深入,再到今天的唇语识别,类似于人工智能这个领域的智能发力。总而言之可视化分析会越走越远,这是整个行业的趋势。

紫数网:那整个大数据领域呢?

冯一村:还是会洗牌。我觉得洗牌是今年的趋势。2015年的时候已经洗过一次牌了。

大数据是从2012年开始讲的,2013年被称为“大数据元年”,因为这一年讲的比较多了;2014年算是第一波高潮。到了2015年就洗牌了,那时候看到很多数据公司都没什么生意,实事求是地说,能活下来的公司就会发展得比较快。

到了2017年,可能又会洗一轮牌——这个领域最终会产生一两家独角兽,而且市值会非常高。所以我们相信,要不然是死,要不然活得非常好,差距会很快地拉大。

紫数网:BAT 手中的数据体量都非常大,它们在2017年会不会取得跨越式的进展呢?

冯一村:它们本身发展得就不错。

百度把重心放在人工智能上。阿里巴巴在2016年发展得就比较快了,所以我们相信2017年的发展会更快。但是阿里也面临着自己的挑战:公司太大了。太大的公司想要做微挑战、微转型还是挺有难度的,毕竟牵一发而动全身。当然马云非常厉害,他调整得很快。团队的力量也很重要,团队起来了,整个就能起来了。腾讯现在的团队里缺一个这个领域里的牛人来带领他们。当然我也相信,对腾讯来说这不是个难题。

用户喜欢...

位置数据:物联网应用和优势

位置,位置,位置。你之前听过这句话。位置一直对企业很重要。这是一个重要的英特尔,可以提供一系列问题。我应该在哪里打开下一个位置?我应该在哪里营销我的产品?如何在客户日常生...


LTC7821:混合降压型同步控制器数据手册

LTC7821:混合降压型同步控制器数据手册...


如何将数据中心从12V转换为48V

谷歌在OpenPOWER峰会和开放计算项目(OCP)美国峰会上的公告是最近转向48V服务器和基础设施的行业证据。 从传统的12V服务器机架到48V机架的转变预计会使能量损失减少30%以上,但服务器和数...


在 GPS 不足以提供精准的位置数据时使用 IMU

全球导航卫星系统 (GNSS) 非常有用,能够定位全球任意位置已正确启用此功能的系统,但仅仅使用 GNSS 接收器进行定位也存在一些问题。使用惯性测量装置 (IMU) 对 GNSS 进行补充,则可以克服这些...


以高数据速率测量ISI是不可能的

信道的频率和损耗响应随信号的本地频率内容而变化。符号有效地相互干扰,因为它们的频率成分取决于它们的邻居。在高数据速率下,PCB上的迹线表现得像荒谬复杂的波导。数字信号变成通过...


如何设计-130-dB超低失真数据采集系统

数据采集​​系统(DAS)是工业,医疗和电信应用的标准测量和分析仪器,包括医学成像,音频和振动分析以及模拟和数字调制系统的测试。在大多数情况下,采集和数字化信号通过快速傅里叶...


制造商和工程师:了解您的仪表放大器以实现准确的物联网数据采集

感知是物联网(IoT)和智能家居开始的地方,也是DIY爱好者,制造者甚至专业设计师遇到他们的第一个问题的地方。许多便宜的传感器,如加速计,力传感器,应变计和压力传感器都是围绕电...


自动汽车设计中的数据分发服务

自动驾驶汽车是一个极度复杂的高度分布的动态系统,其中组件对象基于全系统约束和近似全局状态不断地作出实时局部决策。在自动汽车设计方面,RTI解释了实时和嵌入式系统中最广泛采用,...


物联网三阶段演进 市场、安全、人力与并购均有影响

物联网演进可分为三个阶段,一、串连各系统;二、智能互连的对象不仅将终端设备连网,更让设备之间彼此相连,...


AI和大数据2017“成长的烦恼”

人工智能和大数据在2017年的发展遇到了以下10个成长的烦恼: 1.人工智能无IQ标准 人工智能领域发展最好的一个领域是无人驾驶,而究其原因不外乎其拥有了从L0到L5的全球通用标准。但是在...


大数据和云计算的冲突

最近,IT行业专家在参加相关会议时发现了一个隐藏的主题,那就是虽然很多人将关注的重点转移到基于云计算的架构...


C51单片机是怎么存储程序和数据的

初学51总是会有这样的疑问,从电脑下载程序到开发板后,程序去哪了? C51中,用户或应用程序,系统程序和数据都是存放在哪的? 51单片机从物理结构上,可分为片内,片外程序存储器,片...


无处不在的48V,被谷歌和数据中心大规模采用,究竟优势是什么……

例如服务器中的处理器功耗从不足 100W 增加到了 200W、300W 乃至更高。如果不使用更高电压配电或更大铜母线,这分配...


用友网络李树轩——供应链金融正朝着泛产业链金融、数据化金融裂变

万联导读:12月22日,由万联网主办、西示通协办的“2017产业供应链金融创新高峰论坛”在南京成功举办。本次论坛我...


车子自闭了百年,该让车子“出社会”了

汽车一旦具备物联网的感测能力、网络联机能力后,即成为社会的一员,发挥“分享”、“共有”的各种可能。车与...


恒扬数据携手OpenPOWER多家成员共同推进基于CAPI SNAP框架的FPGA加速应用开发

日前,以“智慧链接新智能 创新加速助中国” 为主题2017年OpenPOWER 中国高峰论坛在京隆重召开,包括IBM、赛灵思、英伟达、浪潮、中太服务器、恒扬数据等在内的联盟成员出席了此次盛会并...