NYU心理学教授:深度学习狂热正把人工智能引入歧途

如今,只要访问科技网站,几乎不可能看不到跟深度学习有关的文章,似乎人工智能即将解决我们的所有问题。但 Gary Marcus 仍然表示怀疑。

Gary Marcus

Marcus 身兼畅销书作者、创业者、纽约大学心理学教授等多重身份。这位曾经花了好几十年研究儿童学习方式的学者认为,单纯凭借更多的数据未必能在语言理解等领域实现进步,更不用说实现通用人工智能(AGI)了。

在人工智能红得发紫的今天,Marcus 的声音显然有悖潮流。

他在2015年将自己的想法变成了一家创业公司——Geometric Intelligence。这家公司希望利用认知心理学方面的研究开发出效果更好、数据需求量更小的机器学习系统。该团队已于去年12月被 Uber 收购,负责运营 Uber 的人工智能实验室。Marcus 的创业伙伴 Zoubin Ghahramani 如今已经被任命为首席科学家。这家科技巨头为何如此看重该公司的技术呢?

Marcus 接受博客节目 Flux 采访时,探讨了为什么人们拿到深度学习这个锤子之后,就会看什么问题都像钉子,以及他开发的这种稀疏数据模式为何很有价值。

他们还探讨了人工智能创业公司与谷歌这种财大气粗的公司竞争时所面临的挑战;为什么很多企业关注的人工智能方向并非社会所需;他对过时的图灵测试的调整建议;以及为什么让机器人理解“伤害”那么困难?

以下为对话概要:

:很多人都知道你一向喜欢批评这项技术,你认为人工智能炒得过热了,还说深度学习非常擅长那些可以轻松实现的目标:感知和分类等细分任务,也许还有下棋,但你觉得深度学习的狂热正在把人工智能引向错误的方向。

你认为我们没有在认知和强人工智能方面取得进展,或者如你所说:“我们本想开发一个机器人 Roise,但却做出了一台扫地机器人。”

所以你主张重新引入心理学元素,因为人类有很多事情做得更好,我们应该研究人类为什么做得更好。

你至今仍对这一领域怀有这些想法吗?

:基本如此。可以轻易达成的目标可能比我的预期还要多一些。

我看到别人更加简明扼要地阐述了这个问题,简单来说,深度学习并不等于通用人工智能。你可以用深度学习做很多事情,比如提升语音识别效果,提高物体识别率,而这并不意味着智能。智能是一个多维度变量,其中牵扯很多问题。

最近在 TEDxCERN 上发表的演讲中,我做了这样一个饼状图,告诉人们:瞧,这就是感知,它只占很小一部分。这是很重要的一部分,但人类的智能还包含其他许多因素,比如我们在同一时间参与正确事情的能力,我们推理事情、建造模型、预测未来的能力。感知只是其中的一部分,而深度学习其实只是在帮助这一部分。

我2012年在《纽约客》杂志上撰文称,这很好,但却并不能帮助我们解决对因果关系的理解,对语言的理解也无法带来帮助。造出了一个更好的梯子并不意味着你能登上月球。

我至今仍然怀有这种想法。我仍然认为我们距离月球很远。要真正登月,就要开发出一种像人类一样灵活的智能。与4年前相比,我们与这个目标的距离便没有缩小。

社会各界对人工智能都兴奋不已,这是它应得的。人工智能第一次成为一项实用的工具,这是好事。企业有足够的理由向这些领域投入资金。

可是看看无人驾驶汽车吧,这的确是一种智能,那就是一种很平庸的智能。只要头脑清醒,16岁的孩子经过几个月的培训也能开车。但谷歌开发这项技术已经7年了,但却只能在晴朗的天气里开车,而且交通不能太拥挤……

:深度学习是不是还有一个黑箱问题?我们并不知道深度学习的内部运作状况,它很神秘。这对无人驾驶汽车这类东西来说难道不是个大问题吗?

:确实是问题。至于究竟能否克服,还要看经验。

至少从现在看来,我们无法很好地解释人工智能所作的事情。所以可以这样来看这个问题,你有数百万个参数和数据点,因此作为一名这方面的工程师,我必须应对基于这些数据生成的数百万或数十亿的数字,而这其中或许蕴含着一些规则,但不够清楚。从理论上看,完全可以认为你永远无法真正找出可以解释的答案。

现在有一种观点认为,我们在90年代从事的一些研究探讨了深度学习是否仅仅是一种记忆。有的论文认为是,有的认为不是。它并不是记忆,但有点像。如果你记住所有的例子,或许没有一种抽象的规则来描绘所有的事情,但或许很难说那里有什么。

所以,如果你完全使用深度学习开发自己的系统,就像英伟达鼓吹的那样,出错的时候就很难知道发生了什么,所以很难排除故障。

:如果你的车撞上了路灯杆,但你却无法知道背后的原因,那就很成问题。

:如果只是路灯杆,而没有太多人受伤的话,那还算幸运。这里面蕴含着很大的风险。已经有人因此丧命,尽管我认为特斯拉的事故中使用的并不是深度学习系统,而是另外一种不同的系统。我们在这两端的技术方面都面临问题。

所以,我不想说经典的人工智能已经完全解决了这些问题,它并没有。我认为现在还没有成熟,人们应该重新讨论这个问题。但事实上,我们并没有好办法来开发真正复杂的系统。思维就是非常复杂的系统。

:你觉得大平台为什么正在围绕人工智能,特别是深度学习进行重组?仅仅是因为他们获得了数据护城河吗,所以是不是说如果你也能得到这些数据,同样会进行很好的训练。

:谷歌有很多数据,他们肯定希望利用这项优势。谷歌有能力开发新的资源,免费提供出去。他们还针对自己的问题开发各种资源。所以,如果谷歌利用这些庞大数据指导他们自己的人工智能,我又怎么能利用这些数据呢?

从他们的商业利益角度来看,这的确有意义。但从社会角度来看,却未必如此。社会需要人工智能吗?应该怎么做?这是最佳开发方式吗?

我认为,如果你询问这些问题,你可能会说,社会最需要的是自动化的科学发现,从而帮助我们真正了解大脑,治愈神经疾病,帮助我们理解和治疗癌症,诸如此类。

如果这是我们最期待用人工智能解决的问题,我认为我们会说,不要完全让这些公司来解决这些问题,而是应该组建一个类似于CERN这样的组织。这需要70亿美元。如果你有70亿美元,并且小心翼翼地向着共同目标努力,会怎样?可以想象,社会会采取这样的方法。考虑到目前的政治环境,应该不会很快发生这种事情。

:大公司们至少在为了 AI 的道德准则而合作,这是个开始。

:人们讨论道德问题是件好事,的确有一些严重问题值得考虑。我想说的唯一问题是,有的人在夸大其词,认为真正的人工智能即将到来,但恐怕不是。我认为可以现在开始思考这些问题,即便真正的人工智能比人们想得更加遥远。如果这能激励人们采取行动,大概需要20年,但行动本身也要20年,所以现在很适合开始思考这个问题。

:我想回到你的人工智能实现方案上,你为什么认为这很重要?

你给出了你认为更好的范式,灵感来自认知心理学。你认为你的算法速度更快、效率更高、数据使用量更少、也更不容易出问题,应用范围也更加广泛。

在很短的时间内,你已经取得了不俗的早期结果。你还运行了许多图形识别测试,证明了你的算法比现有技术表现更好,使用的数据更少。

所以,深度学习在拥有共同例子和高频内容的海量数据时表现很好。但在现实世界中,多数情况下都是长尾任务,没有太多数据。那么,虽然神经网络或许擅长低水平的认知,但他们并不那么擅长理解综合性的事情。

能否再多谈谈你的方法,以及你在认知神经科学方面的训练带来了什么启发?

:我师从 Steve Pinker,在学习中,我发现人类儿童非常擅长学习语言,就算他们还不擅长其他事情。当然,我是作为一名研究生学到了这些,我现在也有了自己的孩子,一个4岁,一个两岁半。他们的学习速度的确令人惊讶。

:你见过的最好的人工智能是什么?

答 :事实上,我儿子跟伟大的机器人学家 Rodney Brooks 同一天生日,有一段时间,我每年都会给 Rodney 发一封电子邮件,跟他说:“生日快乐。我儿子现在一岁了。我认为他可以做到这些事情,而你的机器人做不到。”这像是我们两个人之间的玩笑。

:他现在远超所有机器人了。

:我今年甚至都不考虑这个问题了。4岁的孩子掌握的马达控制和语言能力远超机器人。所以我开始思考90年代初的那种问题,而我从未真正找到答案。但我创办公司的部分动机在于,如果你有很多数据,就可以提供这些非常擅长学习的系统,有很好的效果。

我们举个语音识别的例子,如果要解决白人男性在安静的房间里说出搜索词的问题,经过标注的数据你要多少有多少,在建立机器学习系统时,这些数据非常关键。但我的孩子不需要这些,他们没有标注过的数据,没有海量的数据,他们只要观察世界,就能把这些事情搞清楚。

用户喜欢...

位置数据:物联网应用和优势

位置,位置,位置。你之前听过这句话。位置一直对企业很重要。这是一个重要的英特尔,可以提供一系列问题。我应该在哪里打开下一个位置?我应该在哪里营销我的产品?如何在客户日常生...


LTC7821:混合降压型同步控制器数据手册

LTC7821:混合降压型同步控制器数据手册...


如何将数据中心从12V转换为48V

谷歌在OpenPOWER峰会和开放计算项目(OCP)美国峰会上的公告是最近转向48V服务器和基础设施的行业证据。 从传统的12V服务器机架到48V机架的转变预计会使能量损失减少30%以上,但服务器和数...


在 GPS 不足以提供精准的位置数据时使用 IMU

全球导航卫星系统 (GNSS) 非常有用,能够定位全球任意位置已正确启用此功能的系统,但仅仅使用 GNSS 接收器进行定位也存在一些问题。使用惯性测量装置 (IMU) 对 GNSS 进行补充,则可以克服这些...


以高数据速率测量ISI是不可能的

信道的频率和损耗响应随信号的本地频率内容而变化。符号有效地相互干扰,因为它们的频率成分取决于它们的邻居。在高数据速率下,PCB上的迹线表现得像荒谬复杂的波导。数字信号变成通过...


如何设计-130-dB超低失真数据采集系统

数据采集​​系统(DAS)是工业,医疗和电信应用的标准测量和分析仪器,包括医学成像,音频和振动分析以及模拟和数字调制系统的测试。在大多数情况下,采集和数字化信号通过快速傅里叶...


制造商和工程师:了解您的仪表放大器以实现准确的物联网数据采集

感知是物联网(IoT)和智能家居开始的地方,也是DIY爱好者,制造者甚至专业设计师遇到他们的第一个问题的地方。许多便宜的传感器,如加速计,力传感器,应变计和压力传感器都是围绕电...


自动汽车设计中的数据分发服务

自动驾驶汽车是一个极度复杂的高度分布的动态系统,其中组件对象基于全系统约束和近似全局状态不断地作出实时局部决策。在自动汽车设计方面,RTI解释了实时和嵌入式系统中最广泛采用,...


物联网三阶段演进 市场、安全、人力与并购均有影响

物联网演进可分为三个阶段,一、串连各系统;二、智能互连的对象不仅将终端设备连网,更让设备之间彼此相连,...


AI和大数据2017“成长的烦恼”

人工智能和大数据在2017年的发展遇到了以下10个成长的烦恼: 1.人工智能无IQ标准 人工智能领域发展最好的一个领域是无人驾驶,而究其原因不外乎其拥有了从L0到L5的全球通用标准。但是在...


大数据和云计算的冲突

最近,IT行业专家在参加相关会议时发现了一个隐藏的主题,那就是虽然很多人将关注的重点转移到基于云计算的架构...


C51单片机是怎么存储程序和数据的

初学51总是会有这样的疑问,从电脑下载程序到开发板后,程序去哪了? C51中,用户或应用程序,系统程序和数据都是存放在哪的? 51单片机从物理结构上,可分为片内,片外程序存储器,片...


无处不在的48V,被谷歌和数据中心大规模采用,究竟优势是什么……

例如服务器中的处理器功耗从不足 100W 增加到了 200W、300W 乃至更高。如果不使用更高电压配电或更大铜母线,这分配...


用友网络李树轩——供应链金融正朝着泛产业链金融、数据化金融裂变

万联导读:12月22日,由万联网主办、西示通协办的“2017产业供应链金融创新高峰论坛”在南京成功举办。本次论坛我...


车子自闭了百年,该让车子“出社会”了

汽车一旦具备物联网的感测能力、网络联机能力后,即成为社会的一员,发挥“分享”、“共有”的各种可能。车与...


恒扬数据携手OpenPOWER多家成员共同推进基于CAPI SNAP框架的FPGA加速应用开发

日前,以“智慧链接新智能 创新加速助中国” 为主题2017年OpenPOWER 中国高峰论坛在京隆重召开,包括IBM、赛灵思、英伟达、浪潮、中太服务器、恒扬数据等在内的联盟成员出席了此次盛会并...