专访百度美国研究院总监:语音和人工智能的交互是大趋势

百度硅谷人工智能研究院总监 Adam Coates 在 EmTech Digital 大会上发表演讲

“百度硅谷人工智能研究院的目标是创建我们认为至少能够影响1亿人的人工智能技术。”

百度硅谷人工智能研究院总监 Adam Coates 在本周举办的 Emtech Digital 大会上这样表示,在会后接受专访时,他表示,百度美国研究院的部分人工智能技术成果,实际上已经应用在了很多产品中。

此外,他还证实了百度即将扩大硅谷研究院规模的消息,新的办公区就在距离目前百度美国研究院不到一英里的位置。

“人数会在目前的基础上再扩大约一倍左右。”Coates 说。 目前,百度在美国研究院共有约200名员工。

上周,百度首席科学家吴恩达的突然离职,令外界对百度人工智能研究的未来发展产生新的疑问。百度方面宣布,总裁张亚勤将任百度美国研究院董事长,负责百度在美国研发中心的关键人才吸引、品牌建设、以及美研同国内业务的战略协同等方面的事务。

Adam Coates 表示,自己在百度的工作性质并不会发生变化,依然会继续此前的人工智能研究工作。在加入百度之前,他曾跟随吴恩达在斯坦福大学从事人工智能方面的博士后研究。

“在出差到中国时,给我最大的感受是所有事情的变化都非常快,”Coates 说,“和硅谷的节奏完全不同。”

他表示,百度从事人工智能研究的大背景是,移动互联网的发展为人工智能时代铺平了道路,对于很多发展中国家来说都是如此。

“如果你在2017年第一次连接上互联网,那么你很可能是从移动设备上进行连接的。”Coates 说。

他认为,正是基于人们互联网连接方式的改变,将使得人机交互的方式也在同时发生变化。移动和物联网将变成语音和人工智能的交互。

“在移动互联网时代,我们需要全新的人机交互界面,”Coates 说,“而语音就是我们所认为的能够影响1亿人的方式。”

百度硅谷研究院在过去几年开发了 Deep Speech 技术,不同于传统的语音识别系统,Deep Speech 完全运用了深度学习技术,通过成百上千小时的语音数据训练后,实现对语音的识别。

此前,吴恩达在担任百度首席科学家时曾经介绍过 Deep Speech 系统,他表示,过去对于识别不同的语言,需要做相应的针对不同语言的系统,而运用了深度学习技术的 Deep Speech 系统则完全不需要对不同语言进行区别对待。“学习算法的通用性已经可以不用区分不同的语言。”

目前,Deep Speech 已经推出第二代,Adam Coates 表示,这套系统最初全是用英语语音数据进行训练,后来才引入了中文语音数据的训练。

“因为这套系统完全是基于深度学习,完全取决于训练数据,所以我们可以很快地用中文语音数据来替换,并使其成为非常强的中文语音识别引擎。”Coates 说。

他介绍说,这套系统的训练数据很庞大,加入了非常多的口音很重的中国方言数据,而这些数据的训练效果也很好,以至于很多人耳都难以听清的方言语音,系统都能够成功识别出来。

如今,百度的这套主要由美国人工智能研究院所开发的系统,已经成功实现了产品化。去年10月,一款名为 TalkType 的手机应用登陆安卓商店,这一应用便是基于 Deep Speech 的技术,是被百度称为第一款真正意义上的“语音优先”的输入方式,而非键盘输入之外的“语音辅助”的输入选择。

Coates 认为,百度以及其他在中国从事人工智能研究的公司的最大优势在于,中国互联网用户很快地接受了移动终端这样的上网方式,无论是普通的收发邮件、浏览网页,甚至是到餐馆就餐,全部能够用移动设备来完成,这些使用习惯与美国用户完全不同,而这些给了例如语音识别等人工智能应用的广泛的应用基础。


用户喜欢...

位置数据:物联网应用和优势

位置,位置,位置。你之前听过这句话。位置一直对企业很重要。这是一个重要的英特尔,可以提供一系列问题。我应该在哪里打开下一个位置?我应该在哪里营销我的产品?如何在客户日常生...


LTC7821:混合降压型同步控制器数据手册

LTC7821:混合降压型同步控制器数据手册...


如何将数据中心从12V转换为48V

谷歌在OpenPOWER峰会和开放计算项目(OCP)美国峰会上的公告是最近转向48V服务器和基础设施的行业证据。 从传统的12V服务器机架到48V机架的转变预计会使能量损失减少30%以上,但服务器和数...


在 GPS 不足以提供精准的位置数据时使用 IMU

全球导航卫星系统 (GNSS) 非常有用,能够定位全球任意位置已正确启用此功能的系统,但仅仅使用 GNSS 接收器进行定位也存在一些问题。使用惯性测量装置 (IMU) 对 GNSS 进行补充,则可以克服这些...


以高数据速率测量ISI是不可能的

信道的频率和损耗响应随信号的本地频率内容而变化。符号有效地相互干扰,因为它们的频率成分取决于它们的邻居。在高数据速率下,PCB上的迹线表现得像荒谬复杂的波导。数字信号变成通过...


如何设计-130-dB超低失真数据采集系统

数据采集​​系统(DAS)是工业,医疗和电信应用的标准测量和分析仪器,包括医学成像,音频和振动分析以及模拟和数字调制系统的测试。在大多数情况下,采集和数字化信号通过快速傅里叶...


制造商和工程师:了解您的仪表放大器以实现准确的物联网数据采集

感知是物联网(IoT)和智能家居开始的地方,也是DIY爱好者,制造者甚至专业设计师遇到他们的第一个问题的地方。许多便宜的传感器,如加速计,力传感器,应变计和压力传感器都是围绕电...


自动汽车设计中的数据分发服务

自动驾驶汽车是一个极度复杂的高度分布的动态系统,其中组件对象基于全系统约束和近似全局状态不断地作出实时局部决策。在自动汽车设计方面,RTI解释了实时和嵌入式系统中最广泛采用,...


物联网三阶段演进 市场、安全、人力与并购均有影响

物联网演进可分为三个阶段,一、串连各系统;二、智能互连的对象不仅将终端设备连网,更让设备之间彼此相连,...


AI和大数据2017“成长的烦恼”

人工智能和大数据在2017年的发展遇到了以下10个成长的烦恼: 1.人工智能无IQ标准 人工智能领域发展最好的一个领域是无人驾驶,而究其原因不外乎其拥有了从L0到L5的全球通用标准。但是在...


大数据和云计算的冲突

最近,IT行业专家在参加相关会议时发现了一个隐藏的主题,那就是虽然很多人将关注的重点转移到基于云计算的架构...


C51单片机是怎么存储程序和数据的

初学51总是会有这样的疑问,从电脑下载程序到开发板后,程序去哪了? C51中,用户或应用程序,系统程序和数据都是存放在哪的? 51单片机从物理结构上,可分为片内,片外程序存储器,片...


无处不在的48V,被谷歌和数据中心大规模采用,究竟优势是什么……

例如服务器中的处理器功耗从不足 100W 增加到了 200W、300W 乃至更高。如果不使用更高电压配电或更大铜母线,这分配...


用友网络李树轩——供应链金融正朝着泛产业链金融、数据化金融裂变

万联导读:12月22日,由万联网主办、西示通协办的“2017产业供应链金融创新高峰论坛”在南京成功举办。本次论坛我...


车子自闭了百年,该让车子“出社会”了

汽车一旦具备物联网的感测能力、网络联机能力后,即成为社会的一员,发挥“分享”、“共有”的各种可能。车与...


恒扬数据携手OpenPOWER多家成员共同推进基于CAPI SNAP框架的FPGA加速应用开发

日前,以“智慧链接新智能 创新加速助中国” 为主题2017年OpenPOWER 中国高峰论坛在京隆重召开,包括IBM、赛灵思、英伟达、浪潮、中太服务器、恒扬数据等在内的联盟成员出席了此次盛会并...