Amazon Alexa和Google Home语言系统的前驱服务者:13个MEMS 麦克风+Zynq SoC

背景:
说到语音识别,吸引的大家关注的有两大主力:亚马逊的Alexa和Google伴的Home。首先说说Alexa,随着智能家居Echo受到热捧,亚马逊的语音私人助手Alexa持续受到消费者关注。Alexa能围绕着信息、天气、新闻、音乐和控制其他家庭设备等内容为消费者提供人工智能语音服务,只是此前如果用户想要体验Alexa则首先需要购买Echo,不过现在用户可以在浏览器中使用体验Alexa了。而在2016年5月和2016年10月,Google两次推出了配置有扬声器的语言助理声控设备Google Home,从外观上来说,Google Home类似一个我们常见的智能家居盒子,功能上,可以让你听音乐,处理很多的任务,比如通过语音控制,Google Home可以通过语音控制你的音响,可以连接到你的灯光、恒温器等等,可以成为家庭的控制中心,只需要跟Google Home对话就可以了。同时谷歌表示,可以与Google Home进行双向对话。

Far-Field 开发平台:
继亚马逊的Alexa和谷歌的Home主页上的语音识别功能之后,语音控制系统变得十分重要。但是在现在这种嘈杂的语言环境中,如何才可以做到可靠的、远场的、强健的准确语言识别呢?关于这个问题, Aaware团队通过他们自己开发的价值199美刀的Far-filed 开发平台给出了完美答案。整个系统中应用到13个MEMS 麦克风(在1维线性或2维数组中可以使用较少的麦克风数),然后通过Xilinx Zynq Z-7010 SoC对初始语音信号进行预滤波,最后将一个纯净的语言数据流传输给本地或云端的语言识别系统进行语言信号识别破解。比较有趣的是,在系统中内建了一个wake 字,类似于“Alexa” 或“OK, Google”,通过这个wake字可以触发语言信号滤波算法单元的执行。

 Amazon Alexa和Google Home语言系统的前驱服务者:13个MEMS 麦克风+Zynq SoC

Aaware开发的这套系统中,通过充分应用Zynq Z-7010 SoC系统中的可编程逻辑单元和DSP 处理能力,使得团队的语音捕获技术得以实现的同时并达到加速的效果,这些技术主要包括:

噪声与回音的消除;

语音源头的探测和定位。

更多关于Aaware语言系统的信息可以通过 https://aaware.com/technology 获得。

总结:
随着人工智能的发展,模式识别中衍生出更多详细的研究方向和智能控制策略,其中语音识别是最常见的一种控制方式,但是对于语言识别的精确实现却并不容易,往往需要考虑相当复杂的环境因素和语音语义等等因素在内,信号处理算法也较为艰难。Aaware通过FPGA实现语音信号的预滤波对后期语音识别的精确度具有重大意义,但是也仅仅是一些前期工作,相当于一些试水操作,相信在不久之后会有完全由硬件(FPGA)来快速实现语音识别整个系统的设计出现,到那时,在语音识别系统中FPGA 将会发挥更大的作用。

用户喜欢...

Microchip 的 Amazon 网络服务 (AWS) IoT 套件用于安全物联网应用的快速原型开发

来自Microchip Technology的 AT88CKECC-AWS-XSTK-B零接触安全配置套件帮助设计人员快速、可靠地开发出物联网设备,符合 AWS 安全规定。新的安全模型要求设备必须使用相互身份验证在 AWS 云上获得远程...


NXP与Amazon FreeRTOS携手 LPC54018 IoT解决方案

LPC54018 IoT解决方案由恩智浦与Embedded Artists携手开发,该解决方案是一款独立式高性能微控制器解决方案,适用于开发支持AWS的产品。该解决方案包含一个基于LPC54018的模块,提供板载Wi-Fi和用于...


使用Amazon FreeRTOS将设计快速安全地连接到云端

传统的嵌入式系统开发人员通常在断开设备的裸机级别工作,但物联网需要系统连接到Internet。这要求嵌入式系统开发人员学习如何连接他们的设备并使用更高级别的操作系统,例如实时操作系...


德州仪器宣布其SimpleLink™ MCU平台集成全新的Amazon FreeRTOS,实现快速云连接

德州仪器和亚马逊AWS为物联网设备实现端到端云连接提供持续支持 德州仪器(TI)近日宣布,SimpleLink™微控制器(MCU)平台集成全新的亚马逊FreeRTOS,帮助开发商快速而安全地将物联网(Io...


Google网络服务层:让你云更可控

今年推出的Google Network Service Tier让云用户能够在价格和性能之间进行权衡,但在选择某个层级之前,了解Google的网络...


7倍于GoogleNet/AlexNet GPU的加速器卡:基于Xilinx Kintex UltraScale FPGA的神经网络加速器

背景: 脉冲神经网络Spiking neuralnetworks (SNNs)是第三代神经网络模型,其模拟神经元更加接近实际,除此之外,把时间信息的影响也考虑其中。基本思路为:动态神经网络中的神经元不是在每一...


Marvell社区开发板开始支持Google云端物联网核心内测版本-将物联网智能进一步扩展到企业边缘网络应用

目前,市场上各家分析机构对物联网(IoT)技术在企业环境下应用的预测数据虽然各不相同,但他们对于它未来的巨...


Google 推送 Android 8.1 开发者预览版,新增神经网络 API

Google 今天推送了 Android 8.1 开发者预览版 ,这次更新包含一个神经网络 API,能够为设备上的机器学习操作提供硬件加速支持。Google 称,一般的应用不会调用这个 API,它是专门为机器学习库和...


英特尔推出新工具包 想将芯片装进Alexa设备

移动设备崛起,PC销量下滑,英特尔计算机芯片的销售额也跟着减少。怎么办?英特尔将目光瞄准了“智能家庭”市场...


亚马逊Alexa实现语音身份识别 Echo服务做到因人而异

智能语音助手和智能音箱成为时下两大热点技术领域,而谷歌和亚马逊成为这一市场最具优势的两家企业。谷歌此前...


Sonos One中国发布 多项平台级发展计划同期公布

Sonos 在北京举行媒体活动,正式在中国推出了 Sonos One 智能音响。在活动现场,Sonos 首次提出“音联网”概念,并公布...


英飞凌高信噪比MEMS麦克风助力XMOS推出的亚马逊AVS远场开发套件实现强大功能

XMOS推出适用于远场应用、面向亚马逊Alexa语音服务的VocalFusion 4麦克风开发套件。该套件集成英飞凌的高信噪比麦克风...


五个让你盈利的物联网商业模式

我最近在硅谷参加了一场非常受欢迎的物联网会议,在一场演讲中,主讲嘉宾向观众提问:“你们当中现在有谁在做...


通过Xilinx工具和Amazon EC2云上的InTime优化设计性能

摘要: 本文阐明了InTime和Xilinx软件是如何通过调整编译参数以及运行并行编译来优化FPGA时序性能的。InTime通过机器学习来决定一个FPGA设计的综合和布局布线的最佳配置组合。通过和计算服务...


Google物联网操作系统Fuchsia更改核心架构名称 提供轻便运作特性

日前传出采Magenta核心架构、可对应手机、计算机、嵌入装置使用的全新操作系统“Fuchsia (吊钟花)”,稍早再次将核心...


研究:Siri、Alexa与Cortana有设计漏洞,可以人耳听不见的超高频率遥控

一项研究指出Siri、Cortana、Alexa等语音助理存在设计上的漏洞,可让黑客将语音命令转为人耳听不到的超高频率,在用...