英特尔深度学习产品综述:如何占领人工智能市场

大数据

2017 年第一季度,英伟达数据中心收入同比增长 63%,总体收入也得到增长。这一显著增长主要归功于大型 IT 公司,如谷歌和亚马逊主要基于英伟达 GPU 来加速其人工智能云产品的研发。相较而言,在数据中心领域处于霸主地位的英特尔仅增长了9%。如此悬殊的差距表明,市场中有越来越多的公司正采用深度学习技术;但英特尔已经增加了在深度学习方面的投入与发展力度。本文将就英特尔近期的深度学习产品表达一些见解。

英特尔的人工智能产品

英特尔加强了人工智能硬、软件领域的开发工作。英特尔已在数据中心领域发布了 Xeon 和 Xeon Phi 处理器用于机器学习及其他高性能计算(HPC)应用的通用性案例。为了满足对人工智能日益增长的需求,英特尔还推出了两个用于深入学习模型训练和高效推理的优化产品:

训练:英特尔 Xeon 处理器 + 英特尔深度学习引擎「Lake Crest」,「Lake Crest」具有同类之最的神经网络性能,并能提供前所未有的高带宽互连的计算密度。

推理:英特尔 Xeon 处理器 + FPGA(ARRIA 10)。FPGA 引擎可定制和编程,能提供带有用于机器学习推理的更高perf/w 的低延迟以及灵活的精度。该解决方案专为机器学习应用的高效推理和实时预过滤而设计。

下述章节将提供有关 Lake Crest 、英特尔 FPGA 解决方案 ARRIA 10 以及 Xeon Phi 深度学习模型训练评估结果的更多细节。

Lake Crest

英特尔深度学习引擎「Lake Crest」是一款新型芯片产品,可实现神经网络计算的硬件级优化。与可编程的 FPGA 相比,硬件网络的优势主要在于:像 Lake Crest 这样的芯片在运行时能与代码相适应,并且网络也会在硬件层面进行更新。Lake Crest 具有基于架构的张量,其内存层次结构具有以下特点:高维度(> 2)张量是默认的数据类型;没有应用缓存机制,由编译器分配内存。这些张量可读为转置或定期。它始终具有 ECC 保护,且应用比 DDR4 快 12 倍的 HBM2 RAM。

Lake Crest 的另一项重要创新是数据传输,并拥有高带宽互连——具有 6 个用于 3D 环面互连的双向链接,这些链接比 PCIe快 20 倍。Lake Crest 的 12 个计算单元直接连接到所有其他计算单元,其吞吐率高达每秒 100 千兆字节。

Lake Crest 支持用于深度模型的 16 个 FlexPoint,且聚焦于优化占据大部分神经网络执行时间的 Mat-Mult 和 Convolution 。它还支持如(A ^ 2 * 4B)+ C 这样复杂的 GEMM 函数、自动矩阵阻塞以及部分乘积相加等。

The specific data type designed in Lake Crest can be seen in Figure 1

在 Lake Crest 中设计的具体数据类型如图 1 所示。

大数据

图 1: Lake Crest 支持的数据类型(图片来自英特尔)。

FlexPoint 引擎能够实现基于 12x100Gbps  interc 和 32 GB HDM2 RAM 的 50TOP。 2017 年底将推出基于深度学习平台的Lake Crest,而 2018 年底将推出下一代英特尔深度学习芯片「Spring Crest」,其能使用 8g winograd 实现 80-90 的TOP。

Arria 10 FPGA

Arria 10 是英特尔目前用于机器学习的最新一代 FPGA,它的计算能力可以单精度达到 1.5 TF,Int16达到 3 个 TOP,Int8 达到 6 个 TOP 。2017年末将计划发布下一代 FPGA ——「Stratix 10」,它的计算能力将更强大,单精度高达 9 TF,而 Int16 / 8 则会高达 18/36 TOP。

英特尔为安装 Arria 10 FPGA 模块提供了两种选择:作为单独的 PCIe 组件进行安装,即将来的「离散」版本;另一方面,它可被集成到在内部与处理器直接相连的 Xeon 处理器包中,并在外部与 FPGA 模块之间直接提供一个连接管道,从而实现灵活的数据访问,这便是「集成」版本。

表 1 和 2 显示了使用 Arria 10 FPGA 组件的 Xeon 处理器的吞吐量以及能耗。(所有统计数据收集自英特尔的公开资料。)

大数据

表 1:使用 Arria 10 离散版本的英特尔 Xeon

大数据

表 2:分类任务中「集成」版本的吞吐量。

表中的结果基于以 224x224x3 作为输入、1000×1为输出的 AlexNet 分类。

Xeon Phi Knights Mill

用户喜欢...

LTE Cat M1模块为辅助生活系统提供宽带和智能手机的替代产品

根据联合国的预测,到2050年60岁或以上的人口将占世界人口的22%,这一数字在2000年仅为10%。在同一时期,总数这个星球上活着的人数将达到80亿。绝对而言,60岁以上的年龄组将超过17亿人。...


德州仪器工业4.0产品组合

工业4.0一词源于2011年的汉诺威工业博览会,是对第四次工业革命的参考。第一次工业革命,大约18个世纪,关联与制造过程的机械化。第二次工业革命是指在20月初制造电气化个世纪。 80年代的...


干货 WiFi产品常用射频功率放大器汇总

在这些年的WiFi产品开发中,接触了多种型号的射频功率放大器(以下简称PA),无线时代对WiFi产品中常用的射频功率放大器做个汇总,供读者参考。本文中部分器件型号是Frontend Module,即包含...


华为宣布未来五年将向英国采购30亿英镑的新产品

华为技术有限公司宣布了对英国的一项重大新承诺,承诺在未来五年内采购30亿英镑(合33.8亿欧元)。2月1日,华为公司董事长孙亚芳女士在北京会见了英国首相特蕾莎梅,并重申了公司对英国...


nRF52是可穿戴产品、人机接口设备(比如遥控器、玩具、智能家居设备和电器)以及无线充电应用的理想单芯片解决方案

Nordic Semiconductor nRF52系列SoC Nordic Semiconductor nRF52系列SoC运行频率为64MHz 、 EEMBC Coremark评分215 、能效达90 Coremark/mA,同时具有39A/MHz (闪存)和30A/MHz (RAM)的功耗 。nRF52系列用于在最短的时间内快速执...


Maxim率先推出15W单芯片USB Type-C充电器,简化便携式消费产品设计

率先面市的单芯片方案快速、安全地为2节串联锂离子电池组充电 今日,Maxim宣布推出业内首款高效、高度集成的15W MAX14748 USB Type-C充电及充电器检测方案,帮助设计者利用更简单、更高成效的...


人工智能也有负能量,我们得提前做好准备

最近几天,各种对2018年的科技预测层出不穷,其中对AI的畅想占了大头,内容差不多是一片喜庆祥和。 但事有两来,当我们开始从AI中收获价值的时候,技术升级后带来的潜在风险也在升温。...


大数据和云计算的冲突

最近,IT行业专家在参加相关会议时发现了一个隐藏的主题,那就是虽然很多人将关注的重点转移到基于云计算的架构...


透视CES 2018:Segway-Ninebot携黑科技产品将再次亮相

CES 2018国际消费电子展将在美国拉斯维加斯正式拉开帷幕。全球智能短交通和服务类机器人领域的领军企业 -- Segway-...


智能家居为何需要大数据, 大数据在智能家居领域的贡献是什么?

大数据分为大数据存储和大数据分析,属于两种截然不同的计算机技术领域,大数据存储用于大数据分析。大数据存储重点在于研发可以扩展至PB甚至EB级别的数据存储平台;大数据分析关注在...


明年将会看到自动驾驶应用场景落地

“自动驾驶汽车行业才刚刚起步,这将是几十年乃至数十年的发展,”英伟达汽车业务高级总监Danny Shapiro表示。随着...


12英寸晶圆厂再添新势力 广州粤芯半导体项目动工

芯片,极为微小的电子器件,它被喻为“工业粮食”,是所有整机设备的“心脏”。官方介绍,长期以来,广州缺乏...


瑞萨电子荣获OFweek 2017物联网创新技术产品奖

世界信息产业的第三次浪潮正在袭来,物联网技术已经渗透到各行各业中,并涌现出大量的新技术、新产品、新应用以及新模式。在物联网作为各国政府和企业争相布局的焦点这样的大环境下...


Allegro MicroSystems, LLC发布两款高带宽电流传感器以补充现有的产品系列

Allegro MicroSystems,LLC宣布在现有的高带宽系列电流传感器基础上增加新一代产品ACS732和ACS733,新产品能够为测量DC/DC转...


中科院王飞跃 | 人工智能:第三轴心时代的来临

如何科学地认识人工智能与人类未来的关系,如何有效地抓住人工智能所带来的新技术突破之时机,创新产业升级和...


未来三年,工信部将重点发展这八大人工智能产品

最近,国家工业和信息化部突然又砸下一重磅人工智能红头文件!文件宣布在接下来的2018-2020这三年内,国家要重点推动人工智能和实体经济深度融合,推进人工智能技术产业化、集成应用,...