国漫手机壁纸

MIT发布《人工智能加速器》2021年度综述论文,详解80+类AI芯片性能优劣

新智元报道来源:专知编辑:David在过去的几年里,每个月都会发布新的机器学习加速器,用于语音识别、视频对象检测、辅助驾驶和许多数据中心应用。本文更新了过去两年人工智能加速器和处理器的调研,收集和总结了目前已公开发布的商业加速器的峰值性能和功耗数据。在过去的几年里,每个月都会发布新的机器学习

NetSmell 出品

  新智元报道

  来源:专知

  编辑:David

  在过去的几年里,每个月都会发布新的机器学习加速器,用于语音识别、视频对象检测、辅助驾驶和许多数据中心应用。本文更新了过去两年人工智能加速器和处理器的调研,收集和总结了目前已公开发布的商业加速器的峰值性能和功耗数据。

  在过去的几年里,每个月都会发布新的机器学习加速器,用于语音识别、视频对象检测、辅助驾驶和许多数据中心应用。

  本文更新了过去两年人工智能加速器和处理器的调研,收集和总结了目前已公开发布的商业加速器的峰值性能和功耗数据。性能和功率值绘制在散点图上,从这个图上的趋势的一些维度和观察再次被讨论和分析。今年,我们还编制了一个基准性能结果列表,并计算了相对于峰值性能的计算效率。

  论文地址:

  https://www.zhuanzhi.ai/paper/b5b93469c4c9dcacb9a6f3019291b814

  https://arxiv.org/abs/2109.08957

  引言

  在过去几年里,初创公司和成熟的技术公司一直在宣布、发布和部署各种各样的人工智能(AI)和机器学习(ML)加速器。这些加速器的重点一直是加速深度神经网络(DNN)模型,应用空间跨度从非常低功耗的嵌入式语音识别到数据中心规模的训练。

  在过去的一年里,新加速器的发布速度有所放缓,但定义市场和应用领域的竞争仍在继续。这种开发和部署加速器的动力是现代计算领域更大的工业和技术变革的一部分。

  人工智能生态系统整合了嵌入式计算(边缘计算)、传统高性能计算(HPC)和高性能数据分析(HPDA)的组件,这些组件必须协同工作,以有效地为决策者、作战人员和分析人员提供使用能力。

  这些原始数据产品被输入数据调整步骤,在此步骤中,它们被融合、聚合、结构化、累积并转换为信息。由数据调整步骤生成的信息输入到一系列有监督和无监督的算法中,比如神经网络。

  神经网络可以提取模式、预测新事件、填补缺失的数据,或者在数据集中寻找相似点,从而将输入的信息转化为可操作的知识。然后,这些可操作的知识被传递给人类,用于人机合作阶段的决策过程。

  人机合作阶段为用户提供有用和相关的洞察力,将知识转化为可操作的智能或洞察力。速度有所放缓,但定义市场和应用领域的竞争仍在继续。这种开发和部署加速器的动力是现代计算领域更大的工业和技术变革的一部分。

  下图展示了这种端到端人工智能解决方案及其组件的架构概述。在图的左侧,结构化和非结构化数据源提供了实体的不同视图。

  现代计算机系统是这个系统的基础。摩尔定律的趋势已经结束了,还有一些相关的定律和趋势,包括德纳尔标度(功率密度)、时钟频率、核心计数、每个时钟周期的指令和每个焦耳的指令(库米定律)。

  从最先出现在汽车和智能手机上的片上系统(SoC)趋势来看,为常用的操作内核、方法或功能开发和集成加速器仍在不断进步和创新。这些加速器的设计在性能和功能灵活性之间有不同的平衡。

  这包括深度机器学习处理器和加速器的创新爆炸。了解这些技术的相对优势对于将人工智能应用于具有重大限制的领域(如大小、重量和功率)尤其重要,无论是在嵌入式应用还是在数据中心。

  公开发布的各 AI 加速器和处理器的峰值性能和峰值功率图

  本文是对过去两年 IEEE-HPEC 论文的更新。和过去几年一样,我们将回顾一些与理解加速器功能相关的主题。

  • 神经网络类型——虽然人工智能和机器学习包含了一系列广泛的基于统计的技术,但本文继续关注去年的重点,面向深度神经网络(DNNs)和卷积神经网络(CNN)的加速器和处理器,因为它们具有相当高的计算强度。

  • 神经网络训练与推理——正如前两次调研中所解释的那样,该调研侧重于用于推理的加速器和处理器,原因有很多,包括国防和国家安全 AI/ML 边缘应用依赖推理。

  • 数值精度——我们将考虑加速器支持的所有数值精度类型,但对于大多数类型,它们的最佳推断性能是 int8 或 fp16/bf16 (IEEE 16 位浮点数或谷歌的 16 位脑浮点数)。但从图 2 中可以看出,许多不同的数值格式都报告了峰值性能。

  • 神经形态计算和光子计算——在今年的调研没有发布峰值性能和峰值功率的数字。有一些神经形态处理器与传统加速器的相对比较,但没有确切的数字。也许明年,我们将开始看到实际的性能数据,我们可以纳入这个调研。

  本文转载自微信公众号“专知”

显示余下内容
相关文章:
  1. 信用卡 PIN 码很容易猜测
  2. 神经元簇发能模拟 AI 学习策略
  3. 蜘蛛丝可能根本不具有抗菌性质
  4. 佳能因禁止无墨水打印机扫描被起诉
  5. DeepMind盈利后开始「买买买」!收购机器人模拟平台MuJoCo,全面开源
  6. 分析师:新MacBook Pro搭载自家芯片,苹果利润率更高了
  7. 格芯提交上市申请IPO,筹资约26亿美元
  8. 美股周二:中概股普涨 阿里涨超6% 高途涨逾12%
  9. 搭配自研处理器与安卓12,谷歌新机Pixel 6起价599美元
  10. 摩根士丹利:马斯克有望凭SpaceX成首位万亿美元富豪
  11. 《鱿鱼游戏》助奈飞三季度新增用户翻倍,股价近新高
  12. DOTA 2又上热搜了 为什么这次大家到处刷“猛犸”?
  13. 多位游戏巨头联合希望美国政府监管盗版和作弊网站
  14. Google Play Data Safety开始接受开发者申请:2022年将强制执行
  15. 价格欺诈投诉引发公益诉讼 京东“划线价”格式条款须整改
 

发表回复

您的电子邮箱地址不会被公开。