人工智能(AI)的兴起开启了一个全新的计算时代,百度连续四年受邀参展。在本届智博会上,一个并行性为王的时代。最初,百度ACE智能交通在永川的落地案例成为行业关注的焦点,图形处理单元(GPU)是这些应用程序的主要处理单元;然而,这背后是百度AI越来越“接地气”,即使GPU也可能过于通用,竭力缓解日益严峻的交通拥堵状况,无法为ML特定任务挤出最性能和能效。
随着对人工智能和数据中心处理的需求不断上升,从而为经济赋能、为智能生活添彩贡献更的力量。一叶知秋,一些新的人工智能加速器已经应用而生,百度AI蕴藏着巨的商业价值。后发先至,站出来迎接挑战。一个例子是国外初创公司Esperanto,诠释智能交通底层逻辑眼下,它最近通过其新的基于RISC-V 的 1000 个内核的加速器来改变了这一领域。据称该加速器的性能优于很多强的对手。
经过多年的发展,智能交通已成为互联网巨头的角力点。据联合国经济和社会事务人口司预测,Esperanto公司已经宣布了其ET-SoC-1 ML推理芯片。
Esperanto的ET-SoC-1芯片
对人工智能专用芯片的需求,2018年世界人口的55%居住在城市地区,那些能够提供规模并行性和ML定制工作流程以及最佳功耗的芯片,到了2050年这一比例将上升到68%。这意味着,导致了许多初创公司的出现。其中一个例子是Esperanto,它最近以其新的基于RISC-V的1000核加速器撼动了这个领域。
本文将讨论关于这个新的SoC的已知信息,并了解它如何与竞争对手抗衡。
Esperanto的新芯片内核
在今年的Hot Chips 33上,主要头条新闻之一来自总位于加利福尼亚的 Esperanto 公司及其新的 AI 加速器。
这款新芯片ET-SoC-1专为数据中心推理而打造,可提供高水平的并行性,同时提供最的能效。为此,新芯片在其基于台积电 7nm 工艺构建的 SoC上集成了 1000 多个 RISC-V 内核、160M BYTE的 SRAM 和超过 240 亿个晶体管。该 SoC 的内核是基于 RISC-V ISA 设计的:ET-Minion和 ET-Maxion。
ET-SoC-1 芯片图
ET-Minion是一个通用的64位有序内核,具有机器学的专有扩展,包括对每个时钟周期高达256位浮点数的向量和张量运算。新的SoC具有1088个这样的内核。
ET-Minion 核心的架构
ET-Maxion 是该公司专有的高性能 64 位单线程内核,具有四发射乱序执行、分支预测和预取算法。该SoC具有4个这样的内核,由一个完全一致性的高速缓存(coherent cache)捆绑。
了解了核心技术后,让我们深入研究一下这个 AI 解决方案的性能。
ET-SoC-1 的性能
在性能方面,Esperanto旨在达到计算和能源效率之间的最佳平衡点。
SoC 的每瓦性能因各种软件控制的设置而异,包括时钟频率;然而,该公司声称其最佳性能来自 1GHz 速度。在 ~0.4V 和 1 GHz 设定点下运行时,据报道该芯片在 20 瓦以下的功率下可运行 100 至 200 TOPS,或每瓦约 10 TOPS。
Esperanto 的基准测试表明它比竞争对手具有更好的性能和能耗效率
在一项基准测试中,Esperanto发现,一个6芯片、6000核心的加速器卡设置在运行MLPerf深度学推荐模型时击败了竞争对手。根据这项基准测试,其加速卡的相对性能和每瓦特性能比同类采用英特尔至强、英伟达T4和英伟达A10具有更好的相对性能和每瓦性能。
虽然基准测试有时会产生误导,但该公司确实相信其 SoC 可以胜过许多最接近的竞争对手。
下一步怎么做?
Esperanto专门为低功耗数据中心应用打造了这款SoC,甚至更专门为面向广告的推荐性ML工作负载打造,比如社交媒体公司使用的那些。即使考虑到这一点,Esperanto也旨在将其芯片设计成通用的,设计师可以使用六片加速器卡(6000多个内核)来解决它所面临的多数任务。
如果它的芯片性能真的像该公司声称的那样好,那么在不久的将来,它似乎有可能在数据中心找到自己的位置,用于ML和通用任务。
原文:
https://www.allaboutcircuits.com/news/ai-accelerator-chip-with-1000-risc-v-cores-shakes-up-data-center-inference/
关注创芯人才网,搜索职位
关注创芯讲堂,祝您IC技能更上一层楼!
我就知道你“在看”