丰浩农业网 >> 小黄花茶

汽车智能芯片战争发射管

2022-12-07
汽车智能芯片战争

在汽车芯片行业 ,特斯拉、英伟达、华为、地平线、高通,是这场竞争中的主要参与者。

来源 | 建约车评

2021年7月29日,地平线在上海发布了全新一代芯片征程5(J5),地平线创始人兼CEO余凯称,这是地平线成立六年来最重要的发布会。

这款芯片基于16nm工艺制程,搭载贝叶斯BPU架构,AI算力达128TOPS,最早将在2022年三季度或四季度初量产,在微软的MS CoCo公开测试集中,地平线的征程5可以实现1283FPS,地平线通过估算表示,征程5在AI性能上将与英伟达Orin处于同一水平。

差不多两年前,2019年12月18日,黄仁勋发布了面向自动驾驶的新一代处理器Orin,基于7nm工艺制程,晶体管数量达到170亿个,AI算力达200TOPS,理想X01、蔚来ET7是这款芯片的首批量产车型。

在更早的2019年4月份的特斯拉自动驾驶日上,特斯拉对外展示其FSD芯片的技术细节,基于14nm工艺制程,晶体管达60亿个,AI算力达72TOPS,这一芯片已经搭载在数以百万计的特斯拉汽车上。

特斯拉在那次活动上表示,当其开始准备自研自动驾驶的时候,市场上并没有没有成熟的可用于神经网络的自动驾驶芯片,于是特斯拉花了18个月设计了FSD芯片。

自特斯拉开始,专为神经网络打造的NPU开始成为汽车智能芯片的主要组成部分,传统的通用计算CPU、GPU退居辅助位置,AI算力和性能一跃成为各大芯片厂商的主要竞争点。

特斯拉、英伟达、华为、地平线、高通,是这场竞争中的主要参与者。

不论是老巨头、新玩家,这些参与者们几乎都同意中央计算的演进趋势,以这个趋势来看,眼下整个战场还处于第一轮竞争的资格赛,在这个阶段,芯片主要为自动驾驶服务,更快、更高效、低成本地实现自动驾驶是当前的主要任务。

自动驾驶是智能汽车的第一个杀手级应用,它将为汽车带来超1000TOPS的AI算力、遍布全身的各种传感器,将汽车打造成有史以来最强大的智能终端。

在未来,汽车这个超级终端上还将长出其他杀手级应用,那时的汽车智能芯片还需要为这些应用服务,这意味着未来的竞争将会发生重大变化,汽车智能芯片离最终形态还有很长的路要走。

竞争才刚刚开始。

01

在自动驾驶应用上,本次地平线公布了征程5(J5)的三个主要数据:1283FPS、60毫秒延迟、功耗30W。

1283FPS

在微软的MS CoCo公开测试集中,面对真实场景中的多类物体检测上,地平线的征程5可以实现1283FPS,而英伟达Xavier是143FPS,地平线按照Xavier的7倍去估算Orin的性能为1001,按照这个估算值,地平线征程5在AI性能上略好于Orin。

60毫秒延迟

地平线表示,从摄像头(8M)输入到感知结果的输出,征程5只需要60毫秒,而大部分的竞争对手都是150毫秒以上。

功耗30W

作为对比,特斯拉FSD芯片的AI算力为72TOPS,功耗是36W;

英伟达Orin的AI算力为200TOPS,功耗为45W;

地平线征程5的AI算力为128TOPS,功耗为30W。

对于自动驾驶来说,性能、延迟、功耗都是非常重要的氩弧焊丝参数,它们将直接决定整个自动驾驶系统的能力边界。

在芯片的硬件结构上,征程5有以下主要核心单元:

1.3G Pixel/S的ISP,可以同时接入12路200万像素摄像头、4路800万摄像头;

来自Arm的A55 DynamIQCPU;

来自Tensilica的视觉P6DSP;

地平线自研的用于人工智能计算的贝叶斯BPU.

这些计算单元在分工上如下:

预处理(成像、图像处理),此部分计算通过双ISP、双DSP等单元来进行处理;

感知(目标检测、分类、分割、追踪、识别),此部分计算通过双核BPU来进行处理;

后处理(后处理、融合、预测、规划、建图),由8核A55 CPU集群来负责。

征程5的架构和特斯拉的FSD芯片是比较接近的,另外,两者也都将研发的重点放在了NPU(地平线称为BPU,特斯拉称为NNA)部分,NPU的主要作用是用来运行神经网络,进行大规模并行计算。

与NPU相比,CPU注重单线程性能,在响应速度上较快,但在大规模并行计算上几乎不可用;GPU由于功耗高,运行神经网络方面不如NPU有优势。

特斯拉曾以FSD Chip上的CPU、GPU、NNA的神经网络处理能力举例,GPU(1Ghz 600GFLOPS)大概是CPU(12核ARM A72)的10倍,而NNA(算力72TOPS)的处理能力又是GPU的100倍以上。

尽管NPU在运行神经网络时,具有高性能、低时延、低功耗的特性,但是这里面仍然有很深的know-how。

地平线联合创始人兼CTO黄畅称,贝叶斯BPU在硬件架角阀构方面有三项核心技术:大规模异构近存计算、高灵活大并发数据桥、脉动张量计算。

大规模异构近存计算,为自动驾驶提供了比较合理的异构计算模式配比,这些异构计算单元和存储在物理空间上放得尽可能地近,能够通过L0的绝不到L1(SRAM),能够通过L1的就绝不到外存去,这就使得数据传输的功耗和延迟可实现数量级的降低。

高灵活大并发数据桥,将多个计算单元和存储阵列灵活地连接,以较高带宽,在多个计算单元同时读取数据时,提高每个计算单元的数据吞吐能力,保证每个数据单元都能转起来,有足够的数据去计算,避免出现计算单元空转的现象。

脉动张量计算,来自L0 Memory的数据流经MAC阵列,在数据的交叉流动过程中完成计算,可以大幅降低对L1 Memory的访问频次,进而降低计算功耗、延迟。

在软件层面,地平线将通过编译优化,可实现在高度并行计算的同时,数据外溢到外存的概率和数量降低到极致,通过更少的外存,来支撑更高的有效算力。

上面的技术解释可能过于枯燥,我们试着翻译下。

首先,我们要理解神经网络运算的特征。

特斯拉AI高级总监Andrej Karpathy曾在特斯拉自动驾驶日上表示,一个典型的神经网络有数千万到数亿个神经元,每个神经元又有上千个连接。

这是一个大规模、大数据量的计算。

而在冯诺伊曼架构中,由于“内存墙”的限制,数据在读写环节消耗的能量要比计算环节大两到三个数量级。

2019年特斯拉自动驾驶日

这就意味着,运行神经网络需要在进行大规模并行运算的同时,减少对存储的访问。

从这个角度理解,地平线BPU上述三点核心技术的作用分别为,计算单元在物理结构上靠近存储、提高并行计算的真实性能、减少存储访问。

就像上面说的,这些工作也是围绕着高性能、低时延、低功耗的目标来的。

在高等级自动驾驶中,随着各类传感器以及图片传感器的数量、能力的提升,场景扩展,功能丰富,自动化程度越来越高,对AI算力的需求也在呈指数级爬升,在自动驾驶芯片上,NPU部分也将持续是各家的主要竞争点。

在NPU方面,地平线的核心竞争力在于余凯、黄畅等核心团队都是深度学习算法出身,在打造AI芯片上有着深入的理解。地平线称,其拥有全世界最好的激光雷达的算法技术,世界领先的视觉技术。

在量产应用上,地平线为征程5设计了一些关键节点:2021年Q4,完成基于征程5的城区自动驾驶实车Demo;2022年Q2,合作伙伴域控制器硬件量产;2022年Q4,整车智能解决方案SuperDrive实现量产SOP。

02

汽车智能芯片未来会走向什么方向呢?

在功能手机时代,全球最大的手机芯片制造商是德州仪器,一度占据着60%的市场份额,在这个时代,一款芯片可以横行10年,诺基亚可以在数年内发布的10多款手机上都采用一款芯片。

这时的手机芯片可能就是为「通话」这一个功能设计的,这和现在的汽车AI芯片专为「自动驾驶」设计,有点类似。

随着智能手机的大浪潮,智能手机芯片SoC上开始具备越来越多的能力,DSP、ISP、GPU、NPU等越来越多的异构计算单元被集成到芯片上。

与此同时,智能手机上的应用也越来越丰富,这些应用又反过来对手机芯片提出了更高的要求。现在一款手机芯片如果不好好对待ISP(图像信号处理)、5G基带芯片,甚至是手机上应用较少的NPU,人们都会感到无法理解。

这也使得手机芯片的设计也越来越复杂,参与门槛也越来越高。

目前,在全球范围内的手机芯片制造商,只有苹果、高通、联发科、华为、三星、紫光展锐6家,差不多和手机制造商的数量一样少。

手机芯片行业对汽车芯片行业会有启示吗?

绝对有。

应用(App)及其背后的用户需求,是芯片产业的原始驱动力。

在功能手机时代,人们对手机在应用上的思考极限可能就是上网页、发邮件,而且是以极烂的体验完成这两件事。

那时的人们绝对想不到,随着CPU、摄像头、4G/5G的发展,抖音、王者荣耀会成为很多人在手机上的主力应用。

买一个手机是用来打电话还是用来玩游戏,这种用户需求的变迁,促使着硬件水平不断提升。

对于智能汽车来说,这个逻辑不会变。

对于当前的智能汽车主控芯片来说,第一阶段的核心要求是满足自动驾驶的能力,例如特斯拉就表示,其FSD芯片用来处理自动驾驶计算的时候是非常高效的。

我们可以将自动驾驶当作为智能汽车上的第一个超级应用,现阶段的特斯拉FSD芯片、英伟达Orin、地平线J5等,其实是专为自动驾驶开发的专用芯片。

在应用层面,目前除了自动驾驶之外,智能汽车领域还没有出现真正面向下一个时代的应用,甚至连雏形都还没有出现。

这和当前智能座舱的尴尬现状有关,智能座舱、自动驾驶两者在硬件上几乎完全隔离,智能座舱的应用在用户体验的改善上并不明显,主机厂也没有动力为其升级到更好的硬件水平,这导致了智能座舱在应用和硬件迭代上都属于较慢的水平。

而自动驾驶硬件,不论是计算平台还是各种传感器硬件,近几年都在快速迭代,1000TOPS的计算平台、8M摄像头、激光雷达,层出不穷。

一方面,这是由「自动驾驶」这个超强应用催生出的,另一方面,这些硬件反过来也会催生出「自动驾驶」之后的下一代超级应用。

随着中央计算架构的演进,汽车的计算将会是集中式,这在业界已经几乎成为共识。

在今年4月份的时候,黄仁勋曾表示,英伟达Orin将不仅支持自动驾驶计算,还可以支持仪表、车载娱乐、车载人工智能等多个领域的计算和交互。

特斯拉下一代的FSD芯片、地平线J5,也都在往这个方向努力。

一个显而易见的优势是,智能驾驶已经为汽车的传感器、算力平台等硬件买过单,「下一代超级应用」可以充分利用这些自动驾驶的硬件,开发新的应用场景,但是却不用再付一次费。

下一代超级应用,也许是VR,对AI算力有需求,同时对GPU也有需求。当这类应用超过「自动驾驶」成为智能汽车的主要应用,将对芯片制造商提出新的要求,竞争的内涵也将发生变化。

写到这里,可能很多人会想「难道还有应用在车上能超过自动驾驶?」,就在15年前,人们甚至也很难想到现在的人主要拿手机来刷抖音,而不是打电话。

03

那么问题来了,汽车制造商会做智能芯片吗?

2008年,高通凭借着其在通信方面的能力,上了HTC的车,开始为HTC G1供应芯片,从此高通开始在手机芯片领域争霸称雄。

这和地平线等厂商凭借其AI能力,开始在汽车芯片领域征战,很像。

都是外来人,都是从一个很刚需的起点开始。

在自动驾驶时代,或许车企自研芯片的动力还没有那么充足。

自研的优势是可以更高效地研发自动驾驶,另外,当规模到达一定程度,相对于直接采购,成本上也更有优势;

问题在于这个事太难了,开着飞机修飞机的车企们,在其他的战场上还有很多资源需要投入,实在是空不出手来干这个事。

但是,到下一个超级应用的时代,这个事将会变得不一样。

到那时,最强悍的应用例如元宇宙(Metaverse),甚至可能是汽车制造商开发出来的,而不是第三方应用开发商,第三方厂商只是在这个应用内提供服务和内容。

最具野心的汽车制造商,将会有制造芯片的动机。

因为,他们需要掌握软硬一体的体验,他们可以更好地优化自己的自动驾驶和其他超级应用。

特斯拉已经在做这件事情。当然了,我们不能想当然地认为汽车制造商就一定能把这个事情做好,芯片的开发难度和复杂程度,已经和苹果当初滤波电容开始做A系列芯片时大不相同,甚至和特斯拉在2016年开始做FSD芯片时也已不相同。

马斯克在自动驾驶日上发布FSD芯片的时候说,“现在确实有人可以跟进我们,但是需要三年后才能做出来,而我们在两年之后拿出来的东西将比现在的好三倍。”

特斯拉预计将在8月19日召开「AI Day」,届时我们有望看到特斯拉推出新一代的FSD 2.0和HardWare 4.0。

当然了,第三方的芯片制造商仍然有自身的优势。

当除了自动驾驶之外的另外一个或几个超级应用杀出来,这些应用需要的不是自动驾驶专用的能力,而是一些通用的能力,例如英伟达在GPU方面的超强能力将会爆发出巨大的潜力。

对于地平线来说,其在AI方面的能力需要进一步发挥到极致。

基于征程5芯片,地平线也在做下一代高等级自动驾驶感知系统Demo,该公司表示这个系统可以优化荆门一些环节的效率,例如,

车端影子模式:提升数据上传和存储效率100倍;

自动标注自学习:提升3D数据标注效率1000倍;

AIDI平台工具:提升算法工程师工作效率20倍。

和芯片巨头相比,地平线虽然在资源和积累方面不占优势,但围绕自动驾驶做好相关的服务和赋能,可以帮助这家初创公司拿到下一赛段的入场券。

祝福地平线,祝福中国芯片产业。

本文首发于微信公众号:阿尔法工场研究院。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

(责任编辑:张洋 HN080)上诉离婚律师推荐
离婚房产律师咨询费用
北京离婚律师服务
诉讼离婚调解
友情链接