99科技给大家分享各类生活学习资讯!
您现在的位置是: 首页 > 智能硬件 > 马斯克揭晓全新FSD计算硬件:4nm工艺实现10倍算力飞跃

马斯克揭晓全新FSD计算硬件:4nm工艺实现10倍算力飞跃

特斯拉在近日发布了其下一代车载计算平台的重磅信息,该平台将不再沿用传统的“HW”命名方式,而是直接命名为“AI5”。这一全新的命名方式不仅彰显了特斯拉对于人工智能技术的重视,也预示着该平台在性能和功能上将会有巨大的飞跃。

为啥不叫 HW5.0?有啥提升

HW 其实就是 Hardware 的缩写,字面上自动驾驶系统硬件的意思。

这应该是早期马斯克直接把内部工程项目的代号拿来当产品名称了。

创业阶段初出茅庐,这样搞挺好,凸显特斯拉技术宅、工程师基因。

但现在特斯拉家大业大,全球智能车行业都在模仿和试图超越,再这么随意,好像也不太合适。

于是马斯克宣布,我们改名啦,新一代自动驾驶硬件平台,名字就叫 ——AI5。

这属于是自动驾驶第一性原理命名法了。

老马透露的相关信息还有这些:首先是算力比现款 HW4.0 提升 10 倍,其次是功耗整体提高 4-5 倍。2025 年下半年推出。

有这么几个点值得留意。算力方面,马斯克特别提到整个平台的算力大概是 HW4.0 的 10 倍。

其实特斯拉从未明确公布过 HW4.0 的具体数据,只是说是 HW3.0 的 5 倍(国内三方资料中的 750TOPS 数据无官方证实),所以根据已知信息和国外发烧友的实机拆解测试,大概可以推测出 HW4.0 的算力在 300TOPS-500TOPS 之间。

也就是单颗 FSD 芯片 200 多 TOPS 算力。这样计算,AI5 整个平台算力可能达到 3000-5000TOPS,这个数据是十分恐怖的。

目前国内的 TOP 玩家,比如华为、小鹏等等,支撑无图、轻图城市 NOA 功能的算力平台,不过就在 400-500TOPS 左右。

“芯皇”英伟达 Thor,顶配才 2000 多 TOPS,而且业内已经有很多意见认为量产车并不需要如此过剩的算力。

马斯克到底是在“放卫星”提振外界对特斯拉的信心,还是真的对自动驾驶技术范式做出了革命性变革,是个很大的悬念和看点。

第二个值得留意的是能耗方面。马斯克提到五代硬件平台,整体能耗比 HW4.0 提升 4-5 倍,相比于 10 倍的性能提升,其实证明特斯拉自动驾驶软硬结合能力更进一步,能耗控制更合理了。

还要补充一点,车载计算芯片和手机计算芯片的不同之一,就是可以无后顾之忧地打“富裕仗”,不必过于把能耗、尺寸作为衡量优劣的指标。车载计算平台的散热条件,天然也比 PC、手机优良得多。

毕竟电动车的电池容量远大于手机,而且就算芯片能耗再高,相比于电机、空调等等,也只能算零头。

还有一点容易被忽略,马斯克说 AI5 是“特斯拉最新一代计算平台”,但是严谨地说,特斯拉的业务就仅仅有汽车吗?

所以这也是大部分网友推测的依据:AI5 很可能并不是专门为 FSD 准备,如此高的算力,匹配的可能是今年 8 月即将发布的特斯拉 Robotaxi、人形机器人 Optimus,以及未来支持 L4、L5 的特斯拉车型。

也许那个时候的特斯拉产品,真的会取消驾驶舱。

不过也有用户提了一个很尖锐的问题:

之前 HW3.0 面世时,马斯克就拍胸脯保证可以实现无监督的 FSD 功能,但显然是鸽了。直到今天的 HW4.0 仍然不行。AI5 就一定可以吗?

AI5 会带来什么样的改变?

现在已知的信息并不多,只有一点是较为确定的,AI5 由三星代工,4nm 工艺。

最早特斯拉曾表示过 100% 给台积电代工,不过后来马斯克和三星高层见了一面后,又改了最初的决定。

据说是三星给马斯克开了一个“没法拒绝”的优惠价格,而且先进制程的良品率提升到 70% 多,和台积电相差不多了。

所以可以基本肯定,AI5 仍然会采用基于 Exynos-IP 的内核。Exynos-IP 是三星基于 ARM 构架设计的自有 IP,谷歌的手机也用过。

2019 年三星因为和高通合作,就停止了相关工作,不过 Exynos-IP 设计非常超前,基本上近似于目前 ARM Cortex X 系列的旗舰 X3 的设计,所以 2020 年之后才开始设计的 HW4.0,经国外特斯拉爆料大神 Greentheonly 拆解发现,仍然采用了 Exynos-IP。

AI5 很可能延续这个路线。

当然,今时不同往日,自动驾驶算法的技术范式已经发生了深刻变革,从最初的 CNN 为主的模块化网络结构,转变为以 Transformer 为主的端到端一体化网络。

外界通常更加关心自动驾驶芯片的 NPU 算力,这本身没错,大模型时代,当然需要更强的 AI 计算能力。

但对于自动驾驶任务来说,光 NPU 变强还不够,AI 处理器的速度再快,算力再高,如果 90% 的时间都是在等内存搬运数据,那也是白搭。

CNN 时代外置 CPU 足以配合好 AI 处理器,但到了 Transformer,CPU 反而成了瓶颈,内置成了最佳选择。

实际上,HW4.0 就是添加了一个 CPU 以应对 Transformer,刚好和特斯拉超算芯片 Dojo 的 D1 架构原理相同。

这也就解释了马斯克在剧透 AI5 的同时,还特意强调了 HW4.0 不是直接退役,而是拿去构建训练集群(和英伟达 A100 同时服役)。

所以特斯拉对于下一代计算平台 AI5 的安排和带来的影响,大概也能推测一二了。

AI5 的超大算力,极大可能不是单一芯片或双芯片实现,而是多个下一代 4nm FSD 芯片组合的结果。

如果真是单颗 / 双颗芯片数千 TOPS 算力,成本就会到几乎无法量产,不是汽车工业也不是科技行业的玩法。

这也就说明,AI5 很有可能是一个平台方案,根据任务、场景、产品成本要求不同,“丰俭由马斯克”。

最复杂的人形机器人,可能会用到数千 TOPS 算力,Robotaxi 可能就会低一点。相应的,特斯拉量产车可能会更低。

至于完全无监督的 FSD 在车端到底需要多大算力支持,可能马斯克自己现在也不清楚,仍在摸索中。

“端到端”最合理最高效的模式,到底是全部 AI 模型化,做成一个大黑盒,还是有条件的、逐步一体化,业内也没有定论。

AI5 最终体现在特斯拉量产车的算力有多大,不好判断,但肯定大于现在的四五百 TOPS。

所以 AI5 带来的冲击和影响,最直接的是开启智能汽车、自动驾驶的算力军备竞赛。

全行业玩家在这样的竞赛过程中,逐渐就会明确端到端自动驾驶的实现基本前提和门槛。

L4 也是同样,AI5 在特斯拉的 Robotaxi 上的探索和试错,作用也相当于量产车,那就是给 Robotaxi 的落地打造出一个样板:多大算力、什么样的方案配置、多少成本。

更重要的,是特斯拉身体力行为所有“AGI”玩家打样:需要什么样的技术体系,底层通用平台如何打造,云端终端的架构分别怎么选择…

谷歌安卓15新特性揭秘:AI壁纸分享功能,让你的设计成为焦点

2024/6/22 10:42:06

AI芯片挑战英特尔霸主地位:Lunar Lake 芯片出货时间推迟

2024/6/22 10:46:11