特斯拉公布超算集群「Cortex」,硬件组成多元化

时间:2024-08-06来源:电子产品世界

特斯拉CEO埃隆・马斯克 (Elon Musk) 在参观了最近建成的得克萨斯州超级计算集群后,在社交媒体上公布了超算集群的名称:Cortex,并指出他刚刚完成了新设施的演练。

Cortex拥有约十万颗英伟达H100和H200芯片,专门用于训练特斯拉的自动驾驶系统FSD和Optimus机器人。值得注意的是,虽然马斯克提到的是英伟达的产品,但Cortex庞大算力的硬件组成,可能是多元的,马斯克此前就曾透露超算集群的目标是 —— 一半算力由英伟达和其他厂家组成,比如AMD,另一半则来自特斯拉自研的超算中心Dojo。

特斯拉今年在英伟达芯片上的支出可能达到30亿至40亿美元,占公司总人工智能相关支出100亿美元的近一半,剩余的资金将用于内部研发的AI推理计算机、车辆传感器和Dojo超级计算机。

内部自研,外购囤卡,庞大的算力支撑了FSD的迭代升级,也带来了新的问题:冷却和能耗。网络曝光的工厂信息显示,超算设施内外配置了多重散热冷却措施,包括外部的巨大风扇,以及四个超大水箱和巨大的地下水管。

640-2.png

马斯克此前还详细介绍了Cortex超级计算集群的巨大冷却需求,并解释说该集群今年将需要约130MW的电力,未来18个月内更是有望突破500兆瓦,这也难怪马斯克会担忧“未来2年内缺电”。

但相比之下,目前国内智驾玩家还不到担忧电力的时候。或者说,算力差距才是当前焦虑的主要来源。2024年,智能驾驶领域开始了一场算力战争,特斯拉、小鹏、理想、蔚来等头部玩家纷纷展示自己的算力规模,而且国内智能驾驶玩家面临着算力获取的挑战,尤其是在高端显卡的获取上。

行业普遍认为,影响自动驾驶能力的三要素是:算力、数据和算法。算法架构上,玩家们都转向了端到端,具体组成和细节各有千秋;数据目前主要取决于车辆的保有量,算法迭代升级,则逃不开算力依赖,但对国内玩家来说,高端算力的获取并不容易。

Cortex超算集群的算力规模和硬件组成更是显示了特斯拉在AI技术上的领先地位,这对国内智能驾驶玩家产生了巨大压力,也预示着智能驾驶领域竞争的激烈。但也有供应商认为,算力差距并不能决定一切,马斯克此前也表示虽然FSD的训练受到AI算力制约,但是需要干预的Corner Case场景数据,对迭代也很重要。

关键词: 特斯拉 超算集群 Cortex 英伟达 AMD

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版