快科技3月19日新闻,NVIDIA Blackwell架构固然在减速卡、游戏卡上都遭受诸多曲折,但这并不影响NVIDIA对将来的雄伟计划,岂但颁布了下一代Rubin架构的详细产物计划,还初次发布了再下一代架构“Feynman”。

Feynman就是理查德·费曼,美籍犹太裔人,20世纪最巨大的物理学家之一,诺贝尔物理学奖取得者,在量子电能源学、量子盘算、纳米技巧等范畴都有首创性的成绩,还撰写了《费曼物理学课本》、提出了“费曼进修法”,1986年挑衅者号航天飞机爆炸出事的基本起因也是他查明的。

NVIDIA此次一共发布了三款产物,起首是“Blackwell Ultra NV72”,往年下半年宣布,每个节点装备两颗进级版的Blackwell GPU、一颗Grace CPU,搭配多达288GB HBM3e高带宽内存,Dense FP4机能高达15PFlops(每秒1.5亿亿次)。整台效劳器一共72个节点,也就是144颗GPU、72颗CPU、20TB HBM3e、40TB DDR5内存,比上代增添50%,CX8互连带宽14.4TB/s,增添100%。整机的Dense FP4推感性高达1.1EFlops(每秒110亿亿次),FP8练习机能高达0.36EFlps(36亿亿次),另有新的留神力指令。

2026年下半年,咱们将迎来全新的Rubin架构,首发效劳器产物为“Vera Rubin NV144”,每个节点两颗Rubin GPU搭配一颗全新的Vera CPU。此中,Rubin GPU搭配288GB容量的下一代HBM4内存,FP4浮点机能跃升到50PFlops(每秒5亿亿次)。Vera CPU则包括88个自研Arm架构中心,初次支撑多线程而到达176线程,相互之间经由过程1.8TB/s188体育APP带宽的NVLink-C2C总线衔接在一同。整台效劳器一共144个节点,也就是288颗GPU、144颗CPU、41.5TB HBM4内存(带宽13TB/s),另有75TB的体系内存,NVLink6带宽达260TB/s,CX9总线带宽达28.8TB/s。FP4推感性能离开3.6EFlops(每秒360亿亿次),FP8练习机能则是1.2EFlops(每秒120亿亿次)。

202188宝金博app下载7年下半年,咱们将看到进级版的“Rubin Ultra NV576”,每个节点包括四颗Rubin GPU、一颗Vera GPU,并进级1TB HBM4e内存,FP4浮点机能高达100PFlops(10亿亿次)。整机一共多达576个节点,也就是领有2304颗Rubin GPU、576颗Vera CPU、576TB 皇冠登陆入口HBM5e(带宽4.6PB/s),另有365TB体系内存。NVLink互连总线进级到第七代NVLink7,带宽惊人的1.5PB/s,别的CX9总线带宽115.2TB/s。FP4推感性能高达15EFlops(每秒1500亿亿次),FP8练习机能5EFlops(每秒500亿亿次)。

至于新的Feynman架构,将在2028年初次退场,搭配下一代HBM内存(HBM5?),但详细细节暂未表露。

【本文停止】如需转载请务必注明出处:快科技义务编纂:上方文Q