近日,AMD正式发布了升级版的本能MI325XGPU加速卡,并公布了新一代本能MI350系列的首款产品《本能》。
MI355X“,并披露了部分规格和性能数据。
MI350系列将首次升级为台积电3nm制程,并首次采用CDNA。
4架构,首次引入了FP6、FP4浮点数据类型,带有内存或HBM3E,但容量高达288GB。
具体功耗尚未披露,但MI325X已高达1000W,MI355X也透露AMD将顺应行业趋势(NVIDIAB2001000W,GB200
1700W),势必大幅突破1000W。
Fp6和fp4属于浮点数据格式,分别代表6位和4位精度,即只有6位和4位才能表示一个数,虽然远低于fp16和f8,但数据处理量也大大减少,适用于大模型,特别是大语言模型和混合专家模型的量化。
如果你不需要高精度,而是想要速度,FP6和FP4是非常合适的。
FP6和FP4在MI355X上的浮点性能均为9.2PFlops(每秒9200万亿次运算),而FP16和FP8的性能分别提高了80%到2.3%。
PFlops、4.6PFlops.
NVIDIABlackwellGPU还引入了FP6和FP4精度,但性能更高,分别高达20和40PFlop。
与MI325X相比,分别有1/8和1/3以上,与目前上市的MI300X相比足足增加了50%。
比较竞争产品,BlackwellB200也只有192GBHBM3E,但带宽同样做到了8TB/s。
MI355X在一个平台上还支持8块卡,因此它总共有2.3TBHBME内存,64TB/S带宽,性能高达fP1618.5PFlops,fp837。
、fp6/fp474pflop.
它也将在明年下半年上市。
毫无疑问,本能系列的性能提升是突飞猛进的,每一代人都焕然一新,代际对比更是令人惊叹。
与MI300X、FP16相比,MI355X的性能是7.4倍,HBM的能力是1.5倍,可处理的模型参数规模也从7140亿增加到4.2万亿,高达6倍。
展望未来,下一代本能MI400系列将于2026年推出,基于下一代CDNA架构(CDNA)。
5?)规格和性能将再次向前迈进一大步。