国货之光—— GPU 沐曦 MXC500点亮成功!竞品是训练出GPT的英伟达A100    

电脑配件 06-16 17:39:03 67 0

沐曦 metax是2020年9月于上海成立,北京、南京、成都、杭州、深圳和武汉等地有多个研发中心。主导过十多款世界主流高性能GPU产品研发,包括GPU架构定义、GPU IP设计、GPU SoC设计及GPU系统解决方案的量产交付全流程。

沐曦打造全栈GPU芯片产品,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI训练及通用计算,以及MXG系列GPU(曦彩)用于图形渲染,满足数据中心对“高能效”和“高通用性”的算力需求。沐曦产品均采用完全自主研发的GPU IP,拥有完全自主知识产权的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA)

可以说沐曦 metax算得上中国版的英伟达公司!自研的曦云 MXC500 系列 GPU 成功点亮,只用 5 个小时就完成了芯片功能测试,英伟达 A100 / A800 的算力芯片,目标 FP32 算力 15 TFLOPS(英伟达 A100 的 FP32 性能为 19.5 TFLOPS),采用通用 GPU 架构,兼容 CUDA

英伟达A100是一款HPC(高性能计算)AI领域的GPU,A100基于NVIDIA的Ampere架构,这是一种专为高性能计算和AI工作负载而设计的架构。Ampere架构采用了多个创新技术,如第二代Tensor核心、第三代NVIDIA NVLink高速互联技术和第三代NVIDIA NVSwitch互连交换技术。

每个A100 GPU拥有6912个CUDA核心(计算单元),54GB的高速HBM2内存,约1有9.5 TFLOPS的单精度浮点性能和9.7 TFLOPS的双精度浮点性能。

A100支持NVIDIA NVLink和NVSwitch技术,可以将多个A100 GPU通过高速互连进行直接连接。这样的互连架构提供了更低的延迟和更高的带宽,有助于处理大规模的并行计算和数据密集型任务。

不过目前英伟达有了性能更好的H100!无论是A100还是H100,都和咱们用的RTX系列显卡不同;英伟达把卡分为Geforce、 Quadro、 Tesla三个大类,咱们用的都是Geforce,而A100、H100都属于 Tesla的。首先最明显的就是后两者都是计算卡,计算卡没显示接口、没风扇 。

A100用的是Ampere架构,比如RTX4090卡用则是Ada Lovelace架构,A100用的HBM显存, 没有光追单元 大量的FP64双精度计算单元~更重要的则是价格,这个咱们不是采购企业所以,我了解到的A100 40GB:大约售价在5000美元至8000美元之间;A100 80GB:大约售价在8000美元至10000美元之间。

咱们的曦云 MXC500:是 MXN100 异构GP²U处理器,以及 HBM2E 显存,单卡算力达 160TOPS(INT8)和 80TFLOPS(FP16)(1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作)最高 128 路编码和 96 路解码的视频处理能力,兼容 HEVC、H.264、AV1、AVS2 等多种视频格式,最高支持 8K 分辨率。

其中最值得注意的就是80TFLOPS,也就是浮点运算数值,这个数值受到I/O的性能、存储器的架构、缓冲存储器一致性等影响,理论数值也实际数值其实是有差距的,如果完全不管功耗和散热,RTX4090超频到3150Mhz,TFLOPS数值达到了100。

最后貌似曦云很多的工程师是从AMD来的,兼容的CUDA大概是源于AMD的ROCM的,AMD的 Radeon HD 4850是第一个桌面端达到1TFLOPS的 芯片组显卡,512MB、GDDR3还有55nm制程工艺,不怕慢只怕站,希望国产软硬件厂家都奋力直追,然后赶超!

国货之光—— GPU 沐曦 MXC500点亮成功!竞品是训练出GPT的英伟达A100   
网友评论