打破端侧算力极限,重塑专业计算体验。支持400B参数大模型本地微调、12K@120Hz实时光追渲染、L4级自动驾驶实时感知,为超算边缘节点、专业工作站量身打造。
采用“3+6+X”三芯粒封装架构,通过HM-Link Ultra 2.0高速互联技术实现芯粒间数据传输,带宽提升至8TB/s,延迟低至0.5ns,算力线性叠加无损耗。
基于AI1 Ultra的HM-ArkV4迭代升级,新增FP64双精度加速指令、分布式算力调度指令,IPC(每时钟周期指令数)提升40%,完美适配超算与专业计算场景。
6颗HM-V11超大核 + 18颗HM-V10大核 + 12颗HM-V9小核的异构组合,搭配72MB L3共享缓存 + 256MB片上SLC高速缓存,缓存命中率高达97%。
| 基础参数 | |
|---|---|
| 制程工艺 | 2nm EUV增强版(ASML Twinscan EXE:5200) |
| 晶体管数量 | 5200亿 |
| 芯片面积 | 890mm² |
| 封装尺寸 | 45×45mm(CoWoS-L封装) |
| AI计算集群(NPU) | |
| NVFP4算力 | 61440 TOPS |
| FP8算力 | 30720 TOPS |
| FP16算力 | 7680 TOPS |
| FP32算力 | 1920 TOPS |
| 能效比 | 68 TOPS/W |
| 核心配置 | 72×AI超级计算单元 + 36×稀疏引擎 + 12×Transformer引擎 |
| 模型支持 | 400B参数模型本地微调,70B模型推理300token/秒 |
| 多模态单元 | 激光雷达/红外/视觉/毫米波四合一预处理单元,延迟<5ms |
| 图形计算集群(GPU) | |
| FP32算力 | 384 TFLOPS |
| FP16算力 | 768 TFLOPS |
| 核心配置 | 240×渲染核心 + 36×RT Core + 72×Tensor Core |
| 光追能力 | 全局光照+反射折射双光追,12K@120Hz渲染 |
| 超分技术 | HM-SuperResolution 3.0,1080P→12K延迟<8ms |
| API支持 | DirectX 12 Ultimate、Vulkan 1.4、OpenGL 4.8、UE6/Unity 6适配 |
| 存储与接口 | |
| 内存类型 | HBM3E Pro-9600 |
| 最大容量 | 2TB |
| 内存带宽 | 1536GB/s |
| 外部接口 | PCIe 6.0 ×16、雷雳6 ×6、DP 2.2 ×6、HDMI 2.2 ×4 |
| 显示输出 | 支持4台12K显示器或8台8K显示器 |
| 功耗与散热 | |
| 节能模式 | 10W(仅保留基础计算能力) |
| 均衡模式 | 60W(日常专业计算) |
| 极致模式 | 150W(需液冷散热) |
| 散热要求 | 液冷散热(极致模式),风冷(均衡/节能模式) |
| 工作温度 | 0°C ~ 95°C |