HMGO AI2 Ultra

打破端侧算力极限，重塑专业计算体验。支持400B参数大模型本地微调、12K@120Hz实时光追渲染、L4级自动驾驶实时感知，为超算边缘节点、专业工作站量身打造。

5200亿晶体管

2nm EUV增强版制程极致功耗150W（液冷） 8TB/s HM-Link Ultra 2.0互联 68 TOPS/W 超高能效比

⚙️

核心架构突破

采用“3+6+X”三芯粒封装架构，通过HM-Link Ultra 2.0高速互联技术实现芯粒间数据传输，带宽提升至8TB/s，延迟低至0.5ns，算力线性叠加无损耗。

互联技术 HM-Link Ultra 2.0

芯粒数量 3颗功能芯粒 + 6颗互联芯粒

传输延迟 0.5ns（端到端）

封装工艺 CoWoS-L 先进封装

基于AI1 Ultra的HM-ArkV4迭代升级，新增FP64双精度加速指令、分布式算力调度指令，IPC（每时钟周期指令数）提升40%，完美适配超算与专业计算场景。

指令集版本 HM-ArkV5

IPC提升 40%（对比AI1 Ultra）

新增指令 FP64加速、分布式调度

兼容性 向下兼容ArkV1-V4

6颗HM-V11超大核 + 18颗HM-V10大核 + 12颗HM-V9小核的异构组合，搭配72MB L3共享缓存 + 256MB片上SLC高速缓存，缓存命中率高达97%。

超大核主频 4.8GHz（HM-V11）

大核主频 3.9GHz（HM-V10）

小核主频 2.6GHz（HM-V9）

缓存配置 72MB L3 + 256MB SLC

📊

基础参数
制程工艺	2nm EUV增强版（ASML Twinscan EXE:5200）
晶体管数量	5200亿
芯片面积	890mm²
封装尺寸	45×45mm（CoWoS-L封装）
AI计算集群（NPU）
NVFP4算力	61440 TOPS
FP8算力	30720 TOPS
FP16算力	7680 TOPS
FP32算力	1920 TOPS
能效比	68 TOPS/W
核心配置	72×AI超级计算单元 + 36×稀疏引擎 + 12×Transformer引擎
模型支持	400B参数模型本地微调，70B模型推理300token/秒
多模态单元	激光雷达/红外/视觉/毫米波四合一预处理单元，延迟<5ms
图形计算集群（GPU）
FP32算力	384 TFLOPS
FP16算力	768 TFLOPS
核心配置	240×渲染核心 + 36×RT Core + 72×Tensor Core
光追能力	全局光照+反射折射双光追，12K@120Hz渲染
超分技术	HM-SuperResolution 3.0，1080P→12K延迟<8ms
API支持	DirectX 12 Ultimate、Vulkan 1.4、OpenGL 4.8、UE6/Unity 6适配
存储与接口
内存类型	HBM3E Pro-9600
最大容量	2TB
内存带宽	1536GB/s
外部接口	PCIe 6.0 ×16、雷雳6 ×6、DP 2.2 ×6、HDMI 2.2 ×4
显示输出	支持4台12K显示器或8台8K显示器
功耗与散热
节能模式	10W（仅保留基础计算能力）
均衡模式	60W（日常专业计算）
极致模式	150W（需液冷散热）
散热要求	液冷散热（极致模式），风冷（均衡/节能模式）
工作温度	0°C ~ 95°C