主页 AI2 Standard AI2 Air
AI2 系列 | 专业旗舰
天花板级异构SoC | 三芯粒融合架构

HMGO AI2 Ultra

打破端侧算力极限,重塑专业计算体验。支持400B参数大模型本地微调、12K@120Hz实时光追渲染、L4级自动驾驶实时感知,为超算边缘节点、专业工作站量身打造。

5200亿 晶体管
2nm EUV增强版制程 极致功耗150W(液冷) 8TB/s HM-Link Ultra 2.0互联 68 TOPS/W 超高能效比
HMGO AI2 Ultra 芯片
⚙️

核心架构突破

三芯粒融合集群

采用“3+6+X”三芯粒封装架构,通过HM-Link Ultra 2.0高速互联技术实现芯粒间数据传输,带宽提升至8TB/s,延迟低至0.5ns,算力线性叠加无损耗。

互联技术 HM-Link Ultra 2.0
芯粒数量 3颗功能芯粒 + 6颗互联芯粒
传输延迟 0.5ns(端到端)
封装工艺 CoWoS-L 先进封装

HM-ArkV5 指令集

基于AI1 Ultra的HM-ArkV4迭代升级,新增FP64双精度加速指令、分布式算力调度指令,IPC(每时钟周期指令数)提升40%,完美适配超算与专业计算场景。

指令集版本 HM-ArkV5
IPC提升 40%(对比AI1 Ultra)
新增指令 FP64加速、分布式调度
兼容性 向下兼容ArkV1-V4

全域算力调度

6颗HM-V11超大核 + 18颗HM-V10大核 + 12颗HM-V9小核的异构组合,搭配72MB L3共享缓存 + 256MB片上SLC高速缓存,缓存命中率高达97%。

超大核主频 4.8GHz(HM-V11)
大核主频 3.9GHz(HM-V10)
小核主频 2.6GHz(HM-V9)
缓存配置 72MB L3 + 256MB SLC
📊

详细硬件参数

基础参数
制程工艺 2nm EUV增强版(ASML Twinscan EXE:5200)
晶体管数量 5200亿
芯片面积 890mm²
封装尺寸 45×45mm(CoWoS-L封装)
AI计算集群(NPU)
NVFP4算力 61440 TOPS
FP8算力 30720 TOPS
FP16算力 7680 TOPS
FP32算力 1920 TOPS
能效比 68 TOPS/W
核心配置 72×AI超级计算单元 + 36×稀疏引擎 + 12×Transformer引擎
模型支持 400B参数模型本地微调,70B模型推理300token/秒
多模态单元 激光雷达/红外/视觉/毫米波四合一预处理单元,延迟<5ms
图形计算集群(GPU)
FP32算力 384 TFLOPS
FP16算力 768 TFLOPS
核心配置 240×渲染核心 + 36×RT Core + 72×Tensor Core
光追能力 全局光照+反射折射双光追,12K@120Hz渲染
超分技术 HM-SuperResolution 3.0,1080P→12K延迟<8ms
API支持 DirectX 12 Ultimate、Vulkan 1.4、OpenGL 4.8、UE6/Unity 6适配
存储与接口
内存类型 HBM3E Pro-9600
最大容量 2TB
内存带宽 1536GB/s
外部接口 PCIe 6.0 ×16、雷雳6 ×6、DP 2.2 ×6、HDMI 2.2 ×4
显示输出 支持4台12K显示器或8台8K显示器
功耗与散热
节能模式 10W(仅保留基础计算能力)
均衡模式 60W(日常专业计算)
极致模式 150W(需液冷散热)
散热要求 液冷散热(极致模式),风冷(均衡/节能模式)
工作温度 0°C ~ 95°C
🖥️

适用场景

专业AI工作站

8K/12K影视渲染

L4级自动驾驶域控

超算边缘节点

顶级VR/AR设备

科学计算/仿真