title: 什么是 L1 数据缓存?

L1 数据缓存是流式多处理器 (SM)的私有内存。

HH100 SM 内部架构图。浅蓝色部分描绘的是 L1 数据缓存。修改自 NVIDIA 的 H100 白皮书

每个 SM 将该内存分配给调度到其上的线程组

L1 数据缓存与执行计算的组件(例如 CUDA 核心)位于同一位置,且速度仅慢约一个数量级。

它采用 SRAM 实现,这与 CPU 缓存和寄存器以及 Groq LPU 内存子系统中使用的基本半导体单元相同。L1 数据缓存由 SM加载/存储单元访问。

CPU 也维护 L1 缓存。在 CPU 中,该缓存完全由硬件管理。而在 GPU 中,该缓存主要由程序员管理,即使在使用高级语言(如 CUDA C)时也是如此。

H100 的每个 SM 中的 L1 数据缓存可存储 256 KiB(2,097,152 位)。在 H100 SXM 5 的 132 个 SM 中,总计提供 33 MiB(242,221,056 位)的缓存空间。