title: 什么是流式多处理器架构?
流式多处理器 (SM) 采用特定"架构"进行版本管理,该架构定义了它们与 流式汇编器 (SASS) 代码的兼容性。
采用"Hopper" SM90 架构的流式多处理器。修改自 NVIDIA 的 H100 白皮书。
采用原始"Tesla" SM 架构的流式多处理器。修改自 Fabien Sanglard 的博客。
大多数 SM 版本包含两个组成部分:主版本和次版本。
主版本_几乎_等同于 GPU 架构系列。例如,所有 6.x 版本的 SM 都属于 Pascal 架构。一些 NVIDIA 文档甚至
直接声称这一点。
但举例来说,Ada GPU 的
SM 架构版本为 8.9,
与 Ampere GPU 的主版本相同。
在调用 NVIDIA CUDA 编译器驱动程序 (nvcc) 时, 可以指定 SASS 编译的目标 SM 版本。 明确不保证跨主版本的兼容性。有关跨次版本兼容性的更多信息,请参阅 nvcc 的 文档。