title: 性能
当应用程序在通用硬件上的性能不足时,就会使用 GPU。这使得为 GPU 编程与大多数其他编程形式截然不同。
对于传统的计算机应用程序,如数据库管理系统或 Web 服务器,正确性是首要关注点。如果应用程序丢失数据或返回错误结果,则意味着应用程序失败。性能常常被忽略。
在为 GPU 编程时,正确性的定义通常很模糊。"正确"输出可能只定义到一定数量的有效位,或者仅针对某些不确定的"表现良好"输入子集。而且,正确性充其量只是必要条件而非充分条件。如果应用程序的程序员无法实现卓越的性能(每秒性能、每美元性能或每瓦特性能),那么应用程序就失败了。GPU 编程过于困难且受限,运行成本又高,因此情况只能如此。
在 NVIDIA,这一事实被概括为一句精辟的口号:"性能即产品"。
本部分 GPU 术语表收集并定义了优化 GPU 上运行程序性能所需理解的关键术语。
大致来说,它应涵盖您在使用 NSight Compute 调试 GPU 内核 性能问题时遇到的所有术语。