TLDR:AMP 并不是“将模型变成半精度”。它是一种运行时策略,可以以较低的精度运行安全、高吞吐量的操作,同时保护数字敏感路径。
2分钟阅读 · 2026年5月18日
2026 · mixed-precision · gpu-systems · reading · systems