01. TPU 的基本定义
TPU (Tensor Processing Unit),即张量处理单元,是 Google 专门为加速机器学习工作负载而定制开发的专用集成电路 (ASIC)。
💡 为什么需要 TPU?
深度学习模型的训练和推理需要大量的矩阵运算,通用处理器的设计哲学并不适合这种工作负载。TPU 通过专用设计,将能效比提升了 30 倍以上。
核心功能
与通用处理器不同,TPU 舍弃了复杂的控制逻辑和缓存,专为深度学习中的核心运算——矩阵乘法进行了极致优化。
CPU vs GPU vs TPU
- CPU (通用核心): 擅长处理复杂的逻辑和控制流,串行处理能力强。
- GPU (并行核心): 拥有数千个核心,擅长通用并行计算,适合图形渲染和部分科学计算。
- TPU (矩阵核心): 专为矩阵运算打造的大规模脉动阵列,能效比极高。