35. 下列何者為 TPU(Tensor Processing Unit)提升矩陣運算效率的單元?
(A) 儲存體層級快取加速單元
(B) 單指令多資料流優化單元
(C) 矩陣乘法專用硬體單元
(D) 多核處理器之間的共享記憶體單元

答案:登入後查看
統計: A(6), B(1), C(12), D(6), E(0) #3447902

詳解 (共 1 筆)

#6443960

TPU (Tensor Processing Unit) 是由 Google 設計的專用積體電路,專為加速機器學習工作負載(特別是神經網路的訓練和推論)而設計。其核心優勢在於對矩陣運算的極度優化。

讓我們分析選項:

  • (A) 儲存體層級快取加速單元 (Storage level cache acceleration unit):快取雖然對所有處理器的效能都很重要,但它不是 TPU 提升矩陣運算效率最獨特的、本質性的原因。
  • (B) 單指令多資料流優化單元 (Single Instruction Multiple Data, SIMD optimization unit):SIMD 是一種常見的平行處理技術,CPU 和 GPU 都有。TPU 也利用了大規模的平行處理,但它的設計遠比傳統的 SIMD 更專特化於矩陣運算。
  • (C) 矩陣乘法專用硬體單元 (Matrix multiplication specific hardware unit):這正是 TPU 的核心設計。TPU 內部包含一個大型的二維乘加器陣列,稱為脈動陣列 (Systolic Array),或稱矩陣乘法單元 (Matrix Multiply Unit, MMU)。這個專用硬體能夠以極高的效率執行大量的矩陣乘法和累積運算,這正是深度學習模型中最耗時的運算。這個設計是 TPU 效能超越通用 CPU 和 GPU 的關鍵。
  • (D) 多核處理器之間的共享記憶體單元 (Shared memory unit between multi-core processors):共享記憶體是多核處理器架構中常見的記憶體管理方式,但它本身並非 TPU 提升矩陣運算效率的主要專用單元。TPU 的效率提升更多來自於其計算單元而非記憶體共享方式。

因此,TPU 提升矩陣運算效率的關鍵單元是其專用於矩陣乘法的硬體。

The final answer is C

0
0

私人筆記 (共 1 筆)

私人筆記#7773084
未解鎖
TPU (Tensor Processi...
(共 96 字,隱藏中)
前往觀看
0
0