2.下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題?
(A) 監督式學習(Supervised Learning)
(B) 非監督式學習(Unsupervised Learning)
(C) 半監督式學習(Semi-supervised Learning)
(D)強化學習(Reinforcement Learning)

答案:登入後查看
統計: A(47), B(24), C(15), D(483), E(0) #3416788

詳解 (共 2 筆)

#6356664
圍棋、自動駕駛等動態重複地互動,比較適合...
(共 451 字,隱藏中)
前往觀看
2
0
#6355780
最適合訓練電腦進行圍棋對弈、自動駕駛等動態且需要重複互動的問題的是 (D) 強化學習 (Reinforcement Learning)。
強化學習 是一種機器學習方法,讓代理人 (agent) 在環境中反覆進行決策,透過試錯來學習最佳策略。在這種學習過程中,代理人會根據行動獲得獎勵或懲罰,進而調整其策略,以最大化累積獎勵。這種方法特別適用於需要連續決策並與環境進行互動的問題,如:
其他選項簡要比較:

圍棋:電腦圍棋程式,如 AlphaGo,就是利用強化學習來學習並超越人類棋手。

自動駕駛:透過強化學習,車輛能根據感測器數據和環境狀態進行決策,提高行駛安全性和效率。







0
0

私人筆記 (共 1 筆)

私人筆記#6930665
未解鎖
補充相關知識速解及口訣來了~  關鍵判...
(共 201 字,隱藏中)
前往觀看
1
0