強化學習 Reinforcement Learning 強化學習讓模型在與環境的互動中學習,模型會嘗試不同的行為,並且從環境中得到不同的回饋,而根據回饋的好壞調整模型,著名的圍棋 AI AlphaGo 即是強化學習的產物 Q-learning