強化學習 Reinforcement Learning

強化學習讓模型在與環境的互動中學習，模型會嘗試不同的行為，並且從環境中得到不同的回饋，而根據回饋的好壞調整模型，著名的圍棋 AI AlphaGo 即是強化學習的產物