核心概念解析 簡而言之,強化學習是關於智能體(agent)以及它們如何通過試錯來學習的研究。它將這樣一種理念形式化:對智能體的行為進行獎勵或懲罰,會使它在未來更有可能重複或放棄該行為。 強化學習能做什麼? 強化學習方法近年來在多個領域取得了廣泛的成功。例如: 它被用於教計算機在模擬環境中控制機器。 也能在現實世界中控制機器 它還因