Q-Learning_maze 強化學習-以Q學習法 進行小老鼠走迷宮的實驗 透過函式生成隨機迷宮,可以自行輸入邊長決定迷宮的大小,迷宮必為正方形,範例如下 ++++++ +o + S + S + $+ ++++++ 迷宮會隨機生成S陷阱,數量依據邊長而定,老鼠必須在不碰到陷阱的狀態下抵達$ 每次可以走 上 下 左 右 移動一格。 44 的迷宮訓練約500次可達穩定 55 必須要2000以上 6*6 更複雜...