snake game with A.I.
- 0. python으로 환경 개발
- 1. 강화학습(DQN)으로 snake 학습
- 2. 랜덤 장애물 생성된 환경에서 학습
- 3. 두 개의 agent가 경쟁적인 환경에서 학습
- 4. 장애물 + 경쟁 환경에서 학습
지금 학습이 전혀 안되고 있음.
그말은, train_model 함수가 정상 동작하고 있지 않다는 의미.
아래 요인들이 가능해 보임.
- 메모리에서 배치만큼 가져오는 데에서 문제
- 메모리에서 가져온 데이터에 문제 (넣을때 잘못 넣었다던가)
- 학습 부분 코드에 대한 문제 (큐함수나 벨만 최적 방정식 부분, 이해의 부족)