카테고리 없음2021. 6. 8. 17:54ML-Agents2.0 MA-POCA알고리즘 사용하기
ML-Agents링크1 ML-Agents링크2 MA-POCA(이하poca)알고리즘 설명 링크 두개 특징을 요약하자면 협력적 행동에 특화된 학습방법이다. 에이전트들을 그룹으로 묶은 후(BehaviourName이 같아야함 즉 같은모델이어야 함) 그룹보상과 개인보상을 나누어 주면서 학습을 시키는것이다. 같은 Behaviour를 가지면서 다중에이전트가 협력해야하는 프로젝트에 쓰면된다. 중간에 에이전트가 죽거나 다른 기획상의 이유로 비활성화 시켜도 그룹보상으로 팀이 승리하는 법을 학습한다고 한다. 유니티 예제프로젝트의 예제씬들을 보면 자기자신은 패널티를받아도 팀이 승리하는길을 택하는 AI의 모습을 확인할수 있었다. (DungeonEscape예제) 다만, 코드를 좀 수정해야한다. 먼저 에이전트 그룹으로 쓸 변수를 ..