'RL' 태그의 글 목록

카테고리 없음2021. 6. 8. 17:54ML-Agents2.0 MA-POCA알고리즘 사용하기

ML-Agents링크1 ML-Agents링크2 MA-POCA(이하poca)알고리즘 설명 링크 두개 특징을 요약하자면 협력적 행동에 특화된 학습방법이다. 에이전트들을 그룹으로 묶은 후(BehaviourName이 같아야함 즉 같은모델이어야 함) 그룹보상과 개인보상을 나누어 주면서 학습을 시키는것이다. 같은 Behaviour를 가지면서 다중에이전트가 협력해야하는 프로젝트에 쓰면된다. 중간에 에이전트가 죽거나 다른 기획상의 이유로 비활성화 시켜도 그룹보상으로 팀이 승리하는 법을 학습한다고 한다. 유니티 예제프로젝트의 예제씬들을 보면 자기자신은 패널티를받아도 팀이 승리하는길을 택하는 AI의 모습을 확인할수 있었다. (DungeonEscape예제) 다만, 코드를 좀 수정해야한다. 먼저 에이전트 그룹으로 쓸 변수를 ..

2021. 4. 2. 10:38NetEaseGames의 강화학습 1:1 pvp AI제작기(GDC발표영상)

보호되어 있는 글입니다. 내용을 보시려면 비밀번호를 해주세요.

비밀번호

티스토리툴바