나중에 기억하기위한용도로 작성 1. 우선 Anaconda를 설치 가상환경을 사용하여 혹여나 다른 파이썬 패키지에 영향이 가지않게 하기위함 2. 가상환경 만들기 아나콘다 프롬프트를 열어서 conda create -n ml-agents python=3.7 이러면 ml-agents라는 가상환경이 만들어지게됨 현재로서는 ML-Agents는 파이썬 3.6~3.7까지 지원한다고함 그리고 activate ml-agents를 입력해서 방금만든 가상환경을 액티브시킴 3. 파이토치 설치 pip3 install torch~=1.7.1 -f https://download.pytorch.org/whl/torch_stable.html 를 입력하면 파이토치가 설치됨 4. ml-agents 파이썬패키지 설치 python -m pip..
ML-Agents링크1 ML-Agents링크2 MA-POCA(이하poca)알고리즘 설명 링크 두개 특징을 요약하자면 협력적 행동에 특화된 학습방법이다. 에이전트들을 그룹으로 묶은 후(BehaviourName이 같아야함 즉 같은모델이어야 함) 그룹보상과 개인보상을 나누어 주면서 학습을 시키는것이다. 같은 Behaviour를 가지면서 다중에이전트가 협력해야하는 프로젝트에 쓰면된다. 중간에 에이전트가 죽거나 다른 기획상의 이유로 비활성화 시켜도 그룹보상으로 팀이 승리하는 법을 학습한다고 한다. 유니티 예제프로젝트의 예제씬들을 보면 자기자신은 패널티를받아도 팀이 승리하는길을 택하는 AI의 모습을 확인할수 있었다. (DungeonEscape예제) 다만, 코드를 좀 수정해야한다. 먼저 에이전트 그룹으로 쓸 변수를 ..