목록으로

Programming Notes

다중 에이전트 상호작용에서 발현하는 도구 사용

저희는 간단한 숨바꼭질 게임에서 에이전트들이 점진적으로 더 복잡한 도구 사용법을 발견하는 것을 관찰했습니다. 저희의 새로운 시뮬레이션 숨바꼭질 환경에서의 훈련을 통해, 에이전트들은 여섯 가지의 뚜렷한 전략과 역전략을 구축했으며, 그중 일부는 저희 환경이 지원하는지조차 알지...

저희는 간단한 숨바꼭질 게임에서 에이전트들이 점진적으로 더 복잡한 도구 사용법을 발견하는 것을 관찰했습니다. 저희의 새로운 시뮬레이션 숨바꼭질 환경에서의 훈련을 통해, 에이전트들은 여섯 가지의 뚜렷한 전략과 역전략을 구축했으며, 그중 일부는 저희 환경이 지원하는지조차 알지 못했던 것들이었습니다. 자기 지도 학습을 통해 이 간단한 환경에서 나타난 발현적 복잡성은 다중 에이전트의 공동 적응이 언젠가 매우 복잡하고 지능적인 행동을 만들어낼 수 있음을 더욱 강력하게 시사합니다.