목록으로

Programming Notes

GPT-2: 15억 파라미터 모델 출시

GPT-2의 단계적 출시(staged release)의 마지막 단계로, GPT-2 모델의 출력물 탐지를 용이하게 하기 위해 코드 및 모델 가중치와 함께 가장 큰 버전(15억 파라미터)의 GPT-2를 출시합니다. 지난 8월 이후 더 큰 언어 모델들이 발표되기도 했으나, 저희는 커뮤니티에 전체 단계적 출시 과정에 대한 테스트 케이스를 제공하기 위해 원래의 단계적 출시 계획을 유지해 왔습니다. 이 사례가 향후 강력한 모델을 개발할 이들에게 유용하게 쓰이길 바라며, 저희는 책임 있는 공개(responsible publication)에 대해 AI 커뮤니티와 활발하게 논의를 이어가고 있습니다.