저희는 '반복 증폭'이라고 불리는 AI 안전 기술을 제안합니다. 이 기술은 레이블링된 데이터나 보상 함수를 제공하는 대신, 작업을 더 간단한 하위 작업으로 분해하는 방법을 시연함으로써 인간의 규모를 초월하는 복잡한 행동과 목표를 지정할 수 있게 해줍니다. 이 아이디어는 아직 매우 초기 단계이며, 간단한 알고리즘 기반의 토이 도메인에서만 실험을 완료했지만, 저희는 이 아이디어가 AI 안전에 대한 확장 가능한 접근 방식이 될 수 있다고 생각하여 예비 상태로 발표하기로 결정했습니다.
Programming Notes
반복 증폭을 이용한 복잡한 목표 학습
저희는 '반복 증폭'이라고 불리는 AI 안전 기술을 제안합니다. 이 기술은 레이블링된 데이터나 보상 함수를 제공하는 대신, 작업을 더 간단한 하위 작업으로 분해하는 방법을 시연함으로써 인간의 규모를 초월하는 복잡한 행동과 목표를 지정할 수 있게 해줍니다. 이 아이디어는 아직...