OpenAI는 24개 환경에 걸친 13가지 평가를 포함하는 체인 오브 쏘트(Chain-of-Thought, CoT) 모니터링 가능성을 위한 새로운 프레임워크와 평가 도구(evaluation suite)를 도입했습니다. 연구 결과에 따르면, 모델의 내부 추론 과정을 모니터링하는 것이 결과물만을 모니터링하는 것보다 훨씬 더 효과적이며, 이는 AI 시스템이 더욱 발전함에 따라 확장 가능한 통제(scalable control)를 달성하기 위한 유망한 경로를 제시합니다.
Programming Notes