저희는 미세 조정된 GPT-3 모델보다 거의 두 배 더 높은 정확도로 초등학교 수학 문제를 푸는 시스템을 학습시켰습니다. 이 시스템은 실제 아이들이 푸는 문제의 약 90%를 해결합니다. 예를 들어, 저희 데이터셋의 테스트에서 9세에서 12세 사이의 어린이 소수 표본이 60%의 점수를 기록한 반면, 저희 시스템은 동일한 문제에서 55%의 점수를 기록했습니다.
Programming Notes
수학 문장 문제 풀이
저희는 미세 조정된 GPT-3 모델보다 거의 두 배 더 높은 정확도로 초등학교 수학 문제를 푸는 시스템을 학습시켰습니다. 이 시스템은 실제 아이들이 푸는 문제의 약 90%를 해결합니다. 예를 들어, 저희 데이터셋의 테스트에서 9세에서 12세 사이의 어린이 소수 표본이 60%의...