"특이점은 온다"…오픈AI, 경쟁자 압도하는 'o3' 공개
SBS Biz 김동필
입력2024.12.21 09:50
수정2024.12.21 14:09

챗GPT 개발사 오픈AI가 한층 향상된 고급 추론(reasoning) 인공지능(AI) 모델 'o3'를 현지시간 20일 공개했습니다.
o3는 지난 9월 오픈AI가 출시한 추론 모델 'o1'(오원)의 업그레이드 버전으로, 오픈AI는 소형 모델인 'o3 미니'도 함께 선보였습니다.
모델명 'o2'를 던너뛴 이유에 대해서 오픈AI는 "영국 통신 브랜드 'O2'에 대한 존중의 차원에서 붙이지 않기로 결정했다"라고 설명했습니다.
샘 올트먼 최고경영자(CEO)는 "내년 1월 말 'o3 미니'를 먼저 출시하고 곧이어 o3를 내놓을 예정"이라고 말했습니다.
일부 연구원들에게는 이날부터 미리보기 형태로 제공됩니다.
추론 능력에 초점을 둔 o3는 'o1'과 마찬가지로 응답하기 전에 먼저 생각하도록 훈련됐습니다.
오픈 AI는 "작업을 추론하고 계획할 수 있으며, 오랜 기간에 걸친 작업을 해나가는 데 있어 해결책을 찾는 데 도움이 된다"라면서 "응답하는 데엔 몇 초~몇 분 정도 걸리지만, 물리학·과학·수학과 같은 분야에서 더 신뢰할 수 있다"라고 강조했습니다.
또 특정 조건에서는 범용인공지능(AGI)에 가까워졌다고 덧붙였습니다.
o3는 프롬프트를 받으면 응답 전 잠시 멈추고 관련 프롬프트를 고려해 자신의 추론을 설명한 뒤 가장 정확하다고 생각되는 응답을 요약합니다.
특히 추론 시간 조정이 새롭게 도입됐는데, 이용자는 연산 시간, 즉 o3의 사고 시간을 '낮음, 중간, 높음'으로 설정할 수 있습니다.
연산 시간이 길수록 성능은 더 좋아집니다.
오픈AI는 "o3가 벤치마크(성능 측정)에서 다른 모델을 압도한다"라면서 "프로그래밍 작업에 초점을 맞춘 벤치마크(SWE-Bench Verified)에서는 'o1'보다 22.8%포인트 높은 성능을 보였으며, 코딩 실력 측정 지표(Codeforces)에서는 2천727점을 기록해 엔지니어 상위 99.2%에 해당하는 2천400점을 크게 뛰어넘었다"라고 부연했습니다.
올해 미국 초청 수학 시험(AIME)에서는 단 한 문제만 틀려 96.7%의 점수를 기록했고, 대학원 수준의 생물학, 물리학, 화학 문제 테스트(GPQA Diamond)에서는 87.7%의 성과를 거뒀다고 오픈AI는 설명했습니다.
ⓒ SBS Medianet & SBSi 무단복제-재배포 금지
많이 본 'TOP10'
- 1."손해봐도 일찍 받겠다"…100만원 국민연금 30만원 덜 받지만
- 2.'지역화폐로 기본소득' 설계자 이한주, 이재명 정부 밑그림은?
- 3.'더 멀어진 내 집 마련'…서울서 집 사려면 기본 '10억'
- 4."짜장면 3900원에 먹어볼까"…놓치면 후회한다는데
- 5.트럼프 머스크 결국 파국, 테슬라 14% 폭락…개미들 비명
- 6.은퇴자들 건보료 폭탄 날벼락…이것 꼭 챙기세요
- 7."대선 끝나자마자 썰렁"...세종 집주인들 발칵 무슨 일?
- 8.떨고있는 재계…중복상장·유증 준비 기업 '발 동동'
- 9.이재명 대통령 "해양수산부 신속한 부산 이전" 지시
- 10.이재명 정부 '지역화폐 기대감'…코나아이, 이틀간 58% ↑