▶ 전문 업무평가 지표70.9% 성장
▶ ‘박사급 추론 능력 시험’ 구글 앞서

챗GPT개발사 오픈AI의 로고. [로이터]
챗GPT를 개발한 오픈AI가 12일 새로운 인공지능(AI) 모델인 ‘GPT-5.2’를 공개했다. 앞서 11월 초 이전 버전인 GPT-5.1을 내놓은 지 불과 한 달 만이다. 구글 제미나이3의 빠른 추격에 위기감을 느낀 오픈AI가 신(新) 모델을 조기 출시하며 대응에 나섰다는 분석이 나온다.
오픈AI는 이날 GPT-5.2 시리즈를 공개하며 “전문적인 지식 노동을 위해 지금까지 나온 모델 중 가장 강력한 모델”이라고 자평했다. 기존 즉답(Instant), 사고(Thinking) 모드에 더해 긴 작업시간을 필요로 하는 어려운 질문에 최적화한 프로(Pro) 모드가 새롭게 추가됐다.
엑셀 스프레드시트 제작부터 프레젠테이션 구성, 코드 작성, 이미지 인식, 장문 이해까지 모든 분야에서 강력한 성능을 보여주고 있다는 게 회사 측 설명이다.
실제 오픈AI가 만든 전문 업무 평가 지표 ‘GDPval’에서 GPT-5.2 사고(Thinking) 모드는 70.9%를 기록해 GPT-5(38.8%)보다 크게 성장했다. GDPval은 법률·금융·유통·제조 등 9개 분야 44개 직업군 전문가들이 평균 14년 경력을 바탕으로 제시한 문제를 토대로 AI 모델을 평가하는 지표다. 또 코딩 능력을 평가하는 SWE 테스트에서도 80%를 기록해 구글 제미나이3 프로(76.2%)를 앞섰다. 코딩 능력이 뛰어난 것으로 알려진 앤트로픽의 ‘클로드 오퍼스 4.5(80.9%)’와 차이가 없는 수준이다.
박사급 추론 능력을 재는 ‘인류의 마지막 시험(HLE·Humanity’s Last Exam)’에서도 구글을 앞섰다. 모델 자체의 능력만으로 진행한 HLE 평가에서는 36.6%로 제미나이3 프로(37.5%)보다 낮은 평가를 받았지만, 검색 등 도구를 사용해 진행한 평가에서는 50%로 제미나이3 프로(45.8%)보다 높은 점수를 얻었다. GPT-5.2는 이날부터 유료 이용자에게 순차 적용된다.
오픈AI가 불과 한 달 간격을 두고 챗GPT 새 버전을 내놓은 것은 2022년 11월 이 서비스를 출시한 이후 처음 있는 일이다. 당초 오픈AI는 연말 GPT-5.2를 출시하려고 했지만, 구글이 지난달 18일 제미나이3를 출시하며 AI 시장을 뒤흔들자 시기를 앞당긴 것으로 전해졌다.
<
박준석 기자>
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x