▶ 미니·스몰·미디엄 등 3개 모델… “성능 개선·획기적 저렴”
![MS, 소형언어모델 ‘파이-3’ 출시…구글·메타 등 경쟁 가열 MS, 소형언어모델 ‘파이-3’ 출시…구글·메타 등 경쟁 가열](http://image.koreatimes.com/article/2024/04/23/20240423134241661.jpg)
마이크로소프트 로고[로이터=사진제공]
챗GPT 개발사 오픈AI와 손잡고 인공지능(AI) 열풍을 이끄는 마이크로소프트(MS)가 소형언어모델(SLM)을 출시하며 구글, 메타 등과 경쟁을 예고하고 있다.
MS는 자사가 개발한 소형언어모델 '파이-3 미니'(Phi-3 Mini)를 출시한다고 23일 밝혔다. 파이-3 미니는 MS가 앞으로 내놓을 3가지 소형 모델 중 가장 경량 모델이다.
지난해 12월 파이-2를 출시한 바 있는 MS는 파이-3가 이전 버전보다 성능이 더 뛰어나고, 10배 큰 모델 수준의 응답을 제공할 수 있다고 MS는 설명했다.
대형언어모델(LLM)에 비해 SLM은 휴대전화와 노트북과 같은 개인용 기기들에서 작동하며 기계학습과 구동에 드는 비용도 저렴하다.
MS 생성형 AI 연구 담당 부사장인 세바스티엔 부벡은 "파이-3는 약간이 아니라 획기적으로 비용이 적게 든다"며 "비슷한 기능을 가진 다른 모델들과 비교했을 때 비용이 10분의 1 수준"이라고 말했다.
파이-3 미니의 매개변수(파라미터)는 38억개로, 앞으로 출시될 매개변수 70억개의 파이-3 스몰(Small)이나 140억개의 파이-3 미디엄(Medium)보다도 적은 규모다.
챗GPT의 기반이 되는 대형언어모델 GPT-4의 경우 매개변수가 5천억개로 추정되고 있다. 매개변수는 AI 모델이 얼마나 많은 복잡한 명령어를 이해할 수 있는지를 나타낸다.
SLM은 단순한 작업을 수행할 수 있도록 설계돼 한정된 자원을 가진 기업들이 더 쉽게 사용할 수 있다고 MS는 설명했다.
MS 애저 AI 플랫폼의 부사장 에릭 보이드는 "파이-3는 이전 버전에서 학습한 내용을 기반으로 만들었다"며 "파이-1은 코딩에 중점을 뒀고 파이-2는 추론을 배우기 시작했지만, 파이-3는 코딩과 추론에 더 능숙하다"고 설명했다.
이에 따라 LLM 경쟁과 함께 SLM 경쟁도 치열해질 전망이다.
구글은 앞서 지난 2월 간단한 챗봇과 언어 관련 작업에 유용한 젬마 2B와 7B를 출시했다.
메타는 지난 18일 '라마3'를 출시하면서 파라미터가 700억개인 거대 모델과 함께 챗봇과 코딩 지원에 사용되는 80억개인 소형 모델도 선보인 바 있다.
AI 스타트업 앤스로픽도 그래프가 있는 연구 논문을 읽고 빠르게 요약할 수 있는 클로드 3 하이쿠를 출시했다.
<연합뉴스>
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x