‘쇼핑 위해 탱크 몰고 가야 하나’…빅테크들도 소형 AI 언어모델 개발 박차

입력 2024-07-07 16:51

  • 작게보기

  • 기본크기

  • 크게보기

MS·구글·애플 등 잇따라 출시 및 계획
AI 수익화 불확실해지자 가성비 고민
sLLM, AI 학습량·개발비 훨씬 적어

▲로이터연합뉴스

쇼핑을 위해 탱크를 몰고 갈 필요가 있나

빅테크와 스타트업계가 최근 저렴화·경량화·전문화한 소형거대언어모델(sLLM·Small Large Language Model) 인공지능(AI)으로 눈을 돌리고 있다고 월스트리트저널(WSJ)이 6일(현지시간) 보도했다.

그간 AI 경쟁은 엄청난 양의 데이터를 바탕으로 인간 수준의 지능을 모방하는 데 초점이 맞춰져 있었다. 거대언어모델(LLM), 초인공지능(ASI·Artificial Super Intelligence), 범용인공지능(AGI·Artificial General Intelligence) 등이 그 예다.

하지만 AI 수익화가 불투명하자 ‘가성비’에 대한 고민이 시작됐다는 분석이다. WSJ는 “문서 요약이나 이미지 생성과 같은 단순한 작업에서 LMM을 사용하는 것은 식료품을 사러 가기 위해 탱크를 운전하는 꼴”이라고 평하기도 했다. 이에 AI 업계는 데이터 규모와 비용을 효율화하고, 범인류적 지식보다는 금융·법률·의료 등 특정 분야에 집중한 AI를 설계하는 데 박차를 가하고 있다.

예를 들어 오픈AI의 GPT-4 같은 LLM은 파라미터(매개변수·AI 학습·추론에 필요한 변수)가 1조 개가 넘고 개발 비용도 최소 1억 달러(약 1383억 원) 이상이지만, sLLM은 100억 개 미만의 파라미터를 사용하며 개발 비용도 1000만 달러 미만이 될 수 있다고 WSJ는 설명했다.

마이크로소프트(MS)는 4월 sLLM 모델인 ‘파이(Phi)3’를 선보였다. 사티아 나델라 MS 최고경영자(CEO)는 “이 모델이 오픈AI의 챗GPT 무료 모델의 100분의 1에 불과한 크기지만 성능은 많은 작업을 거의 비슷하게 해낼 수 있다”고 설명했다.

MS는 생성형 AI에 수십억 달러를 투자한 최초의 빅테크 기업이지만, 예상했던 것보다 AI 개발에 비용이 많이 든다는 사실을 깨달았다. 이후 AI 경량화에 대해 고민했고 이제는 거대 클라우드 기반의 슈퍼컴퓨터에 접속할 필요 없이 장치에서 바로 구동될 수 있는 sLLM 모델 개발에 속도를 내는 것이다.

구글이 2월 ‘젬마’를 선보인 것을 비롯해 AI 유명 스타트업인 미스트랄, 앤스로픽, 코히어 등도 올해 sLLM 모델을 선보였다. 애플도 지난달 공개한 AI 로드맵에서 sLLM을 활용해 휴대폰에서 가동되는 ‘온디바이스 AI’를 선보이겠다고 발표했다.

sLLM으로의 전환은 LLM의 성능 향상이 지연되면서 한층 가속화되고 있다는 분석이다. 오픈AI가 작년 GPT4를 출시한 이후로 이전 모델인 GPT 3.5에서 기능이 크게 향상됐지만 이와 동등한 도약을 이룬 새로운 모델은 출시되지 않았다는 평이다.

파이 모델 프로젝트를 이끄는 세바스티안 버벡 MS 임원은 “LLM 개발의 침체가 일시적인 것인지 아니면 고품질의 훈련데이터 부족 등 더 광범위한 기술적 문제인지는 아직 알 수 없다”면서 “LLM 소강 국면에서 이제 ‘이걸 실제로 더 효율적으로 만들 수 있을까’로 관심을 돌리는 것은 자연스러운 일”이라고 말했다.

※용어설명 소형거대언어모델(sLLM·small Large Language Model)
소형화하고 경량화한 거대언어모델(LLM)을 지칭한다. 오픈AI의 GPT나 구글의 제미나이 등과 같은 LLM이 방대한 양의 데이터를 학습해 모든 질문에 답할 수 있게 설계된 것과 달리 의료·법률·금융 등 특정 분야로 한정, 처리하는 데이터와 전력을 대폭 줄이면서도 성능을 정교히 끌어올린 것이 특징이다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소