업스테이지는 자사의 사전학습 언어 모델 ‘솔라’의 베타 버전을 출시하고, 내달 31일까지 해당 모델을 무료로 공개한다고 22일 밝혔다. 간단한 응용프로그램 인터페이스(API) 호출을 통해 일반 대화형 모델과 번역 특화 모델 등 2종류 모두 사용해 볼 수 있다.
솔라는 지난해 12월 허깅페이스 ‘오픈 대규모언어모델(LLM) 리더보드’에서 알리바바, 미스트랄AI 등 빅테크 모델을 제치고 1위를 차지한 세계 최고 경량형 언어모델(SLM)이다. 작지만 강력한 성능과 GPT-3.5 대비 2.5배 이상 빠른 속도가 특징이다. 프롬프트 당 최대 4000토큰을 입력할 수 있으며, 향후 베타 버전을 필두로 ‘믹스트랄 8x7B’ (3만2000토큰), ‘라마 2’ (1만6000토큰) 등 빅테크 모델을 크게 뛰어넘는 6만4000토큰까지 처리 규모를 확대한다.
함께 공개하는 번역 모델은 기계번역 평가의 바로미터로 여겨지는 메타의 ‘플로레스(Flores)’ 벤치마크 테스트에서 GPT-4, 딥엘(DeepL) 등의 모델보다 높은 점수를 기록했다. 특히, 단순 문장 번역을 넘어 전후 문맥을 종합해 의미를 추론하고, 대화의 맥락과 흐름까지 기억할 수 있어 정확도를 극대화했다. 한-영 및 영-한 번역을 제공하며, 최대 3만2000개의 토큰을 처리할 수 있다.
솔라 베타 테스트는 이날부터 다음달 31일까지 5주 간 진행된다. 업스테이지 홈페이지에서 간단한 등록만 하면 해당 기간 동안 솔라를 무료로 사용할 수 있다. 특히, 별도의 구축 작업 없이 API 호출 만으로 손쉽게 도입이 가능해, 기존에 생성형 인공지능(AI_를 활용 중이거나 도입을 고민하던 기업 모두에게 최적의 선택지를 제공할 예정이다.
업스테이지는 솔라 생태계 확장과 기업들의 생성형 AI 혁신을 지원하고자 솔라 베타 버전을 활용한 기업들을 대상으로 창의성, 기술 혁신성 등 다양한 부문을 평가해 최대 10곳의 우수 사례를 선발, 한화로 총 3억여 원 상당의 API 크레딧을 증정한다. 이벤트 참여는 업스테이지 홈페이지를 통해 별도 응모할 수 있다.
향후 업스테이지는 글로벌 무대에서 확인한 범용 모델의 기술력과 GPT-4를 뛰어넘는 번역 도메인에서의 성과 등을 필두로 ‘목적별 특화(purpose-trained)’ 언어 모델 고도화에 박차를 가한다. 이를 통해 금융, 보험, 의료, 교육 등 다양한 영역의 기업 맞춤형으로 적용할 수 있는 SLM을 주력으로 글로벌 시장을 공략한다는 구상이다.
김성훈 대표는 “많은 분들이 세계 1위의 SLM 업스테이지 솔라를 써보실 수 있도록 베타 버전을 공개하게 되어 기쁘다”라며 “앞으로 업스테이지는 GPT-4를 뛰어넘는 번역 특화 모델 등 다양한 도메인에 맞춤형으로 적용할 수 있는 모델을 개발, 국내를 넘어 글로벌 생성형 AI 생태계 확장에 힘쓸 것”이라고 말했다.