"310억 매개변수로 2배 성능" 업스테이지 솔라 프로2 프리뷰
"라마4 스카우트, 큐원2.5 72B보다 벤치마크 성능 우위"
- 윤주영 기자
(서울=뉴스1) 윤주영 기자 = 업스테이지(486550)는 자사의 차세대 거대언어모델(LLM) '솔라 프로 2'의 프리뷰 버전을 20일 공개했다.
솔라 프로 2는 지난해 12월 출시된 '솔라 프로'의 후속으로, 모델 매개변수(파라미터)는 기존 220억 개에서 310억 개로 확대되고 성능도 대폭 늘었다. 업스테이지는 올해 7월 정식 출시에 앞서, 초기 테스트용으로 프리뷰 응용 프로그램 인터페이스(API)를 무료로 사용할 수 있도록 공개했다.
솔라 프로 2는 종합 지식(MMLU), 지시 이행(IFEval) 등 주요 LLM 벤치마크 성능 평균에서 메타의 '라마 4 스카우트'·'라마 3.3 70B', 알리바바의 '큐원 2.5 72B' 등 두 배 이상 큰 빅테크 모델들을 앞질렀다.
또 'KMMLU'·'해례'(HAE-RAE) 등 한국어 성능을 평가하는 대표 벤치마크에서 높은 점수를 기록, 현재 공개된 소형언어모델 중 가장 뛰어난 수준임을 입증했다. 고품질 한국어 데이터를 학습에 적극 활용한 것이 주효했다.
아울러 솔라 프로 2에는 업스테이지 LLM 최초로 '하이브리드 모드'가 적용된다. 모델 사용 시 빠른 응답에 최적화된 '챗 모드'와, 단계적 사고를 거쳐 구조화한 답변을 생성하는 '추론 모드' 중 선택할 수 있다.
추론 모드에는 '생각 사슬'(Chain of Thought, CoT) 기법이 적용, 수학이나 코딩처럼 복잡한 문제에서 더욱 정교한 답변을 제공한다.
사용성도 강화됐다. 기존보다 2배 확장된 6만 4000 토큰까지 지원해 더 긴 문서나 대화를 한 번에 처리할 수 있다. 자체 토크나이저(tokenizer) 개선을 통해 한국어 및 문서 기반 작업에서 최대 30%까지 토큰 절감이 가능해졌으며, 이에 따라 응답 속도와 비용 효율도 대폭 향상됐다
김성훈 업스테이지 대표는 "솔라 프로 2는 310억 개의 비교적 소규모 파라미터로도 700억 개 파라미터 모델 수준의 성능을 구현한다"며 "추론과 한국어 성능이 뛰어난 만큼 많은 업무를 혁신할 수 있을 것"이라고 말했다.
legomaster@dqdt.shop
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.