업스테이지, 한국형 LLM 생태계 구축 잰걸음…'1T 클럽' 발족
SBS Biz 이민후
입력2023.08.14 10:11
수정2023.08.14 10:12
인공지능(AI) 스타트업 업스테이지가 가장 '한국적인' 거대언어모델(LLM)을 개발하기 위해 머리를 맞댑니다.
업스테이지는 고성능 LLM에 쓰이는 한국어 데이터 확보를 위해 '1T 클럽'(1조 토큰 클럽)을 발족한다고 오늘(14일) 밝혔습니다.
1억 단어 이상 한국어 데이터에 기여할 수 있는 파트너사로 구성되며 현재 언론사·기업, 학계 등 데이터 제공자 20여 곳과 파트너십을 위해 협의하고 있습니다.
업스테이지는 확보한 데이터로 한국 문화·정서를 담아낼 수 있는 거대언어모델을 개발하고 다양한 분야의 생성 인공지능 애플리케이션에 활용한다고 설명했습니다.
이어 업스테이지는 기여한 토큰 수에 비례해 거대언어모델 응용프로그램 인터페이스(API)를 사용할 수 있는 비용을 할인하고. 사업 수익 일부를 파트너사들에 지급합니다.
또 파트너사들이 제공하는 데이터는 한글 프리트레이닝 학습 용도로만 사용하며, 원문을 유출할 수 없도록 자체 탈옥 방지 기술을 적용합니다.
이를 통해 인공지능이 데이터를 자동으로 수집·분류·저장하는 '크롤링'으로 발생하는 저작권 문제 등을 해결하고, 데이터 제공자와 모델 제작자 모두가 혜택을 볼 수 있도록 운영할 수 있다고 설명했습니다.
앞서 업스테이지가 자체 개발한 메타 '라마-2' 파인튜닝(미세조정) 거대언어모델은 머신러닝 플랫폼 '허깅페이스'에서 운영하는 오픈 거대언어모델(LLM) 리더보드에서 72.3점으로 1위를 차지한 바 있습니다.
ⓒ SBS Medianet & SBSi 무단복제-재배포 금지
많이 본 'TOP10'
- 1.CNN "트럼프, 몇 주 전보다 전투 재개 더 진지하게 고려"
- 2.70조 넘게 던졌다…블룸버그 "외국인 韓 주식 이탈 가속"
- 3."삼전닉스 우습다, 우린 1인당 440억"…벼락부자된 월급쟁이들
- 4.아빠차 열풍…넘사벽 국민차 1위, 줄서서 샀다
- 5."하이닉스 덕분에 96억 벌었다"…일본인 계좌 인증에 술렁
- 6."내 돈인데 못 뺀다?"…퇴직연금 '묶인 돈' 논란
- 7.[단독] 삼성·애플 벽 못 넘었다…샤오미 총판, 알뜰폰 철수
- 8."수입차 보고 있나"…아빠들 이 車 나오자마자 계약서 썼다
- 9.'밥 안 먹고 축의금 5만원 내자도 눈총?'…이젠 10만원이 대세
- 10.[현장연결] 삼성전자 운명의 성과급 협상…극적 타결 가능성은