SBS Biz

사진 올리면 길 알려주고 작품 설명도

SBS Biz 김한나
입력2024.08.28 17:54
수정2024.08.28 19:16

[앵커]

오픈AI의 챗GPT 등 생성 AI에는 텍스트뿐 아니라 이미지와 음성을 이해하고 처리하는 멀티모달 기술이 적용돼 있습니다.

다만 우리나라 지역과 문화, 가치관 등이 제대로 반영되지 않은 답변이 나올 때가 있는데요.

한국어 기반 생성 AI인 네이버 하이퍼클로바X가 멀티모달 기능을 탑재하면서 국산 AI 경쟁력 높이기에 나섰습니다.

김한나 기자가 보도합니다.

[기자]

읽고 쓰기에만 능했던 네이버의 생성 AI 하이퍼클로바X가 자연스럽게 보고 듣고 말할 수 있는 기능을 탑재했습니다.

제 뒤로 서울 강남의 코엑스가 있습니다.

하이퍼클로바X에게 이 건물 안에 영화관이 있는지와 길 찾는 법을 물어보겠습니다.

보시는 대로 질문에 맞는 내용을 답변하고 교통수단별 길 찾는 방법 등 추가 정보까지 알려줍니다.

황소를 그린 작품을 보여주자 작가는 물론 그림 내용과 작가의 작품관까지 설명합니다.

[하정우 / 네이버클라우드 센터장 : (하이퍼클로바X는) 검색엔진을 호출해서 최신 정보도 가져올 수 있고... 나의 의도를 정확하게 파악해서 실행할 수 있게 됩니다. 소버린AI는 비즈니스 관점에서도 굉장히 큰 기회(입니다). 하이퍼클로바X 기반으로 네이버가 운영하고 있는 200개 이상의 서비스들을 진화시켜서 새로운 사용자 가치를 제공하는 데 활용하고 있습니다.]

네이버는 일단 무료로 서비스를 제공하면서 충성 이용자 확보를 꾀하고 있습니다.

[이성엽 / 고려대 기술경영전문대학원 교수 : 자국의 데이터를 가지고 멀티모달(텍스트·이미지·음성 이해) 형태로 가는 부분은 소버린AI를 주장하는 데 도움이 된다고 봐야 되겠죠. 소비자 니즈를 파악해서 (돈을) 지불할 만한 서비스가 나와야지만 가능할 것 같은데...]

네이버는 글쓰기나 번역 등에 주로 쓰였던 클로바X가 이미지 이해 능력을 기반으로 활용 범위를 넓힐 것으로 기대하고 있는데, 앞서 이와 같은 멀티모달을 선보인 글로벌 빅테크들의 생성 AI와 경쟁에서 한국어 기반 모델의 강점을 얼마나 소구하느냐가 관건이 될 전망입니다.

SBS Biz 김한나입니다.
 

ⓒ SBS Medianet & SBS I&M 무단복제-재배포 금지

김한나다른기사
[르포] 멀티 플랫폼 소비자 밀착·눈앞 아이템이 게임 속으로…게임시장 새판
AI로 현실을 게임에 녹인다