SBS Biz

이제 사람처럼 대화한다…오픈AI, 실시간 음성AI모델 공개

SBS Biz 임선우
입력2026.05.08 04:30
수정2026.05.08 05:45


챗GPT 개발사 오픈AI가 끊김 없이 이용자의 음성을 인식하는 실시간 인공지능(AI) 모델을 선보였습니다.



오픈AI는 GPT-5급 추론 능력을 갖추고 실제 사람들의 자연스러운 대화 행태를 반영한 음성 모델 'GPT-리얼타임-2'를 7일(현지시간) 공개했습니다.

이 모델은 이용자와 AI가 번갈아 말해야 했던 기존의 AI 모델과 달리 이용자가 AI의 답변 내용을 중간에 끊고 말하거나, 앞서 말했던 내용을 중도에 고쳐 말해도 즉각 반응하도록 한 것이 특징입니다.

또 상황에 따라 말투를 조절할 수도 있고, 개발자가 빠른 답변이 필요한 업무와 신중한 답변이 필요한 업무 등에 맞춰 추론 수준을 선택할 수도 있도록 했습니다.

오픈AI는 음성을 실시간으로 번역해주는 모델 'GPT-리얼타임-트랜슬레이트'와 실시간 받아쓰기 모델인 'GPT-리얼타임-위스퍼'도 함께 선보였습니다.



오픈AI는 "실시간 음성 기술이 단순한 문답 수준을 넘어서서 대화 흐름에 따라 이용자의 말을 듣고 추론하며 번역하고 받아적으며 작업을 수행할 수 있도록 발전시키고 있다"고 개발 배경을 설명했습니다.

실제 기업들의 도입 사례도 소개됐습니다. 부동산 플랫폼 질로(Zillow)는 고객이 음성으로 설정한 조건에 맞춰 매물을 검색하고 방문 일정을 잡아주는 음성 비서를 구축 중이며, 유럽 통신사 도이체텔레콤은 고객이 가장 편한 언어로 소통할 수 있는 고객 지원 실시간 번역 서비스를 테스트하고 있습니다.

오픈AI가 이 같은 음성 모델을 개발한 것은 외부 기업들의 수요 외에 자체 AI 기기 준비에도 필요했기 때문으로 풀이됩니다.

오픈AI는 애플의 제품 디자인을 총괄했던 조니 아이브의 스타트업 'io'를 지난해 65억 달러에 인수한 이후 음성으로 조작할 수 있는 AI 기기를 준비 중입니다.

오픈AI가 내놓을 제품으로는 스마트 안경이나 옷에 부착할 수 있는 핀 형태의 스마트 기기, 스마트 스피커 등이 지목되고 있습니다.

궈밍치 TF인터내셔널증권 분석가는 오픈AI가 AI 에이전트 기능을 탑재한 자체 스마트폰을 개발하고 있다는 관측을 최근 내놓기도 했습니다.

한편 오픈AI는 이날 챗GPT에 '신뢰할 수 있는 연락처'라는 안전 기능을 새로 도입했다고도 밝혔습니다.

챗GPT가 대화 중 자해를 비롯한 이용자의 정신건강 위기 상황을 감지하면 사전에 지정한 가족이나 친구 등 지인에게 알림을 보내 도움을 받을 수 있도록 연결해주는 기능입니다.

이는 청소년 등 미성년자 계정에는 이전부터 있었던 기능으로, 이번에 성인 계정으로 확대된 것입니다.

ⓒ SBS Medianet & SBSi 무단복제-재배포 금지

임선우다른기사
[외신 헤드라인] 헤지펀드 거물 "AI 강세장 1∼2년 더 지속할 것"
[글로벌 비즈 브리핑] 너무 오른거 아냐?…블랙록 '코리아ETF'서 사상 최대 자금 유출 外