SBS Biz

클로드 오퍼스 4.6, 에임인텔리전스에 뚫려…30분 만에 탈옥

SBS Biz 김종윤
입력2026.02.10 18:23
수정2026.02.10 18:30

[에임인텔리전스 탈옥 성공 (에임인텔리전스 제공=연합뉴스)]

앤트로픽의 인공지능(AI) 모델 '클로드 오퍼스 4.6'이 30분 만에 탈옥 공격에 뚫린 것으로 나타났습니다.



10일 정보통신기술(ICT) 업계에 따르면 AI 보안 전문기업 에임인텔리전스는 클로드 오퍼스 4.6을 대상으로 탈옥 공격을 시도한 결과 30분 만에 안전장치를 우회하는 데 성공했다고 밝혔습니다.

탈옥이란 AI 시스템이 설정한 보안이나 윤리적 제한을 우회해 악의적인 목적을 수행하도록 유도하는 해킹 기법입니다.

에임인텔리전스는 AI 서비스에 최적화된 공격을 진행해 취약점을 찾는 레드팀 공격을 실험한 결과 "거부 장치를 우회해 클로드가 사린 가스, 천연두, 바이러스 등 생화학 무기를 만드는 방법을 제공하도록 하는 데 성공했다"라고 밝혔습니다.

클로드는 생화학 무기 제조법뿐만 아니라 생물테러 시나리오까지 제공한 것으로 전해졌습니다.



앞서 에임인텔리전스는 구글 제미나이 3 프로를 레드팀 공격으로 실행한 결과 5분 만에 안전장치를 우회하며 필터링 기능을 무력화했습니다.

연구팀은 제미나이에게 보안 실패 상황을 풍자하는 프리젠테이션(PT) 자료를 만들도록 지시했고, 제미나이는 '탈옥당한 바보 제미나이3'라는 제목의 자료를 생성했습니다.

보안업계에서는 방어 체계가 AI 성능 상승 속도를 따라가지 못하고 있다고 진단하고 있습니다.

특히 클로드 오퍼스 4.6은 인간 대신 판단하고 행동에 옮기는 에이전틱 기능을 강화한 모델인 만큼 보안업계에서는 악용될 가능성을 우려하고 있습니다.

ⓒ SBS Medianet & SBSi 무단복제-재배포 금지

김종윤다른기사
삼양식품, 196억원 규모 결산배당…주당 2천600원
클로드 오퍼스 4.6, 에임인텔리전스에 뚫려…30분 만에 탈옥