SBS Biz

AI 발전에 뉴스 무단학습 논란…"학습 데이터 공개해야"

SBS Biz 안지혜
입력2025.05.29 11:09
수정2025.05.29 11:59

[앵커]

요즘 간단한 궁금증 해결부터 복잡한 보고서 작성까지, 묻고 답하는 생성형 인공지능 많이들 활용하시죠.

서비스 고도화를 위해서는 정확하고 풍부한 콘텐츠 학습이 핵심인데요.

이 과정에서 뉴스 콘텐츠 저작권을 제대로 보호해야 한다는 목소리도 커지고 있습니다.

보도에 안지혜 기자입니다.

[기자]

왼쪽은 생성형 AI, 챗GPT로 검색한 결과물입니다.

오른쪽은 뉴욕타임스의 실제 기사 내용입니다.

첫 줄을 빼고는 모든 내용이 같습니다.

챗GPT가 기사를 그대로 긁어다 썼기 때문입니다.

이처럼 최근 생활에 인공지능 기술이 급속히 퍼지면서 AI학습에 활용되는 창작물 '제값 쳐주기'가 뒤늦게 쟁점이 됐습니다.

[최승재 / 세종대학교 법학과 교수 : 인공지능 학습에 있어서 '학습용 데이터'라는 이름으로 뭉쳐져 있는 저작물, 저는 '데이터'라는 이름으로 함부로 불리는 건 적절하지 않다고 생각하는데, 왜 저작물을 함부로 데이터라는 이름으로 중성화하고….]

실제로 뉴욕타임스는 오픈 AI가 자사의 기사를 무단으로 사용했다며 저작권 침해 소송을 진행 중입니다.

[최승재 / 세종대학교 법학과 교수 : 뉴욕타임스의 질문은 이겁니다. '우리가 더 이상 아무런 보상을 받을 수가 없어서 기사를 낼 수 없게 되면, (인공지능은) 무엇을 학습할 것인가.]

제대로 된 보상을 위해서는 AI 사업자들의 학습데이터 사용 목록 공개가 우선입니다.

[백지연 / 국회 입법조사처 입법조사관 : 제한적인 공개를 통해서 최소한 (창작자와) 협상의 근간, 협상의 기본을 만들어야 한다...]

국내에서도 언론사들이 네이버를 상대로 AI의 뉴스 무단학습 관련 분쟁을 시작한 가운데, 앞으로 정당한 저작물 활용 관련 논쟁은 더 커질 것으로 보입니다.

SBS Biz 안지혜입니다.
 

ⓒ SBS Medianet & SBS I&M 무단복제-재배포 금지

안지혜다른기사
쿠팡 개인정보 유출 9일 만에…이용자수 예전수준 복귀
삼성전자 노사, 2026년 임금교섭 첫 상견례…16일부터 본교섭