SBS Biz

카카오모빌리티, AI 학습용 자율주행 데이터셋 공개

SBS Biz 김동필
입력2025.02.28 10:05
수정2025.02.28 10:05


카카오모빌리티가 과학기술정보통신부와 자율주행기술개발혁신사업단(KADIF)의 '자율주행 기술개발 혁신사업' 국책과제 일환으로 구축한 'AI 학습용 자율주행 데이터셋'을 한국전자통신연구원(ETRI) 'AI 나눔'에 공개했다고 오늘(28일) 밝혔습니다.



국내 도로 환경에서 구축한 비식별화된 AI 학습용 데이터셋을 일반에 공개해 저작권 문제없이 누구나 자유롭게 자율주행 연구개발에 활용할 수 있도록 한다는 취지입니다. 카카오모빌리티는 레벨4(Lv.4) 자율주행 구현을 위한 해당 사업에 참여해 차량, 엣지-인프라, 지능학습을 연계해 융합형 자율주행 데이터의 생성·관리·배포 자동화 기술 개발을 완료한 바 있습니다.
 
그동안 자율주행을 연구하는 소규모 기업이나 학계, 연구계에서는 막대한 비용과 시간이 소요돼 라이다·레이더·카메라 센서로 자율주행 데이터를 직접 확보하기 어려운 문제가 있었습니다. 또 이미 공개된 데이터셋은 대부분 해외 지역이나 특정 시간대에 수집된 데이터로 국내 실정에 맞는 연구개발에 한계도 있었습니다.

카카오모빌리티가 이번에 공개한 데이터셋은 국내 주요 도로변에 설치된 라이다·카메라 센서 등 엣지-인프라와 카카오모빌리티가 직접 운영한 자율주행차를 통해 획득한 15만 건의 자료입니다. 카카오모빌리티 관계자는 "이 데이터는 도로타입(고속도로, 국도, 지하차도, 터널 등), 시간(주/야간), 날씨(맑음/강우/안개 등) 등 총 31개 카테고리의 다양한 환경 조건에서 수집됐다"라면서 "라이다 센서를 통해 취득한 포인트클라우드의 좌표값은 물론 사람, 사물 등 개체 속성을 구분할 수 있는 세분화(Pointcloud segmentation) 데이터도 포함돼 활용 가치가 높을 것으로 예상된다"라고 강조했습니다.



데이터의 신뢰성도 ETRI의 실증을 통해 검증을 마친 상태입니다. 사람과 차량, 자전거 등 3D 동적 객체 검출 AI 성능은 약 5~8%, 신호등 인식 AI 성능은 약 2%가 향상된 것으로 확인된 겁니다. 자율주행 AI의 객체 검출 및 인식 성능이 향상되면, 주변 환경을 보다 정확히 인식해 안정적인 자율주행이 가능합니다.

장성욱 카카오모빌리티 미래이동연구소장은 "이번 데이터셋 공개가 국내 자율주행 기술의 상용화와 발전을 앞당기는 초석이 되길 기대한다"라면서 "앞으로도 다양한 공공 및 민간기업과 협력하여 자율주행 기술 혁신과 공공 데이터 활용 확대에 앞장서겠다"라고 말했습니다.

정광복 KADIF 단장은 "본 사업을 통해 ‘미래의 석유’라 불리는 15만 건의 융합형 자율주행 학습 데이터셋을 공개하게 돼 기쁘게 생각한다"라면서 "이번에 공개된 학습 데이터가 관련 학계, 스타트업 등의 성장 발판이 되고, 나아가 AI 자율주행 기술 고도화에 기여할 수 있기를 기대한다"라고 전했습니다.
 

ⓒ SBS Medianet & SBSi 무단복제-재배포 금지

김동필다른기사
토허제 나비효과…마용성까지 들썩이자 대출 조바심?
[인사] 과학기술정보통신부