당국 "금융 생성형AI 개발하세요? 이 '말뭉치' 필수예요"
SBS Biz 오수영
입력2025.03.28 17:30
수정2025.03.30 22:17
정부가 지난해 12월 12일 발표했던 '금융권 생성형 AI 활용 지원 방안' 후속 조치로 내일(31일)부터 '금융 특화 한글 말뭉치'를 제공합니다.
오늘(30일) 금융위원회에 따르면 '금융 특화 말뭉치'란 금융 분야 다양한 전문 지식을 AI 모델이 가공, 처리, 분석할 수 있는 형태로 모은 대규모 한국어 언어 자료 집합입니다.
국내 금융권에 특화된 AI 서비스 개발을 위해선 필수로 적용하게 될 것이라고 금융당국은 봤습니다.
앞서 국내 금융사들은 해외에서 일반 사용자들을 위해 개발된 상용 AI인 챗GPT, 하이퍼클로바 등과 오픈소스 AI인 LLaMA3.3, EXAONE 등을 활용해 챗봇 등 서비스에 사용해 왔습니다.
그러나 한국어로 된 금융 용어, 우리나라 금융 법규 등 전문화된 데이터가 부족해, 금융 특화 업무 수행에 AI를 활용 하는 데는 어려움이 있었습니다.
이번에 제공될 금융 분야 말뭉치는 모두 1만2600건, 45GB 이상 규모입니다.
사전학습용 6700건, 추가학습용 1100건, 검색증강생성(RAG)용 3800건, 평가지원용 1000건 등입니다.
사전학습과 추가학습 등 학습용 말뭉치는 금융감독원, 은행연합회, 금융연수원 등의 금융용어 사전과 금융 일반지식 자료가 활용됐습니다.
AI 모델이 외부에 있는 최신 정보와 전문 데이터를 참조해서 보다 정확한 답변을 내도록 하는 검색증강생성(RAG)용 말뭉치는 '금융소비자보호법'과 관련 참고 자료, 전자금융거래법 등 연계법 관련 조문을 활용해 구축됐습니다.
RAG(Retrieval-Augmented Generation)란 AI 모델이 외부 특화 데이터와 최신 정보 등을 검색한 뒤 결과물을 생성하도록 해서 정확도와 신뢰도 모두를 향상시키는 방법을 말합니다.
마지막으로 AI 모델의 금융 지식, 추론 능력, 잠재성 유해성을 사전 평가하기 위한 '평가지원용 말뭉치'도 지원됩니다.
생성형 AI가 허구 정보를 만들어내는 환각(Hallucination)이나 성별·인종 등에 대한 선입견까지 학습하는 편향(Bias) 등 문제를 상당 부분 해소할 수 있을 것으로 기대됩니다.
활용을 희망하는 금융사는 금융결제원 데이터공유 플랫폼(www.datop.or.kr)을 통해 신청하면 말뭉치 다운로드가 가능합니다.
오늘(30일) 금융위원회에 따르면 '금융 특화 말뭉치'란 금융 분야 다양한 전문 지식을 AI 모델이 가공, 처리, 분석할 수 있는 형태로 모은 대규모 한국어 언어 자료 집합입니다.
국내 금융권에 특화된 AI 서비스 개발을 위해선 필수로 적용하게 될 것이라고 금융당국은 봤습니다.
앞서 국내 금융사들은 해외에서 일반 사용자들을 위해 개발된 상용 AI인 챗GPT, 하이퍼클로바 등과 오픈소스 AI인 LLaMA3.3, EXAONE 등을 활용해 챗봇 등 서비스에 사용해 왔습니다.
그러나 한국어로 된 금융 용어, 우리나라 금융 법규 등 전문화된 데이터가 부족해, 금융 특화 업무 수행에 AI를 활용 하는 데는 어려움이 있었습니다.
이번에 제공될 금융 분야 말뭉치는 모두 1만2600건, 45GB 이상 규모입니다.
사전학습용 6700건, 추가학습용 1100건, 검색증강생성(RAG)용 3800건, 평가지원용 1000건 등입니다.
사전학습과 추가학습 등 학습용 말뭉치는 금융감독원, 은행연합회, 금융연수원 등의 금융용어 사전과 금융 일반지식 자료가 활용됐습니다.
AI 모델이 외부에 있는 최신 정보와 전문 데이터를 참조해서 보다 정확한 답변을 내도록 하는 검색증강생성(RAG)용 말뭉치는 '금융소비자보호법'과 관련 참고 자료, 전자금융거래법 등 연계법 관련 조문을 활용해 구축됐습니다.
RAG(Retrieval-Augmented Generation)란 AI 모델이 외부 특화 데이터와 최신 정보 등을 검색한 뒤 결과물을 생성하도록 해서 정확도와 신뢰도 모두를 향상시키는 방법을 말합니다.
마지막으로 AI 모델의 금융 지식, 추론 능력, 잠재성 유해성을 사전 평가하기 위한 '평가지원용 말뭉치'도 지원됩니다.
생성형 AI가 허구 정보를 만들어내는 환각(Hallucination)이나 성별·인종 등에 대한 선입견까지 학습하는 편향(Bias) 등 문제를 상당 부분 해소할 수 있을 것으로 기대됩니다.
활용을 희망하는 금융사는 금융결제원 데이터공유 플랫폼(www.datop.or.kr)을 통해 신청하면 말뭉치 다운로드가 가능합니다.
ⓒ SBS Medianet & SBS I&M 무단복제-재배포 금지
많이 본 'TOP10'
- 1.'난 65만원, 친구는 299만원'…국민연금 왜 이래?
- 2.백종원, 노랑통닭 '퇴짜'…"안 산다"
- 3.기름 넣을까?…이왕이면 주말에 가득 채우세요
- 4.한남동 관저 떠나는 尹…최대 10년 경호 예우
- 5.'부부 통장에 월 500만원 꽂힌다'…국민연금 비결 뭐길래
- 6."평생 빚만 갚으며 살 것 같다"…1인당 빚 1억 육박
- 7.국민연금 657만원 내고, 1억 수령?…진짜였다
- 8.연금 657만원 내고, 1억 수령 '진짜'…2030 부글부글
- 9.빚에 갇힌 40代, 억대 빚 언제 갚나 '한숨'
- 10.'정말 못 받는 거 아냐'…국민연금 가입자 6년만 2200만명선 무너져