thebell

전체기사

[Risk Manager Awards] '기업' 신용평가에 ML 탑재한 KB국민은행[2019년 우수사례/은행I 권역 최우수상] DBM알고리즘 활용, 조기경보 시스템 구축

손현지 기자공개 2019-10-31 15:33:42

이 기사는 2019년 10월 31일 11:01 thebell 에 표출된 기사입니다.

지난 2월 은행권 최초로 '기업' 신용평가를 위해 머신러닝(Machine Learning, ML)기법을 활용한 은행이 등장했다. 무엇보다 자체 검증 시스템을 구축하고 있어 내부 역량 측면에서도 합격점을 받았다. 이러한 리스크관리 혁신의 주역은 바로 KB국민은행이다.

최근 많은 금융회사들이 신용평가모델로 머신러닝 기법을 많이 활용하고 있는 추세다. 다만 국민은행처럼 기업에 대한 심사 및 검증 등 여러 업무에 다양하게 적용하려는 시도 자체는 거의 없었다. 그저 소매쪽 국한돼 시도하고 있을 뿐이다. '2019 더벨 리스크 매니저 어워즈(thebell Risk Manager Awards)' 심사위원들이 국민은행 평가에 높은 점수를 부여한 배경이기도 하다.

국민은행이 ML을 탑재해 새로 구축한 모델은 총 10개에 달한다. 활용 목적별로 소매쪽 3개(신용, 저신용, 소매형 SOHO), 조기경보, 기업검증모델 등으로 분류된다. 소매 신용평가모델의 경우 총 5개 모델로 가계 신규 신용대출이나 소매형 SOHO 고객 평가 시에 활용된다.

그 중에서도 가장 혁신적인 시도로 꼽히는 기업여신의 리스크를 경감시키는 모델은 '기업조기경보모델'이다. 이른바 하위 10%의 나쁜 섹터를 걸러내는 작업으로 선제적으로 부실 징후에 대응한 체계라고 할 수 있다.

매달 신용도가 안좋다고 평가된 고객군을 재점검해서 여신 사후관리 전략으로 활용하는 게 특징이다. 내부·외부 데이터를 통틀어 평균 50만 거래 내역을 통해 고객의 리스크를 재차 측정하는 모델로 그동안 통계모델이 선별하지 못했던 '부도 가능성'이 높은 기업들을 조기경보대상 리스트에 추가시킨다.

ML기반 신용평가모델

반면 기업검증모델은 우량한 상위 30%의 등급의 고객군을 대상으로 한다. 부도율이 낮은 중상위등급 고객 중 우불량을 선별해내는 장치다. 은행이 부여한 신용등급 대비 부도율이 높은 업체의 공통적인 리스크 특성을 비교분석해 신용평가모델을 개선시키는 역할을 수행한다.

이로써 금융지원 범위에서 중하위(4~7등급) 신용등급자를 배제하지 않을 수 있게 됐다. 단순 리스크 경감 차원에서보 면 신용등급을 기준으로 판단하기 일수지만 ML기반 신용평가 모델을 활용해 분석할 경우 신용평가체계에서 불이익을 받아왔던 고객군도 검증에 포함시킬 수 있다. 알고보면 부도율이 낮은 이른바 '우량고객'들을 선별해 우대금리를 혜택을 부여할 수 있다는 장점이 있다.

이는 금융당국이 지향하는 서민 금융지원 범위 확대 기조와도 부응한 모범적 활용사례로 판단된다. 한 심사위원은 "보통 소외계층 (주부,사회초년생)의 경우 소득증빙도 잘 안되고 신용카드발급도 안되기 때문에 대출이 어려움이 있다"며 "금융회사입장에서는 그만큼 그들에 대한 금융정보가 부족하다는 뜻이기도 한데 ML은 금감원의 심사부문을 염두에 뒀다고 해도 과언이 아니다"고 설명했다.

GBM알고리즘 모형도

국민은행이 신용평가모델을 처음 구축한 건 1999년으로 거슬러 올라간다. 당시 모델은 로지스틱(Logistic) 회귀분석에 의거해 개발한 것으로 대부분의 금융사들이 활용해온 전통적인 통계방법이었다. 다만 ML기법이 발전하면서 새로운 신용평가모델 구축 움직임이 우후죽순 생겨났다.

국민은행도 예외는 아니었고 작년 초부터 본격적으로 개발 단계에서 돌입했다. 주목할 점은 기존 모델에 적합한 알고리즘을 선별하기 위해 다양한 시행착오를 거쳤다는 점이다. △DNN(Deep Neural Network) △GBM(Gradient Boosting Machine) △RF(Random Forest) 알고리즘을 적용한 결과 GBM알고리즘을 최종적으로 선정했다. BGM알고리즘은 예측력이 약한 모델들을 결합해 강한 예측 모델을 만드는 알고리즘이다. 각 단계에서 새로운 예측모델을 생성하는데 이전 단계의 예측 오류를 수정하는 방식이다.

ML기법의 최대 장점은 대량 데이터에 유리하다는 점이다. 정형화된 모델링 만들어서 시스템을 설계하기만 하면 데이터 평가를 '자동'으로 해주는 방식이기 때문이다. 따라서 영업점에서 서류를 추가하지 않아도 자료를 취득할 수 있다. 전산시스템이 고도화되면서 생소한 정보도 포함되기 때문에 기존 로지스틱 방법론보다 우발채무 위험을 사전에 감지하기 쉽다.

퍼포먼스(변별력)측면에서도 우수하다는 평가다. 개발 데이터 기준으로 보면 퍼포먼스로 변별력(Accuracy Ratio, AR)지수를 많이 사용하는데 보통 60%가 넘으면 모델 성능이 양호하다고 평가한다. 신용평가와 기업조기경보모델의 AR은 대부분 70%를 넘는다.

기업검증모델의 AR은 48~67%로 이에 비하면 낮으나 부도판별이 어려운 중상위등급(AAA~BB)부여 고객을 대상으로 판별할 때는 높은 퍼포먼스를 나타내고 있다. 실제로 각 모델별로 상위 40%에 해당하는 집단의 불량률을 비교 분석한 결과 기존 통계모델에 비해 ML모델의 불량률이 0.05~0.25%포인트 낮다. 즉 ML모델의 성능이 정량적 수치로도 입증된 셈이다.

ML기법
행 리스크전략그룹
< 저작권자 ⓒ 자본시장 미디어 'thebell', 무단 전재, 재배포 및 AI학습 이용 금지 >

더벨 서비스 문의

02-724-4102

유료 서비스 안내
주)더벨 주소서울시 종로구 청계천로 41 영풍빌딩 5층, 6층대표/발행인성화용 편집인이진우 등록번호서울아00483
등록년월일2007.12.27 / 제호 : 더벨(thebell) 발행년월일2007.12.30청소년보호관리책임자김용관
문의TEL : 02-724-4100 / FAX : 02-724-4109서비스 문의 및 PC 초기화TEL : 02-724-4102기술 및 장애문의TEL : 02-724-4159

더벨의 모든 기사(콘텐트)는 저작권법의 보호를 받으며, 무단 전재 및 복사와 배포 등을 금지합니다.

copyright ⓒ thebell all rights reserved.