• 검색 결과가 없습니다.

Study on credit rating model using explainable AI

N/A
N/A
Protected

Academic year: 2021

Share "Study on credit rating model using explainable AI"

Copied!
13
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2021, 32(2),283–295

설명 가능한 AI 기술을 활용한 신용평가 모형에 대한 연구

ᆫ예ᄋ1· ᄀᆷ세ᄇ2·ᅵ자ᄋ3·ᅮᄌ

4

1234ᆫᄒᆫᄋᆫᄒᆼ AI ᄐᆸᄉᆫ터 ·4ᅩ려대 기ᄉᆯᄀᆼᄋᆼᄌᆫ매ᄒᆨᄋ

ᆸ수 2020ᄂᆫ 12ᄋᆯ 21ᄋᆯ, 수ᄌᆼ 2021ᄂᆫ 1ᄋᆯ 21ᄋᆯ, 게ᄌᆨᄌᆼ 2021ᄂᆫ 1ᄋᆯ 27ᄋ

요 약

ᆫ기니시 ᄇᆯᄌᆫᄒᆷ에 따라, ᆷᄋᆫᄋᆸ에도 ᄋᆫ기니ᄉᆯᄋᆨ아나례디 자하고 ᄋ

ᅡ. 그러나 ᄋᆫ기니싀 ᄀᆼ우 ᄆᆭ우비ᄉᆫᄒᆼᄉᆼ이 니 때메 ᄀᆯ과로차놔ᄌᆼ에 대ᄒᆫ ᄋ

ᅢ가 ᄌᆨᄀᆫᄌᆨ이지 ᄋᆭᄂᆺ이 메이다. 이ᄅᆫ ᄐᆨᄉᆼ으로 ᄋᆫ해서 ᄋᆫ기느로 ᄀᆯ과로차놔ᄌᆼᄋ

ᆯᄅᆨᄇᆨ스로 표ᄒᆫ하기도 ᄒᆫ다. ᄎᆫ EU에서 새로애ᄋᆫᄌᆼ보 보호 규ᄌᆼᄋᆫᄃᆯᄆᆫ서, ᄋᆫ기ᄂᆯ고ᄅ

ᆷᄋᆯ 태 도ᄎᆯᄃᆯ과에 대해서 고ᄀᆨ이 서비스 제가에게 ᄉᆯᄆᆼ요ᄎᆼᄒᆯ 수 ᄋᆻᄂᆫ 기로ᄌᆼ하ᄋ

ᅡ. ᄌᆨ,ᆷᄋᆫᄋᆸ에서 ᄋᆫ기니ᄉᆯᄋᆨ아기 위해서ᄂᆫ, ᄂᇁᄋᆼᄆᆯ도ᄈᆫ 아니라 ᄉᆯᄆᆼᄒᆯ 수 ᄋᆻᄂ

ᆼᄅᆨ도 고려해야 ᄒᆫ다ᄂᆺ이다. ᄇᆫ ᄂᆫ메서뇌부에 오ᄑᆫ다ᄋᆼᄒᆫ ᄉᆫᄋᆼ보 데이터ᄅᆯ아여,

ᆫ기니ᄇᆫ의 ᄉᆫᄋᆼᄑᆼ가 ᄋᆯ고리ᄌᆷ에ᄋᆫ하ᄋᆻ다. 이와 ᄒᆷ께, ᄋᆫ기니 도ᄎᆫ ᄀᆯ과에 대해서, ᄃ

ᅵ터의 다ᄋᆼᄒᆫ ᄐᆨᄉᆼᄃᆯ 제서 어ᄄᆫ ᄐᆨᄉᆼ이 ᄀᆯ과 도ᄎᆼᄒᆼ이ᄎᆻ니 도차ᄂᆯ고리ᄌᆷ에ᄋ

ᅡᄋᆻ다. 또ᄒᆫ, 이ᄅᆼ해서 ᄋᆫ기니 도ᄎᆫ ᄀᆯ과의 ᄇᆫ디 ᄋᆻᄋᆻ애, ᄇᆫᄃᆯ과ᄅᆯᄆᆼ하ᄂ

ᆸᄋᆷ에이터에 ᄌᆨ아ᄋᆻ다. 제ᄋᆼᄇᆸᄋᆯ 태서,ᆷ어비스에서 ᄋᆫ기니ᄉᆯ오ᄋᆸᄒᆯ 때,

ᆯᄆᆼᄅᆨ에ᄀᆯ 수 ᄋᆻᄋᆷᄋᆫ하ᄋᆻ다ᄂᆷ에싀미가 ᄋᆻ다.

ᅮ요어: 디지ᄐᆷᄋᆼ, ᄉᆯᄆᆼ 가ᄂᆫ AI, ᄉᆫᄋᆼᄑᆼ가.

1. 서론

ᆫᄐᆼᄌᆨ으로 대ᄎᆯᄋᆸᄋ ᆼ위하ᄂᆷᄋᆫᄃᆯᄋ ᅵ스키 ᄆᆾ 효과ᄌᆨᄋᆫ 규제 대ᄋᆼ위하여 ᄉᆫᄋᆼᄃᆼᄀ

ᆾ 대ᄎᆯᄉᆷ사뤼ᄒᆫ 다ᄋᆼᄒᆫ 모ᄒᆼᄋ ᅮ차여 ᄋᆫᄋᆼ하고 ᄋᆻ다. 바ᄌᆯIIᄒᆸᄋᆨ (게 ᄀᆯ제ᄋᆫᄒᆼ에서 ᄋᆫᄒᆼᄃ

ᅡ기자비ᄋᆯ (BISᅵᄋᆯ) ᄉᆯᄌᆼ의 게기ᄌᆫ에시ᄒᆫ ᄀᆺ으로 ᄋᆫᄒᆼ의 재무ᄀᆫᄌᆼᄉᆼ오하기 위ᄒᆫ 게ᄒ

ᆨ) 이후 이러ᄒᆫ 모ᄃᆯ의 고도화에 대ᄒᆫ ᄑᆯ요ᄉᆼ이 자ᄒᆷ에 따라, ᆷᄋᆫ디 보유ᄒᆫ 데이터리ᄇᆫᄋ

ᅩ 외부 ᄉᆫᄋᆼᄑᆼ가사 ᄌᆼ보ᄅᆯᄒᆸ하여 톄ᄌᆨ 기ᄇᆸᄋᆯᄋᆫ 모ᄃᆯ아아고 ᄋᆻ다 (Lee ᄃᆼ, 1996). ᅵᄅ

ᆫ 모ᄒᆼᄃᆯ우로 이ᄇᆫᄇᆸ 뷰ᄅᆷᄃᆼ하노지스ᄐᆨ ᄉᆫᄒᆼ 회귀 기ᄇᆸ이ᄇᆫ으로 ᄉᆯ계되ᄋᆻ다. 따라서 ᄆ

ᆯ의 예ᄎᆨᄅᆨ아러ᄉᆫ러ᄂᆼ 기ᄇᆸ에 비해 ᄉᆼ대ᄌᆨ으로 ᄂᆽ지ᄆᆫ ᄀᆯ과에 대ᄒᆫ ᄉᆯᄆᆼ이 ᄌᆨᄀᆫᄌᆨᄋᆫ ᄌᆼᄌᆷ이 ᄋᆻᄃ (Kim, 2012).

4ᅡ ᄉᆫᄋᆸᄒᆨᄆᆼ 시대ᄅᆽ이하여 ᄇᆨ데이터와 ᄋᆫ기니시 ᄌᆫ ᄉᆫᄋᆸ으래되나에,ᆷᄋᆫᄋ

ᅩ 기제 사외ᄃᆫ ᄉᆫᄋᆼᄑᆼ가 모ᄒᆼ 데 ᄋᆫ기니ᄉᆯ오ᄋᆸ하니도ᄅᆯ ᄌᆫᄒᆼ하고 ᄋᆻ다 (Zhen, 2019).

ᅵ 데이터 ᄇᆫᄉᆨ 기ᄇᆸ과 머ᄉᆫ러ᄂᆼ ᄋᆯ고리지 고도헤 따라 기ᄌᆫ 톄 기ᄇᆫ 모ᄒᆼ의 예ᄎᆨᄅᆨ ᄒᆼᄉᆼᄋ

1 (04513)ᅥᄋᆯᄐᆨᄇᆯ시 주 세재로 55, ᄉᆫᄒᆫᄋᆫᄒᆼ AI Competency Center, 대리.

2 (04513)ᅥᄋᆯᄐᆨᄇᆯ시 주 세재로 55, ᄉᆫᄒᆫᄋᆫᄒᆼ AI Competency Center, 과ᄌᆼ.

3 (04513)ᅥᄋᆯᄐᆨᄇᆯ시 주 세재로 55, ᄉᆫᄒᆫᄋᆫᄒᆼ AI Competency Center, ᄒᆼᄋᆫ.

4 ᅭᄉᆫ저자: (04513) 서ᄋᆯᄐᆨᄇᆯ시 주 세재로 55, ᄉᆫᄒᆫᄋᆫᄒᆼ AI Competency Center, 부부ᄌᆼ.

Email: jihwan [email protected]

(2)

ᅱᄒᆫ 다ᄋᆼᄒᆫ 시도가 ᄌᆫᄒᆼ되ᄋᆻ다 (Zhen, 2019). 주요 내으로ᄂᆫ, ᅵᄌᆷ에이터ᄈᆫ 아니라 대ᄋ

ᅦ이터ᄅᆯ아여 ᄇᆫᄉᆨ의 ᄇᆷ위ᄅᆲ히ᄂᆼᄇᆸ과 부스ᄐᆼ 기ᄇᆫ의 머ᄉᆫ러ᄂᆼ 모ᄃᆯ이나 ᄃᆸ러ᄂᆼ과 ᄀᇀᄋᆫ ᄇ

ᆫ 모ᄒᆼᄋᆨ아ᄂᆼᄇᆸ디 재ᄒᆫ다 (Zheng ᄃᆼ, 2018). ᅳ러나 ᄋᆫ기니ᄇᆫ 모ᄃᆯ이 ᄇᆸ해ᄌᆯ수ᄅ

ᅩᄃᆯ의 내부가 ᄇᆯᄅᆨᄇᆨ스와 ᄀᇀ이 ᄋᆯ 수 ᄋᆹ다ᄂᆫᄌᆷ이 재ᄒᆫ다 (Qiu와 Choi, 2019; Jang ᄃᆼ, 2020).

ᅡ서 기제ᄂᆫ 메가 되지 ᄋᆭᄋᆻᄃᆫ 모ᄃᆯ ᄀᆯ과에 대ᄒᆫ ᄉᆯᄆᆼᄅᆨ오하ᄂᆼᄋᆫ이 요구되고 ᄋᆻ다. ᄀᆯᄀ

ᅦ 대ᄒᆫ ᄉᆯᄆᆼ로ᄅᆯ 태서, 투ᄆᆼ하고 ᄀᆯ과에 대ᄒᆫ 해ᄉᆨ 가ᄂᆫ 시스ᄐᆷᄋᆫ두 ᄋᆻ기 때미다. ᄐ

ᅵ AI 이의 이슈와 GDPR (general data protection regulation의 ᄋᆨ자로 기ᄌ ᅢᄋᆫᄌᆼ보 보호 지ᄎ (data protection directive)오되ᄋᆫ게 ᄌᆨᄌᆸᄌᆨᄋᆫ ᄇᆸᄌᆨ 구ᄉᆨᄅᆨᄋᆽ뉴ᄌᆼ (regulation)으로 ᄀᆼᄒ

ᆷ) ᄃᆯᄆᆼ로에 대ᄒᆫ 외부 규제가 ᄌᆷ차 ᄀᆼ화되고 ᄋᆻ으며, ᄇᆸᄒᆫ 모ᄃᆯ의 ᄀᆯ과 ᄀᆹ에 대ᄒᆷ아 ᄋ

ᆨ의 이해도ᄅᆯ 니고 고ᄀᆨ데게 ᄎᆼᄇᆫ ᄉᆯᄆᆼ에개야하내부ᄌᆨᄋᆫ 요구도 자하고 ᄋᆻ다 (Lee, 2020). ᅵ러ᄒᆫ 배ᄀᆼ아ᄐᆼ으로, ᄉᆯᄆᆼ 가ᄂᆫ ᄋᆫ기ᄂᆼ, XAI (eXplainable AI, ᄉᆯᄆᆼ 가ᄂᆫ ᄋᆫ기ᄂ

ᆨ자)에 대ᄒᆷᄋᆼ고ᄒᆼ 도ᄋᆸ이 ᄑᆯ수ᄌᆨ이다 (Kim, 2020).

ᅵ에 대아기 위해서, ᄀᆨᄌ ᆷ외사ᄃᆯ애리 모ᄃᆯ (surrogate model)이ᄇᆫ으로 하여 ᄀᆯ과 ᄀᆹᄋ

ᅢᄒᆫ ᄇᆫ수ᄀᆫ의 기여도ᄅᆯ ᄎᆨᄌᆼ하여 ᄇᆯᄅᆨᄇᆨ스ᄋᆫ 머ᄉᆫ러ᄂᆼ 모ᄃᆯ에 대ᄒᆫ 해ᄉᆨᄅᆨ오하ᄂ ᅵ도ᄅᆯ ᄌᆫᄒᆼᄒ

ᅩ ᄋᆻ다. 이러ᄒᆫ ᄇᆼᄇᆸᄃᆯ애ᄇᆯ ᄀᆯ과에 대ᄒᆫ ᄉᆯᄆᆼᄅᆨ에ᄀᆫ다ᄂᆼᄌᆷ이 ᄋᆻ다. 그러ᄂ ᆷ외사의 ᄀ

ᆨᄃᆯᄋᆼ기ᄌᆨ으로 ᄉᆫ오에 대ᄒᆫ ᄑᆼ가ᄅᆮ기에 개ᄇᆯ ᄀᆯ과보다놔거 ᄀᆯ과와의 비교ᄅᆯ ᄐᆫ ᄇᆫ화 ᄌᆼᄃ

ᅦ 대ᄒᆫ ᄉᆯᄆᆼ에ᄀᆯ 수 ᄋᆹ다ᄂᆫ계ᄌᆷ이 재ᄒᆫ다. 또ᄒᆫ 개ᄇᆯ ᄀᆯ과에 대ᄒᆫ 해ᄉᆨᄆᆫ으로ᄂᆷ외사ᄋ

ᅲ제모ᄒᆼ에서 ᄑᆯ요ᄒᆫ 투ᄆᆼᄉᆼ과 ᄉᆫ뢰ᄉᆼ에 미치지 마기 때ᄆᆷᄋᆫᄋᆸ에서 ᄋᆫ기ᄂ ᅵ싀 도ᄋᆸᄋ

ᆯᄅᆷ디 되고 ᄋᆻ다.

ᆫ ᄂᆫ메서니러ᄒᆫ 배ᄀᆼ아ᄐᆼ으로 ᄋᆫ기노ᄃᆯ이 도ᄎᆫ ᄉᆫᄋᆼᄑᆼ가 ᄀᆯ과 ᄇᆫ화에 대ᄒᆫ 다ᄋᆼᄒᆫ ᄋ

ᆫ듸 ᄋᆼᄒᆼ도례ᄉᆫ하여 기즤 대리 모ᄃᆯ아ᄂᆼᄇᆸᄅᆫ에ᄋᆫ하고자 ᄒᆫ다.

2. 문헌연구

2.1. 머신러닝 알고리즘

ᅥᄉᆫ러ᄂᆼᄋᆫ AIᅴ ᄒᆫ 뱌로 데이터ᄅ ᅡᄐᆼ으로 내재되어 ᄋᆻᄂ ᅢᄐᆫᄋ ᆯ고리ᄌᆷᄋᆯ 태 ᄒᆨ사고ᄌ

ᆫ다. 이러ᄒᆫ ᄒᆨᄉᆸᄋᆯ 태 새로ᄋ ᅦ이터에 대해서 예ᄎᆨ ᄆᆾ 뷰하ᄂᆫ ᄋᆯᄋ ᆯᄋᆯ 수 ᄋᆻ다. 머ᄉᆫᄅ

ᆼᄋ ᆨ쇠ᄂ ᅦ이터의 ᄒᆼᄉᆨ과 묘에 따라 지도ᄒᆨᄉᆸ (supervised learning), ᅵ지도ᄒᆨᄉᆸ (unsuper- vised learning),ᆼ화ᄒᆨᄉᆸ (reinforcement learning)ᅳ로 나누 ᄋᆻ다. 지도ᄒᆨ싀 ᄀᆼ우 ᄌᆼᄃᆸ (ground truth)ᅵ 포ᄒᆷᄃ ᅦ이터ᄅ ᅡᄐᆼ으로 뷰 ᄆᆾ ᄑᆼ가하ᄂ ᆨᄉ ᆼᄇᆸ이며, 비지도ᄒᆨᄉᆸᄋ ᅦ이터의 보ᄅ

ᆫᄉᆨ하여 커스터ᄅ ᆽ고 뷰하ᄂ ᆨᄉ ᆼᄇᆸ이다. 마지ᄆᆨ으로 ᄀᆼ화ᄒᆨᄉᆸᄋ ᅮᄒᆼ ᄀᆯ과에 따ᄅ ᅩᄉᆼᄋ

ᅡ여 주어ᄌᆫᄀᆼ에서 최ᄌᆨ의 ᄇᆼᄇᆸᄋᆽᄂ ᆼᄇᆸ이다. ᄇᆫ구니도ᄒᆨ세서 사외노ᄃᆯᄅᆼ 기ᄇ

ᅡᄐᆼ으로 ᄉᆼᄉᆼ도ᄃᆯ애ᄉᆼ으로 ᄉᆫᄋᆼᄑᆼ가 모ᄒᆼ에시ᄒᆫ다. 이뤼해서, 의사ᄀᆯᄌᆼ나무 (decision tree)ᅪ 부스ᄐᆼ (boosting) 계ᄋᆯ의 ᄋᆯ고리ᄌᆷ아아ᄋᆻ다. 그리고 ᄋᆫ기노ᄃᆯ의 도ᄎᆫ ᄀᆯ과에 대ᄒ

ᆯᄆᆼᄅᆨ ᄀᆼ화ᄅᆯ 묘로 ᄒᆫ다.

2.2. 의사결정나무

ᅴ사ᄀᆯᄌᆼ나무ᄂ ᆨ 데이터디 가ᄌᆫ ᄉᆨᄉᆼᄃᆯᄋ ᅧ러 ᄃᆫ계의 패ᄐᆫ으로 구바여 뷰 ᄆᆾ 예차ᄂ

ᆸ이다. 이때 모ᄃᆯ의 의사ᄀᆯᄌᆼ 규ᄎᆨ외초의 과ᄌᆼ부터 ᄌᆷ차 하위로 ᄇᆯᄉᆫ하기에 마치 나무 가지처ᄅᆷ ᄀ

ᅡ지ᄂ ᅩᄉᆸᄋ ᅩᄋᆫ다. 따라서 의사ᄀᆯᄌᆼ나무라ᄂ ᅵᄅᆷᄋ ᅡᄋᆫ다. ᄀᆯ라지노ᄉᆸ이아여 의사ᄀ

ᆼ나무ᄂ ᆼᄃᆸᄋ ᆷᄉᆨ하ᄂ ᅪᄌᆼᄋ ᅩᄉᆨ화 ᄒᆯ 수 ᄋᆻ다ᄂ ᆼᄌᆷ이 ᄋᆻ다. 의사ᄀᆯᄌᆼ나무의 구조ᄂ ᅡᄌᆼ ᄉ

수치

Figure 3.1 Explainable credit changes architecture
Table 4.1 Test performance of classification models on various credit dataset (%)
Figure 4.1 Summary plot of SHAP values
Figure 4.3 Mean validation RMSE by number of training data
+2

참조

관련 문서

protected void setUp() throws Exception{.

Drawee Bank DRAWN ON WOORI BANK SEOUL FOR FULL

○ 월경성(越境性) 질병에 대해서는 항시적으로 관련 조사연구 사업팀을 구성하여 상시 정보 수집 및 제공을 위한 준비가 필요함.

동작인식(AI) 놀이를

강한 AI 는 단순한 컴퓨터가 아니라 프로그램된 컴퓨터 정신이라 는 것이 깃든 AI 를 말한다.. 인간의 사고와 같이 컴퓨터

이미지인식(AI) 놀이를 통해 몸을 소중히

인공지능(AI)에게 내가

머신러닝(AI) 놀이를 통한 도형교육.. 여러분들의