• 검색 결과가 없습니다.

Comparison of bankruptcy prediction models using statistical learning at multiple times<sup>†</sup>

N/A
N/A
Protected

Academic year: 2021

Share "Comparison of bankruptcy prediction models using statistical learning at multiple times<sup>†</sup>"

Copied!
13
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2021, 32

(

3)

,

487–499

통계적 학습을 이용한 다시점 기업부도 예측모형들의 비교

ᅩᄀᆼᄋ

1

· ᄀᆷᄋᆼᄆ

2

12

ᆼ배ᄒᆨ교 톄ᄒᆨᄀ

ᄌ ᅥ

ᆸᄉ ᅮ 2021ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯ 13ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2021ᄂ ᅧ ᆫ 2ᄋ ᅯ ᆯ 19ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2021ᄂ ᅧ ᆫ 2ᄋ ᅯ ᆯ 23ᄋ ᅵ ᆯ

요 약

ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄃ ᅡᄋ ᅣ ᆼᄒ ᅡ ᆫ ᄐ ᅩ ᆼ ᄀ ᅨᄌ ᅥ ᆨ ᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄒ ᅢᄉ ᅥ ᄉ ᅵᄀ ᅡ ᆫᄋ ᅴ ᄒ ᅳᄅ ᅳ ᆷ ᄋ ᅦ ᄄ ᅡᄅ ᅳ ᆫ ᄀ ᅵᄋ ᅥ ᆸᄇ ᅮᄃ ᅩᄋ ᅨᄎ ᅳ ᆨ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅴ ᄇ ᅧ ᆫ ᄒ

ᅪᄋ ᅪ ᄉ ᅥ ᆼᄂ ᅳ ᆼ ᄋ ᅴ ᄇ ᅧ ᆫᄒ ᅪᄅ ᅳ ᆯ ᄌ ᅩᄉ ᅡᄒ ᅡ ᆫᄃ ᅡ. ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ 2000ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯ 1ᄋ ᅵ ᆯᄇ ᅮᄐ ᅥ 2016ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯ 31ᄋ ᅵ ᆯᄁ ᅡᄌ ᅵ ᄒ ᅡ ᆫᄀ ᅮ ᆨ ᄀ ᅥᄅ ᅢᄉ ᅩᄋ ᅦ ᄉ

ᅡ ᆼᄌ ᅡ ᆼ ᄃ ᅬ ᆫ ᄀ ᅵᄋ ᅥ ᆸᄋ ᅳ ᆯ ᄃ ᅢᄉ ᅡ ᆼᄋ ᅳᄅ ᅩ ᄒ ᅡᄆ ᅧ, ᄉ ᅡ ᆼᄌ ᅡ ᆼᄑ ᅨᄌ ᅵ ᄄ ᅩᄂ ᅳ ᆫ ᄋ ᅯᄏ ᅳᄋ ᅡᄋ ᅮ ᆺ ᄉ ᅵ ᆫᄎ ᅥ ᆼᄒ ᅡ ᆫ ᄀ ᅵᄋ ᅥ ᆸᄋ ᅳ ᆯ ᄇ ᅮᄃ ᅩᄅ ᅩ ᄌ ᅥ ᆼᄋ ᅴᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅳ ᆯ ᄋ

ᅱᄒ ᅢᄉ ᅥ ᄉ ᅥ ᆼᄌ ᅡ ᆼᄉ ᅥ ᆼ ᄇ ᅵᄋ ᅲ ᆯ ᄀ ᅪ ᄀ ᅪ ᆫᄅ ᅧ ᆫ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄒ ᅬᄀ ᅨᄇ ᅧ ᆫᄉ ᅮᄋ ᅪ ᄀ ᅥᄉ ᅵᄀ ᅧ ᆼᄌ ᅦᄇ ᅧ ᆫᄉ ᅮᄅ ᅩᄊ ᅥ ᄌ ᅥ ᆫᄉ ᅡ ᆫᄋ ᅥ ᆸᄉ ᅢ ᆼᄉ ᅡ ᆫᄌ ᅵᄉ ᅮᄅ ᅳ ᆯ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄋ ᅳᄆ ᅧ, ᄉ ᅵᄌ ᅡ ᆼᄇ ᅧ ᆫᄉ ᅮ ᄋ

ᅵ ᆫ ᄉ ᅵᄀ ᅡᄎ ᅩ ᆼᄋ ᅢ ᆨᄋ ᅳ ᆯ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄇ ᅧ ᆫᄃ ᅩ ᆼᄉ ᅥ ᆼ, ᄋ ᅫᄃ ᅩ, ᄎ ᅥ ᆷᄃ ᅩᄅ ᅳ ᆯ ᄉ ᅢ ᆼᄉ ᅡ ᆫᄒ ᅢᄉ ᅥ ᄒ ᅪ ᆯᄋ ᅭ ᆼᄒ ᅢ ᆻᄃ ᅡ. 2000ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯᄇ ᅮᄐ ᅥ 2016ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯᄁ ᅡᄌ ᅵ ᄀ

ᆨ ᄉ ᅥ ᆫᄒ ᅢ ᆼ 3ᄂ ᅧ ᆫᄋ ᅳ ᆯ ᄒ ᅮ ᆫᄅ ᅧ ᆫᄃ ᅦᄋ ᅵᄐ ᅥ, ᄒ ᅮᄒ ᅢ ᆼ 1ᄂ ᅧ ᆫᄋ ᅳ ᆯ ᄀ ᅥ ᆷᄌ ᅥ ᆼᄃ ᅦᄋ ᅵᄐ ᅥᄅ ᅩ ᄉ ᅥ ᆯᄌ ᅥ ᆼᄒ ᅢᄉ ᅥ, ᄃ ᅡᄉ ᅵᄌ ᅥ ᆷ ᄀ ᅵᄋ ᅥ ᆸᄇ ᅮᄃ ᅩᄋ ᅨᄎ ᅳ ᆨ ᄋ ᅴ ᄆ ᅩᄒ ᅧ ᆼᄀ ᅪ ᄉ ᅥ ᆼᄂ ᅳ ᆼ ᄋ

ᅳ ᆯ ᄇ ᅵᄀ ᅭᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄅ ᅩᄌ ᅵᄉ ᅳᄐ ᅵ ᆨ ᄒ ᅬᄀ ᅱᄇ ᅮ ᆫᄉ ᅥ ᆨ, ᄇ ᅮᄇ ᅮ ᆫ ᄎ ᅬᄉ ᅩᄌ ᅦᄀ ᅩ ᆸᄇ ᅥ ᆸ, ᄅ ᅢ ᆫᄃ ᅥ ᆷᄑ ᅩᄅ ᅦᄉ ᅳᄐ ᅳ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄒ ᅢᄉ ᅥ ᄌ ᅢᄒ ᅧ ᆫᄋ ᅲ ᆯᄋ ᅳ ᆯ ᄀ ᅵᄌ ᅮ ᆫ ᄋ ᅳ ᄅ

ᅩ ᄎ ᅬᄌ ᅩ ᆼ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆯ ᄉ ᅥ ᆫᄌ ᅥ ᆼᄒ ᅡᄋ ᅧ ᆻᄋ ᅳᄆ ᅧ, ᄋ ᅵ ᄄ ᅢ ᄇ ᅮ ᆯᄀ ᅲ ᆫᄒ ᅧ ᆼᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄀ ᅵᄋ ᅥ ᆸᄇ ᅮᄃ ᅩ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅴ ᄐ ᅳ ᆨᄉ ᅥ ᆼᄋ ᅳ ᆯ ᄀ ᅩᄅ ᅧᄒ ᅢ ᄅ ᅩᄌ ᅵᄉ ᅳᄐ ᅵ ᆨ ᄒ ᅬᄀ ᅱᄇ ᅮ ᆫᄉ ᅥ ᆨ ᄀ

ᅪ ᄅ ᅢ ᆫᄃ ᅥ ᆷᄑ ᅩᄅ ᅦᄉ ᅳᄐ ᅳᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄇ ᅮᄃ ᅩᄀ ᅵᄋ ᅥ ᆸᄋ ᅦ ᄀ ᅡᄌ ᅮ ᆼ ᄎ ᅵᄅ ᅳ ᆯ ᄀ ᅩᄅ ᅧᄒ ᅡᄋ ᅧ ᆻᄀ ᅩ, ᄇ ᅮᄇ ᅮ ᆫ ᄎ ᅬᄉ ᅩᄌ ᅦᄀ ᅩ ᆸᄇ ᅥ ᆸᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ Synthetic Minority Oversampling Technique (SMOTE)ᄅ ᅳ ᆯ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅢᄉ ᅥ ᄇ ᅮ ᆯᄀ ᅲ ᆫᄒ ᅧ ᆼᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅴ ᄐ ᅳ ᆨᄉ ᅥ ᆼᄋ ᅳ ᆯ ᄇ ᅩ ᄋ ᅪ ᆫ ᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮ ᄋ

ᅦᄉ ᅥᄂ ᅳ ᆫ ᄋ ᅬᄇ ᅮ ᄀ ᅧ ᆼᄌ ᅦᄉ ᅡ ᆼ ᄒ ᅪ ᆼᄋ ᅵ ᄇ ᅧ ᆫᄒ ᅪᄀ ᅡ ᄏ ᅥᄌ ᅵᄆ ᅧ ᆫ ᄌ ᅮᄋ ᅭ ᄇ ᅧ ᆫᄉ ᅮᄃ ᅳ ᆯ ᄋ ᅵ ᄉ ᅵᄌ ᅥ ᆷᄇ ᅧ ᆯᄅ ᅩ ᄇ ᅧ ᆫᄒ ᅪᄒ ᅡᄂ ᅳ ᆫ ᄀ ᅥ ᆺᄋ ᅳ ᆯ ᄒ ᅪ ᆨ ᄋ ᅵ ᆫᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄋ ᅳᄆ ᅧ, ᄐ ᅳ ᆨ ᄒ

ᅵ ᄌ ᅥ ᆫᄉ ᅡ ᆫᄋ ᅥ ᆸᄉ ᅢ ᆼᄉ ᅡ ᆫᄌ ᅵᄉ ᅮ, ᄉ ᅥ ᆼᄌ ᅡ ᆼᄉ ᅥ ᆼ ᄇ ᅵᄋ ᅲ ᆯ ᄒ ᅬᄀ ᅨᄇ ᅧ ᆫᄉ ᅮᄀ ᅡ ᄆ ᅩᄃ ᅳ ᆫ ᄉ ᅵᄌ ᅥ ᆷᄋ ᅦᄉ ᅥ ᄀ ᅵᄋ ᅥ ᆸᄇ ᅮᄃ ᅩᄋ ᅦ ᄋ ᅲᄋ ᅴᄆ ᅵᄒ ᅡ ᆫ ᄀ ᅧ ᆯᄀ ᅪᄀ ᅡ ᄌ ᅦᄉ ᅵᄃ ᅬᄋ ᅥ ᆻᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄇ ᅮᄇ ᅮ ᆫ ᄎ ᅬᄉ ᅩᄌ ᅦᄀ ᅩ ᆸᄇ ᅥ ᆸ, ᄇ ᅮ ᆯᄀ ᅲ ᆫᄒ ᅧ ᆼ ᄃ ᅦᄋ ᅵᄐ ᅥ, ᄉ ᅥ ᆼᄌ ᅡ ᆼᄉ ᅥ ᆼ ᄇ ᅵᄋ ᅲ ᆯ ᄒ ᅬᄀ ᅨᄇ ᅧ ᆫᄉ ᅮ, ᄌ ᅥ ᆫᄉ ᅡ ᆫᄋ ᅥ ᆸᄉ ᅢ ᆼᄉ ᅡ ᆫᄌ ᅵᄉ ᅮ, ᄅ ᅢ ᆫᄃ ᅥ ᆷᄑ ᅩᄅ ᅦᄉ ᅳᄐ ᅳ.

1. 서론

ᆯᄇᆫᄌᆨ으로 ᄒᆫᄀᆨᄌᆼ거래소의 ᄉᆼᄌᆼ기ᄋᆸ의 부도ᄂᆫ 가의 ᄀᆼ제ᄈᆫ 아니라 ᄉᆼᄌᆼ이 되지 ᄋᆭ아ᄅᆫ ᄌ

ᅩ기ᄋᆸ, 거래하ᄂᆫ ᄋᆫᄒᆼᄀ ᆫᄅᆫ 기ᄋᆸ에 투자ᄒᆫ 투자자데게까지 ᄋᆨᄋᆼᄒᆼ이ᄎᆫ다. 따라서, ᄌᆼ부부처ᄂ

ᅢᄇᆯᄋᆫᄒᆼᄃᆯ이ᄋᆸ의 구조조ᄌᆼ ᄆᆾ 조ᄃᆯ, 리스크 ᄇᆫᄉᆨ 듸 다ᄋᆼᄒᆫ ᄇᆼᄇᆸ으로 기ᄋᆸ부도의 이슈라ᄌ

ᆾ 사후ᄌᆨ ᄇᆼᄇᆸ으로 다ᄋᆼ하게 해ᄀᆯ하려고 노ᄅᆨ하고 ᄋᆻ다. 대ᄒᆫᄆᆫᄀᆨ우ᄋᆨ의조가 70%ᄋᆫ ᄆᆷ 게ᄀ

ᅦ ᄉᆼ이 기ᄋᆸ에 미치ᄂᆼᄒᆼ이 ᄉᆼᄃᆼ하므로 (Kim ᄃᆼ, 2011)ᅥ시ᄀᆼ제가 기ᄋᆸ부도에 미치ᄂᆼᄒᆼ에 ᄃ

ᆫ 다ᄋᆼᄒᆫ ᄋᆫ구가 꾸지 ᄌᆫᄒᆼ되고 ᄋᆻ다. 티, 2008ᄂᆫ 세ᄀᆷ위기로 ᄋᆫ해 ᄋᆨᄒᆫ 게ᄀᆼ제 ᄉᆼ ᄉ

ᅦᄉᆷ이스ᄐᆷ의 ᄋᆫᄌᆼᄉᆼᄋᆯ ᄎᆨᄌᆼ하ᄂᆫ Stress Testᆷ이 ᄀᆸᄌᆼᄒᆻ으며, 이너시ᄀᆼ제의 ᄇᆫ화가 기ᄋ

ᅮ도에 미치ᄂᆼᄒᆼ에 대ᄒᆷ이 나지녜기가 되ᄋᆻ다.

Beaver (1966)와 Altman (1968)이 기ᄋᆸ의 부도예ᄎ ᆫ ᄋᆫ구ᄅᆯ ᄉᆯ시ᄒᆫ 이후로 꾸지 부도ᄋ

ᅩᄒᆼᄋᆫ ᄋᆫ구ᄂᆫ ᄌᆫᄒᆼ되어 오고 ᄋᆻ다. Altman (1968)ᄋ ᅵᄋᆸ의 회계ᄌᆼ보ᄅ ᅡᄇᆫᄅᆼᄑᆫᄇᆯᄇᆫᄉᆨᄇᆼᄇ

ᆨ애서 기ᄋᆸ의 부도ᄅ ᅨ차ᄂᆫ Z-ᄌᆷ수모ᄒᆼᄋ ᅦᄋᆫ하ᄋᆻ고, Ohlson (1980)ᄋᆫ Z-ᄌᆷ수모ᄒᆼ의 ᄆ

† ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ ᄉ ᅡ ᆫᄋ ᅥ ᆸᄐ ᅩ ᆼ ᄉ ᅡ ᆼᄌ ᅡᄋ ᅯ ᆫ ᄇ ᅮᄅ ᅩᄇ ᅮᄐ ᅥ ᄌ ᅢᄋ ᅯ ᆫᄋ ᅳ ᆯ ᄇ ᅮᄋ ᅧᄇ ᅡ ᆮᄋ ᅳ ᆫ ᄒ ᅡ ᆫᄀ ᅮ ᆨ ᄋ ᅦᄂ ᅥᄌ ᅵ ᄀ ᅵᄉ ᅮ ᆯ ᄑ ᅧ ᆼᄀ ᅡᄋ ᅯ ᆫ (KETEP)ᄋ ᅴ ᄋ ᅦᄂ ᅥᄌ ᅵ ᄀ ᅵᄉ ᅮ ᆯ ᄋ ᅵ ᆫᄅ ᅧ ᆨ ᄌ

ᅵᄋ ᅯ ᆫ ᄉ ᅡᄋ ᅥ ᆸᄋ ᅴ ᄌ ᅵᄋ ᅯ ᆫᄋ ᅳ ᆯ ᄇ ᅡ ᆮᄋ ᅡ ᆻᄋ ᅳ ᆷ (No. 20204010600060).

1 (41566) ᄃ ᅢᄀ ᅮ ᄀ ᅪ ᆼᄋ ᅧ ᆨᄉ ᅵ ᄇ ᅮ ᆨ ᄀ ᅮ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 80 (ᄉ ᅡ ᆫᄀ ᅧ ᆨᄃ ᅩ ᆼ), ᄀ ᅧ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄉ ᅥ ᆨᄉ ᅡ.

2 ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (41566) ᄃ ᅢᄀ ᅮ ᄀ ᅪ ᆼᄋ ᅧ ᆨᄉ ᅵ ᄇ ᅮ ᆨ ᄀ ᅮ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 80 (ᄉ ᅡ ᆫᄀ ᅧ ᆨᄃ ᅩ ᆼ), ᄀ ᅧ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄌ ᅩᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

(2)

ᆷ애ᄉᆫ하기 위해 로ᄌᆺᄇᆫᄉᆨ이ᄋᆫ O-ᄌᆷ수모ᄒᆼ에ᄋᆫ하ᄋᆻ다. ᄇᆫᄆᆫ 시ᄌᆼᄇᆫ수ᄅᆯᄋᆫ 모ᄒᆼ으로ᄂ Merton (1974)ᅴ 부도거리모ᄒᆼ (distance to default)이 가ᄌᆼ ᄌᆯ ᄋᆯ려져 ᄋᆻ다. Duan (1994)아ᄂ

ᆷ수리ᄌᆼᄇᆫ수에 ᄌᆨ애서 기ᄋᆸ의 부도례차ᄂᆫ구ᄅᆯ ᄌᆫᄒᆼ하ᄋᆻ다. Shumway (2001)뇌계ᄌᆼᄇ

ᅪ 시ᄌᆼᄌᆼ보ᄅᆯ ᄐᆸ하여 기ᄋᆸ의 부도예ᄎᆨᄅᆨᄋᆯ ᄂᇁᄋᆫ 헤저드모ᄒᆼ에ᄋᆫ하ᄋᆻ으며, Gwon ᄃᆼ (2019)ᄂ

ᅵᄀᆼ제ᄇᆫ수, 회계ᄇᆫ수, 시ᄌᆼᄇᆫ수로려ᄒᆫ 모ᄒᆼ우차ᄋᆻ다. 하지ᄆᆫ, 그 ᄋᆫ구에서ᄂᆯ 기ᄀᆫᄋᆫᄇ

ᅡ나의 데이터 ᄌᆸᄒᆸ으로 가ᄌᆼ해서, 그 데이터 ᄌᆸᄒᆸ ᄋᆫ에서 ᄒᆫᄅᆫ데이터와 ᄀᆷᄌᆼ데이터료부채서 ᄆ

ᆼ구차ᄋᆻ네, ᄋᆯᄇᆫᄌᆨ으로 기ᄋᆸ부도예ᄎᆨ와거와 ᄒᆫ재의 데이터로 미래례차ᄂᆺ에 대ᄒᆫ ᄆᆨᄌ

ᅵ기 때메, Gwon ᄃᆼ (2019) ᄋᆫ구에서노ᄒᆼ구ᄎᆼᄇᆸ과 모ᄒᆯᄋᆼ ᄆᆨᄌᆨ의 차이가 ᄇᆯᄉᆼ하ᄂᆫ계ᄀ

ᅢᄒᆫ다. 예ᄅᆯ 더, 2008ᄂᆫ 세ᄀᆷ위기와 ᄀᇀᄋ ᅡᄀᆫ이 ᄇᆯᄉᆼ하ᄆᆫ 세ᄀᆷ위기 이ᄌᆫ의 기ᄋᆸ부ᄃ

ᅦ ᄋᆼᄒᆼ이치누요 ᄇᆫ수와 2008ᄂᆫ 세ᄀᆷ위기 이후에니ᄋᆸ부도에 ᄋᆼᄒᆼ이치누요 ᄇᆫ수가ᄃ

ᅮ ᄋᆻ다.

ᆫ구에서놔거 ᄆᆾ ᄒᆫ재의 데이터로 미래례차니ᄋᆸ부도예초ᄒᆼ우채서 시ᄌᆷ ᄇᆯ로 ᄀ

ᆸ부도예초ᄒᆼ ᄆᆾ ᄉᆼᄂᆼ이교ᄒᆫ다. 티 시ᄌᆷᄇᆯ로 기ᄋᆸ부도에 ᄋᆼᄒᆼ이치ᄂᆫ수ᄐᆨᄉᆼᄋᆫᄒᆯ ᄀᆺᄋ

ᅡ.

ᆫ ᄂᆫᄆᆫᄋ ᅡ와 ᄀᇀ이 구ᄉᆼ되어 ᄋᆻ다. 2ᄌᆯ이ᄋᆸ부도예초ᄒᆼᄋ ᅮ차고자 ᄌᆨᄋᆼᄃ ᅨᄌᆨᄇᆫᄉᆨᄇ

ᆸ ᄆᆾ 톄ᄒᆨᄉᆼᄇᆸ (또니계ᄒᆨᄉᆼᄇᆸ)에 대해서 ᄉᆯᄆᆼᄒᆫ다. 3ᄌᆯ에ᄂ ᅵᄋᆸ 부도예ᄎᆨᄋ ᅱᄒᆫ ᄇᆫ수ᄃ

ᅢ해 ᄉᆯᄆᆼ과 그 ᄇᆫ수듸 기초데이터ᄅᆯ ᄇᆫᄉᆨᄋᆯ ᄉᆯ시ᄒᆫ다. 4ᄌᆯᄋᆨ ᄇᆫᄉᆨᄇᆼᄇᆸᄃᆯᄋᆨ애 ᄆᆫ디ᄋᆸ부ᄃ

ᅨ초ᄒᆼᄃᆯᄋᆯ애 모ᄒᆼ추ᄌᆼ ᄀᆯ과 ᄆᆾ ᄀᆨ 다시ᄌᆷ 부도예초ᄒᆼ의 ᄐᆨᄉᆼ데 대ᄒᆫ 비교ᄒᆯ ᄀᆺ이다. 5ᄌᆯᄋ

ᆫ재 ᄋᆫ구ᄀᆯ과에 대ᄒᆫ ᄀᆯᄅᆫ ᄆᆾ 제ᄋᆫ아라.

2. 통계적 분석방법론

2.1. 라쏘를 활용한 로지스틱 회귀분석 2.1.1. 로지스틱 회귀모형

ᅩ지스ᄐᆨ 회귀모ᄒᆼᄋ ᆼ긔 톄ᄒᆨ자ᄋᆫ Cox (1958)가 제ᄋᆫᄒ ᆨᄅ ᅩᄒᆼ으로서 ᄃᆨᄅᆸ ᄇᆫ수듸 ᄉᆫᄒ

ᆯᄒᆸᄋᆯ애서 사ᄀᆫ의 ᄇᆯᄉᆼ 가ᄂᆼᄉᆼ예차ᄂᆫ 톄 기ᄇᆸ이다. 로지스ᄐᆨ 회귀모ᄒᆼᄋᆫ ᄌᆼᄉᆫ수가 ᄇ

ᅮᄒᆼ 데이터이고, 새로ᄋᆫ치가 주어ᄌᆻ애 기ᄌᆷ주 자나로 예최ᄂᆫ ᄋᆯ즤 뷰기ᄇᆸ이다. ᄅ

ᅵ스ᄐᆨ 회귀모ᄒᆼᄋᆷ주가 두 개ᄋᆯ ᄀᆼ우에 이ᄒᆼᄒᆼ, ᄇᆷ주가 세개 이ᄉᆼᄋᆯ ᄀᆼ우에 다ᄒᆼᄒᆼ으로 바. ᄅ

ᅵ스ᄐᆨ 회귀모ᄒᆼ에서ᄂᆫ ᄃᆨᄅᆸᄇᆫ수 x가 주어ᄌᆻ애, ᄌᆼᄉᆨᄇᆫ수가 ᄇᆷ주 1에 ᄉᆨᄅᆯ의미하며, ᄃᆨᄅᆸᄇ

ᅮ가 [−∞, ∞] 의 ᄇᆷ위라지며, ᄌᆼᄉᆨᄇᆫ수ᄂᆫ [0, 1]ᅴ ᄇᆷ위라ᄌᆫ다. 여기서 ᄌᆼᄉᆨᄇᆫ수와 ᄉᆯᄆᆼᄇᆫ수ᄅ

ᆯ하노ᄌᆺ ᄒᆷ수ᄂᆫ ᄉᆨ (2.1)과 ᄀᇀ이 ᄌᆼ의 ᄒᆫ다.

ϕ(X = x) = P (y = 1|x) = 1

1 + e

−(β

0

+xβ)

, (2.1)

ᅧ기서 β = (β

1

, ..., β

p

)

T

ᅩᄒᆼ의 모수이고, pᄂᆫ수의 ᄀᆺ수이다. ᄉᆫ(odds)ᄋᆫ ᄉᆯ패ᄒᆨ래비 ᄉ

ᆨ릐 비오써 ᄉᆨ (2.2)과 ᄀᇀ이 ᄌᆼ의 하고, 로ᄌᆺᄇᆫᄒᆫᄋᆯ ᄐᆫ 로지스ᄐᆨ 회귀모ᄒᆼᄋᆫ ᄉᆨ (2.3)에 ᄀ

ᆨ 제시ᄒᆫ다.

odds = ϕ(X = x)

1 − ϕ(X = x), (2.2) logit(odds) = log

 ϕ(X = x) 1 − ϕ(X = x)



= β

0

+ xβ. (2.3)

(3)

2.1.2. 라쏘를 활용한 변수선택법 (Lasso variable selection)

ᅡ쏘 (LASSO, Least Absolute Shrinkage and Selection Operator)ᄂ ᅨᄎ ᆼ호ᄅᆯ 니고, ᄇᆫᄉ

ᆫᄐᆨᄇᆼᄇᆸ으로ᄃᆯᄋᆯ 수 ᄋᆻᄂᆯᄌᆷ회귀ᄇᆫᄉᆨ ᄇᆼᄇᆸ의 ᄋᆯ지다 (Kukreja, 2006). 로지스ᄐᆨ 회귀ᄇᆫᄉᆨᄋ

ᅥ의 의 로그 가노ᄒᆷ수 (Log Likelihood Function)ᄋᆫ L에 최소화ᄅᆯ ᄌᆫᄒᆼᄒᆯ때 회귀계수에 대해 ᄌ

ᆨ조ᄀᆫᄋᆫ 패ᄂᆯ티ᄒᆷ수, λP

p

j=1

j

|, 루가ᄒᆫ 후 ᄉᆨ (2.5)아ᄌᆼ ᄌᆨ게하노수, (β

0

, β

T

)루ᄌᆼᄒᆫᄃ (Tibshirani, 1996). ᅧ기서 Lᄋᆫ ᄉᆨ (2.4)과 ᄀᇀ이 ᄌᆼ의ᄒᆫ다.

L = − log( Y

i:Y

i

=+

p(X

i

) Y

j:Y

j

=−

(1 − p(X

j

))), (2.4)

L + λ

p

X

j=1

j

| , (2.5)

ᅧ기서 λᄀᆹ이 쿠ᄅ ᆼᄒᆫ 제ᄋᆨ조ᄀᆫ으로 모ᄒᆼ이 ᄀᆫᄃᆫ해지고, ᄇᆫ대로 λᄀᆹ이 ᄌᆨ우ᄅ ᆨᄒᆫ 제ᄋᆨ조ᄀᆫᄋ

ᅩ ᄋᆫᄒᆫ 모ᄒᆼ이 ᄇᆸ해ᄌᆫ다. 티, 라쏘내ᄂᆯ티ᄒᆷ수에서 λᄀᆹ이 커ᄌᆯ수례체 죠하지 ᄋᆭᄋᆫᄉ

ᅡ 0이 되어 ᄇᆫ수ᄉᆫᄐᆨ이 가나다. ᄇᆫ ᄂᆫ메서니러ᄒᆫ 라쏘의 ᄐᆨᄉᆼ이애 ᄇᆫ수ᄉᆫᄐᆨᄋᆯ ᄌᆫᄒᆼᄒᆫ ᄒ

ᅩ지스ᄐᆨ 회귀모ᄒᆼ우ᄎᆫ다.

2.2. 랜덤포레스트 (random forest)

ᆫᄃᆷ포레스트ᄂᆫ Breiman (2001)ᅦ 의해 제ᄋᆼᄇᆸ으로써, 부츠트ᄅᆸ ᄇᆼᄇᆸᄋᆯ애서 비ᄑᆫᄒᆼ 모ᄒ

ᅴ 예ᄎᆹ으 ᄑᆼᄀᆫᄋ ᆯ아여 과ᄌᆨᄒᆸ으로 ᄋᆫᄒᆫ 예ᄎᆹ의 ᄇᆫᄋᆯ 지ᄂᆼᄉᆼ비ᄇᆸ의 ᄋᆯ지다. ᄄ

ᆫ 교호ᄌᆨᄋᆼ오려하ᄂ ᅴ사ᄀᆯᄌᆼ나무모ᄒᆼᄋ ᅮᄅ ᆯᄋᆫ다. 하지ᄆᆫ, 모ᄃ ᆫ수ᄋᆯᄋᆼ우ᄌᆼ도ᄒ

ᆫ의 ᄉᆫ계ᄅᆯ ᄂᇁᄋᆯ 수 ᄋᆻ기 때메, ᄇᆫ수리ᄇᆨ우초 추채서 모ᄒᆼ우ᄎᆫ다. ᄌᆨ, ᄅᆫᄃᆷᄑ

ᅦ스녜ᄎᆹ의 ᄑᆫ차와 ᄇᆫᄋᆷ소시키ᄆᆫ서 모ᄒᆼ의 ᄉᆼᄂᆼᄋᆼᄉᆼ시키ᄂᆼᄇᆸ이다. 다으로 ᄅᆫᄃᆷ포ᄅ

ᅳ트의 과ᄌᆼ에 대해 ᄉᆯᄆᆼᄒᆫ다.

의사결정나무모형을 활용한 랜덤포레스트 과정

Step 1ᅮ츠트ᄅᆸ 기ᄇᆸ아아여 ᄃᆼᄋᆯᄒᆫ 데이터 수ᄋᆯᄀᆹ우ᄎᆫ다.

Step 2 ᄎᆫ수 제서 무ᄌᆨ위ᄌᆨ으로 ᄋᆷ의의 ᄇᆫ수ᄅᆫᄐᆨᄒᆫ다.

Step 3ᅮ어ᄌᆫ ᄇᆫ수와 데이터에 의사ᄀᆯᄌᆼ모ᄒᆼ우ᄌᆼᄒᆫ다.

Step 4ᆨ 모ᄒᆼᄋᆯ 태서 추ᄌᆼᄃᆹᄋᆼᄉᆼ비ᄇᆸᄋᆯ애서 최ᄌᆨ의 ᄀᆹ예ᄎᆫ다.

ᅩᄒᆫ ᄅᆫᄃᆷ포레스트 ᄇᆼᄇᆸᄋ ᆫ수의 죠도ᄅ ᅦ시하고 ᄋᆻ네, 다ᄆᆫ ᄉᆫᄒᆼ회귀ᄇᆫᄉᆨ이나 로지스ᄐᆨ 회ᄀ

ᆫᄉᆨ과 ᄀᇀᄋᆫ 톄ᄌᆨᄇᆫᄉᆨ ᄇᆼᄇᆸ과ᄂᆯ리 개ᄇᆯᄇᆫ수의 톄ᄌᆨ 유의ᄉᆼ에 대ᄒᆫ ᄀᆷᄌᆼᄋᆫ ᄌᆫᄒᆼ하지 ᄋᆭ나. ᄃ

ᆫ에 다의 ᄀᇀ이 ᄀᆫᄌᆸᄌᆨᄋᆫ ᄇᆼᄇᆸ으로 ᄇᆫ수의 죠도ᄅᆯᄌᆼᄒᆫ다.

변수 중요도 과정

Step1 ᆨ 부츠트ᄅᆸ 데이터 ᄌᆸᄒᆸ에 ᄉᆼᄉᆼᄃ ᅩᄒᆼ에 대해 Out of Bag (OOB) 오차ᄅ ᅮᄒᆫ다.

(r

i

, i = 1, 2, . . . , t)

Step2 ᆨ 추ᄌᆼᄃ ᅩᄒᆼ에서 ᄐᆨᄌᆼᄇᆫ수의 ᄀᆹᄋᆯ ᄋᆷ의로 뒤ᄉᆩᄋ ᅦ이터 ᄌᆸᄒᆸ에 대해 OOB오차ᄅ

ᆫ다. (e

i

, i = 1, 2, . . . , t)

수치

Table 3.1 Description of bankruptcy, accounting and derived Variables
Table 3.2 Description of Market and derived variables Variables Description Note
Table 4.1 Data description for each trial
Table 4.2 Results of trials T 1 - T 6 Method ACC(%) Option Recall VariableImportance
+2

참조

관련 문서