• 검색 결과가 없습니다.

Gaussian linear structural equation model learning using prior information<sup>†</sup>

N/A
N/A
Protected

Academic year: 2021

Share "Gaussian linear structural equation model learning using prior information<sup>†</sup>"

Copied!
12
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2020, 31

(

4)

,

489–500

사전 지식을 이용한 가우시안 선형 구조 방정식 학습

ᆷᄋᆼᄒ

1

· ᄀᆷ예ᄉ

2

·ᆨᄀᆫᄋ

3

123ᅥ이ᄅᆸ대 톄ᄒᆨᄀ

ᄌ ᅥ

ᆸᄉ ᅮ 2020ᄂ ᅧ ᆫ 6ᄋ ᅯ ᆯ 5ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2020ᄂ ᅧ ᆫ 7ᄋ ᅯ ᆯ 7ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2020ᄂ ᅧ ᆫ 7ᄋ ᅯ ᆯ 13ᄋ ᅵ ᆯ

요 약

ᅦᄋ ᅵᄌ ᅵᄋ ᅡ ᆫ ᄂ ᅦᄐ ᅳᄋ ᅯᄏ ᅳᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄇ ᅧ ᆫᄉ ᅮᄀ ᅡ ᆫ ᄇ ᅡ ᆼᄒ ᅣ ᆼᄉ ᅥ ᆼ ᄀ ᅪ ᆫ ᄀ ᅨ ᄎ ᅮᄅ ᅩ ᆫᄋ ᅳ ᆫ ᄆ ᅩᄌ ᅵ ᆸᄃ ᅡ ᆫᄋ ᅦᄉ ᅥ ᄌ ᅩᄎ ᅡ ᄇ ᅮ ᆯ ᄀ ᅡᄂ ᅳ ᆼ ᄒ ᅡᄃ ᅡᄀ ᅩ ᄋ ᅡ ᆯᄅ ᅧᄌ ᅧ ᄋ ᅵ ᆻ ᄋ

ᅥ ᆻᄋ ᅳᄂ ᅡ, ᄎ ᅬ ᄀ ᅳ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥ ᄋ ᅩᄎ ᅡᄋ ᅴ ᄇ ᅮ ᆫ ᄉ ᅡ ᆫᄋ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄀ ᅡᄋ ᅮᄉ ᅵᄋ ᅡ ᆫ ᄉ ᅥ ᆫᄒ ᅧ ᆼ ᄀ ᅮᄌ ᅩᄇ ᅡ ᆼᄌ ᅥ ᆼᄉ ᅵ ᆨᄋ ᅴ ᄉ ᅵ ᆨᄇ ᅧ ᆯᄀ ᅡᄂ ᅳ ᆼ ᄒ ᅡ ᆷᄋ ᅳ ᆯ ᄌ ᅳ ᆼᄆ ᅧ ᆼᄒ ᅡᄋ ᅧ ᆻ ᄃ

ᅡ. ᄒ ᅡᄌ ᅵᄆ ᅡ ᆫ ᄌ ᅦᄋ ᅡ ᆫ ᄃ ᅬ ᆫ ᄉ ᅵ ᆨᄇ ᅧ ᆯᄉ ᅥ ᆼ ᄌ ᅩᄀ ᅥ ᆫᄋ ᅳ ᆫ ᄃ ᅡᄋ ᅣ ᆼᄒ ᅡ ᆫ ᄒ ᅧ ᆼᄐ ᅢᄋ ᅴ ᄇ ᅧ ᆫᄉ ᅮᄅ ᅳ ᆯ ᄀ ᅡᄌ ᅵ ᆫ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄆ ᅡ ᆫᄌ ᅩ ᆨ ᄒ ᅡᄀ ᅵ ᄋ ᅥᄅ ᅧ ᆸᄃ ᅡ. ᄄ ᅡᄅ ᅡᄉ ᅥ ᄇ

ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄉ ᅡᄌ ᅥ ᆫ ᄌ ᅵᄉ ᅵ ᆨᄋ ᅳ ᆯ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄆ ᅩᄃ ᅦ ᆯ ᄉ ᅵ ᆨᄇ ᅧ ᆯᄉ ᅥ ᆼ ᄀ ᅡᄌ ᅥ ᆼᄋ ᅵ ᄆ ᅡ ᆫᄌ ᅩ ᆨ ᄒ ᅡᄌ ᅵ ᄋ ᅡ ᆭᄃ ᅥᄅ ᅡᄃ ᅩ ᄀ ᅡᄋ ᅮᄉ ᅵᄋ ᅡ ᆫ ᄉ ᅥ ᆫᄒ ᅧ ᆼ ᄀ ᅮᄌ ᅩ ᄇ ᅡ ᆼᄌ ᅥ ᆼ ᄉ ᅵ

ᆨᄋ ᅳ ᆯ ᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄒ ᅡᄂ ᅳ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄌ ᅦᄋ ᅡ ᆫᄒ ᅡ ᆫᄃ ᅡ. ᄌ ᅦᄋ ᅡ ᆫᄒ ᅡᄂ ᅳ ᆫ ᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷᄋ ᅳ ᆫ ᄎ ᅥ ᆺᄇ ᅥ ᆫᄍ ᅢᄅ ᅩ ᄋ ᅵ ᆫᄀ ᅪ ᄆ ᅵ ᆾ ᄇ ᅡ ᆼᄒ ᅣ ᆼᄉ ᅥ ᆼ ᄀ ᅪ ᆫ ᄀ ᅨᄅ ᅳ ᆯ ᄋ ᅡ ᆯᄀ ᅩ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄂ ᅩ ᄃ

ᅳ ᄀ ᅳᄅ ᅮ ᆸ ᄀ ᅪ ᄆ ᅩᄅ ᅳᄂ ᅳ ᆫ ᄂ ᅩᄃ ᅳ ᄀ ᅳᄅ ᅮ ᆸᄋ ᅳ ᆯ ᄂ ᅡᄂ ᅮᄀ ᅩ, ᄃ ᅮᄇ ᅥ ᆫᄍ ᅢᄅ ᅩ ᄆ ᅩᄅ ᅳᄂ ᅳ ᆫ ᄂ ᅩᄃ ᅳ ᄀ ᅳᄅ ᅮ ᆸ ᄋ ᅦᄉ ᅥᄋ ᅴ ᄋ ᅩᄃ ᅥᄅ ᅵ ᆼᄋ ᅳ ᆯ ᄇ ᅮ ᆯᄒ ᅪ ᆨ ᄉ ᅵ ᆯᄉ ᅥ ᆼ ᄌ ᅥ ᆷᄉ ᅮᄅ ᅩ ᄒ ᅡ

ᆨᄉ ᅳ ᆸ ᄒ ᅡᄀ ᅩ, ᄆ ᅡᄌ ᅵᄆ ᅡ ᆨᄋ ᅳᄅ ᅩ ᄌ ᅩᄀ ᅥ ᆫᄇ ᅮ ᄃ ᅩ ᆨᄅ ᅵ ᆸᄀ ᅪ ᆫ ᄀ ᅨᄅ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅡᄋ ᅧ ᄇ ᅧ ᆫᄉ ᅮᄀ ᅡ ᆫ ᄇ ᅡ ᆼᄒ ᅣ ᆼᄉ ᅥ ᆼ ᄉ ᅥ ᆫᄋ ᅵ ᄌ ᅩ ᆫ ᄌ ᅢᄒ ᅡᄂ ᅳ ᆫ ᄌ ᅵ ᄑ ᅡᄋ ᅡ ᆨᄒ ᅡ ᆫᄃ ᅡ. ᄃ ᅡᄋ ᅣ ᆼᄒ ᅡ ᆫ ᄆ

ᅩᄋ ᅴᄉ ᅵ ᆯᄒ ᅥ ᆷᄋ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅡᄋ ᅧ ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥ ᄌ ᅦᄋ ᅡ ᆫᄒ ᅡ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅵ ᄀ ᅵᄌ ᅩ ᆫ ᄋ ᅴ ᄉ ᅥ ᆫᄒ ᅧ ᆼ ᄀ ᅮᄌ ᅩ ᄇ ᅡ ᆼᄌ ᅥ ᆼᄉ ᅵ ᆨ ᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄋ ᅦ ᄊ ᅳᄋ ᅵᄂ ᅳ ᆫ Uncertainty Scoring (US), Greedy DAG Search (GDS), Linear non-Gaussian Models (LINGAM) ᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷ ᄃ

ᆯ ᄀ ᅪ ᄋ ᅵ ᆯᄇ ᅡ ᆫᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄇ ᅡ ᆼᄒ ᅣ ᆼᄉ ᅥ ᆼ ᄇ ᅵᄉ ᅮ ᆫᄒ ᅪ ᆫ ᄀ ᅳᄅ ᅢᄑ ᅵᄏ ᅥ ᆯ ᄆ ᅩᄃ ᅦ ᆯ ᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄋ ᅦ ᄊ ᅳᄋ ᅵᄂ ᅳ ᆫ PC, Greedy Equivalent Search (GES) ᄋ

ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷᄃ ᅳ ᆯ ᄇ ᅩᄃ ᅡ ᄑ ᅧ ᆼᄀ ᅲ ᆫᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄃ ᅥ ᄌ ᅥ ᆼᄒ ᅪ ᆨ ᄒ ᅡᄀ ᅦ ᄀ ᅳᄅ ᅢᄑ ᅳᄅ ᅳ ᆯ ᄎ ᅮᄌ ᅥ ᆼᄒ ᅡᄂ ᅳ ᆫ ᄀ ᅥ ᆺᄋ ᅳ ᆯ ᄒ ᅪ ᆨ ᄋ ᅵ ᆫᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄆ ᅡᄌ ᅵᄆ ᅡ ᆨᄋ ᅳᄅ ᅩ ᄉ ᅵ ᆯᄌ ᅦ 2014 - 2019ᄂ ᅧ ᆫ ᄇ ᅮᄃ ᅩ ᆼ ᄉ ᅡ ᆫ ᄀ ᅥᄅ ᅢ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅦ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄒ ᅢᄉ ᅥ ᆨ ᄀ ᅡᄂ ᅳ ᆼ ᄒ ᅡ ᆫ ᄇ ᅧ ᆫᄉ ᅮᄀ ᅡ ᆫ ᄀ ᅪ ᆫ ᄀ ᅨᄅ ᅳ ᆯ ᄎ ᅡ ᆽᄂ ᅳ ᆫ ᄀ ᅥ ᆺᄋ ᅳ ᆯ ᄒ ᅪ ᆨ ᄋ ᅵ ᆫᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄀ ᅮᄌ ᅩᄒ ᅡ ᆨᄉ ᅳ ᆸ, ᄇ ᅡ ᆼᄒ ᅣ ᆼᄉ ᅥ ᆼ ᄇ ᅵᄉ ᅮ ᆫᄒ ᅪ ᆫ ᄀ ᅳᄅ ᅢᄑ ᅵᄏ ᅥ ᆯ ᄆ ᅩᄃ ᅦ ᆯ, ᄇ ᅦᄋ ᅵᄌ ᅵᄋ ᅡ ᆫ ᄂ ᅦᄐ ᅳᄋ ᅯᄏ ᅳ, ᄉ ᅥ ᆫᄒ ᅧ ᆼ ᄀ ᅮᄌ ᅩ ᄇ ᅡ ᆼᄌ ᅥ ᆼᄉ ᅵ ᆨ, ᄋ ᅵ ᆫᄀ ᅪ ᄀ ᅪ ᆫ ᄀ ᅨ ᄇ

ᅮ ᆫᄉ ᅥ ᆨ.

1. 서론

ᅦ이지ᄋᆫ 네트워크 (Bayesian network) 또ᄂᆼᄒᆼᄉᆼ 비ᄉᆫ흐래피ᄏᆯ 모ᄃᆯ (directed acyclic graph- ical model)ᄋ ᆫ수ᄃ ᆨᄅᆯᄌᆨ 의ᄌᆫ계 또ᄂᆫ ᄋᆫ계ᄅ ᅭᄒᆫ하기 위ᄒᆫ 모ᄃᆯ로서, ᄎᆫ ᄇᆸᄒᆫ ᄋ

ᆨ (domain)에서 ᄇᆯᄒᆯᄉᆼᄋ ᅢᄀᆯ하기 위ᄒᆫ 머ᄉᆫ러ᄂᆼ ᄇᆼᄇᆸ으로 부ᄀᆨ되고 ᄋᆻ다. 이에 따라 의ᄒᆨ, 기ᄉ

ᆨ, 소프트웨어, 스포츠 뱌 다ᄋᆼᄒᆫ 뱌에서 ᄇᆫ수디 이루니스ᄐᆷᄋᆯᄆᆼ하ᄂᆯ외고 ᄋᆻᄃ (Choiᅪ Lee, 2016; Park, 2019; Park과 Park, 2019). 하지ᄆᆫ ᄇᆫ수ᄀᆫ ᄇᆼᄒᆼ셰ᄅᆼ히 ᄎᆽ우 ᄋ

ᅩᄃᆯ ᄉᆨᄇᆯᄉᆼ (model identifiability) 메로 ᄋᆫ해 ᄒᆨᄉᆯ고리즤 개ᄇᆯ에ᄒᆫᄌᆨ으로 이루어ᄌᆻ다.

CPDAG Learning Algorithm ᄉᆯᄆᆼ 대표ᄌᆨᄋᆫ ᄇᆼᄒᆼᄉᆼ 비ᄉᆫᄒ ᅳ래피ᄏᆯ 모ᄃᆯ의 ᄒᆨᄉᆯ고리즈로ᄂ

ᆼᄉᆯᄉᆼ 가ᄌᆼ (faithfulness assumption) 하에서 마코프 ᄃᆼ드ᄅᆸ (Markov equivalence class; MEC)ᄅ

ᆽ우 ᄋᆻᄂᆫ PCᆯ고리좌 Greedy Equivalent Search (GES) ᄋᆯ고리지 ᄋᆻ다. 여기서 ᄎᆼᄉᆯᄉᆼ 가ᄌ

ᄋ ᅵ ᄉ ᅥ ᆼᄀ ᅪᄂ ᅳ ᆫ 2018ᄂ ᅧ ᆫᄃ ᅩ ᄀ ᅪᄒ ᅡ ᆨᄀ ᅵᄉ ᅮ ᆯᄌ ᅥ ᆼᄇ ᅩᄐ ᅩ ᆼᄉ ᅵ ᆫᄇ ᅮᄋ ᅴ ᄌ ᅢᄋ ᅯ ᆫ ᄋ ᅳᄅ ᅩ ᄒ ᅡ ᆫᄀ ᅮ ᆨᄋ ᅧ ᆫᄀ ᅮᄌ ᅢᄃ ᅡ ᆫᄋ ᅴ ᄌ ᅵᄋ ᅯ ᆫᄋ ᅳ ᆯ ᄇ ᅡ ᆮᄋ ᅡ ᄉ ᅮᄒ ᅢ ᆼᄃ ᅬ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅵ ᆷ(NRF- 2018R1C1B5085420).

1

(02504) ᄉ ᅥᄋ ᅮ ᆯ ᄃ ᅩ ᆼ ᄃ ᅢᄆ ᅮ ᆫ ᄀ ᅮ ᄉ ᅥᄋ ᅮ ᆯ ᄉ ᅵᄅ ᅵ ᆸᄃ ᅢᄅ ᅩ 163, ᄉ ᅥᄋ ᅮ ᆯ ᄉ ᅵᄅ ᅵ ᆸᄃ ᅢ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄃ ᅢᄒ ᅡ ᆨᄋ ᅯ ᆫᄉ ᅢ ᆼ.

2

(02504) ᄉ ᅥᄋ ᅮ ᆯ ᄃ ᅩ ᆼ ᄃ ᅢᄆ ᅮ ᆫ ᄀ ᅮ ᄉ ᅥᄋ ᅮ ᆯ ᄉ ᅵᄅ ᅵ ᆸᄃ ᅢᄅ ᅩ 163, ᄉ ᅥᄋ ᅮ ᆯ ᄉ ᅵᄅ ᅵ ᆸᄃ ᅢ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄃ ᅢᄒ ᅡ ᆨᄋ ᅯ ᆫᄉ ᅢ ᆼ.

3

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (02504) ᄉ ᅥᄋ ᅮ ᆯ ᄃ ᅩ ᆼ ᄃ ᅢᄆ ᅮ ᆫ ᄀ ᅮ ᄉ ᅥᄋ ᅮ ᆯ ᄉ ᅵᄅ ᅵ ᆸᄃ ᅢᄅ ᅩ 163, ᄉ ᅥᄋ ᅮ ᆯ ᄉ ᅵᄅ ᅵ ᆸᄃ ᅢ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

(2)

ᅵᄅᆫ 모ᄃᆫ수듸 조ᄀᆫ부 ᄃᆨ례와 그래프에서 ᄇᆼᄒᆼᄉᆼ 비 (d-separation)가 서로 ᄑᆯ요ᄎᆼᄇ

ᅵ며, 이때 ᄇᆼᄒᆼᄉᆼ 비ᄅᆫ 그래프에서 ᄇᆫ수 X와 Y 가 서로 ᄋᆫᄀᆯ되어 ᄋᆻ지 ᄋᆭᄋᆼ우릐미ᄒᆫ다. 또ᄒ

ᅡ코프 ᄃᆼ드리ᄅᆫ ᄋᇁ서 ᄋᆫᄀᆫ 조ᄀᆫ부 ᄃᆨ례ᄃᆯᄋᆯ 규하ᄂ ᅳ래프듸 ᄌᆸᄒᆸ의미ᄒᆫ다. 하ᄌ

ᆫ 대부븨 마코프 ᄃᆼ드ᄅᆸ아나 이ᄉᆼ의 그래프로ᄒᆷ하고 ᄋᆻ기 때메 ᄉᆯ제 그래프루ᄌᆼ하ᄂ

ᅥ려이 ᄋᆻ다 (Spirtes ᄃᆼ, 2000).

ᅡ라서 ᄇᆼᄒᆼᄉᆼ 비ᄉᆫᄒ ᅳ래피ᄏᆯ 모ᄃᆯᄋ ᆼ히 추ᄌᆼ하기 위하여 ᄉᆨᄇᆯᄉᆼ 조ᄀᆫᄋ ᅦᄋᆫ하고, 이ᄅ

ᅡᄂ ᆯ고리ᄌᆷ디 개ᄇᆯ되고 ᄋᆻ다. 티 ᄉᆫᄒᆼ 구조 ᄇᆼᄌᆼᄉᆨᄋ ᆨ사기 위ᄒᆫ ᄇᆼᄇᆸ으로 (Petersᄋ uhlmann, 2014; Parkᅪ Kim, 2020; Shimizu ᄃᆼ, 2006)ᅦ서 ᄀᆨᄀᆨ Greedy DAG Search (GDS) ᄋ

ᅩ리ᄌᆷ, Uncertainty Scoring (US)ᆯ고리ᄌᆷ, LINGAMᆯ고리지 개ᄇᆯ되ᄋᆻ다. 이라세히 ᄉᆯᄆᆼᄒ

ᆫ, (Peters와 B¨uhlmann, 2014)이 제ᄋᆫᄒᆫ GDS ᄋᆯ고리ᄌᆷᄋᆫᄒᆼ 구조 ᄇᆼᄌᆼᄉᆨ의 모다ᄉᆫ오차의 ᄇ

ᅵ ᄀᇀ다ᄂᆫ ᄃᆼᄋᆯ 오차 ᄇᆫ아ᄌᆼ하여 그래프 구조ᄅᆨᄉᆫ다. 하지ᄆᆫ ᄃᆼᄋᆯ 오차 ᄇᆫ 가ᄌᆼᄋᆫ ᄀᆫ ᄆ

ᅵ계ᄋᆯ과 ᄀᇀᄋ ᅦ이터라 ᄒᆯ지라도 ᄆᆫ자기 어ᄅᆸ다. 따라서 (Park과 Kim, 2020)ᄋ ᅩ차의 ᄇᆫ이 ᄇ

ᅡ더라도 그래프 ᄒᆨ시 가ᄂᆫ Uncertainty Scoring (US) ᄋᆯ고리ᄌᆷ애ᄇᆯ하ᄋᆻ다. 그리고 마지ᄆᆨᄋ

ᅩ (Shimizu ᄃᆼ, 2006)ᅵ 제ᄋᆫᄒᆫ LINGAM ᄋᆯ고리즤 ᄀᆼ우 오차의 ᄇᆫ에네ᄋᆨ조ᄀᆫ이 ᄋᆹ지ᄆᆫ 모ᄃ

ᅩ차의 비가우시ᄋᆫ 보라ᄌᆼ하고 ᄉᆫᄒᆼ 구조 ᄇᆼᄌᆼᄉᆨᄋᆨᄉᆫ다 (모ᄃᆯ ᄉᆨᄇᆯᄉᆼ 조ᄀᆫ의 자세ᄒᆫ ᄉᆯᄆᆼᄋ 3ᄌᆯ에서 다라).

ᅡ지ᄆᆫ 위의 세 가지 ᄒᆨᄉᆯ고리ᄌᆷᄃᆯ오ᄃᆯ ᄉᆨᄇᆯᄉᆼ 가ᄌᆼ이 ᄆᆫ자지 ᄋᆭ으ᄆᆫ 모ᄌᆸᄃᆫ에서조차 ᄇᆫ수ᄀ

ᆼᄒᆼ셰ᄅᆽᄂᆺ이 바나다고 ᄋᆯ려져 ᄋᆻ다. 또ᄒᆫ 위에서 ᄋᆫᄀᆫ ᄃᆼᄋᆯ ᄆᆾ 비ᄉᆫ 오차 ᄇᆫ, ᄇ

ᅡ우시ᄋᆫ 오차보와 ᄀᇀ아ᄌᆼᄋᆫ수의 수가 ᄆᆭᄋᆫ ᄇᆨ데이터ᄋᆫᄀᆼ에서ᄂᆫ자기 매우 어ᄅᆸ다. ᄄ

ᅡ서 ᄇᆫ구에서ᄂᆫᄒᆼ 구조 ᄇᆼᄌᆼᄉᆨ의 모ᄃᆯ ᄉᆨᄇᆯᄉᆼ 조ᄀᆫᄋᆫᄇᆨ히 ᄆᆫ자지 ᄋᆭ더라도, 사ᄌᆫ 지ᄉᆨᄋ

ᆼ으로 ᄒᆨᄉᆯ 수 ᄋᆻᄂ ᆼᄇᆸᄋ ᅦᄋᆫᄒᆫ다. 제ᄋᆫ하ᄂ ᅮ조 ᄒᆨᄉ ᆯ고리ᄌᆷᄋ ᅡ와 ᄀᇀ이 세가지 ᄃᆫ계ᄅ

ᅮᄉᆼ다. ᄎᆺᄇᆫ째로 ᄋᆫ과 ᄆᆾ ᄇᆼᄒᆼ셰ᄅᆯ고 ᄋᆻ노드 (node) 그롸 모르노드 그ᄅᆸ아나.

ᅮᄇᆫ째로 모르노드 그레서의 오더ᄅᆼᄋᆯ USᆯ고리제서 사아ᄂᆫ ᄇᆯᄒᆯᄉᆼ ᄌᆷ수리애 ᄒᆨᄉ

ᅡ. 마지ᄆᆨ으로 조ᄀᆫ부 ᄃᆨᄅᆸᄉᆼ ᄀᆷᄌᆼᄋᆯ 타여 ᄇᆫ수ᄀᆫ ᄇᆼᄒᆼᄉᆼ ᄉᆫ이 재하니 파ᄋᆨᄒᆫ다.

ᆫ구의 구ᄉᆼᄋ ᅡ와 ᄀᇀ다. 2ᄌᆯ에서ᄂ ᆼᄒᆼᄉᆼ 비ᄉᆫ흐래피ᄏᆯ 모ᄃᆯ과 가우시ᄋᆫ ᄉᆫᄒᆼ 구조 ᄇᆼᄌ

ᆨ의 이ᄅᆫᄌᆨ 배ᄀᆼᄋᆯᄆᆼ하고, 3ᄌᆯ에서ᄂᆫ ᄇᆫ구에서 제ᄋᆫ하ᄂᆨᄉᆯ고리ᄌᆷᄋᆯᄆᆼᄒᆫ다. 그리고 4ᄌ

ᅦ서ᄂ ᆨᄉ ᆯ고리좌 기즤 ᄇᆼᄇᆸᄃᆯ오의ᄉᆯᄒᆷᄋᆯ 태 비교하며, 5ᄌᆯ에서ᄂ ᅦᄋᆫᄒᆫ ᄒᆨᄉᆯ고리ᄌ

ᆯ 2014 - 2019ᄂᆫ 서이 부ᄃᆫ 데이터에 ᄌᆨ아여 ᄌᆫ세가와 매매가예루ᄅᆫ다. 마지ᄆᆨ으ᄅ 6ᄌᆯ에서ᄂᆫ구의 ᄀᆯ과료ᄋᆨ하며 ᄀᆯᄅᆫᄋᆽ나.

2. 이론적 배경

ᅵ ᄌᆯ에서ᄂᆫ ᄇᆫ ᄂᆫ메 사ᄋᆼᄃᆼᄒᆼᄉᆼ 비ᄉᆫ흐래피ᄏᆯ 모ᄃᆯ의 어와 개ᄂᆷ오개하고, ᄉᆫᄒᆼ 구조 ᄇ

ᆼᄉᆨ에 대ᄒᆫ 기즤 ᄒᆨᄉᆼᄇᆸ에 대해 ᄉᆯᄆᆼᄒᆫ다.

2.1. 방향성 비순환 그래피컬 모델의 기본 개념

ᆼᄒᆼᄉᆼ 그래프 Gᄂᆫ (V, E)ᅩ 표ᄒᆫ되며, V = {1, 2, ..., p}노드듸 ᄌᆸᄒᆸ이고, E ⊂ V ×V 노드ᄀ

ᆫ (edge)듸 ᄌᆸᄒᆸ이다. 노드 j로부터 k로 가ᄂᆼᄒᆼᄉᆼ ᄉᆫ의 ᄀᆼ우 j → k ᄒᆨᄋᆫ (j, k) ∈ Eᅩ 표ᄒᆫᄒᆫ다.

ᅩ드 j의 부모 ᄌᆸᄒᆸ (parents set)ᄋᆫ Pa(j) := {k ∈ V | (k, j) ∈ E},ᅳ ᄇᆫ대라ᄉᆨ ᄌᆸᄒᆸ (children set) Ch(j) := {k ∈ V | (j, k) ∈ E}ᅵ라 ᄒᆫ다. ᄆᆫᄋᆨ 노드 j로부터 k로 가ᄂᆼᄒᆼᄉᆼ ᄀᆼ로가 j → · · · → kᄋ

ᆼ우, jᄂᆫ kᅴ 조ᄉᆼ (ancestor)이고, kᄂᆫ jᅴ 자ᄉᆫ (descendant)ᅵ라 ᄒᆫ다. 이때 노드 j의 자ᄉᆫ ᄌ

ᆸᄋᆫ De(j)ᅵ며, 노드 j의 비자ᄉᆫ ᄌᆸᄒᆸ (non-descendant set)ᄋᆫ N d(j) := V \ ({j} ∪ De(j))ᅵᄅ

(3)

ᆫ다. ᄇᆼᄒᆼᄉᆼ 비ᄉᆫᄒ ᅳ래프ᄂ ᅮ모노드가 자ᄉᆨ노드보다 ᄆᆫ저 위치하ᄂ ᅩ더ᄅᆼ (ordering)ᄋ ᅡ지며, π = (π1, π2, ..., πp)ᅳ로 표기ᄒᆫ다. ᄌᆨ, ᅩᄃᆫ j < kᅦ 대하여 πjᅪ πkᅡ 서로 ᄉᆫ으로 ᄋᆫᄀᆯ되어 ᄋᆻ으ᄆᆫ, πjᆫ드시 πkᅴ 부모노드가. 그리고 ᄋᆸᄅᆨ차수 (in-degree)ᄂᆫ d = maxj|Pa(j)|ᅩ ᄀᆨ 노드가 ᄀ

ᅵ누모 수의 최대ᄀᆹ이다.

ᅳ래프에 대아ᄂᆨᄅᆯᄇᆨ터ᄂᆫ X := (Xj)j∈V,ᅳ래프의 ᄀᆯᄒᆸᄒᆨᄅᆯ보ᄂᆫ P(G) = P(X1, X2, ..., Xp)

ᅳ로 표기ᄒᆫ다. 또ᄒᆫ 노드 j ∈ V 에 대하여, P(Xj| XS)ᄂᆨᄅᆯᄇᆨ터 XS:= {Xs| s ∈ S}ᅡ 주어ᄌᆯ ᄄ Xjᅴ 조ᄀᆫᄇᆨᄅᆯ보릐미ᄒᆫ다. 그래프의 ᄀᆯᄒᆸᄆᆯ도ᄒᆷ수ᄂᆫ ᄋᆫ수배 ᄌᆼ리에 의하여 다와 ᄀᇀ다.

fG(X1, X2, ..., Xp) =

p

Y

j=1

fG(Xj| XPa(j)). (2.1)

ᅵ때 fG(Xj| XPa(j))ᄂᆫ XPa(j):= {Xk : k ∈ Pa(j)}ᅡ 주어ᄌᆯ 때의 Xjᅴ 조ᄀᆫᄇᆨᄅᆯᄆᆯ도ᄒᆷ수이다.

ᆼᄒᆼᄉᆼ 비ᄉᆫ흐래피ᄏᆯ 모ᄃᆯ에 대ᄒᆫ 보다 자세ᄒᆫ 내ᄋᆼᄋᆫ (Lauritzen, 1996; Spirtes ᄃᆼ, 2000)ᅦᄉ

ᅡ기루ᄎᆫᄒᆫ다.

2.2. 선형 구조 방정식과 학습 알고리즘

ᆫᄒᆼ 구조 ᄇᆼᄌᆼᄉᆨ 모ᄃᆯᄋᆨ ᄇᆫ수디 부모 ᄇᆫ수돠 ᄉᆫᄒᆼ계리루고, 서로 ᄃᆨᄅᆸᄋᆫ 가ᄉᆫ오차ᄅ

ᆼᄒᆼᄉᆼ 비ᄉᆫ흐래피ᄏᆯ 모ᄃᆯ의 ᄐᆨᄇᆯᄒᆫ ᄒᆼ태이다. 다ᄋᆷᄋᆫᄒᆼ 구조 ᄇᆼᄌᆼᄉᆨ 모ᄃᆯ의 구조이다:

Xj= βj0+ X

k∈Pa(j)

βjkXk+ ϵj, for all j ∈ V. (2.2)

ᅵ때 (ϵj)j∈Vᅥ로 다ᄅᆫ ᄇᆫ어아나ᄉᆫ오차이다. 이ᄅᆯ ᄒᆼᄅᆯ로 표ᄒᆫ하ᄆᆫ 다와 ᄀᇀ이 쑤 ᄋ

ᅡ:

(X1, X2, ..., Xp)T = B0+ B(X1, X2, ..., Xp)T+ (ϵ1, ϵ2, ..., ϵp)T,

ᅵ때 B0 = (β10, β20, ..., βp0)T ∈ Rpᆯᄑᆫ ᄇᆨ터이고, B = (βjk) ∈ Rp×pᆫ 가지 또나기ᄒ

ᅱ ᄒᆼᄅᆯ이다. ᄉᆫ 가지 ᄒᆼᄅᆯ의 오 [B]jk= βjkᆫ Xkᅡ Xjᅦ ᄋᆼᄒᆼ우ᄂᆼ도라고 ᄒᆯ 수 ᄋᆻ다. ᄄ

ᆫ, ϵ = (ϵ1, ϵ2, ..., ϵp)T ∼ N (0p, Σϵ),ᅧ기서 0p= (0, 0, ..., 0)T ∈ Rpᅵ며 Σϵ∈ Rp×pᅩ차의 ᄇ j2)j∈Vᆯ 오로 ᄀᆽ내ᄀᆨᄒᆼᄅᆯ이다.

ᆫ 가지 ᄒᆼᄅᆯ Bᄂ ᆫ수디 이루ᄂᆫ ᄋᆫ과 ᄆᆾ ᄒᆷ셰ᄅ ᆫᄋᆼ하여 k ∈ Pa(j)라ᄆᆫ βjk ̸= 0이고, k /∈ Pa(j)ᅡᄆᆫ βjk = 0ᄋᆫ 0이 아ᄂᆫ ᄉᆫ 가지 조ᄀᆫ (non-zero edge weights condition)ᄋ ᆫᄌᆫ다.

ᅵ 조ᄀᆫ하에서 가우시ᄋᆫ ᄉᆫᄒᆼ 구조 ᄇᆼᄌᆼᄉᆨ 모ᄃᆯ아코프 조ᄀᆫ (Markov condition)과 ᄋᆫ과ᄌᆨ 최소ᄉᆼ ᄌ

ᆫ (causal minimality condition)ᄋᆫ자여, 다와 ᄀᇀᄋᆫ수듸 조ᄀᆫ부 ᄃᆨᄅᆸ계ᄅᆫ자ᄀ ((Pearl, 2014)): ᅩ도드 j ∈ V 에 대하여,

k ∈ Pa(j) ⇐⇒ Xj̸⊥ Xk| XS, for all Pa(j) \ {k} ⊂ S ⊂ Nd(j) \ {k}. (2.3)

ᅡ지ᄆᆫ ᄇᆼᄒᆼᄉᆼ 비ᄉᆫ흐래피ᄏᆯ 모ᄃᆯᄋᆫ수ᄀᆫ의 ᄌᆨ·ᄀᆫᄌᆸᄌᆨᄋᆫ ᄋᆼᄒᆼᄅᆨᄋᆯᄆᆼᄒᆯ 수 ᄋᆻ다ᄂᆼᄌᆷ에도 ᄇ

ᅮ하고, 추가ᄌᆨᄋᆫ ᄌᆼ보 ᄋᆹ이느래프 ᄒᆨ시 바ᄂᆫ ᄉᆨᄇᆯᄉᆼ (identifiability) 메라지고 ᄋᆻ다. ᄋ

X1 X2

G1

X1 X2

G2

X1 X2

G3

Figure 2.1 Bivariate directed acyclic graphs of G

1

, G

2

and G

3

수치

Figure 4.1 Comparison of the USP algorithm to the US, GDS, LINGAM, PC, and GES algorithms in terms of Hamming distance for the type 1 setting
Figure 4.2 Comparison of the USP algorithm to the US, GDS, LINGAM, PC, and GES algorithms in terms of Hamming distance for the type 2 setting
Table 5.1 Description of variables and their descriptive statistics for real estate transaction data

참조

관련 문서

artificial neural network, nonlinear regression, intersections, structural equation, traffic accident 인공신경망, 비선형 회귀모형, 교차로, 구조방정식,

In this study, we apply to approach multi-level structural equation modeling which is based on the technology acceptance model (TAM).. Participants have responded

An Analysis of Traffic Accident Injury Severity for Elderly Driver on Goyang-Si using Structural Equation Model.. 김`솔`람 Kim,

본 연구에서는 구조방정식모 형(SEM: Structural Equation Model)을 활용하여 버스 이용자의 통행시간에 대한 중요도와 만족도를 동시에 고려할 수