• 검색 결과가 없습니다.

Partial AUC and VUS using minmax combination method

N/A
N/A
Protected

Academic year: 2021

Share "Partial AUC and VUS using minmax combination method"

Copied!
14
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2021, 32

(

1)

,

1–14

최소최대 조합방법을 이용한 부분 AUC와 VUS

ᆼᄌᆼᄉ

1

· ᄋᆷᄃ

2

12ᆼᄀᆫ개ᄒᆨ교 톄ᄒᆨᄀ

ᄌ ᅥ

ᆸᄉ ᅮ 2020ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 18ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2020ᄂ ᅧ ᆫ 12ᄋ ᅯ ᆯ 4ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2020ᄂ ᅧ ᆫ 12ᄋ ᅯ ᆯ 7ᄋ ᅵ ᆯ

요 약

ᅮ ᄇ ᅥ ᆷᄌ ᅮᄋ ᅪ ᄉ ᅦ ᄇ ᅥ ᆷᄌ ᅮᄋ ᅴ ᄑ ᅡ ᆫᄇ ᅧ ᆯ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅴ ᄉ ᅥ ᆼᄂ ᅳ ᆼᄋ ᅳ ᆯ ᄀ ᅡ ᆨᄀ ᅡ ᆨ ᄑ ᅧ ᆼᄀ ᅡᄒ ᅡᄂ ᅳ ᆫ AUC (area under the ROC curve), ᄇ ᅮ ᄇ

ᅮ ᆫ AUCᄋ ᅪ ᄋ ᅣ ᆼᄇ ᅡ ᆼᄒ ᅣ ᆼ ᄇ ᅮᄇ ᅮ ᆫ AUC ᄀ ᅳᄅ ᅵᄀ ᅩ VUS (volume under ROC surface), ᄇ ᅮᄇ ᅮ ᆫ VUSᄋ ᅪ ᄉ ᅦᄇ ᅡ ᆼᄒ ᅣ ᆼ ᄇ ᅮᄇ ᅮ ᆫ VUSᄅ ᅳ ᆯ ᄎ ᅮᄌ ᅥ ᆼᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅡᄋ ᅧ ᄌ ᅥ ᆯᄃ ᅡ ᆫ ᄒ ᅪ ᆨᄅ ᅲ ᆯᄆ ᅵ ᆯᄃ ᅩᄒ ᅡ ᆷᄉ ᅮᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄀ ᅥᄂ ᅡ ᄇ ᅵᄆ ᅩᄉ ᅮᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄐ ᅩ ᆼ ᄀ ᅨᄅ ᅣ ᆼᄋ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄂ ᅳ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄃ ᅳ ᆯ ᄋ ᅵ ᄋ ᅵ ᆻ ᄃ

ᅡ. ᄃ ᅡᄇ ᅧ ᆫᄅ ᅣ ᆼ ᄇ ᅧ ᆫᄉ ᅮᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄂ ᅳ ᆫ ᄆ ᅡ ᆭᄋ ᅳ ᆫ AUC ᄎ ᅮᄌ ᅥ ᆼᄇ ᅡ ᆼᄇ ᅥ ᆸᄃ ᅳ ᆯ ᄌ ᅮ ᆼ ᄋ ᅦᄉ ᅥ ᄎ ᅬᄉ ᅩᄎ ᅬᄃ ᅢ ᄌ ᅩᄒ ᅡ ᆸᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆫ ᄇ ᅧ ᆫᄉ ᅮᄃ ᅳ ᆯ ᄋ ᅴ ᄎ ᅬᄃ ᅢᄀ ᅡ ᆹᄀ ᅪ ᄎ

ᅬᄉ ᅩᄀ ᅡ ᆹᄋ ᅴ ᄌ ᅩᄒ ᅡ ᆸᄋ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄆ ᅵ ᆫᄀ ᅡ ᆷᄃ ᅩᄋ ᅪ ᄐ ᅳ ᆨ ᄋ ᅵᄃ ᅩᄅ ᅳ ᆯ ᄌ ᅥ ᆼᄋ ᅴᄒ ᅡᄀ ᅩ, AUC ᄄ ᅩᄂ ᅳ ᆫ ᄇ ᅮᄇ ᅮ ᆫ AUCᄅ ᅳ ᆯ ᄎ ᅬᄃ ᅢᄒ ᅪᄒ ᅡ ᆫᄃ ᅡ. ᄇ ᅩ ᆫ ᄋ ᅧ ᆫ ᄀ

ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄎ ᅬᄉ ᅩᄎ ᅬᄃ ᅢ ᄌ ᅩᄒ ᅡ ᆸᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄎ ᅬᄃ ᅢᄒ ᅪᄒ ᅡᄂ ᅳ ᆫ VUSᄅ ᅳ ᆯ ᄌ ᅥ ᆼᄋ ᅴᄒ ᅡᄀ ᅩ, ᄂ ᅡᄋ ᅡᄀ ᅡ ᄎ ᅬᄉ ᅩᄎ ᅬᄃ ᅢ ᄌ ᅩᄒ ᅡ ᆸᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄇ ᅮ ᄇ

ᅮ ᆫ AUCᄋ ᅪ ᄋ ᅣ ᆼᄇ ᅡ ᆼᄒ ᅣ ᆼ ᄇ ᅮᄇ ᅮ ᆫ AUC, ᄇ ᅮᄇ ᅮ ᆫ VUSᄋ ᅪ ᄉ ᅦᄇ ᅡ ᆼᄒ ᅣ ᆼ ᄇ ᅮᄇ ᅮ ᆫ VUSᄅ ᅳ ᆯ ᄌ ᅥ ᆼᄋ ᅴᄒ ᅡᄆ ᅧ ᄀ ᅡ ᆨᄀ ᅡ ᆨᄋ ᅴ ᄇ ᅮ ᆫ ᄑ ᅩᄒ ᅡ ᆷᄉ ᅮᄋ ᅦ ᄃ ᅢᄋ ᅳ ᆼ ᄒ ᅡ ᄂ

ᅳ ᆫ ᄌ ᅥ ᆯᄃ ᅡ ᆫ ᄒ ᅪ ᆨᄅ ᅲ ᆯᄆ ᅵ ᆯᄃ ᅩᄒ ᅡ ᆷᄉ ᅮᄅ ᅩ ᄑ ᅭᄒ ᅧ ᆫᄒ ᅡᄀ ᅩ ᄀ ᅪ ᆫ ᄀ ᅨᄅ ᅳ ᆯ ᄉ ᅥ ᆯᄆ ᅧ ᆼᄒ ᅡ ᆫᄃ ᅡ. ᄃ ᅡᄋ ᅣ ᆼᄒ ᅡ ᆫ ᄌ ᅥ ᆼᄀ ᅲᄇ ᅮ ᆫ ᄑ ᅩᄋ ᅦᄉ ᅥ ᄉ ᅥ ᆯᄌ ᅥ ᆼᄒ ᅡ ᆫ ᄌ ᅥ ᆯᄃ ᅡ ᆫ ᄒ ᅪ ᆨᄅ ᅲ ᆯᄆ ᅵ ᆯᄃ ᅩᄒ ᅡ ᆷᄉ ᅮᄃ ᅳ ᆯ ᄋ

ᅦ ᄃ ᅢᄒ ᅡᄋ ᅧ, ᄋ ᅣ ᆼᄇ ᅡ ᆼᄒ ᅣ ᆼ ᄇ ᅮᄇ ᅮ ᆫ AUCᄋ ᅪ ᄉ ᅦᄇ ᅡ ᆼᄒ ᅣ ᆼ ᄇ ᅮᄇ ᅮ ᆫ VUSᄅ ᅳ ᆯ ᄀ ᅮᄒ ᅡᄀ ᅩ, ᄉ ᅵ ᆯᄌ ᅳ ᆼ ᄌ ᅡᄅ ᅭᄅ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅡᄋ ᅧ ᄒ ᅪ ᆯᄋ ᅭ ᆼᄉ ᅥ ᆼᄋ ᅳ ᆯ ᄐ ᅩᄅ ᅩ ᆫ ᄒ ᅡ ᆫᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄆ ᅵ ᆫᄀ ᅡ ᆷᄃ ᅩ, ᄇ ᅮᄇ ᅮ ᆫ, ᄇ ᅵᄆ ᅩᄉ ᅮ, ᄌ ᅥ ᆯᄃ ᅡ ᆫ, ᄐ ᅳ ᆨ ᄋ ᅵᄃ ᅩ.

1. 서론

ROC (receiver operating characteristic)ᄀᆨᄉᆫᄋᆫ 뷰모ᄒᆼ 또ᄂᆫ 뷰자의 ᄉᆼᄂᆼᄋᆼ가하며 이리ᄀ

ᅪ하ᄂᆼᄇᆸ으로 ᄉᆯ제 ᄌᆯᄇᆼᄋᆯ ᄌᆯᄇᆼ으로 ᄌᆯ 예ᄎᆫ 비ᄋᆯᄋᆫ TPR (true positive rate, hit rate, recall)ᄀ

ᆯ제 ᄌᆼᄉᆼᄋᆯ ᄌᆯᄇᆼ으로 ᄌᆯ몌차니ᄋᆯᄋᆫ FPR (false positive rate, false alarm rate)ᄋᆨᄀᆨ 수ᄌᆨᄎ ᅪ 수ᄑᆼ체 구ᄒᆫᄒᆫ다. 그리고 ᄋᆯᄇᆫᄌᆨ으로 TPRᄋᆫ ᄆᆫᄀᆷ도 (sensitivity)라 하며, ᄋᆷ의의 뷰ᄌᆷ c에 ᄃ

ᅡ여 ᄌᆯᄇᆼᄋᆨᄅᆯᄇᆫ수 X1ᅴ 누ᄌᆨ보ᄒᆷ수ᄂᆫ FX1(c)ᅩ 표ᄒᆫ하고, FPRᄋᆫ 1-티도 (1-specificity)라ᄀ

ᅡ며 ᄌᆼᄉᆼᄋᆨᄅᆯᄇᆫ수 X2ᅴ 누ᄌᆨ보ᄒᆷ수ᄂᆫ FX2(c)ᅩ 나타ᄂᆫ다 (Metz와 Kronman, 1980; Provostᄋ Fawcett, 2001; Pepe, 2003; Fawcett, 2006; Tasche, 2008).

ROC ᄀᆨᄉᆫ 아래의 ᄆᆫᄌᆨᄋᆫ AUC (area under the ROC curve)ᄂᆫ AU C = P r(X1 ≤ X2)ᅩ ᄌᆼ의되며,

ᆫᄇᆯ 모ᄒᆼ의 ᄉᆼᄂᆼᄋᆼ가하ᄂᆫ 초이다. AUC 톄ᄅᆼᄋᆫ 0.5ᅦ서 1.0까지의 ᄇᆷ위ᄅᆽ네 1.0에 가까ᄋ

ᆯ수ᄅᆫᄇᆯᄅᆨ이 ᄌᇂ오ᄒᆼ이라고 ᄒᆯ 수 ᄋᆻ다 (Bradley, 1997; Krzanowski와 Hand, 2009; Engelmann

ᆼ, 2003; Vukᅪ Curk, 2006). 세 ᄇᆷ주ᄅᆯ 뷰ᄒᆯ 때에ᄂᆫ ROC ᄀᆨᄆᆫ (surface)아래의 부피ᄋᆫ VUS (vol- ume under the ROC surface)톄ᄅᆼ, V US = P r(X1 ≤ X2 ≤ X3),아ᄋᆫ다 (Dreiseitl ᄃᆼ, 2000;

Fawcett, 2003; Nakasᅪ Yiannoutsos, 2004; Nakas ᄃᆼ, 2010; Wandishinᅪ Mullen, 2009).

Hongᅪ Cho (2015)ᄂᆫ AUCᅪ VUS 그리고 ROC 다ᄆᆫ체 (manifold)아래 ᄆᆫᄌᆨᄋᆫ HUM (hyper- volume under the ROC manifold)ᄋᆯ ᄆᆫ-휘트니 (Mann-Whitney)톄ᄅᆼ이아여 비모수ᄌᆨᄋᆫ 추ᄌ

1

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (03063) ᄉ ᅥᄋ ᅮ ᆯᄐ ᅳ ᆨᄇ ᅧ ᆯᄉ ᅵ ᄌ ᅩ ᆼ ᄅ ᅩᄀ ᅮ ᄉ ᅥ ᆼᄀ ᅲ ᆫᄀ ᅪ ᆫ ᄅ ᅩ 25-2, ᄉ ᅥ ᆼᄀ ᅲ ᆫᄀ ᅪ ᆫ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

2

(03063) ᄉ ᅥᄋ ᅮ ᆯᄐ ᅳ ᆨᄇ ᅧ ᆯᄉ ᅵ ᄌ ᅩ ᆼ ᄅ ᅩᄀ ᅮ ᄉ ᅥ ᆼᄀ ᅲ ᆫᄀ ᅪ ᆫ ᄅ ᅩ 25-2, ᄉ ᅥ ᆼᄀ ᅲ ᆫᄀ ᅪ ᆫ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄃ ᅢᄒ ᅡ ᆨᄋ ᅯ ᆫᄉ ᅢ ᆼ.

(2)

ᆫ구하ᄋᆻ다. Hong ᄃᆼ (2019)ᄋᆨᄌᆯᄒᆫ 구ᄀᆫ에 제ᄒᆫ두ᄇᆫ AUC (partial AUC),ᆼᄇᆼᄒᆼ 부ᄇᆫ AUC (two-way partial AUC), ᅮᄇᆫ VUS (partial VUS)ᅪ 세ᄇᆼᄒᆼ 부ᄇᆫ VUS (three-way partial VUS)

ᅢ하여 비모수ᄌᆨ ᄇᆼᄇᆸ으로 추ᄌᆼ하ᄋᆻ다. 또ᄒᆫ Hong과 Hong (2019)ᄋᆼᄇᆼᄒᆼ 부ᄇᆫ AUCᅪ 세ᄇᆼᄒᆼ 부ᄇ VUSᄅᆯᄃᆨᄅᆯᄆᆯ도ᄒᆷ수 (truncated probability density function)리아여 표ᄒᆫ하ᄋᆻ다.

ᅮ 쥬ᄋᆨᄅᆯᄇᆫ수가 다ᄇᆫᄅᆨᄅᆯᄇᆨ터ᄋᆯ 때 AUC루하ᄂᆼᄇᆸ이즤 가노비 조ᄒᆸ (likelihood- ratio combination)ᄋ ᅵᄋᆫ ᄇᆼᄇᆸ, 로지스ᄐᆨ 회귀 (logistic regression)ᄅ ᅵᄋᆫ ᄇᆼᄇᆸ (Henley ᄋ McNeil, 1982; Suᅪ Liu, 1993; Heagerty와 Pepe, 1999; Liu ᄃᆼ, 2005; Jinᅪ Lu, 2009)이외에 Liu

ᆼ (2011)ᅵ 제ᄋᆫᄒᆫ 최소최대 조ᄒᆸᄇᆼᄇᆸ (min-max combination)ᄋ ᅵᄋᆫ ᄇᆼᄇᆸ 디 ᄋᆻ다. 티 ᄎ

ᅩ최대 조ᄒᆸᄇᆼᄇᆸᄋ ᆨᄅᆯᄇᆨ터 X1 = {X11, X12, ..., X1k}ᅪ X2 = {X21, X22, ..., X2k}ᅦ서 ᄀᆨᄀᆨ의 ᄎ

ᅩᄀᆹ과 최대ᄀᆹ X1,minᅪ X2,max ᅳ리고 ᄋᆷ의의 뷰ᄌᆷ c에 대하여 ᄆᆫᄀᆷ도와 티도ᄅ ᆼ리하ᄆᆫ ᄆ

ᆷ도= P r(X1,min < c) ≥ P r(X1i < c)ᅪ 티도= P r(X2,max > c) ≥ P r(X2i > c)ᅵ며, X1 X2ᅴ ᄀᆨᄀᆨ의 최대ᄀᆹ과 최소ᄀᆹ X1,maxᅪ X2,minᅦ 대하여ᄂᆫ P r(X1,max < c) ≤ P r(X1i < c) P r(X2,min> c) ≤ P r(X2i > c)ᅵ므로 ᄆᆫᄀᆷ도나 티도ᄅᆼᄉᆼ시키기 위하여 최대ᄀᆹ과 최소ᄀᆹᄋᆨᄌ

ᆫ ᄉᆼ수 α에 대ᄒᆫ 조ᄒᆸ으로 Xα= Xmax+ αXminᅴ ᄒᆼ태리아여 최대화하ᄂᆫ AU CmM(α)나ᄋ

ᅪ ᄀᇀ이 ᄌᆼ의하고, ᄆᆫ-휘트니 톄ᄅᆼ이아여 비모수ᄌᆨ ᄇᆼᄇᆸ으로 표ᄒᆫ하ᄋᆻ다.

AU CmM(α) = P r(X1,max+ αX1,min≤ X2,max+ αX2,min).

ᆫ구에서ᄂᆫ Liu ᄃᆼ (2011)ᅵ 제ᄋᆫᄒᆫ AUC 추ᄌᆼᄇᆼᄇᆸ에 가지 ᄇᆷ주ᄅᆯ 뷰하ᄂᆫ ROC ᄀᆨᄆᆫ으ᄅ

ᆼᄒᆫ VUSᄅ ᅮᄌᆼ하기 위하여 최소최대 조ᄒᆸᄇᆼᄇᆸ이아여 ᄌᆼ의하고, 나아가 ROC 다ᄆᆫ체에 대ᄒ HUMᅳᄅᆼ 가ᄂᆷᄋᆫ구ᄒᆫ다. 그리고 최소최대 조ᄒᆸᄇᆼᄇᆸᄋ ᅵᄋᆫ 부봐 ᄋᆼᄇᆼᄒᆼ 부ᄇᆫ AUC

ᅵ고 부봐 세ᄇᆼᄒᆼ 부ᄇᆫ VUSᄅᆯ Hongᅪ Hong (2019)이 제ᄋᆫᄒᆫ ᄌᆯᄃᆨᄅᆯᄆᆯ도ᄒᆷ수리아여 표ᄒᆫᄒ

ᅡ. 또ᄒᆫ 여러 쥬의 AUC와 VUS리모수ᄌᆨ ᄇᆼᄇᆸᄋᆫ ᄆᆫ-휘트니 톄ᄅᆼ으로 ᄌᆼ리하고, 최소최대 조ᄒ

ᆼᄇᆸ이ᄋᆫ AUC와 VUS의 ᄒᆷ셰ᄉᆨ유도ᄒᆫ다.

ᆫ ᄂᆫ믜 구ᄉᆼᄋ ᅡ와 ᄀᇀ다. 2ᄌᆯ에서ᄂᆫ ROC ᄀᆨᄉᆫ에서 최소최대 조ᄒᆸᄇᆼᄇᆸᄋ ᅵᄋᆫ AUCᄅ ROC ᄀᆨᄆᆫ의 VUSᄅ ᆼ하여 ᄌᆼ의하고, ᄆᆫ-휘트니 톄ᄅᆼ으로 표ᄒᆫᄒᆫ다. 그리고 이ᄅᆫ ᄌᆼ의ᄅᆯ ROC

ᅡᄆᆫ체의 HUM으ᄅᆼᄒᆯ 수 ᄋᆻᄋᆷᄋᆯᄆᆼᄒᆫ다. 3ᄌᆯ에서뇌소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋᆫ 부ᄇᆫ AUCᄅ

ᆼᄇᆼᄒᆼ 부ᄇᆫ AUC ᅢ하여 ᄌᆼ의하고, 이ᄅᆯ ᄆᆫ-휘트니 톄ᄅᆼ으로 표ᄒᆫ하ᄆᆫ서 ᄌᆯᄃᆨᄅᆯᄆᆯ도ᄒᆷ수ᄅ

ᅭᄒᆫᄃ ᅮᄇᆫ AUCᅪ ᄋᆼᄇᆼᄒᆼ 부ᄇᆫ AUCᅴ ᄒᆷᄉ ᅨᄅᆯ 3.1ᄌᆯ과 3.2ᄌᆯ에서 ᄀᆨᄀᆨ 유도ᄒᆫ다. 4ᄌᆯ에서ᄂ ROC ᄀᆨᄆᆫ으ᄅᆼ하여 최소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋᆫ 부ᄇᆫ VUSᅪ 세ᄇᆼᄒᆼ 부ᄇᆫ VUSᄅᆼ의하고, ᄆᆫ-

ᅱ트니 톄ᄅᆼ으로 표ᄒᆫ하ᄆᆫ서 ᄌᆯᄃᆨᄅᆯᄆᆯ도ᄒᆷ수로 표ᄒᆫᄃ ᅮᄇᆫ VUSᅪ 세ᄇᆼᄒᆼ 부ᄇᆫ VUSᅴ ᄒᆷᄉ

ᅨᄅᆯ 4.1ᄌᆯ과 4.2ᄌᆯ에서 ᄉᆯ펴바. 5ᄌᆯ에서나ᄇᆫᄅᆼ ᄌᆼ규보ᄅᆯᄌᆼ하여 최소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋ

ᅡᄋᆼᄒᆫ AUC와 VUSᄅᆯ ᄆᆫ-휘트니 톄ᄅᆼᄋ ᅡ아여 추ᄌᆼ하고, 이ᄅ ᆯᄃᆨᄅᆯᄆᆯ도ᄒᆷ수리아여 ᄀ

ᆫ ᄀᆹ돠 ᄒᆷ셰ᄋᆷ오ᄋᆫ다. 6ᄌᆯ에서ᄂᆫ AUCᅪ VUS에 대ᄒᆫ ᄉᆯ졔제ᄅᆯ 태 ᄇᆫ구에서 제ᄋᆫᄒ

ᅩ 유도혜ᄅᆫᄒᆫ다. 마지ᄆᆨ 7ᄌᆯ에서ᄂᆯᄅᆫ유도하며 ᄒᆼ후 ᄋᆫ구과제에 대해 토ᄅᆫ다.

2. 최소최대 조합방법을 이용한 VUS

ᅲᄒᆯ ᄇᆷ주가 세 가지ᄋᆫ ᄀᆼ우에서 ROC ᄀᆨᄆᆫᄋ ᆨᄅᆯᄇᆫ수 X1, X2, X3ᅴ 누ᄌᆨ보ᄒᆷ수 (cumula- tive distribution function; cdf)ᄋᆫ FX1(x), FX2(x), FX3(x)ᄅ ᅵ아여 뷰ᄌᆷ c1ᅪ c2ᅦ 대하ᄋ (FX1(c1), FX2(c2)−FX2(c1), 1−FX3(c2))ᄅᆨᄀᆨ X, Y, Z츠로 표ᄒᆫᄒᆫ다 (Heckerling, 2001; Petalᄀ Markey, 2005). ᄇᆫ구에서뇌소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋᆫ AUCᄅᆼ하여 최소최대 조ᄒᆸᄇᆼᄇᆸᄋ

ᆫ VUSᄅᆼ의ᄒᆫ다.

(3)

ᆨᄅᆯᄇᆫ수 Xi, i = 1, 2, 3ᅦ 대해 Xi,max+ αXi,min≡ Xi,minmaxᅩ 표기하ᄆᆫ, V U SmM(α)나ᄋ

ᇀᄋᆨᄅᆯᄉᆨ으로 ᄌᆼ의ᄒᆫ다.

Definition 2.1 ᅬ소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋᆫ VUSᄂᆫ V U SmM(α)ᅩ 표기하고 다와 ᄀᇀ이 ᄌᆼ의ᄒ

ᅡ.

V U SmM(α) = P r(X1,minmax≤ X2,minmax≤ X3,minmax).

ᅬ소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋᆫ V U SmM(α)ᄅᆯ Hongᅪ Cho (2015)가 제ᄋᆫᄒᆫ ᄆᆫ-휘트니 톄ᄅᆼ이ᄋ

ᆫ ᄇᆼᄇᆸ으로 추ᄌᆼ하ᄆᆨᄅᆯᄇᆨ터 X1, X2, X3ᅴ 표브기가 ᄀᆨᄀᆨ n1, n2, n3ᆫ ᄀᆼ우에 V USM W(α)

ᅭ기ᄒᆫ다.

Lemma 2.1 V U SmM(α)ᄅᆯ ᄆᆫ-휘트니 톄ᄅᆼ으로 추ᄌᆼ하ᄆᆫ V U SM W(α)ᅩ 표기하고 다와 ᄀᇀᄋ

ᅭᄒᆫᄒᆫ다.

V U S

M W

(α) = 1 n

1

n

2

n

3

n1

X

i=1 n2

X

j=1 n3

X

k=1

I(X

2j,minmax

< X

3k,minmax

|X

1i,minmax

< X

2j,minmax

)

+ 1

2 I(X

2j,minmax

< X

3k,minmax

|X

1i,minmax

= X

2j,minmax

) + 1

2 I(X

2j,minmax

= X

3k,minmax

|X

1i,minmax

< X

2j,minmax

) + 1

2

2

I(X

2j,minmax

= X

3k,minmax

|X

1i,minmax

= X

2j,minmax

) .

Proof : Hongᅪ Cho (2015)의 Theorem 1이아ᄋ

1 n

1

n

2

n

3

n1

X

i=1 n2

X

j=1 n3

X

k=1

I(X

1i,minmax

< X

2j,minmax

< X

3k,minmax

)

= P

n1

i=1

P

n2 j=1

P

n3

k=1

I(X

2j,minmax

< X

3k,minmax

|X

1i,minmax

< X

2j,minmax

) n

3

P

n1

i=1

P

n2

j=1

I(X

1i,minmax

< X

2j,minmax

) × P

n1

i=1

P

n2

j=1

I(X

1i,minmax

< X

2j,minmax

) n

1

n

2

= 1

n

1

n

2

n

3 n1

X

i=1 n2

X

j=1 n3

X

k=1

I(X

2j,minmax

< X

3k,minmax

|X

1i,minmax

< X

2j,minmax

)

ᅨ리아여 V USM W(α)나와 ᄀᇀ이 구ᄒᆯ 수 ᄋᆻ다.

V U S

M W

(α) = 1 n

1

n

2

n

3

n1

X

i=1 n2

X

j=1 n3

X

k=1

I(X

1i,minmax

< X

2j,minmax

< X

3k,minmax

)

+ 1 2

n1

X

i=1 n2

X

j=1 n3

X

k=1

I(X

1i,minmax

= X

2j,minmax

< X

3k,minmax

)

+ 1 2

n1

X

i=1 n2

X

j=1 n3

X

k=1

I(X

1i,minmax

< X

2j,minmax

= X

3k,minmax

)

+ 1 2

2

n1

X

i=1 n2

X

j=1 n3

X

k=1

I(X

1i,minmax

= X

2j,minmax

= X

3k,minmax

) 

(4)

= 1 n

1

n

2

n

3

n1

X

i=1 n2

X

j=1 n3

X

k=1

I(X

2j,minmax

< X

3k,minmax

|X

1i,minmax

< X

2j,minmax

)

+ 1

2 I(X

2j,minmax

= X

3k,minmax

|X

1i,minmax

< X

2j,minmax

) + 1

2 I(X

2j,minmax

< X

3k,minmax

|X

1i,minmax

= X

2j,minmax

) + 1

2

2

I(X

2j,minmax

= X

3k,minmax

|X

1i,minmax

= X

2j,minmax

). □

ROC ᄀᆨᄉᆫ에서 ᄀᆨᄆᆫ으로ᄋᆼ과 유사ᄒᆫ 개ᄂᆷᄋ ᅵ아여 네 가지 ᄇᆷ주ᄅᆯ 뷰하ᄂᆫ k = 4ᅦ서ᄋ ROCᅡᄆᆫ체의 최소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋᆫ HUM의 ᄌᆼ의나와 ᄀᇀᄀ

HU MmM4 (α) = P r(X1,minmax≤ X2,minmax≤ X3,minmax≤ X4,minmax),

V U SM W(α)ᅦ서 k ≥ 5ᄋᆫ ᄀᆼ우ᄋᆫ ROC 다ᄆᆫ체에서 최소최대 조ᄒᆸᄇᆼᄇᆸᄋ ᅵᄋᆫ HUM으로ᄃᆼᄀ

ᅡ다. 그리고 비모수ᄌᆨᄋᆫ 추ᄌᆼ ᄇᆼᄇᆸ으로 HUMM Wk (α) (k ≥ 4)ᅩ Hong과 Cho (2015)의 ᄋᆫ구ᄅ

ᆼ하여 표ᄒᆫ 가나다 (Hong과 Cho, 2015 ᄎᆷ조).

3ᄌᆯ부터ᄂᆫ ROC ᄀᆨᄉᆫ과 ᄀᆨᄆᆫ에서 최소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋᆫ AU CmM(α)ᅪ V USmM(α)ᄅ ᆯᄃ

ᆨᄅᆯᄆᆯ도ᄒᆷ수리아여 AUC, VUSᄅᆼ의하며 ᄋᆫ구ᄅᆯ ᄌᆫᄒᆼᄒᆫ다.

3. 절단확률밀도함수로 표현한 부분 AUC와 양방향 부분 AUC

ᅮᄇᆫ AUC (pAUC)누 ᄌᆯᄃᆫᄌᆷ 사이의 ROC ᄀᆨᄉᆫ의 ᄆᆫᄌᆨ아타내며 (Scurfield, 1996; Mossman, 1999), ᄉᆯ제의 ᄉᆼᄂᆼᄑᆼ가에서ᄂᆫ ᄂᇁᄋᆫ ᄆᆫᄀᆷ도와 티도ᄅᆯ 디에 고려하ᄂᆺ이 죠하기 때메 Yang ᄃ (2019)ᅪ Hong ᄃᆼ(2019)ᄋᆫ ᄆᆫᄀᆷ도와 티도ᄅᆯ 디에 제ᄒᆫᄒᆫ ᄋᆼᄇᆼᄒᆼ 부ᄇᆫ AUC (tpAUC)레ᄋᆫ하ᄋ

ᅡ.

ᆫ구에서ᄂᆫ Hongᅪ Hong (2019)에서 제ᄋᆫᄒᆫ ᄌᆯᄃᆨᄅᆯᄆᆯ도ᄒᆷ수ᄅ ᅵᄋᆫ AUC와 VUSᄅ

ᅡ여 ᄇᆫ수가 다ᄇᆫᄅᆼᄋᆫ ᄀᆼ우에서 최소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋᆫ AUC와 VUSᄅᆯᄃᆨᄅᆯᄆᆯ도ᄒᆷ수로 표ᄒ

ᆫ다. 3ᄌᆯ에서ᄂᆫ AUCᆫ 내ᄋᆼ아루네 우ᄉᆫ 2ᄌᆯ에서와 ᄃᆼᄋᆯ하게 최소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋ AU CmM(α)ᅦ 대하여 Xi,minmaxᆨᄅᆯᄇᆫ수ᄅᆯ Yi, i = 1, 2, . . .ᅡ고 하고,ᆨᄅᆯᄇᆫ수 Y1ᅪ Y2ᆨᄅᆯᄆ

ᅩᄒᆷ수 (probability density function; pdf)와 누ᄌᆨ보ᄒᆷ수ᄅᆨᄀᆨ fY1(·), FY1(·), fY2(·), FY2(·)ᅩ ᄉ

ᆼᄒᆫ다. 최소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋᆫ pAUC나와 ᄀᇀ이 ᄌᆼ의ᄒᆫ다.

pAU CmM(α) = P r(Y1≤ Y2, y01≤ Y2≤ y02) .

ᅬ소최대 조ᄒᆸᄇᆼᄇᆸ이ᄋᆫ pAUC의 ᄆᆫ-휘트니 톄ᄅᆼ이ᄋᆫ 추ᄌᆼᄋᆫ Y1ᅪ Y2ᅴ 표부가 ᄀᆨᄀ n1, n2ᆫ ᄀᆼᄋᆨᄅᆯᄇᆨ터 Y1= {Y11, Y12, ..., Y1n1}과 Y2= {Y21, Y22, ..., Y2n2}ᄋᆯ 때 다와 ᄀᇀ이 표ᄒᆫᄒ

ᆻ다.

pAU CM W(α) = 1 n1n2

n1

X

i=1 n2

X

j=1

I(Y1i< Y2j, y01≤ Y2j≤ y02) +1

2I(Y1i= Y2j, y01≤ Y2j≤ y02) .

참조

관련 문서