• 검색 결과가 없습니다.

Review of the survival analysis methods for genetic data

N/A
N/A
Protected

Academic year: 2021

Share "Review of the survival analysis methods for genetic data"

Copied!
18
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2018, 29

(

6)

,

1391–1408

유전체 자료분석을 위한 생존분석방법에 관한 고찰

ᅵᄉᆼᄋ

1

1ᅦ재ᄒᆨ교 수ᄒᆨ톄ᄒᆨᄇ

ᄌ ᅥ

ᆸᄉ ᅮ 2018ᄂ ᅧ ᆫ 10ᄋ ᅯ ᆯ 15ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2018ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 15ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2018ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 16ᄋ ᅵ ᆯ

요 약

ᄀ ᅪ

ᆫ ᄉ ᅵ ᆷᄋ ᅴ ᄃ ᅢᄉ ᅡ ᆼᄋ ᅵ ᄃ ᅬᄂ ᅳ ᆫ ᄉ ᅡᄀ ᅥ ᆫᄋ ᅵ ᄇ ᅡ ᆯᄉ ᅢ ᆼᄒ ᅡ ᆯ ᄄ ᅢᄁ ᅡᄌ ᅵ ᄀ ᅥ ᆯᄅ ᅵᄂ ᅳ ᆫ ᄉ ᅢ ᆼᄌ ᅩ ᆫ ᄉ ᅵᄀ ᅡ ᆫᄋ ᅳ ᆯ ᄃ ᅡᄅ ᅮᄂ ᅳ ᆫ ᄉ ᅢ ᆼᄌ ᅩ ᆫᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅴ ᄀ ᅡᄌ ᅡ ᆼ ᄏ ᅳ ᆫ ᄐ ᅳ ᆨᄉ ᅥ ᆼᄋ ᅳ ᆫ ᄉ ᅢ

ᆼᄌ ᅩ ᆫ ᄉ ᅵᄀ ᅡ ᆫᄋ ᅵ ᄋ ᅪ ᆫᄌ ᅥ ᆫᄒ ᅡᄀ ᅦ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄃ ᅬᄌ ᅵ ᄋ ᅡ ᆭᄀ ᅩ ᄌ ᅮ ᆼ ᄃ ᅩᄌ ᅥ ᆯᄃ ᅡ ᆫ ᄃ ᅬ ᆫ ᄃ ᅡᄂ ᅳ ᆫ ᄌ ᅥ ᆷᄋ ᅵᄃ ᅡ. ᄋ ᅵᄅ ᅥᄒ ᅡ ᆫ ᄌ ᅮ ᆼ ᄃ ᅩᄌ ᅥ ᆯᄃ ᅡ ᆫᄌ ᅡᄅ ᅭᄋ ᅴ ᄐ ᅳ ᆨᄉ ᅥ ᆼᄋ ᅳ ᆯ ᄀ ᅩᄅ ᅧᄒ ᅡ ᄋ

ᅧ ᄎ ᅮᄌ ᅥ ᆼ, ᄀ ᅥ ᆷᄌ ᅥ ᆼ ᄆ ᅵ ᆾ ᄆ ᅩᄒ ᅧ ᆼᄌ ᅥ ᆨᄒ ᅡ ᆸᄋ ᅦ ᄃ ᅢᄒ ᅡᄋ ᅧ ᄀ ᅩᄌ ᅥ ᆫᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄉ ᅢ ᆼᄌ ᅩ ᆫᄇ ᅮ ᆫᄉ ᅥ ᆨ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄃ ᅳ ᆯ ᄋ ᅵ ᄆ ᅡ ᆭᄋ ᅵ ᄀ ᅢᄇ ᅡ ᆯᄃ ᅬᄋ ᅥᄌ ᅧ ᄋ ᅪ ᆻ ᄋ ᅳᄂ ᅡ, ᄆ ᅡᄋ ᅵᄏ ᅳᄅ ᅩ ᄋ

ᅥᄅ ᅦᄋ ᅵᄌ ᅡᄅ ᅭᄅ ᅳ ᆯ ᄉ ᅵᄌ ᅡ ᆨᄋ ᅳᄅ ᅩ ᄃ ᅢᄋ ᅭ ᆼ ᄅ ᅣ ᆼᄋ ᅴ ᄋ ᅲᄌ ᅥ ᆫᄎ ᅦ ᄌ ᅡᄅ ᅭᄀ ᅡ ᄉ ᅮᄌ ᅵ ᆸᄃ ᅬᄆ ᅧ ᆫᄉ ᅥ ᄋ ᅲᄌ ᅥ ᆫᄌ ᅥ ᆨ ᄌ ᅥ ᆼᄇ ᅩᄋ ᅪ ᄉ ᅢ ᆼᄌ ᅩ ᆫ ᄉ ᅵᄀ ᅡ ᆫᄀ ᅪᄋ ᅴ ᄋ ᅧ ᆫᄀ ᅪ ᆫᄉ ᅥ ᆼ ᄋ ᅧ ᆫᄀ ᅮ ᄀ

ᅡ ᄌ ᅵ ᆫᄒ ᅢ ᆼᄃ ᅬᄆ ᅧ ᆫᄉ ᅥ ᄑ ᅭᄇ ᅩ ᆫ ᄋ ᅴ ᄉ ᅮᄋ ᅦ ᄇ ᅵᄒ ᅡᄋ ᅧ ᄋ ᅥ ᆷᄎ ᅥ ᆼᄂ ᅡᄀ ᅦ ᄆ ᅡ ᆭᄋ ᅳ ᆫ ᄉ ᅮᄋ ᅴ ᄋ ᅲᄌ ᅥ ᆫᄌ ᅥ ᆼᄇ ᅩ ᄇ ᅧ ᆫᄉ ᅮᄃ ᅳ ᆯᄋ ᅳ ᆯ ᄃ ᅡᄅ ᅮᄂ ᅳ ᆫ ᄉ ᅢᄅ ᅩᄋ ᅮ ᆫ ᄐ ᅩ ᆼ ᄀ ᅨᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄇ ᅡ ᆼ ᄇ ᅥ

ᆸᄃ ᅳ ᆯ ᄋ ᅵ ᄉ ᅢ ᆼᄌ ᅩ ᆫ ᄌ ᅡᄅ ᅭᄋ ᅦ ᄒ ᅪ ᆨ ᄌ ᅡ ᆼᄃ ᅬᄋ ᅥ ᆻᄃ ᅡ. ᄀ ᅧ ᆯᄀ ᅪᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄀ ᅵᄌ ᅩ ᆫ ᄋ ᅴ ᄋ ᅵ ᆷᄉ ᅡ ᆼᄌ ᅡᄅ ᅭᄅ ᅩᄆ ᅡ ᆫ ᄀ ᅮᄎ ᅮ ᆨᄃ ᅬ ᆫ ᄐ ᅩ ᆼ ᄀ ᅨᄋ ᅨᄎ ᅳ ᆨ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅦ ᄋ ᅲᄌ ᅥ ᆫᄎ ᅦ ᄌ ᅥ ᆼ ᄇ

ᅩᄀ ᅡ ᄎ ᅮᄀ ᅡᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄀ ᅩᄅ ᅧ ᄃ ᅬ ᆷ ᄋ ᅳᄅ ᅩᄊ ᅥ ᄉ ᅢ ᆼᄌ ᅩ ᆫ ᄒ ᅡ ᆷᄉ ᅮᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄋ ᅨᄎ ᅳ ᆨᄅ ᅧ ᆨᄋ ᅵ ᄒ ᅣ ᆼᄉ ᅡ ᆼᄃ ᅬᄋ ᅥ ᆻᄀ ᅩ, ᄀ ᅢᄋ ᅵ ᆫᄋ ᅴ ᄋ ᅲᄌ ᅥ ᆫᄌ ᅥ ᆼᄇ ᅩᄋ ᅦ ᄄ ᅡᄅ ᅡ ᄃ ᅥ ᄌ ᅥ ᆨ ᄒ ᅡ

ᆸᄒ ᅡ ᆫ ᄎ ᅵᄅ ᅭᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅵᄂ ᅡ ᄎ ᅵᄅ ᅭᄋ ᅣ ᆨᄋ ᅳ ᆯ ᄀ ᅢᄇ ᅡ ᆯᄒ ᅢᄋ ᅣ ᄒ ᅡ ᆫᄃ ᅡᄂ ᅳ ᆫ ᄀ ᅢᄋ ᅵ ᆫᄆ ᅡ ᆽᄎ ᅮ ᆷ ᄋ ᅴᄒ ᅡ ᆨᄋ ᅴ ᄑ ᅵ ᆯᄋ ᅭᄉ ᅥ ᆼᄋ ᅵ ᄇ ᅮᄀ ᅡ ᆨᄃ ᅬᄀ ᅵ ᄉ ᅵᄌ ᅡ ᆨᄃ ᅬᄋ ᅥ ᆻᄃ ᅡ. ᄃ ᅡᄋ ᅣ ᆼ ᄒ ᅡ

ᆫ ᄎ ᅥ ᆷᄃ ᅡ ᆫ ᄉ ᅢ ᆼᄆ ᅮ ᆯ ᄒ ᅡ ᆨ ᄀ ᅵᄉ ᅮ ᆯᄋ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅡᄋ ᅧ ᄉ ᅥᄅ ᅩ ᄃ ᅡᄅ ᅳ ᆫ ᄒ ᅧ ᆼᄐ ᅢᄋ ᅴ ᄃ ᅢᄋ ᅭ ᆼ ᄅ ᅣ ᆼᄋ ᅴ ᄋ ᅲᄌ ᅥ ᆫᄎ ᅦ ᄌ ᅡᄅ ᅭᄅ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅡ ᆸᄒ ᅡᄂ ᅳ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄅ ᅩ ᆫ ᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄋ ᅧ ᆫ ᄀ

ᅮᄃ ᅳ ᆯ ᄋ ᅵ ᄋ ᅵᄅ ᅮᄋ ᅥᄌ ᅵᄆ ᅧ ᆫᄉ ᅥ ᄀ ᅵᄀ ᅨᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅵ ᄉ ᅢ ᆼᄌ ᅩ ᆫᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅦ ᄌ ᅥ ᆸᄆ ᅩ ᆨ ᄃ ᅬᄋ ᅥ ᄆ ᅡ ᆭᄋ ᅳ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄇ ᅡ ᆼᄇ ᅥ ᆸᄃ ᅳ ᆯ ᄋ ᅵ ᄀ ᅢᄇ ᅡ ᆯᄃ ᅬᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄋ ᅧ ᆫ ᄀ

ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄀ ᅵᄌ ᅩ ᆫ ᄋ ᅴ ᄋ ᅵ ᆷᄉ ᅡ ᆼᄌ ᅡᄅ ᅭᄅ ᅳ ᆯ ᄀ ᅵᄇ ᅡ ᆫᄋ ᅳᄅ ᅩ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄒ ᅡᄂ ᅳ ᆫ ᄌ ᅥ ᆫᄐ ᅩ ᆼᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄉ ᅢ ᆼᄌ ᅩ ᆫᄇ ᅮ ᆫᄉ ᅥ ᆨ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄃ ᅳ ᆯᄋ ᅳ ᆯ ᄉ ᅩᄀ ᅢᄒ ᅡᄀ ᅩ, ᄀ ᅩᄎ ᅡᄋ ᅯ ᆫ ᄋ ᅴ ᄋ ᅲ ᄌ

ᅥ ᆫᄎ ᅦ ᄌ ᅡᄅ ᅭᄅ ᅳ ᆯ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅡ ᆫ ᄉ ᅢ ᆼᄌ ᅩ ᆫᄇ ᅮ ᆫᄉ ᅥ ᆨ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄃ ᅳ ᆯ ᄀ ᅪ ᄐ ᅩ ᆼ ᄒ ᅡ ᆸᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄋ ᅲᄌ ᅥ ᆫᄎ ᅦ ᄌ ᅡᄅ ᅭᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅡᄋ ᅧ ᄉ ᅢ ᆼᄌ ᅩ ᆫᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅦ ᄌ ᅥ ᆸᄆ ᅩ ᆨ ᄃ ᅬ

ᆫ ᄀ ᅵᄀ ᅨᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄃ ᅳ ᆯ ᄋ ᅦ ᄃ ᅢᄒ ᅡᄋ ᅧ ᄀ ᅡ ᆫᄅ ᅣ ᆨᄒ ᅡᄀ ᅦ ᄉ ᅡ ᆯᄑ ᅧᄇ ᅩᄀ ᅩᄌ ᅡ ᄒ ᅡ ᆫᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄀ ᅵᄀ ᅨᄒ ᅡ ᆨᄉ ᅳ ᆸ, ᄇ ᅥ ᆯᄌ ᅥ ᆷᄒ ᅡ ᆷᄉ ᅮ, ᄇ ᅵᄆ ᅩᄉ ᅮᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸ, ᄉ ᅢ ᆼᄌ ᅩ ᆫ ᄉ ᅵᄀ ᅡ ᆫ, ᄌ ᅮ ᆼ ᄃ ᅩᄌ ᅥ ᆯᄃ ᅡ ᆫ, ᄐ ᅩ ᆼ ᄀ ᅨᄋ ᅨᄎ ᅳ ᆨ ᄆ ᅩᄒ ᅧ ᆼ.

1. 서론

ᆼᄌᆫᄇᆫᄉᆨ (survival analysis)어ᄄᆫ 시ᄌᆷ에서부ᄐᆷ의 대ᄉᆼ이 되나ᄀᆫ이 ᄇᆯᄉᆼᄒᆯ 때까지 ᄀᆯ리ᄂ

ᆼ지ᄀᆫ (survival time)에 대하여 톄ᄌᆨᄋᆫ 추ᄅᆫ아루ᄂᆫ 뱌이다. ᄉᆼᄌᆫᄇᆫᄉᆨ에서ᄂᆫᄌᆫ하ᄀ ᆫᄎ

ᆫ ᄉᆼ지ᄀᆫ 외에 조ᄌᆯᄃᆫ (censoring)ᅡ료로ᄒᆷ하게 되네 이ᄂᆫ구 기ᄀᆫ 내ᄋᆷ의 대ᄉᆼᄋ

ᅬᄂ ᅡᄀᆫ이 ᄇᆯᄉᆼ하지 ᄋᆭ아 ᄉᆯ제의 ᄉᆼ지ᄀᆫᄋᆫ차지 마ᄂᆼ우가 히 ᄋᆯ어나기 때미다. 이ᄋ

ᇀ이 조ᄌᆯᄃᆫ자료ᄅᆯ ᄇᆫᄉᆨ해야 하ᄂᆺ이 ᄉᆼᄌᆫᄇᆫᄉᆨ의 ᄐᆨᄉᆼ이며 ᄉᆼᄌᆫᄇᆫᄉᆨ의 이롸 ᄇᆼᄇᆸᄃᆯᄋᆫ 조ᄌᆯᄃᆫᄌ

ᅭᄅᆯ ᄇᆫᄉᆨᄒᆯ 수 ᄋᆻ도ᄅ ᅢᄇᆯ되아. ᄋᆷᄉᆼ시ᄒᆷ과 ᄀᇀᄋ ᅩ호트 ᄋᆫ구의 죠ᄒᆫ ᄆᆨᄌᆨᄋ ᅩᄅᆫ 기ᄀᆫ ᄃ

ᅮᄌᆨ조사ᄅᆫ최ᄂᆼ지ᄀᆫ의 ᄉᆼᄌᆷ수루ᄌᆼ하거나 기즤 치료ᄇᆼᄇᆸ과 새로이료ᄇᆼᄇᆸ ᄀᆫ의 ᄉᆼᄌ

ᅦ 유의ᄒᆫ 차이가 나니 여부ᄅᆷᄌᆼ하ᄂ ᆺ이다. 또ᄒᆫ ᄉᆼ지ᄀᆫ과 ᄋᆫᄀᆫᄉᆼ이 ᄋᆻ뇨ᄋᆫᄃᆯᄋᆯ ᄋᆫ구ᄐ

ᅨᄒᆨᄌᆨ, ᄋᆷᄉᆼᄒᆨᄌᆨ,ᆫᄀᆼᄌᆨᄋᆫ 자료도부터 ᄎᆽ아내어 톄예초ᄒᆼ우차ᄂᆺ이다.

ᆫᄐᆼᄌᆨᄋᆫ ᄉᆼᄌᆫᄇᆫᄉᆨ에서 다루누제느게 세 가지로 요ᄋᆨ하ᄆᆫ ᄉᆼᄌᆷ수의 추ᄌᆼ, 그ᄅᆫ의 ᄉᆼᄌᆷᄉ

ᅴ 비교, ᄉᆼ지ᄀᆫ예ᄎᆯ 수 ᄋᆻ뉘ᄒᆷ요ᄋᆫ돠의 ᄋᆫᄀᆫᄉᆼ ᄀᆷᄌᆼ ᄆᆾ 톄모ᄒᆼ의 구치라고 ᄒᆯ 수 ᄋᆻ다.

ᄋ ᅵ ᄂ ᅩ ᆫᄆ ᅮ ᆫᄋ ᅳ ᆫ 2016ᄂ ᅧ ᆫᄃ ᅩ ᄌ ᅥ ᆼᄇ ᅮ(ᄀ ᅭᄋ ᅲ ᆨ ᄀ ᅪᄒ ᅡ ᆨᄀ ᅵᄉ ᅮ ᆯ ᄇ ᅮ)ᄋ ᅴ ᄌ ᅢᄋ ᅯ ᆫ ᄋ ᅳᄅ ᅩ ᄒ ᅡ ᆫᄀ ᅮ ᆨᄋ ᅧ ᆫᄀ ᅮᄌ ᅢᄃ ᅡ ᆫᄋ ᅴ ᄌ ᅵᄋ ᅯ ᆫᄋ ᅳ ᆯ ᄇ ᅡ ᆮᄋ ᅡ ᄉ ᅮᄒ ᅢ ᆼᄃ ᅬ ᆫ ᄀ

ᅵᄎ ᅩᄋ ᅧ ᆫᄀ ᅮᄉ ᅡᄋ ᅥ ᆸ(NRF-2016R1D1A1B03934908)ᄋ ᅵ ᆸᄂ ᅵᄃ ᅡ.

1

(05006) ᄉ ᅥᄋ ᅮ ᆯᄐ ᅳ ᆨᄇ ᅧ ᆯᄉ ᅵ ᄀ ᅪ ᆼ ᄌ ᅵ ᆫᄀ ᅮ ᄂ ᅳ ᆼᄃ ᅩ ᆼ 209, ᄉ ᅦᄌ ᅩ ᆼ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄉ ᅮᄒ ᅡ ᆨᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄇ ᅮ, ᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

(2)

ᅢ표ᄌᆨᄋᆫ ᄉᆼᄌᆷ수 추ᄌᆼᄅᆼᄋᆫ Kaplan-Meier (1958)ᅡ 제ᄋᆫᄒᆫ 비모수ᄌᆨᄋᆫ 카ᄑᆫ-마이어 추ᄌᆼᄅᆼ으로 ᄃ

ᅮ븨 ᄉᆼᄌᆫᄇᆫᄉᆨ ᄀᆯ과에서 ᄎᆽ아부 ᄋᆻ다. 두 그ᄅᆫ의 ᄉᆼᄌᆫᄀᆨᄉᆫᄋᆷᄌᆼ하ᄂᆼᄇᆸ으로노그-쉬 ᄀ

ᆼᄇᆸ이 가ᄌᆼ ᄆᆭᄋᆯ외네 이 ᄇᆼᄇᆸ도 비모수ᄌᆨᄋᆫ ᄀᆷᄌᆼᄇᆸ이다. ᄉᆼ지ᄀᆫ에 대ᄒᆫ 톄예초ᄒᆼ으로ᄂ Cox (1972)ᅡ 제ᄋᆫᄒᆫ ᄏᆨ스모ᄒᆼ으로 위ᄒᆷᄅᆷ수리ᄇᆫ으로 ᄒᆫ 회귀모ᄒᆼ이다. ᄌᆫᄐᆼᄌᆨᄋᆫ ᄉᆼᄌᆫᄇᆫᄉᆨᄋ

ᅵ, ᄉᆼᄇᆯ, ᄋᆫᄌᆼ,ᅡ회 계ᄎᆼᄌᆨ ᄇᆫ수와 ᄀᇀᄋᆫ ᄋᆫ구톄ᄒᆨᄌᆨ 요ᄋᆫ, ᄒᆯᄋᆸ, 케스테ᄅᆯ, BMI, ᄌᆼ크기 돠 ᄀ

ᆫ ᄋᆷᄉᆼᄒᆨᄌᆨ 요ᄋᆫ과 ᄒᆸᄋᆫ여부, 미세ᄆᆫ지 오ᄋᆷ도, 오ᄌᆫ노와 ᄀᇀᄋᆫᄀᆼᄌᆨ 요ᄋᆫᄃᆯ이ᄇᆫ으로 표부ᄋ

ᅵ하여 ᄇᆫ수의 수가 비교ᄌᆨ ᄌᆨᄋᆼ우에 대하여 ᄉᆼᄌᆫ에 대ᄒᆫ 예ᄎᆨᄋᆯᄋᆯ 니ᄂᆫ 톄모ᄒᆼ애ᄇᆯ하ᄂ

ᅮᄇᆼᄇᆸ데 주ᄅᆨ하ᄋᆻ다.

21ᅦ기에 더서서 ᄉᆼᄆᆨ의 최ᄎᆷᄃᆫ 기싀 ᄇᆯᄃᆯ로 유ᄌᆫᄌᆼ보에 대ᄒᆫ DNA microarrays 자료(Eisen

ᆼ, 1998; Alizadeh ᄃᆼ, 2000; Dudoit ᄃᆼ, 2002; Tusher ᄃᆼ, 2001; Lee ᄃᆼ, 2000; Newton ᄃᆼ, 2000)

ᅮᄌᆸᄃ ᅵ후로 SNP (single nucleotide polymorphism), CNV (copy number variant), NGS (next generation sequencing), methylation, protein chips ᄃᆼ (Sebat, 2007; Korn ᄃᆼ, 2008)ᅡᄋᆼᄒᆫ ᄎᆷᄃᆫ ᄉ

ᆨ 기ᄉᆯᄋᆯ 타여 유ᄌᆫ체 자료가 대ᄋᆼ으로 수ᄌᆸ되어 톄ᄌᆨ으로 ᄇᆫᄉᆨᄃᆯ요ᄉᆼ이 ᄀᆸ자ᄋᆻ다. 이ᄅ

ᆫ 유ᄌᆫ자 ᄌᆼ보ᄅᆯ ᄇᆫᄉᆨ하ᄂᆫ 메ᄂ ᆯ교부에 비하여 ᄋᆷᄎᆼ나게 ᄆᆭᄋᆫ수의 수 (유ᄌᆫ자 ᄌᆼ보 수)

ᆽᄂᆫ “ᅡ의 저주 (curse of dimensionality)” (Theodoridis와 Konstantinos, 2008)ᄅᆯ 퍼야 ᄒ

ᆫ 메로 ᄌᆨᄀᆯ되ᄋᆻ다. ᄆᆭᄋᆫ 톄ᄒᆨ자디 이 메의 해ᄀᆯᄎᆨ으로 ᄇᆫ수의 회귀계수에 ᄇᆯᄌᆷᄒᆷ수(penalty function)레ᄒᆫ 조ᄀᆫ으로 두어 ᄉᆯ제로 효과규ᄌᆫ자ᄃᆫᄋᆫᄐᆨᄒᆯ 수 ᄋᆻᄂ ᆼᄇᆸᄃᆯ애ᄇᆯ하ᄋᆻ다.

ᅢ표ᄌᆨᄋᆫ ᄇᆯᄌᆷᄒᆷ수로ᄂᆫ Lasso, Ridge, Elastic-Netᅵ ᄋᆻ으며 ᄇᆯᄌᆷᄒᆷ수리ᄋᆫ ᄇᆼᄇᆸ디 기즤 ᄏᆨᄉ

ᅩᄒᆼ으ᄅᆼ되어 고차의 유ᄌᆫ자 ᄌᆼ보ᄅᆨᄒᆸᄒᆯ 수 ᄋᆻ노ᄒᆼ디 개ᄇᆯ되ᄋᆻ고, 기즤 ᄋᆷᄉᆼᄒᆨᄌᆨᄋᆫ ᄋ

ᆫ에 유ᄌᆫᄌᆼ보루가ᄒᆷ으로써 ᄉᆼ지ᄀᆫ에 대ᄒᆫ 예ᄎᆨᄅᆨᄋᆯ 니ᄂᆫ구디 개ᄇᆯ되ᄋᆻ다.

1990ᄂᆫ에 시ᄌᆨ하여 2003ᄂᆫ도에 ᄌ ᆫᄀᆫ게ᄂ ᅳ로ᄌᆨ트 (www.ornl.gov/sci/techresources/

Human_Genome/index.shtml)에서 ᄒᆫ ᄆᆼ의 개ᄋᆫ으로부터 30ᄋᆨ 개의 DNA ᄌᆼ보래다네 27ᄋᆨ ᄃ

ᅥ라ᄂᆫᄆᆨᄌᆨᄋᆫ 비이 ᄃᆯᄋᆻ네 ᄒᆫ재ᄂᆫ ᄃᆼᄋᆯᄒᆫ ᄌᆨᄋᆸ이 30시ᄀᆫ에 1000ᄃᆯ러의 비으로 가나게 ᄃ

ᆻ다. 개ᄋᆫ의 유ᄌᆫᄌᆼ보에 대ᄒᆫ 자료늬사의 ᄌᆫᄃᆫ과 ᄀᇀ이 ᄀᆫᄀᆼᄉᆼ태라ᄋᆨᄒᆯ 수 ᄋᆻᄂᆫ ᄌᆫᄃᆫ마커로 수ᄋ

ᅡ 더ᄋᆨ 자하누세이다. ᄒᆫ 개ᄋᆫ에 대ᄒᆫ 유ᄌᆫᄌᆼ보도 microarrys, SNP, protein chip, RNA-seq ᄃ

ᅧ러 ᄉᆼᄆᆨ 기소부터 다ᄅᆼ보디 ᄋᆮ어지므로 이와 ᄀᇀ이 서로 다ᄅᆼ태의 유ᄌᆫᄌᆼ보료과ᄌᆨ으ᄅ

ᆸ하여 예ᄎᆨᄅᆨᄋᆯ ᄂᇁᄋᆯ 수 ᄋᆻᄂᆫ 톄ᄌᆨ 모ᄒᆼ우차려ᄂᆫ구디 지ᄉᆨᄌᆨ으로 ᄌᆫᄒᆼ되고 ᄋᆻ다. 이ᄅ

ᆫ 추세ᄂᆫ ᄃᆼᄋᆯᄒᆫ ᄌᆯ히라도 치료ᄋᆨ이나 치료ᄇᆼᄇᆸᄋ ᅢᄋᆫ의 유ᄌᆫ자 ᄌᆼ보에 따라 ᄆᆽ츠로 제가려ᄂ

ᆼᄆᆯ의ᄒᆨ의 개ᄇᆯ로 가솨 되고ᄋᆻ다. 이와 ᄀᇀ이 ᄇᆸ하고 노이즈가 ᄆᆭ아료ᄃᆯᄋᆯ ᄐᆸ하여 ᄋᆯᄌᆼᄒᆫ ᄑ

ᆫᄋᆽ아내네 톄ᄌᆨᄋᆨ리롸 모ᄒᆼᄃᆯ이아니계ᄒᆨᄉᆼᄇᆸᄋᆫ ᄎᆨᄌᆨ듀ᄌᆫ체 자료ᄅᆯ ᄇᆫᄉᆨᄒ

ᅩ자 하ᄂ ᆼᄌᆫᄇᆫᄉᆨ의 수요와 ᄆᆽ며 이미 20여 ᄂᆫ ᄌᆫ부터 ᄋᆷ ᄌᆯᄒᆫᄋᆯ ᄌᆫᄃᆫ하ᄂᆯ외기 시ᄌᆨ하ᄋᆻᄃ (Cruzᅪ Wishart, 2006). 체ᄂᆷ ᄌᆯ희 위ᄒᆷ여부, 재ᄇᆯ여부 ᄆᆾ ᄋᆷ ᄌᆯ희 ᄉᆼᄌᆫᄋᆯ예차기 ᄋ

ᅡ여 artificial neural network (ANN), decision tree (DT), genetic algorithm (GA) 돠 ᄀᇀ이계ᄒ

ᆼᄇᆸ에 기ᄇᆫᄒᆫ 톄ᄌᆨ ᄇᆼᄇᆸ디 ᄉᆼᄌᆫᄇᆫᄉᆨ에서 크ᄀ ᆯ외고 ᄋᆻ다. ᄋᇁ으로뉴ᄌᆫ체 ᄌᆼ보ᄈ ᆫ 아ᄂ

ᅡ ᄌᆫᄉᆫᄒᆫ ᄇᆼ이레이터까지 ᄐᆸᄒᆫ 자료ᄅᆯ ᄇᆫᄉᆨ하기 위하여 ᄃᆸ러ᄂᆼ (deep learning)의 기ᄇᆸᄃ

ᅩᄋᆸ되누세로 ᄇᆯᄌᆫᄃᆯ ᄀᆺ으로 ᄌᆫ마.

ᆫ구에서ᄂᆼᄌᆫᄇᆫᄉᆨ의 기초ᄌᆨᄋᆫ 개ᄂᆷ과 이레 대하여 ᄀᆯᄌᆨ으로 소개하고 시대의 흐레 따ᄅ

ᆯᄌᆫ해 ᄋᆼᄌᆫᄇᆫᄉᆨ ᄇᆼᄇᆸ데 대하여 ᄉᆯ펴보고자 ᄒᆫ다. ᄆᆫ저 2ᄌᆯ에서 ᄉᆼᄌᆫᄇᆫᄉᆨ에서 다루니초ᄌᆨᄋᆫ ᄋ

ᅪ ᄒᆷ수에 대하여 ᄀᆫᄃᆫ하게 소개하고, 3ᄌᆯ에서 ᄌᆫᄐᆼᄌᆨᄋᆫ ᄉᆼᄌᆫᄇᆫᄉᆨ ᄇᆼᄇᆸᄃᆯᄋ ᅩ개하ᄀᆻ다. 4ᄌᆯ에서ᄂ

ᅩ차의 유ᄌᆫ체 자료ᄅᆯ ᄇᆫᄉᆨ하기 위ᄒᆫ 톄ᄌᆨᄋᆫ ᄇᆼᄇᆸ다여 ᄉᆯ펴보고, 5ᄌᆯ에서니계ᄒᆨᄉ

ᆫᄃᆫ ᄉᆼᄌᆫᄇᆫᄉᆨ ᄇᆼᄇᆸ데 대하ᄋᆯ외녜ᄅᆯ ᄌᆼᄉᆷ으로 소개하고 6ᄌᆯ에 ᄀᆯ르로 ᄇᆫ ᄂᆫᄆᆫᄋᆯ ᄁᇀᄆᆽᄋ

ᅩ자 ᄒᆫ다.

수치

Table 4.1 Prostate cancer data: comparing different methods Method Test mean-squares error Variable selected

참조

관련 문서

We suggest a clinical model using an alternative statistical analysis including hierarchical clustering and nonlinear regression methods for predicting a drug response to

With the measured piezoelectric active-sensing data, basic statistics, which include first four statistical moments and normality test, were used to extract damage

Keywords: Arabidopsis, false discovery rate, false nondiscovery rate, family-wise error rate, gene expression data, multiple testing. † This research was supported by

While user experience research has been traditionally opted for survey or observation methods, this paper utilized big data analysis method for user

Seven different edge detection methods were comparatively analyzed using synthetic magnetic data for prism models, with variations in the sizes, numbers, and spacing

This study was initiated to evaluate the performance of density values that were estimated using VDS data and two traditional methods, including a method using traffic flow

This study uses the Mean-Field Bias (MFB) and Statistical Objective Analysis (SOA) as correction methods to create adjusted grid-based radar rainfall data which can represent

The results have demonstrated that our proposed methods identified target genes better than the original method, SAM, for both simulation studies and real data analysis.. Using