빅 데 이 터
브
리
프
H
I
R
A
H I R A B i g D a t a B r i e f HIRA 빅데이터 브리프 제3권 1호HIRA 빅데이터 활용 가이드 _ 44
1. 원격 접속 통계분석시스템 신청 _ 46 2. 원격 접속 통계분석시스템 이용 _ 49HIRA 빅데이터 분석 사례 _ 20
1. 건강보험 청구데이터를 이용한 질병 네트워크 분석 _ 22 2. 심방세동의 급성 악화에 기여하는 기후요소 및 대기오염 물질 _ 31 3. 돌발성 난청 발병과 기후요소 및 대기오염의 관계에 대한 연구 _ 36보건의료 빅데이터 동향에서는 국내·외 빅데이터 관련 기술 개발,
활용 등 빅데이터와 관련한 최신 동향을 소개하고 있습니다.
보건의료
빅데이터
동향
Ⅰ
1. 들어가는 글
● ●딥러닝(Deep learning)을 필두로 하는 인공지능이 영상 분석, 음성인식 등 다양한 분야에서 우수한성과를보이며,보건의료분야에서도인공지능에대한기대감이높아짐 ● ●실제로의학논문검색엔진인PubMed1)에서인공지능관련키워드로검색되는논문들은그림1과 같이증가하고있음보건의료 분야에서의 인공지능과
기계학습 활용 및 전망
윤덕용교수 아주대학교의료정보학과 [그림 1]연도별인공지능관련키워드를가진논문의수(~2018년)The number of publications
7000 6000 5000 4000 3000 2000 1000 0 1950 1960 1970 1980 1990 2000 2010 2020
Deep learing Machine learing Artificial learing
●
● ●하지만 인공지능을 공부하는데 있어서의 높은 학습 장벽 때문에 아직 보건의료 분야의 많은 연구자들은인공지능에대해막연한기대감만을갖고있는경우가많음 ● ●따라서,본고에서는인공지능,기계학습,딥러닝에대한기본적인개념을간단히설명하고,보건 의료분야에서활용된사례와향후전망에대해살펴보고자함
2. 인공지능과 기계학습
[그림 2]인공지능,기계학습,딥러닝간의관계도식도2.1 인공지능
● ●딥러닝이 인공지능 분야의 대표적인 알고리즘으로 자리잡으면서, 딥러닝이 곧 인공지능으로 표현되는경우가많으나,인공지능은훨씬광범위한개념임 ▶전통적인정의에따르면인간의지능을흉내내는모든프로그램을인공지능이라고할수있음2) ● ●현재과학기술로는실제지능의원리에대해서도자세하게밝히지못하고있기때문에,이를 인공적으로만든다는것은불가능함▶따라서지능의원리는따지지않고프로그램의결과가인간의지능과유사한결과를보인다면 인공지능이라고할수있어,의사결정나무,Supportvectormachine,인공신경망등다양한 알고리즘이존재함 ▶예를들어,어떤전문가의경험을바탕으로작성된단순한순서도(flowchart)기반의프로그램도 입력에대한결과반응이인간의반응과유사하다면인공지능이될수있음
2.2 기계학습
● ●기계학습(machinelearning,ML)은인공지능의여러분야중한분야에속함(그림2) ▶기계학습은다양한방법을이용해서데이터에존재하는어떤패턴을찾아가는특징이있어‘학습’ 이라는단어가붙음 ● ●기계학습은비지도학습(unsupervisedlearning),지도학습(supervisedlearning),강화학습 (reinforcementlearning)으로분류됨 ▶비지도학습 : 학습하는 데이터에 특정 그룹에 대한 정보(label) 없이 데이터 내에 존재하는 패턴을찾는방법으로,그림3의좌측데이터를x,y축의값을기반으로하여우측과같이두 그룹으로나눌수있음 [그림 3]비지도학습결과예시▶지도학습:지도학습은학습하는데이터에특정그룹에대한정보(label)가있어주어진정보에 맞춰패턴을찾는방법으로,그룹에대한정보를바탕으로그림3과동일한데이터를분석한다면 결과는그림4와같이달라짐(화살표) ▶강화학습:강화학습은시행착오를겪으며가장높은보상을받는행동의정책을학습하는분야로, 그림5에서오른쪽으로가능행동은+10점의보상,왼쪽으로가는행동은-10점의패널티를 준다면여러번의시행착오를겪은후,오른쪽으로가는행동이좋다는것을학습하게됨 ▶딥러닝:딥러닝은패턴을학습하는방법,즉알고리즘에대한이름으로그림2에서제시된 바와같이비지도학습,지도학습,강화학습에모두사용될수있음.인공신경망알고리즘을 여러겹(깊게)붙여사용하여딥러닝이라고불리움 [그림 5]강화학습결과예시 정책수립 →오른쪽선택 강화학습 경험(행동,보상)
-10
+10
[그림 4]지도학습결과예시3. 인공지능과 데이터
● ●앞서살펴본바와같이,인공지능의개념은매우광범위하지만현재가장주목받고있는분야는 데이터에기반한방법인기계학습이며,그중에서도딥러닝이비지도,지도,강화학습분야에서 가장활발하게사용되고있음 ▶기계학습알고리즘은데이터로부터패턴을학습하여데이터가많을수록좋은성능을보이며, 특히딥러닝기반모델의경우모델의복잡성이높아더많은데이터가필요함 ● ●대부분의산업분야에서정보화가이루어지고,데이터저장에필요한비용이급격하게감소하면서 가용데이터의양이급속하게증가함 ▶2010년대초반,전세계의데이터양은5zettabytes미만이었지만2018년도에는33zettabytes, 2025년도에는175zettabytes에이를것으로예상되고있음3) ● ●데이터의양이급속하게증가하면서특히많은데이터가요구되는딥러닝의성능이월등하게 좋아짐에따라딥러닝에대한기대가커짐 ▶하지만한사람이생산하는수많은정보중병원에서는아주일부만이수집되고있어,보건의료 분야에서충분한데이터가수집되고있는지고민이필요함 [그림 6]데이터와기계학습알고리즘의성능간의관계 Deep learning Most other algorithms Performance Amount of Data[그림 8]아주대학교병원생체신호데이터수집인프라구축현황 ● ●아주대학교 병원에서는 이러한 문제를 해결하기 위해 병원에서 수집이 가능한 데이터이지만, 놓치고있는데이터들을최대한자동적으로수집할수있는인프라확충에노력하고있음 ▶대표적인예로중환자실및수술실에서측정되는생체신호(심전도,연속측정동맥혈압,호흡 등)를파형데이터원본그대로실시간으로수집하는인프라를구축하여운영중 [그림 7]한사람으로부터수집가능한데이터중수집여부에따른분포 Data not recorded
Data recorded outside the hospital Data recorded in the hospital
▶2019년 3월 현재 기준, 약 11,000여명의 환자로부터 생체신호 데이터를 수집하였으며,
수집된모든파형데이터의총길이는약650년에달함
4. 보건의료 분야에서의 활용 사례
4.1 비지도학습 : 의학용어 유사도 계산 사례
● ●의학용어들간의유사도를계산하기위해서는개별용어들을계산가능하도록수치화하는과정이 필요한데,이를위해의학용어들의사용패턴을학습하게하면각개념들을수치화하여표현할 수있음 [그림 10]Med2Vec을이용한의학용어의수치화예시 ▶각의학용어들은사용된기록만있고,어떠한개념인지에대한label은사용되지않았으며, 단순히전자의무기록내에서사용된패턴만을보고학습하였기때문에비지도학습에해당됨 ▶이렇게수치화된개념들은유사한의학용어를추천해주거나,유사한환자들을찾는데활용될 수있음● ●그림 11은 임상시험 대상자를 찾는 프로그램에 응용된 사례로 특정 약물을 검색하면 비슷한 사용 패턴을 보였던 약물들을, 일부 환자군을 선택하면 유사한 환자군들을 추천해줌으로써 분석과정을지원함 ● ●이렇게비지도학습을통해추출된패턴은원본의고차원데이터에서의미있는인자들이추출된 (추상화된)결과이기때문에,지도학습이나강화학습의입력데이터로유용하게사용될수있음
4.2 지도학습 : 중환자실 내 패혈증 발생 예측 모델 개발 사례
● ●본 연구진은 패혈증이 발생한 환자군에서 패혈증이 발생하기 1시간 전의 생체신호 데이터와 패혈증이발생하지않은환자의생체신호데이터를분석하여,패혈증을조기에예측할수있는 모델을개발하였음 [그림 11]Metformin과유사한사용패턴을보이는약물을추천해주는화면 [그림 12]패혈증예측모델개발연구모식도[그림 13]패혈증예측모델구조 [그림 14]패혈증발생예측모델기반패혈증위험도분석결과예시 ▶예측모델의구조는그림13과같이심전도(ECG),맥박파형(PPG),호흡파형(RESPIMP) 데이터를분석한후,패혈증발생에대한예측여부를결과로내도록되어있음 ▶실제임상데이터에적용ㆍ평가하여현재약85%의정확도를확보하였으며,그림14과같이 시간별로특정환자의패혈증발생위험도를계산할수있음
4.3 강화학습 : 패혈증 환자에 대한 승압제 및 수액 치료 전략
수립 사례
● ●최근Naturemedicine지에발표된논문에따르면,중환자실에서치료했던데이터를기반으로 가상의임상환경을마련해두고,그안에서시행착오를경험하며적절한승압제와수액치료를할 수있도록인공지능모델을학습시킴5) ▶그결과,실제의료진의치료정책보다인공지능의치료정책이더많은환자를살릴수있을 것이라고평가됨 [그림 15]Naturemedicine지에소개된AIclinician논문 (https://www.nature.com/articles/s41591-018-0213-5)5. 미래 전망
● ●앞서살펴본내용들을바탕으로보건의료분야의빅데이터에서인공지능및기계학습이적용되는 과정을보면그림16과같음 [그림 16]보건의료빅데이터기반인공지능적용프로세스개요 ▶보건의료 분야에서 기계학습의 적용을 위해서는 의료현장에서 의미 있는 데이터를 정확히, 많이수집하려는노력이필요함 ▶이렇게 수집된 원본 데이터는 매우 고차원이며 복잡하기 때문에 중요한 특징을 추출하는 과정이필요함(비지도학습) ▶이후 질병의 여부 등을 판단하거나 예측모델의 개발을 위해서 질병에 대한 정보가 포함된 데이터학습이필요함(지도학습) ▶또한다양한임상상황에맞는최적의치료전략을수립하는일도중요함(강화학습)● ●현재앞서나열한프로세스의각부분들혹은몇몇부분들이연계된형태의연구들이활발하게 진행되고있음 ▶각 부분의 연구들에서 우수한 연구 성과들이 도출되고 있어, 향후 가까운 미래에서는 모든 프로세스가연계되어궁극적인AIclinician이등장할수있을것으로기대됨 ● ●AIclinician은다음과같은점에서인간보다우수한능력을보여줄것으로예상됨 ▶환자로부터필요한데이터를보다효율적으로수집함 ▶환자로부터수집한데이터를보다적절하게추상화함 ▶정확한진단을먼저내릴수있음 ▶효과적인치료전략을수립할수있음 ▶데이터및문헌을참고하여새로운지식을보다빠르게습득 ● ●따라서보건의료분야에서활용될인공지능기술에대한관심을넘어,향후개발될AIclinician 과의공존방향에대해서도고민이필요함
참고문헌
1.PubMed.https://www.ncbi.nlm.nih.gov/pubmed/. 2.RussellSJN,Peter.ArtificialIntelligence:AModernApproach (3rded.:UpperSaddleRiver,NewJersey:PrenticeHall;2009. 3.RydningDRJGJ.TheDigitizationoftheWorldFromEdgetoCore.2018. 4.SunECMTBESCCJ.Multi-layerRepresentationLearningforMedicalConcepts. CoRR.2016. 5.KomorowskiM,CeliLA,BadawiO,GordonAC,FaisalAA.TheArtificial IntelligenceClinicianlearnsoptimaltreatmentstrategiesforsepsisinintensive care.NatMed.2018;24(11):1716-1720.HIRA 빅데이터 분석 사례에서는 HIRA 빅데이터를 활용하여 분석된
주요 이슈 분석, 연구 결과 등 다양한 활용 사례를 소개하고 있습니다.
HIRA
빅데이터
분석 사례
Ⅰ
Ⅰ
1. 분석 배경
● ●일반적으로두가지질환간의연관성에대한연구는임상경험과기존연구결과를바탕으로가설 수립후관련데이터를수집하여수행됨 ● ●최근전산기술의발전과새로운분석방법등장으로인해가설수립시데이터를활용하는데이터 기반분석이가능함 ● ●최근대규모데이터와새로운분석방법을적용하여질환간의연관성을조사하기위해해외에서 많은연구들이수행됨 ▶Hidalgo는입원환자의건강보험청구데이터를활용하여질병간의연관성을나타내는네트 워크를구축함(Hidalgoetal.2009.) ▶Roque는전자의무기록으로부터텍스트마이닝과유사성분석을통해,동반상병들을조사함 (Roqueetal.2011.) ● ●건강보험심사평가원환자표본자료(HIRA-NPS)를활용하여국내환자들의자료를기반으로한 질병네트워크를구축하고자함 연구책임자 연구실무자 윤재문 김진희 손기영 서울대학교의과대학 서울대학교의과대학 서울대학교의과대학 본내용은‘JournalofBiomedicalInformatics.61(2016)276–282’에게재된‘Networkanalysisofhumandiseasesusing Koreannationwideclaimsdata’를요약한것임 원문링크:https://doi.org/10.1016/j.jbi.2016.05.002건강보험 청구데이터를 이용한 질병 네트워크 분석
2. 분석 방법과 내용
● ●자료원:건강보험심사평가원환자표본자료(HIRA-NPS)2011 ▶건강보험심사평가원청구자료중무작위층화추출방법을통해추출된자료(전체환자중약 3%)로2011년1,375,842명자료이용 ● ●질병의정의 ▶ICD-10기준2,049개의질병코드중불분명한질병코드,유병률이낮은질병코드를제외하고, 유사질병들을합쳐381개의대표질병코드에대해분석 [그림 1]대표적인질병코드선택흐름도● ●통계분석 ▶Bonferroni보정후검정을사용하여381개질병코드조합에대한P값을계산 (cutoff:P<1.38×10-7) ▶질병코드간연관성은오즈비(Oddsratio)로산출 AB:질병A와B가모두있는대상자수 ANB:질병A는있으나,B는없는대상자수 NAB:질병B는있으나,A는없는대상자수 NANB:질병A와B모두없는대상자수
OR=
A
B/NA
BA
NB/NA
NB3. 분석 결과
● ●연령및성별분포 ▶최소연령은9개월,최대연령은117세이며,평균연령은38.6세(표준편차:±20.7세)임 ▶남성은48.36%,여성은51.64%임 ● ●네트워크분석및시각화 ▶질병코드간의연관성(오즈비)을노드의길이와두께로표현하여쉽게알아볼수있도록시각화 [그림 2]질병네트워크구축흐름도[그림 3]구축된질병네트워크 ● ●질병네트워크분석 ▶72,390개의질병코드쌍중OR이5보다크고,통계적으로유의한(p<1.38×10-7)5,515개 (7.62%)질병코드쌍에대한네트워크를구축함 ▶질병네트워크는질병분포와질병그룹간의관계를보여주고있으며,질병이서로연관되어 복잡한네트워크를형성하고있음
[표 1]유형별질병간의연관성 ● ●질병간의연관성 ▶일반적으로질병간의연관성은다음과같이분류됨 ①공통적인병인,위험을공유하는경우 ②한질병이다른질병의원인이되는경우 ③한질병의치료결과로다른질병이발생하는경우 ④문화적,사회적특성으로인하여두질병이연관된것으로보이는경우 ▶질병간연관성을검토한결과,연관성이있는질병들은유형에따라표1과같이분류할수있음
● ●사망률및이환율의주요원인과관련된질병 ▶‘허혈성심장질환(I20,I21)’,‘뇌혈관질환(I60-I69)’,‘폐암(C34)’,‘기분장애(F30-F34)’와 같은사망률및이환율의주요원인과관련된질병을조사한결과,다음그림과같은결과가 나타남 [그림 4]사망률및이환율의주요원인과관련된질병
4. 결론
● ●본연구는특정질병에초점을맞추기보다는연관성갖는질병들을전체적으로확인하기위해 질병네트워크를구축함 ▶국내에서질병네트워크를구축한최초연구이며,전국민샘플데이터(HIRA-NPS)활용함 ● ●질병네트워크를구축하여질병분포와질병그룹간의관계를확인할수있었으며,이를이해하기 쉽게시각적으로표현함 ▶통계 분석을 통해 유의한 값을 가지는 질병 간의 관계를 찾고, 이를 네트워크 분석을 통해 표현함 ▶질병네크워크는질병간의연관성을확인하고,향후질병간연관성에대한연구계획수립시 활용할수있음 ● ●질병간의연관성에대한구체적인원인과매커니즘을밝히기위해서는추가적인연구가필요함심방세동의 급성 악화에 기여하는 기후요소 및
대기오염 물질
1. 분석 배경
● ●심방세동은치료가필요한가장흔한부정맥으로조기진단및적극적인관리가필요하며,이와 관련된사회경제적비용이증가하고있음 ▶심방세동은심방이불규칙하게수축하는상태로가슴두근거림,숨참,어지럼증등의증상이 나타나며,뇌졸중등의심각한합병증으로이어질수있음 ● ●심근경색이나 급성 심장사와 유의한 관련이 있는 기후인자에 대해서 기존에 많은 연구가 수행되었음 ▶심방세동에대해서도기상변수와의관계에대한연구들이진행되었으나,기후요인이온도로 제한되거나연구집단이소규모인한계가있었음 ● ●본연구에서는심방세동의급성악화와대기온도,상대습도,기압,대기오염등다양한기상및 환경요인의관계를건강보험심사평가원의청구데이터를이용하여분석하고자함 연구책임자 연구실무자 김영훈 안진희 엄태웅 고려대학교의과대학 부산대학교의과대학 부경대학교통계학과 본내용은‘JournalofOccupationalandEnvironmentalMedicine.December2018.Volume60Issue12p1082-1086’에게재된 ‘MeteorologicalFactorsandAirPollutantsContributingtoSeasonalVariationofAcuteExacerbationofAtrialFibrillation’를 요약한것임 원문링크:https://doi.org/10.1097/JOM.00000000000014492. 분석 방법과 내용
● ●자료원:2013년~2015년건강보험청구자료,기상청기후자료,한국환경공단대기오염자료 ● ●대상:I48.0,I48.1,I48.9상병코드(ICD-10)로서울에위치한의료기관의응급실을이용한 환자 ● ●분석방법:심방세동으로서울지역의응급실을이용한환자의인구학적요소를분석하고,이와 기후요소및대기오염요소를Pearson’scorrelationcoefficient분석을사용하여연관성 여부를확인함3. 분석 결과
● ●2013년~2015년사이총7,777건의심방세동급성악화에피소드가발생하였고,이중남성의 비중은55.5%이며,50%이상이65세이상환자임 [표 1]연도별심방세동발생현황(2013~2015년,서울지역)● ●심방세동급성악화의발생현황을월별,계절별로보면계절적변동이뚜렷한것으로나타남(그림1) ▶평균일일발생횟수는다른계절에비해여름이가장낮음(6.71vs7.25,eventsperday, respectively,p=0.005) [표 2]월별평균기후요소및대기오염특성(2013~2015년,서울지역) ● ●연구기간동안평균월간기온은-1.7~26.4℃사이였으며,상대습도와기압의범위는각각 51.3~74.8%,1006.1~1025.4hPa임 ▶여름은 다른 계절보다 기온, 상대습도 및 O3(오존)가 높고, 기압과 PM10(미세먼지), PM2.5 (초미세먼지), NO2(이산화질소), SO2(아황산가스), CO(일산화탄소)는 다른 계절보다 유의 하게낮음 [그림 1]월별(A),계절별(B)심방세동발생(2013~2015년,서울지역)
●
●기후요소및대기오염과심방세동급성악화간연관성을분석한결과,기온,O3,NO2,SO2,CO
와연관이있는것으로나타남(그림2) ▶이벤트발생은기온과음의상관관계(r=-0.058,p=0.056;그림2-A)가있으며,기온을 4분위로나누면보다명확히기온상승에따라감소하는경향이나타남(표3) [그림 2]기후요소및대기오염과심방세동급성악화간연관성(2013~2015년,서울지역) [표 3]기온에따른심방세동급성악화발생비율(2013~2015년,서울지역)
▶대기오염물질과관련하여O3는심방세동악화와유의한음의상관관계(그림2-F)가있으며, NO2와SO2,CO는유의한양의상관관계(그림2-G,H,I)를보임 ● ●세가지기후인자(대기온도,상대습도및기압)를보정한후대기오염물질의영향을재분석한 결과,NO2만이통계적으로유의하게나타남(표4) ▶NO2와심방세동급성악화사이의유의한관계는여성과65세미만연령그룹에서두드러짐 [표 4]기후요소조정후대기오염물질과심방세동의상관관계
4. 결론
● ●우리나라청구데이터와기후관련데이터를분석한결과,심방세동의급성악화는계절적변화가 있음을확인할수있었음 ▶이벤트발생률은여름에가장낮았고,기여한환경요인은기온(음의상관관계)과NO2(양의 상관관계)였음 ▶NO2의영향은여성과65세미만연령그룹에서보다강하게나타났는데,이는그룹간면역 체계와외부노출시간차이로생각됨 ● ●본연구에서활용한데이터는각환자의세부적인임상정보가부족하고,심방세동병발시실제 응급실을방문한환자만을대상으로분석한점등의한계점이존재함 ● ●하지만이벤트발생당일의실제기상요인을분석하였고,계절에따른기후요인및대기오염 물질의변화와심방세동의급성악화간상관관계가있음을입증한것에본연구의의의가있음1. 분석 배경
● ●돌발성난청은3일이내의기간에갑자기발생하는일측성또는양측성의난청으로이비인후과적인 응급질환임 ▶돌발성난청발병의원인은아직정확하게알려지지않았으나바이러스감염,미세혈관문제, 청신경종양,면역문제등이원인으로추정되고있음 ▶돌발성으로발생하는난청으로인하여환자는공포감을느끼고삶의질이저하되며,적절한 시기를놓치면잘호전되지않음 ● ●대기오염은건강위협요소중하나로최근진행되는연구들을통해여러건강문제를야기하는 것으로알려져있음 ▶이로인한건강문제로는입원과응급실방문의증가,심혈관질환및만성호흡기질환의증가, 폐기능저하등이있음 ● ●본 연구에서는 건강보험심사평가원(HIRA)의 데이터와 기상청의 기후 데이터를 이용하여 부산지역의돌발성난청발병과기후요소및대기오염의연관성을확인하고자함돌발성 난청 발병과 기후요소 및 대기오염의
관계에 대한 연구
연구책임자 연구실무자 이일우 이현민 엄태웅 한준희 부산대학교의과대학 부산대학교의과대학 부경대학교통계학과 한림대학교통계학과 본내용은‘AmericanJournalofotolaryngology’에게재예정인‘EffectsofMeteorologicalFactorandAirPollutiononSudden SensorineuralHearingLossUsingtheHealthClaimsDatainBusan,RepublicofKorea’를요약한것임 원문링크:https://doi.org/10.1016/j.amjoto.2019.02.0102. 분석 방법과 내용
● ●자료원:2015년건강보험청구자료,2015년통계청인구자료,2015년부산지역기상청기후 데이터,2015년부산지역대기오염데이터(www.airkorea.or.kr) ● ●대상:연구기간동안주진단명H91.2(돌발성난청)으로진단받고입원치료를받은환자 ● ●분석방법:2015년부산지역에서돌발성난청으로입원치료를받은환자의인구학적요소를 분석하고,일일환자수와일일기후요소및대기오염요소를Pearson’scorrelationcoefficient 분석을사용하여연관성여부를확인함3. 분석 결과
● ●2015년부산지역에서돌발성난청으로입원한환자는817명이었으며,유병률은10만명당 23.4명임 ▶이중여성은467명(남성350명)이며,평균연령은51세임 ▶일일평균입원환자수는2.27명이며,평균입원기간은7.1일임 [그림 1]돌발성난청의성,연령별환자수및유병률(2015년,부산지역)● ●기후요소(평균기온,평균기압,평균이슬점,체감온도등)는계절적경향을보이며,대기오염 (이산화황,오존,질소산화물,미세먼지등)은2월에서6월까지증가되는양상을보임(표1,그림2) ▶돌발성난청환자는4월에가장많고,8월에가장적음 [표 1]기후요소와대기오염기술통계량(2015년,부산지역)
[그림 2]기상요소및대기오염과관련된돌발성난청환자의월별분포(2015년,부산지역) (A)월평균기온과일일기온분포는계절적변화를보임 (B)겨울에는평균풍속과최대풍속이더높음 (C)평균대기압의월별분포는계절변동을보임 (D)평균이슬점및풍속지수의월별분포는평균기온과비슷함 (E,F)대기오염수준은계절변화를보임 (G,H)월평균과최대PM10과PM2.5는늦은겨울과봄에더높음
● ●돌발성난청환자의계절별분포를살펴보면봄에가장많고여름에가장적음 ▶계절별평균비교를위해ANOVA분석결과,계절에따른환자발생은유의한차이가없었으나, 포아송 로그 선형모형을 이용한 오즈비(Odds ratio)추정에서는 여름에 발생한 환자수가 봄보다통계적으로유의하게적음(표2) [표 2]돌발성난청환자의계절발생경향(2015년,부산지역)
● ●돌발성난청환자의발생과기후요소의연관성분석을위해상관분석을실시한결과,평균기온, 일교차,체감기온과환자발생은약한음의상관성을보였으나통계적으로유의하지않음 ▶평균풍속,최대풍속,일간기압차는환자의발생과통계적으로유의한약한양의상관관계를 보임(그림3) [그림 3]돌발성난청환자의입원과기상요소의관계(2015년,부산지역)
●
●돌발성 난청 환자의 발생과 대기오염의 연관성을 분석한 결과, 이산화황, 오존, 질소산화물,
일산화탄소,PM10,일간최대PM10,PM2.5등에서는유의미한상관계수는없음
4. 결론
● ●부산지역의돌발성난청발병률은인구10만명당23.4명이었으며,여성에서더많은경향을 보였고,50대에서가장많음 ▶돌발성난청의발병은봄에많은경향을보였는데이는이전의연구결과와비슷한양상임 ● ●돌발성난청의발병은평균풍속,평균최대풍속,일간기압차와양의상관관계를보였으며,최대 PM2.5와는음의상관관계를보임 ▶기존의돌발성난청과기후요소의상관관계에대한국내연구결과와비슷한결과를보임 ▶대기오염요소와돌발성난청의발생은뚜렷한연관성이없는것으로나타났는데,이는일부 데이터(PM2.5)가2015년부터공개되어분석기간이짧은한계점의영향이있을수있음 ▶또한돌발성난청으로입원한환자만분석한한계점이존재함 ● ●본연구는부산지역에서발생한1년간의환자를분석하였고,지역환자의데이터를활용하여 기후요소와대기오염요소를같이분석하였다는것에의의가있음 ▶향후새로운연관성분석방법과누적된데이터를활용한추가적인연구가필요함HIRA 빅데이터 활용 가이드에서는 HIRA 빅데이터에 대한 구조를
소개하고, 대표적인 통계 분석 방법을 안내하여 연구자들이 좀 더
쉽게 HIRA 빅데이터를 활용할 수 있도록 지원하고자 합니다.
HIRA
빅데이터
활용 가이드
Ⅰ
Ⅰ
Ⅰ
원격 접속 통계분석시스템 신청
1. 빅데이터 분석 이용 신청 1 회원 가입 2 로그인 3 빅데이터분석 이용신청 ‘의료빅데이터’메뉴를선택하여 ‘빅데이터분석이용신청’클릭 ● ●보건의료빅데이터개방시스템(https://opendata.hira.or.kr)에서제공하는서비스종류(3종) ▶공공데이터:연구및R&D사업,프로그램개발등을위한공공데이터제공 ▶의료빅데이터:전문적인분석·연구를위한맞춤형데이터제공 ▶의료통계정보:연도별수요가많은항목(상병,진료행위등)에대한통계자료제공 ● ●본가이드는외부연구자들이주로활용하는원격접속통계분석시스템에대해소개함2. 신청정보 입력 ●●신청구분●:과제성격에따라해당하는분류선택 (연구과제)원격접속을통한일반연구과제 (연구중심병원)「보건의료기술진흥법」에따른연구중심병원 ※해당과제에한함 (공동연구)심사평가원과공동연구(협업과제)를수행하는과제에한함 ●●분석과제명●:IRB(기관생명윤리위원회)심의에제출한과제명 ●●세부과제명●:없을경우분석과제명과동일하게기입 ●●신청기관명●:연구책임자의소속기관 ※주관기관명:발주기관이있을시작성 ●●기관분류●:신청기관의분류에해당하는기관선택 (국가기관)국가기관및지방자치단체 (공공기관)「공공기관의운영에관한법률」에따른공공기관 (대학기관)「고등교육법」에따른대학기관 (의료기관)「의료법」에따른의료기관 (학회및협회)학술단체및의약단체(협회) (산업계)제약회사등산업계 ●●연구기간(예정)●:사용기간선택에따라자동계산 ●●사용기간선택●:월단위는30일로날짜계산 4 개인정보 제공 및 활용 동의 5 ‘기본정보’ 확인 6 ‘과제정보’ 입력 3. 이용자 정보 입력 9 기타 필수항목(*) 입력 7 이용자 구분 책임자,실무자,분석자중 해당하는항목에체크 8 이용자 ID ‘포털ID조회’를클릭하여 회원명,ID로조회·선택 ※회원명으로조회시동명이인주의
12 산출기준 조건에만족하는‘해당명세서’인지 ‘수진자의모든명세서’인지확인 4. 자료 요청 입력 11 분석주제설정 상병,약품,행위중해당하는 항목에체크 ※중복체크가가능하며, 상세조건(‘AND’/‘OR’)선택 13 진료기간 조건에해당하는환자가진료받은 시점기준 14 대상자 추출 환자특성,명세서서식(입원,외래 등),요양기관의기본사항선택 15 대상컬럼 분석시활용할컬럼(변수)을선택할 수있으며,해당테이블을클릭하여 필요한컬럼 16 출력 자료요청완료한후담당자에게 상담신청할수있으며,이용자검토 후이상이없을경우요청완료클릭 ※요청완료클릭후팝업창이뜨면 ‘상담신청’클릭 17 서류제출 담당자상담완료후필수서류제출 ▶자세한내용은‘보건의료빅데이터개방시스템’내공지사항에게시된 ‘연구과제이용신청방법안내’참고
1. 인증서 발급 ①이용승인후‘https://ras.hira.or.kr’접속 ②‘인증센터’클릭 ③‘인증센터’로그인:원격접속시ID,PW와동일함 ④인증서비밀번호(8~30자리영,숫자조합)입력후발급 ⑤인증서는하드디스크에저장
원격 접속 통계분석시스템 이용
2. 원격 접속 통계분석시스템 이용 ①원격접속통계분석시스템로그인
③프로파일설정:수정클릭
⑤프로파일재설정:입력값변경후저장
▶자세한내용은원격접속후바탕화면에있는‘SAS실행가이드(ppt파일)’참고
⑦라이브러리경로확인
발 행 월 2019년●3월 발 행 인 김●승●택 발 행 처 [26465]●강원도●원주시●혁신로●60 전 화 1644-2000 홈 페 이 지 www.hira.or.kr 디자인·기획 전우용사촌(주)
빅 데 이 터
브
리
프
브리프