• 검색 결과가 없습니다.

Li-Lee 모형에서 준거집단의 선택 문제 논문보기 | 통계개발원

N/A
N/A
Protected

Academic year: 2021

Share "Li-Lee 모형에서 준거집단의 선택 문제 논문보기 | 통계개발원"

Copied!
25
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)
(2)

이와 같은 배경에서 본 연구는 LL의 예측 정확성을 개선하려는 시도 차원에서, 다 양한 준거집단 선택의 효과를 살펴보고자 한다. 구체적으로 사망률의 국가별 수렴 현 상에 근거하여, 준거집단의 지역적 범주를 확장하는 방식으로 준거집단을 다양화하고, 평균 제곱근 오차(Root Mean Square Error)를 이용해 각 준거집단별 평가·비교를 수 행한다. 결과적으로 남자 사망률은 준거집단의 지역적 범주를 확장함으로써 예측 정확성이 개선되는 경향을 보였다. 반면, 여자는 여자의 사망률만을 고려해 지역 범주를 확장함 으로써 예측 정확성이 개선되는 것을 확인했다. 이러한 성별 차이가 생기는 원인은 다양하겠지만, 필자들은 연령별 사망률 변동성의 성별 차이가 한 가지 이유가 될 수 있을 것으로 추측했다. 이상을 위한 논의의 순서는 다음과 같다. 2절에서는 분석 자료인 Human Mortality Database(이하 HMD)와 모형을 살펴보고, 준거집단 선택 문제와 예측 정 확 성(prediction accuracy)의 평가 지표를 소개한다. 3절에서는 준거집단 선택에 따른 분 석 결과를 제시하고, 마지막 4절에서는 결론을 도출한다.

2. 연구의 설계

본 절에서는 본격적인 논의에 앞서 분석을 위해 사용할 데이터와 모형에 대해 먼 저 설명한다. 그리고 연구에서 쟁점이 되는 준거집단에 대해 논의하고, 분석 결과의 성과를 평가하기 위해 사용할 측도에 대해 설명한다. 2.1 데이터 연구에서는 분석을 위해 HMD에서 제공하는 사망률 데이터를 사용한다. 분석 대 상은 유럽대륙의 OECD 국가 중 1950년부터 2010년까지의 데이터가 존재하는 국가이 다. 이에 해당되는 국가는 총 15개국으로 서유럽 5개국, 동유럽 3개국, 북유럽 4개국, 남유럽 3개국이다(<표 2.1> 참조). <표 2.1> 분석 대상 국가 권역 서유럽 동유럽 북유럽 남유럽 국가 네덜란드, 오스트리아, 벨기에, 프랑스, 스위스 체코, 헝가리, 슬로바키아 덴마크, 스웨덴, 핀란드, 노르웨이 스페인, 포르투갈, 이탈리아 데이터의 연령 범위는 0~99세이고, 분석 기간인 1950~2010년 중 모형 적합 기간은 1950~1989년, 예측의 평가를 위한 기간은 1990~2010년으로 한다. 그리고 데이터의 사

(3)

망률이 0이거나 결측인 불완전 데이터 원소(incomplete data element)는 통계패키지 R의 demography 패키지(Hyndman et al, 2014)의 smooth.demogdata 함수를 이용해 보정했다. 보정에 이용한 평활화(smoothing) 방법은 가중 제약 벌점화 회귀 스플라인 (weighted constrained penalized regression splines)이다(Hyndman et al, 2007, p.4945). <표 2.2> 불완전 데이터 원소의 비율 국가 남녀 남자 여자 국가 남녀 남자 여자 국가 남녀 남자 여자 네덜란드 0 0 0 체코 0 0 0 핀란드 0 0.0021 0.0007 오스트리아 0 0.0003 0.0003 헝가리 0 0 0 노르웨이 0 0.0003 0.0028 벨기에 0 0 0 슬로바키아 0 0.0015 0.0007 스페인 0 0 0 프랑스 0 0 0 덴마크 0.0002 0.0003 0.0016 포르투갈 0 0 0 스위스 0 0.0003 0.0008 스웨덴 0 0 0.0007 이탈리아 0 0 0 불완전 데이터 원소의 비율(불완전 데이터 원소 개수/데이터 원소 개수)은 <표 2.2>와 같다. 노르웨이 여자 데이터가 0.0028로 가장 높은 불완전 데이터 원소의 비율 을 보이는데 이는 낮은 비율이므로 불완전 데이터로 인한 문제는 고려치 않는다. 2.2 모형 지금까지 개발된 사망률 전망 모형들의 종류는 다양하지만(우해봉 등, 2016, p.36), 본 연구 목적이 준거집단에 대한 논의이므로 LC와 LL만 살펴보도록 한다. Lee & Carter(1992)는 사망률 전망을 위한 확률모형인 LC를 제안했다. LC는 연령별 사망률 데이터의 구조만을 기초로 사망률을 전망하는 모형이다. LC는 다음과 같다. log       위 식에서  는 연도의 세 사망률, 는 연령별 로그사망률의 평균, 는 시 간에 따른 사망률의 변화 정도, 는 연도별 사망률 변화에 따른 연령별 사망률의 변 화 정도를 나타낸다. 그리고  는 평균이 0, 분산이 인 분포를 갖는다.

LC는 log    행렬에 특이값 분해(singular value decomposition)을 이용하

여 사망률 데이터 변동을 가장 크게 설명하는 부분을 추출하는 방식을 택한다. 즉, 사 망률 데이터를 순위(rank) 1로 근사하는 방식으로 간단히 계산할 수 있다.  ×  log   를  ×  ×  ×  로 분해하여 는

       , 는   

  를 얻을 수 있다. 위의 설명과 같이 LC는 간결한 모형이며, 과거 사망률의 연도별, 연령별 자료 구 조의 특성만으로 미래 사망률 전망이 가능한 장점이 있다. 하지만 LC는 유사 집단들

(4)

의 사망률을 독립적으로 전망해, 각각의 사망률 전망이 발산할 수 있는데 이는 현실 적으로 받아들이기 어려운 점이 있다. 이러한 문제점을 개선하고자 Li & Lee(2005)는 준거집단을 고려한 모형인 LL을 제안했다. LL은 다음과 같다. log            위 모형과 LC의 차이는 에 기인한다. 는 준거집단 내 하위집단이 공유 하는 공통인자에 해당하며, 는 LC의 에, 는 LC의 에 대응되는 구조다. 여기 서 는 하위집단을 구분하는 인덱스이다. 위 모형의 적합 방법은 LC의 절차와 동일하다. 우선 준거집단을 기준으로 다음과 같은 LC 구조를 고려한다. log       위 식은 LC의 수식과 동일한 구조로  는 준거집단의 연도 세 사망률이다. LC 적합 절차와 동일하게 우선 log   의 특이값 분해를 적용해 를 추정 하고, 추정된 를 다시 LL에 대입한다. 그리고 log      를 특이값 분해해   를 추정하는 반복적인(iterative) 절차를 거친다. 그리고 적합한 모형의

전망을 위해 공통인자 는 LC와 같이 경향이 있는 임의보행(Random walk with drift) 모형을 사용하고,  는 경향이 없는 임의보행(Random walk without drift) 모

형이나 AR(1) 모형(first-order autoregressive model)으로 전망하는데, 두 시계열 모 형 간에 특별한 우위는 없다(Li & Lee, 2005, p.577, p.579). 이하에서는 는 경향이

있는 임의보행 모형,  는 경향이 없는 임의보행 모형을 이용해 전망한다. 2.3 준거집단 LL의 사망률 전망 결과는 결국 준거집단의 선택에 의존하므로, 준거집단 선택 과 정에서 자의성을 최대한 배제하는 것이 바람직할 것이다. 하지만 기존 문헌들의 준거 집단 선택 경향을 살펴보면, 연구자들마다 준거집단 선택 범주가 상이함을 알 수 있 다. 우선 개별 국가를 준거집단으로 설정한 연구는 통계청(2011), Van Baal et al(2016) 등이 있다. 예컨대 통계청(2011)은 하위집단인 남녀 각각의 사망률 전망 시 남녀 전체, 즉 한국 인구를 준거집단으로 설정했다. 다음으로 복수 국가를 준거집단으 로 설정한 연구로는 김수영(2011), Janssen et al(2013), Kjærgaard et al(2016) 등이 있다. 한 예로 Janssen et al(2013)은 HMD에서 제공하는 10개국 전체를 준거집단으로 고려하고, 하위집단인 네덜란드 흡연자와 비흡연자의 사망률을 전망한 바 있다.

(5)

준거집단을 선택하는 것은 어렵다. 이 문제를 논의하기 위해 본 연구는 다양한 준거 집단을 구성해 예측의 정확성을 평가하는 방식을 취하고자 한다. 구체적으로 개별 국 가, 인접 국가(권역), 권역 전체(유럽대륙) 등 지역적 범주를 확장함으로써 준거집단을 다양화한다. 그리고 각 준거집단별 사망률 전망 결과를 예측의 정확성 측면에서 비교· 평가하여 특정한 패턴이 나타나는지를 관찰할 것이다. 그리고 이를 바탕으로 준거집 단 선택에 관한 함의를 도출할 것이다. 2.4 평가 방법 사망률 전망의 성과(performance) 평가를 위해서는 평가 대상과 비교 측도를 정할 필요가 있다. 첫째, 사망률 성과 평가는 연령별 사망률() 또는 기대수명()을 대상 으로 수행될 수 있는데, LL이 연령별 사망률에 기초해 결과를 전망하고 연령별 사망 률 자료가 사망률 구조를 명확히 보여준다는 점에서 연령별 사망률을 평가 대상으로 사용한다. 둘째, 측도는 일반적으로 예측의 정확성을 평가하기 위해 사용하는 평균 제 곱근 오차 RMSE(Root Mean Square Error)를 고려한다. RMSE는 예측 오차   를 기초로 하는 측도로서 다음과 같이 표현된다. RMSE=

 

,   ⋯ 연구에서 언급되는 예측 오차는 모두 RMSE를 기준으로 한다.

3. 준거집단 선택

본 절에서는 2절의 연구 설계를 바탕으로 준거집단 선택에 관한 논의를 시작한다. 3.1 준거집단 유무 남녀 전체 집단을 준거집단으로 고려하는 LL은 남녀의 기대수명이 수렴하는 특징 으로 인해 여자의 기대수명 수준은 LC보다 낮게 전망되고, 남자의 기대수명 수준은 높게 전망될 개연성이 있다. 이러한 모형의 특징이 좋은 예측 결과를 산출할 수도 있 지만 성별에 따라 LC에서 더 좋은 예측 결과를 보일 수도 있다. 이러한 추측을 바탕으로 준거집단 유무에 따른 사망률 모형의 예측 정확성을 평가· 비교해본다. LC를 적용해 각 국가별 남녀 사망률을 전망한 뒤 RMSE를 계산하는 한 편, 국가별 전체 인구(남녀)를 준거집단으로 한 모형(LL)을 적용해 RMSE를 계산했다. <그림 3.1>은 LC와 LL의 RMSE를 비교해 도식화한 것이다.4) 그림의 왼쪽 ①, ② 4) 본 연구에서 그림의 RMSE 수치는 모두 부록의 표에서 확인할 수 있다.

(6)

는 남자의 LC와 LL의 비교 결과이고, 오른쪽 ③, ④는 여자의 LC와 LL의 비교 결과 를 나타낸다. 그리고 ①, ③은 준거집단을 고려해 예측 오차가 작아진 국가이고, ②, ④는 준거집단을 고려해 예측 오차가 커진 국가이다. 주: ★은 RMSE의 평균을 나타낸다. <그림 3.1> LC와 LL의 RMSE 결과 비교 <그림 3.1>을 보면 준거집단을 고려할 경우, 남자는 예측의 정확성이 향상된 반면 여자는 그렇지 않음을 알 수 있다. 남자는 15개국 중 11개국에서 예측 정확성이 개선 됐지만(①), 여자는 15개국 중 10개국에서 예측 정확성이 악화됐다(④). 예측 개선 정도를 수치로 확인하기 위해 각 국가의 예측 오차 개선 정도를 나타내 는 와 상대적인 예측 오차 개선 정도를 나타내는 를 아래 식과 같이 정의했다. 여기서 는 개별 국가이다.

 = LC의 RMSE – LL의 RMSE,  =  / LC의 RMSE.

<표 3.1>은 각 사례별 와 의 평균과 표준편차를 요약한 것이다. 예측 오차가

개선된 국가(①, ③)를  기준으로 비교했을 때, 남자의  평균은 여자보다 약 4.7배

크고,5) 예측 오차가 개선되지 않은 국가(②, ④)에서는 여자에 비해 남자의 예측 오차

5) <그림 3.1>의 ①에서 예측 오차가 높게 나타나는 국가는 슬로바키아로 이를 제외한 의

(7)

가 더 크게 증가한다. <그림 3.1>에서 LC와 LL의 전체적인 예측 오차의 분포를 보면, 모형에 관계없이 여자가 남자보다 예측 오차 수준이 낮고 편차가 작음을 알 수 있다. 또한, 여자의 LC 와 LL의 예측 오차 평균이 각각 0.0130, 0.0134, 표준편차는 각각 0.0054, 0.0050로 분 포가 거의 동일해 준거집단이 예측 오차에 미치는 영향은 거의 없다고 볼 수 있다. <표 3.1> 예측 오차 개선 정도(, ) 비교: LC vs LL 남자 여자 LC>LL(①) LC<LL(②) LC>LL(③) LC<LL(④)  평균 (표준편차) 0.0093 (0.0048) -0.0043 (0.0055) 0.0020 (0.0013) -0.0016 (0.0012)  평균 (표준편차) 0.2880 (0.1093) -0.2864 (0.3426) 0.1196 (0.0537) -0.1359 (0.0863) 사례 수 (11개국) (4개국) (5개국) (10개국) 네덜란드, 오스트리아, 벨기에, 체코, 헝가리, 슬로바키아, 덴마크, 핀란드, 노르웨이, 포르투갈, 이탈리아 프랑스, 스위스, 스웨덴, 스페인 스위스, 슬로바키아, 덴마크, 스페인, 포르투갈 네덜란드, 오스트리아, 벨기에, 프랑스, 체코, 헝가리, 스웨덴, 핀란드, 노르웨이, 이탈리아 위 결과를 정리하면, 첫째, 준거집단 고려 시 예측 정확성의 개선 여지는 남자가 여자에 비해 크다. 이를 연령별 사망률의 변동성 차이로 설명하고자 한다.6) <그림 3.2>의 기대수명과 65세 기대여명을 보면 남자가 여자보다 기대수명의 변동성이 크게 나타나는데, 남녀 전체 준거집단이 남자 사망률의 큰 변동성을 안정화시키는 역할을 한다고 추론할 수 있고, 따라서 남자의 예측 정확성의 개선 여지가 여자보다 크다고 할 수 있다. 둘째, 여자는 준거집단 유무에 따른 효과가 비교적 미미하다. <그림 3.2> 를 보면 대부분 국가에서 여자의 사망률 변동이 크지 않기 때문인 것으로 보인다. 남 녀 전체의 사망률이 여자의 사망률에 비해 불안정하기 때문에 여자는 상대적으로 남 자에 비해 준거집단에 따른 효과가 미미하게 나타나는 것으로 보인다. 셋째, 여자는 남자보다 준거집단 유무에 관계없이 예측 오차 수준이 낮은 편이다. 동일한 모형으로 적합했을 때, 남자는 여자에 비해 불안정한 자료를 가지므로 예측 오차 수준 또한 높 6) 우해봉 등(2016, pp.132-133)에서 제시된 다수 국가의 남녀 연령별 로그사망률 변화 그림을 보면 남자가 여자보다 연령별 사망률 변동이 큰 것을 확인할 수 있다. 본문에서 말하는 사망 률 변동성은 연령별 사망률 변동을 말한다.

(8)

게 형성될 것으로 판단된다. 주: 유럽대륙 15개국 남녀, 남자, 여자의 1950년부터 2010년까지의 기대수명과 65세 기대여명 변화를 나타낸다. 그리고 빨간색 실선은 스위스, 검정색 실선은 프랑스를 나타낸다. <그림 3.2> 연도별 기대수명, 65세 기대여명 변화 위의 결과에서 보듯이 준거집단의 유무가 예측 정확성에 미치는 영향은 성별에 따 라 다름을 알 수 있다. 남자의 사례와 같이 각 국가의 남녀 전체 준거집단을 고려했 을 때 예측의 정확성이 개선된다면 어떠한 준거집단의 선택이 더 좋은 예측 결과를 가져올 수도 있다. 다음으로 국가의 지역적 범주를 확장하는 방식으로 준거집단을 선 택하는 방법이 예측의 정확성을 높일 수 있는지 살펴보도록 한다. 3.2 준거집단 범주의 선택: 권역, 유럽대륙 3.1절에서는 개별 국가(즉, 해당국)를 준거집단으로 하는 LL을 고려한 바 있다. 하 지만 전술한대로 준거집단의 범위는 개별 국가로 제한될 필요가 없으며, 경우에 따라 서 복수 국가가 선택되기도 한다. 이러한 논의는 Li & Lee(2005), 김수영(2011), Hatzopulos et al(2013), Kjærgaard et al(2016)에서 이뤄졌는데 이 연구들의 공통점은 준거집단을 선택할 때 다른 국가의 사망률 경험을 고려했다는 데 있다.

(9)

성, 사회 문화, 생활 방식, 경제 등의 요인들이 세계적 수준 또는 선진국 수준에서 수 렴하고, 사망률 패턴 또한 수렴하는 현상을 보인다고 했다. 따라서 국가 교류가 활발 해지고 있는 상황에서는 준거집단이 지역적, 사회경제적 특성 등이 유사한 국가들로 구성됐을 때 조금 더 나은 사망률 전망이 가능할 것으로 예상된다. 즉, 국가별 특성이 유사해질수록 사망률이 수렴한다는 것은, 곧 유사 국가들의 사망률 패턴이 미래에 점 차 안정성을 보이며 유사해짐을 의미한다. 이러한 관점에서 지역적, 사회경제적 특성 이 유사한 국가들로 준거집단을 구성할수록 준거집단의 사망률 정보는 미래의 실제 값과 유사해져 예측 오차가 작아질 것으로 예상된다.7) 이에 본 연구는 지역적 범주를 확장하는 방식으로 준거집단을 선택하여 분석을 시도한다. 구체적으로 유럽 15개국을 대상으로 준거집단의 지역적 범주를 개별 국가별, 권역 별(서유럽, 동유럽, 북유럽, 남유럽), 유럽대륙(15개국 통합)으로 세분화했다. 필자들이 유럽 15개국을 분석 대상으로 선택한 이유는 다른 국가들에 비해 비교적 국가 특성이 유사하고, 지역적 인접성이 높기 때문이다.

권역별(또는 유럽대륙) 준거집단 사망률은 Hyndman et al(2013)과 Kjærgaard et al(2016)과 같이 해당 범주에 속한 각 국가 사망률의 기하평균(geometric mean)으로 구했다. 권역별(또는 유럽대륙) 준거집단의 사망률은 아래와 같이 계산한다.

 ⋯  여기서

는 준거집단 범주에 포함된 국가의 개수이다. 7) LL에서 준거집단 사망률 는 특이값 분해로 log ≈ 로 분해 되고, 이에 해당하는 설명 정도(explained variance)는     

    이다(은 이고, 는 의 rank임). 사망률의 세계적 수렴성에 비춰 봤을 때, 변동성이 큰 사망률 패턴을 갖는 단수 국가의 준거집단보다는, 여러 유사 국가 사망률의 평균을 고려한 준거집단을 이용할 때 더욱 높은 설명력을 갖게 될 개연성이 있다(즉,  이 1에 가까워짐). 물론 적합성 개선이 반 드시 예측 오차의 감소를 담보하지는 않을 것이다. 다만 본 연구는 미래의 사망률 패턴이 세 계적으로 유사해질 것이라는 가정 하에 실험되었고, 실제 예측기간인 1990~2010년의 국가별 기대수명 추세는 상대적으로 안정·수렴되는 경향을 보였다(<그림 3.2> 참고). 따라서 적합성 의 개선이 예측 정확성을 일정 수준 개선할 것으로 보았다. 물론, 추후에는 보다 엄밀한 수리 적 증명에 기반을 둔 연구가 수행될 필요가 있다. 다만 본 연구의 근간이 되는 Li & Lee(2005)의 기본 아이디어가 애초 수리적 모형보다는 뛰어난 직관과 경험적 관찰에서 비롯 되었다는 점과, 애초 본 연구의 초점이 이론보다는 실증에 있었다는 점을 미리 밝혀둔다. 준 거집단의 범주 확장과 오차 간 관계의 이론적 근거가 일정 수준 보완될 수 있도록 제안해주 신 익명의 평가자께 감사의 뜻을 전한다.

(10)

주: ★은 RMSE의 평균을 나타낸다. <그림 3.3> LL과 LL 권역의 RMSE 결과 비교 <그림 3.3>은 권역 수준을 준거집단으로 하는 LL(이하 LL 권역)의 RMSE와 개별 국가를 준거집단으로 하는 LL과 비교한 것이다. 그림의 왼쪽 ①, ②는 남자의 LL, LL 권역의 결과이고, 오른쪽 ③, ④는 여자의 LL, LL 권역 결과를 나타낸다. ①, ③은 LL 보다 LL 권역에서 예측의 정확성이 개선된 국가이고, ②, ④는 이와 반대다. 남자는 LL보다 LL 권역에서 15개국 중 10개국이 예측의 정확성이 개선됐고, 여자는 15개국 중 8개국이 예측의 정확성이 좋아졌다. 각 국가의 LL 대비 LL 권역의 예측 오차 개선 정도를 라고 하고, 상대적인 예 측 오차 개선 정도를 라고 하자.

 = LL의 RMSE – LL 권역의 RMSE,  =  / LL의 RMSE.

<표 3.2>는 와 의 평균과 표준편차를 요약한 것이다. 예측 오차가 개선된 국가(①, ③)의 경우 남녀의 예측 오차 개선 정도()가 유사하지만, 를 기준으로 비교하면 여자가 남자보다 더 많이 개선됐다. 하지만 LL 권역에서 예측 오차가 개선 되지 않은 국가(②, ④)의 경우 여자가 남자보다 예측 정확성의 악화 정도가 크다. ②의 ,  평균과 표준편차가 작기 때문에 남자는 전반적으로 권역별 준거집 단을 고려함으로써 예측 오차가 개선된다고 할 수 있다. 여자는 예측 오차가 개선되 는 국가와 아닌 국가가 절반 정도로 나뉘고 편차가 남자보다 크기 때문에, 예측 오차

(11)

의 뚜렷한 개선이 보이지 않는다고 할 수 있다. 이는 LC와 LL 권역을 비교해도 마찬 가지이다. 실제 LC에 비해 LL 권역에서 개선이 이루어진 8개 국가의 개선 정도의 평 균은 0.0035이고, 개선되지 않은 7개 국가의 평균은 –0.0040이다. 종합하면 여자는 LL 권역을 고려해도 예측 오차의 개선이 이루어졌다고 할 수 없다. <표 3.2> 예측 오차 개선 정도(,  ) 비교: LL vs LL 권역 남자 여자 LL>LL 권역(①) LL<LL 권역(②) LL>LL 권역(③) LL<LL 권역(④)  평균 (표준편차) 0.0034 (0.0025) -0.0011 (0.0009) 0.0034 (0.0016) -0.0030 (0.0033)  평균 (표준편차) 0.1485 (0.0770) -0.0444 (0.0376) 0.2230 (0.1055) -0.3634 (0.4884) 사례 수 (10개국) (5개국) (8개국) (7개국) 네덜란드, 오스트리아, 벨기에, 프랑스, 스위스, 덴마크, 스웨덴, 핀란드, 스페인, 이탈리아 체코, 헝가리, 슬로바키아, 노르웨이, 포르투갈 네덜란드, 오스트리아, 벨기에 슬로바키아, 스웨덴, 핀란드, 스페인, 포르투갈 프랑스, 스위스, 체코, 헝가리, 덴마크, 노르웨이, 이탈리아 주: ★은 RMSE의 평균을 나타낸다. <그림 3.4> LL과 LL 유럽의 RMSE 결과 비교

(12)

준거집단의 범주를 권역에서 유럽대륙으로 확장하면(이하 LL 유럽) 남자는 LL보 다 LL 유럽에서 체코, 슬로바키아 2개국을 제외한 13개국의 예측 정확성이 좋아졌고 (<그림 3.4>의 ①), 여자는 15개국 중 11개국의 예측 정확성이 좋아졌다(<그림 3.4> 의 ③). 각 국가의 LL 대비 LL 유럽의 예측 오차 개선 정도를  , 상대적 예측 오차 개선 정도를  라고 하자.

 = LL의 RMSE – LL 유럽의 RMSE,  =  / LL의 RMSE.

<표 3.3>은 와   의 평균과 표준편차를 요약한 것이다. 앞서와 마찬가지로 유 럽대륙을 준거집단으로 고려하는 경우에도, 남자는 여자에 비해 예측 오차 개선 정도 가 크다(①, ③). 그리고 ②의 , 의 평균과 표준편차가 작아 남자는 유럽대륙을 준거집단으로 고려함으로써 예측의 정확성이 향상됨을 알 수 있다. 유럽대륙을 준거집단으로 고려하면 여자는 남자보다 상대적으로 개선이 이루어지 지 않지만 LL보다 개선되었다고 할 수 있다. 그리고 여자의 LC와 LL 유럽을 비교하 면, 예측 오차가 개선된 9개 국가의 개선 정도는 평균 0.0038, 개선되지 않은 6개 국 가의 평균은 -0.0019로 LC에 비해서도 개선된 것으로 보인다. 하지만 상대적인 예측 오차 개선 정도를 기준으로 LC와 LL 유럽을 비교하면, 개선된 국가들의 상대 개선 정도의 평균은 0.2188, 개선되지 않은 국가의 평균은 –0.2751인 것으로 나타나 LL 유 럽이 LC에 비해 개선되었다고 볼 수 없다. 종합하면 여자는 LL 유럽이 LL에 비해 예 측의 정확성이 개선되지만, LC에 비해서는 개선된다고 볼 수 없다. <표 3.3> 예측 오차 개선 정도(, ) 비교: LL vs LL 유럽 남자 여자 LL>LL 유럽(①) LL<LL 유럽(②) LL>LL 유럽(③) LL<LL 유럽(④)  평균 (표준편차) 0.0047 (0.0032) -0.0014 (0.0003) 0.0035 (0.0025) -0.0023 (0.0015)  평균 (표준편차) 0.2084 (0.1051) -0.0475 (0.0276) 0.2068 (0.1460) -0.3007 (0.1551) 사례 수 (13개국) (2개국) (11개국) (4개국) 네덜란드, 오스트리아, 벨기에, 프랑스, 스위스, 헝가리, 덴마크, 스웨덴, 핀란드, 노르웨이, 스페인, 포르투갈, 이탈리아 체코, 슬로바키아 네덜란드, 오스트리아, 벨기에, 체코, 헝가리, 슬로바키아, 스웨덴, 핀란드, 노르웨이, 스페인, 포르투갈 프랑스, 스위스, 덴마크, 이탈리아

(13)

또한, 준거집단을 권역에서 유럽대륙으로 범주를 확장했을 때 예측 정확성의 개선 이 이뤄졌는지 확인할 필요가 있다. 남자의  (LL 권역에서의 개선 정도)의 전체 평 균은 0.0019,  (LL 유럽에서의 개선 정도)의 전체 평균은 0.0039로 남자는 유럽대륙 을 준거집단으로 고려할 때 예측 오차가 더욱 개선된다. 결국 남자는 LL 유럽, LL 권 역, LL, LC 순으로 예측 정확성이 높다. 이러한 분석 결과를 볼 때 유럽대륙 국가의 남자는 단일 사망률 전망 모형보다 준거집단을 고려한 모형이 예측의 정확성을 높이 고, 국가의 범주를 권역에서 유럽대륙으로 확장하여 준거집단을 고려할 때 예측의 개 선을 기대할 수 있을 것이다. 여자의 의 전체 평균은 0.0004, 의 전체 평균은 0.0019로 여자도 남자와 마찬 가지로 권역보다 유럽대륙을 준거집단으로 고려할 때 평균적으로 예측 오차가 개선된 다고 할 수 있다. 종합하면 여자의 모형별 예측 정확성 비교 결과는, LC와 LL 간 판 단 불확실, LL과 LL 권역 간 판단 불확실, LC와 LL 권역·유럽 간 판단이 불확실한 것으로 나타났고, 오로지 LL 유럽이 LL 권역에 비해서만 개선된 것으로 나타나므로 전체적인 평가를 내리기가 쉽지 않다. 이러한 결과는 유럽대륙 국가의 여자가 단일 사망률 전망 모형이나 국가의 범주를 확장하는 준거집단을 고려한 모형에서 전반적으 로 두드러질만한 예측의 개선을 기대할 수 없다는 것을 말해준다. 지역 범주를 확장한 준거집단은 남자의 변동이 큰 사망률을 안정되게 하고, 이러 한 점이 예측의 정확성으로도 이어진다고 판단된다. 반면 변동이 낮은 여자의 경우 남자가 포함된 남녀 전체를 준거집단으로 고려하면, 오히려 변동이 큰 준거집단을 고 려하게 되어 남자에 비해 뚜렷한 예측 오차의 개선이 이루어지지 않는 것으로 보인 다. 하지만 이러한 부분에도 예외는 존재하는데, 프랑스와 스위스 남자는 LC로 전망할 때 가장 작은 예측 오차를 보인다. 그리고 체코와 슬로바키아 남자는 지역의 범주를 확장하는 것보다 LL로 전망하는 것이 더 좋은 예측 결과를 갖는다. <그림 3.2>의 프 랑스와 스위스 남자의 기대수명 추세를 살펴보면 거의 선형에 가깝다. 그리고 고연령 인 65세 기대여명에서 프랑스와 스위스 남자가 상대적으로 높은 기대여명 궤적을 형 성하는 것을 볼 수 있다. 이러한 특징들이 프랑스와 스위스 남자의 LC 전망의 정확성 을 보다 좋게 만드는 것으로 보인다. 그리고 체코와 슬로바키아 남자는 다른 국가들 에 비해 사망률이 높고 사망률 변동이 매우 큰 국가로, 지역적 범주를 확장한 평균에 수렴하는 것 보다는 해당 국가의 여자의 사망률 패턴에 우선하여 의존하는 것이 더 좋은 예측 오차 개선을 기대할 수 있을 것으로 판단된다. 이처럼 남녀의 사망률 패턴이 상이한 점을 볼 때, 필자들은 남자와 여자를 따로따 로 고려하여 준거집단을 선택함으로써 여자의 예측 오차 개선이 이루어질 수 있을 것 이라고 기대하였다.

(14)

3.3 준거집단 범주의 선택: 권역(남·여), 유럽대륙(남·여) <그림 3.5> LL 권역 모형과 LL 권역 성별 고려 모형의 RMSE 결과 비교 성별을 구분하여 범주를 확장했을 때 예측 정확성이 개선되는지 살펴본다. <그림 3.5>에서 남자는 LL 권역보다 LL 권역(남)에서 6개국의 예측 정확성이 좋아졌고(①), 여자는 LL 권역보다 LL 권역(여)에서 네덜란드와 스위스를 제외한 13개국이 더 좋은 전망 결과를 보인다(③). 각 국가의 LL 권역 대비 LL 권역(남 또는 여)의 예측 오차 개선 정도를 , 상대적 예측 오차 개선 정도를 라고 하자.  = LL 권역의 RMSE – LL 권역(남 또는 여)의 RMSE,  =  / LL 권역의 RMSE. <표 3.4>는 와 의 평균과 표준편차를 요약한 것이다. 권역 수준의 준거집단 을 성별로 구분했을 때 예측의 정확성이 개선된 ①, ③의 는 남녀가 서로 유사하지 만, 로 비교하면 여자의 개선 정도가 남자보다 크다. 게다가 여자는 2개국을 제외 한 대부분의 국가에서 예측 정확성이 개선된 것을 볼 때, 여자는 남자의 사망률 정보 를 배제함으로써 예측의 정확성이 향상되었다. 하지만 남자는 준거집단에서 여자의 사망률 정보를 배제할 경우, 예측 정확성의 개선이 이루어지지 않는다고 볼 수 있다.

(15)

<표 3.4> 예측 오차 개선 정도(, ) 비교: LL 권역 vs LL 권역 성별 남자 여자 LL 권역 > LL 권역(남) (①) LL 권역 < LL 권역(남) (②) LL 권역 > LL 권역(여) (③) LL 권역 < LL 권역(여) (④)  평균 (표준편차) 0.0019 (0.0022) -0.0038 (0.0029) 0.0018 (0.0018) -0.0037 (0.0027)  평균 (표준편차) 0.0971 (0.0994) -0.1947 (0.1414) 0.1152 (0.1026) -0.3717 (0.1753) 사례 수 (6개국) (9개국) (13개국) (2개국) 네덜란드, 오스트리아, 프랑스, 덴마크, 스웨덴, 노르웨이, 벨기에, 스위스, 체코, 헝가리, 슬로바키아, 핀란드, 스페인, 포르투갈, 이탈리아 오스트리아, 벨기에, 프랑스, 체코, 헝가리, 슬로바키아, 덴마크, 스웨덴, 핀란드, 노르웨이, 스페인, 포르투갈, 이탈리아 네덜란드, 스위스 아래 <표 3.5>는 LL 권역 성별과 LC, LL, LL 권역간의 예측 오차 개선 정도를 요약한 것이다. LL보다 LL 권역(여)에서 예측 오차가 작아진 국가는 8개국(오스트리 아, 벨기에, 헝가리, 슬로바키아, 스웨덴, 핀란드, 스페인, 포르투갈)이고, LC보다 LL 권역(여)에서 예측 오차가 작아진 국가도 이와 동일하다. 즉, 권역 수준에서 여자는 남자를 배제한 준거집단을 고려할 경우 예측 정확성이 개선되지만, 여전히 LC와 LL 에 비해서는 뚜렷한 개선이 있다고 보기에는 어려운 측면이 있다. 반면, 남자는 여자의 사망률 정보를 배제하기보다는 포함함으로써 예측 정확성이 개선됨을 알 수 있다. 그리고 LC보다 LL 권역(남)에서 예측 오차가 개선된 것은 변동 성이 큰 남자 사망률 자체만의 전망보다는 권역의 남자 사망률 기하평균에 해당하는 준거집단이 변동성을 안정화해 예측 오차를 개선한 것으로 보인다.

(16)

<표 3.5> 남자와 여자의 예측 오차 개선 정도 비교: LC, LL, LL 권역, LL 권역(남,여) 남자 LC > LL 권역(남) LC < LL 권역(남) LL > LL 권역(남) LL < LL 권역(남) LL 권역 > LL 권역(남) LL 권역 < LL 권역(남)  평균 (표준편차) 0.0082 (0.0059) -0.0077 (0.0055) 0.0037 (0.0031) -0.0046 (0.0043) 0.0019 (0.0022) -0.0038 (0.0029)  평균 (표준편차) 0.2566 (0.1419) -0.4192 (0.4269) 0.1577 (0.1259) -0.2250 (0.1827) 0.0971 (0.0994) -0.1947 (0.1414) 사례 수 (13개국) (2개국) (9개국) (6개국) (6개국) (9개국) 여자 LC > LL 권역(여) LC < LL 권역(여) LL > LL 권역(여) LL < LL 권역(여) LL 권역 > LL 권역(여) LL 권역 < LL 권역(여)  평균 (표준편차) 0.0045 (0.0042) -0.0030 (0.0017) 0.0047 (0.0019) -0.0024 (0.0013) 0.0018 (0.0018) -0.0037 (0.0027)  평균 (표준편차) 0.2593 (0.1946) -0.3471 (0.2460) 0.2960 (0.1028) -0.2683 (0.1649) 0.1152 (0.1026) -0.3717 (0.1753) 사례 수 (8개국) (7개국) (8개국) (7개국) (13개국) (2개국) 주: 은 예측 오차 개선 정도이고, 은 상대적 예측 오차 개선 정도를 나타낸다. <그림 3.6> LL 유럽과 LL 유럽 성별 고려 모형의 RMSE 결과 비교

(17)

범주를 권역에서 유럽대륙으로 확장하면 여자는 LL 유럽보다 LL 유럽(여)에서 더 좋은 전망을 보이는 국가는 8개국으로 절반 정도이다. 남자는 LL 유럽보다 LL 유럽 (남)에서 4개국의 예측 정확성이 좋아졌고 11개국의 예측 정확성이 악화된 것을 볼 때, 성별을 구분한 준거집단이 남자의 예측 오차를 크게 한다. 유럽대륙을 성별로 구 분한 준거집단의 개선 정도를 평가하기 위해 각 국가의 LL 유럽 대비 LL 유럽(남 또 는 여)의 예측 오차 개선 정도를  , 상대적 예측 오차 개선 정도를   라고 하자.  = LL 유럽의 RMSE – LL 유럽(남 또는 여)의 RMSE,  =  / LL 유럽의 RMSE <표 3.6>은 와   의 평균과 표준편차를 요약한 것이다. 성별을 구분한 유럽대 륙을 준거집단으로 고려할 때 예측 오차가 개선된 국가(①, ③)에서 남자가 여자보다 개선 정도가 크지만, 그러한 국가의 수가 적고 예측 정확성 악화 정도(②)가 심하다. 반대로 여자는 개선되지 않은 국가(④)의 ,   의 평균과 표준편차가 작아, 성별을 따로 고려함으로써 예측 정확성의 개선이 이루어졌다고 할 수 있다. <표 3.6> 예측 오차 개선 정도(,  ) 비교: LL 유럽 vs LL 유럽 성별 남자 여자 LL 유럽 > LL 유럽(남) (①) LL 유럽 < LL 유럽(남) (②) LL 유럽 > LL 유럽(여) (③) LL 유럽 < LL 유럽(여) (④)  평균 (표준편차) 0.0017 (0.0016) -0.0030 (0.0027) 0.0012 (0.0009) -0.0007 (0.0006)  평균 (표준편차) 0.0836 (0.0834) -0.1938 (0.1861) 0.0947 (0.0641) -0.0711 (0.0506) 사례 수 (4개국) (11개국) (8개국) (7개국) 네덜란드, 스위스, 노르웨이, 스페인 오스트리아, 벨기에, 프랑스, 체코, 헝가리, 슬로바키아, 덴마크, 스웨덴, 핀란드, 포르투갈, 이탈리아 오스트리아, 체코, 헝가리, 덴마크, 스웨덴, 핀란드, 스페인, 포르투갈 네덜란드, 벨기에, 프랑스, 스위스, 슬로바키아, 노르웨이, 이탈리아 아래 <표 3.7>은 LL 유럽 성별과 LC, LL, LL 유럽 간의 예측 오차 개선 정도를 비교한 것이다. 여자의 경우 LL보다 LL 유럽(여)에서 더 좋은 전망을 보이는 국가는 10개국이고, LC보다 LL 유럽(여)에서 더 좋은 전망을 보이는 국가는 10개국이다. 즉, 여자는 남자를 배제한 유럽 수준의 준거집단을 선택할 경우, LC와 LL에 비해서도 예

(18)

측의 정확성이 개선됨을 알 수 있다. 남자는 권역을 성별로 구분한 준거집단의 경우와 유사하게 LC보다 LL 유럽(남)에 서 예측 오차의 개선이 이뤄졌다. 이러한 결과는 변동성이 큰 남자 사망률 데이터 자 체만의 전망보다는 범주를 권역 또는 유럽대륙으로 확장하여 준거집단을 선택함으로 써 예측의 정확성이 향상될 수 있음을 말해준다. <표 3.7> 남자와 여자의 예측 오차 개선 정도 비교: LC, LL, LL 유럽, LL 유럽(남,여) 남자 LC > LL 유럽(남) LC < LL 유럽(남) LL > LL 유럽(남) LL < LL 유럽(남) LL 유럽 > LL 유럽(남) LL 유럽 < LL 유럽(남)  평균 (표준편차) 0.0094 (0.0043) -0.0023 (0.0017) 0.0051 (0.0036) -0.0038 (0.0033) 0.0017 (0.0016) -0.0030 (0.0027)  평균 (표준편차) 0.3023 (0.1047) -0.1621 (0.0751) 0.2021 (0.1226) -0.1817 (0.1916) 0.0836 (0.0834) -0.1938 (0.1861) 사례 수 (13개국) (2개국) (10개국) (5개국) (4개국) (11개국) 여자 LC > LL 유럽(여) LC < LL 유럽(여) LL > LL 유럽(여) LL < LL 유럽(여) LL 유럽 > LL 유럽(여) LL 유럽 < LL 유럽(여)  평균 (표준편차) 0.0040 (0.0032) -0.0026 (0.0012) 0.0044 (0.0028) -0.0021 (0.0010) 0.0012 (0.0009) -0.0007 (0.0006)  평균 (표준편차) 0.2352 (0.1764) -0.3812 (0.3142) 0.2611 (0.1698) -0.2877 (0.1826) 0.0947 (0.0641) -0.0711 (0.0506) 사례 수 (10개국) (5개국) (10개국) (5개국) (8개국) (7개국) 주: 은 예측 오차 개선 정도이고, 은 상대적 예측 오차 개선 정도를 나타낸다. 요컨대 남자의 경우 준거집단에서 여자의 사망률 정보를 포함하기보다 배제할 경 우 예측 정확성이 악화됨을 알 수 있다. 이는 여자보다 사망률 변동이 큰 남자로만 구성된 준거집단이 전망의 불확실성을 보다 확대시킨 것으로 이해된다. 반면 여자는 준거집단에서 남자의 사망률 정보를 포함하는 것 보다 배제하는 동시에 지역 범주를 확장함으로써 예측 오차가 감소하는 것을 확인하였다. 이러한 현상은 여자의 안정적 인 사망률의 변동으로만 이루어진 준거집단의 조합으로부터 기인한다고 볼 수 있다.8) 지금까지의 분석 결과를 <그림 3.7>을 통해 확인해보자. 해당 그림은 성별, 국가 별, 모형별 예측 오차 분포를 보여주고 있다.9) 색이 진할수록 예측 오차가 크다는 것 을 의미한다. 그림의 전반적인 특징은 다음과 같다. 첫째, 그림 왼쪽 남자의 예측 오 8) 추가적으로 논의할 만한 사항은 예측 오차의 평가 지표로서 RMSE 외의 평가 지표의 활용 이다. RMSE와 함께 대표적인 예측 오차 평가 지표인 평균 절댓값 오차 MAE(Mean Absolute Error; 

)에 의한 결과도 전체적인 경향에 있어 유사하므로 예측 결과가 평 가 지표에 강건함을 확인했다. 참고로 MAE에 대한 결과는 부록에 수록했다. 9) 수치는 부록을 참조할 수 있다. 예측 오차 분포를 시각화함으로써 독자들이 분석 결과를 보 다 쉽게 이해할 수 있도록 도와주신 익명의 평가자께 감사의 뜻을 전한다.

(19)

차 분포에서, 1열부터 4열까지 즉, LC → LL → LL 권역 → LL 유럽의 순으로 갈수 록 국가별 예측 오차가 전반적으로 감소하는 경향이 있다. 둘째, 그림 오른쪽 여자의 예측 오차 분포를 보면, LL, LL 권역, LL 유럽(2열부터 4열) 모형에서는 남자의 경우 와 달리 특별한 개선 패턴이 발견되지 않았다. 반면, 남성의 사망률 정보를 배제할 경 우, 6열의 LL 유럽(여)가 5열의 LL 권역(여)에 비해 예측 오차가 감소하는 경향을 보 였다. 따라서 남자는 남녀 사망률 정보를 모두 고려한 준거집단의 지역 범주를 확장 함으로써, 여자는 여자의 사망률만을 고려한 준거집단의 지역 범주를 확장함으로써 예측의 정확성이 개선됨을 알 수 있다. <그림 3.7> 성별·국가별·모형별 예측 오차 분포

(20)

4. 결론

사망률은 연금, 건강보험 등 재정 전망의 기초 자료로 활용되며 국민 건강 수준을 평가할 수 있는 중요한 지표라는 점에서, 사망률의 정확한 전망은 중요한 과제라고 할 수 있다. 이에 본 연구에서는 LL의 예측 정확성 개선을 위한 시도로써, 그간의 문 헌들에서 비중 있게 다뤄지지는 않았지만 중요한 과제라고 판단되는 준거집단 선택 문제에 관해 논의했다. 이에 본 연구는 HMD의 유럽대륙 국가들의 사망률 데이터를 이용해 RMSE를 측도로 준거집단 선택 문제를 분석했다. 준거집단 선택에 따른 예측 정확성을 개선하기 위한 시도로 우선 준거집단의 지역적 범주를 확장하는 방식을 취 하였다. 그리고 성별 사망률 변동성에 차이가 있다는 점에 착안하여 준거집단을 성별 로 구분하는 방식도 고려하였다. 분석 결과는 크게 세 가지로 요약된다. 첫째, 준거집단 유무에 따른 예측 정확성의 개선 정도에 성별 차이가 존재했다. 남자는 준거집단을 고려함으로써 예측 정확성이 개선된 반면, 여자는 준거집단을 고려하여도 뚜렷한 개선이 이루어지지 않았다. 남자 의 경우 뚜렷한 개선이 관찰된 이유는 여자의 안정된 사망률 변동이 남자의 변동이 큰 사망률 패턴을 안정시켜주는 역할을 했기 때문인 것으로 추측된다. 둘째, 지역 범주를 확장시키는 방식으로 준거집단을 선택하는 경우에도 예측 정확 성의 개선 정도에 성별 차이가 존재하였다. 남자의 경우, 준거집단의 지역 범주를 개 별 국가에서 권역, 권역에서 유럽대륙으로 넓힘으로써 예측 오차가 줄어드는 경향을 보였는데, 이는 경험적으로 관찰되고 있는 사망률의 세계적 수렴성과 연관된다. 예외 적으로 동유럽의 남자와 같이 다른 유럽 국가들과 매우 상이한 패턴을 보이는 국가들 의 경우, 오히려 해당 국가의 남녀 전체 집단을 준거집단으로 고려하는 것이 보다 좋 은 예측 결과를 보여준다. 반면 여자의 경우 앞서와 마찬가지로 준거집단의 지역적 범주를 확장해도 뚜렷한 개선 효과가 나타나지 않았으며, 이는 준거집단에 변동성이 큰 남자의 사망률 정보가 반영되었기 때문인 것으로 추측했다. 셋째, 이러한 추측을 바탕으로 준거집단의 성별을 구분하여 지역적 범주를 확장할 경우 앞서와 반대의 양상이 나타남을 알 수 있었다. 즉, 남자의 경우 준거집단에서 여 자의 사망률 정보를 배제할 경우 오히려 예측의 개선 정도가 악화되었다. 반면 여자 의 사망률 전망 시 준거집단에서 남자의 사망률 정보를 배제할 경우에는 오히려 지역 적 범주의 확장에 따라 예측의 정확성이 개선되는 경향을 보였다. 이상의 결과들을 종합해보면 사망률의 세계적 수렴성에 따라 지역 범주를 확장함 으로써 예측의 정확성이 개선되는 가운데, 남자는 준거집단에 변동성이 낮은 여자의 사망률 정보를 포함시킬 때 예측의 정확성이 개선되는 경향성이 뚜렷함을 알 수 있 고, 여자는 변동성이 큰 남자의 사망률 정보를 배제할 경우 예측의 정확성이 개선되 는 경향성이 나타난다는 결론을 내릴 수 있었다. 이처럼 다양한 준거집단을 고려할 때 남자와 여자의 예측 결과의 차이는 서로 다른 사망률 패턴 또는 변동성에 기인하 며, 이는 근본적으로 남자와 여자의 생물학적, 사회경제적 차이로 설명될 것으로 추측 된다. 그리고 위의 분석 결과와 더불어 세계적으로 특히 선진국에서 사망률이 수렴하 는 현상은 남자와 여자의 준거집단을 선택할 때 지역적 범주를 확장하는 좋은 근거가

(21)

된다. 본 연구의 결론은 유럽 자료를 바탕으로 도출된 것으로, 이를 비유럽 국가들 사례 에 적용하는 것에 신중을 기할 필요가 있다. 이를 일반화하기 위해서는 한국 등 비유 럽 나라들을 대상으로 한 후속 연구가 선행될 필요가 있다. 현재 우리나라 통계청의 사망률 전망은 개별 국가(즉, 우리나라)를 준거집단으로 한 LL을 기반으로 이뤄지고 있다. 향후 우리나라 사망률 전망 시, 지역적으로 인접하고 사회경제적 조건이 유사한 국가들의 조합으로 준거집단을 구성함으로써 예측의 정확성을 개선할 수 있을 것으로 기대된다. 특히 여자 사망률은 그러한 국가들의 여성 사망률 정보만을 준거집단에 반 영함으로써 보다 나은 전망이 가능할 것으로 보인다. (2017년 11월 2일 접수, 2017년 12월 4일 수정, 2017년 12월 8일 채택)

(22)

부록

<부표> RMSE, MAE 결과 비교 평가 측도 성별 남자 여자 전망 모형 LC 모형 LL 모형 LC 모형 LL 모형 준거집단(국가) 없음 국가단 위 권역 유럽 권역 유럽 없음 국가단 위 권역 유럽 권역 유럽 준거집단(성별) 없음 남녀 남녀 남녀 남 남 없음 남녀 남녀 남녀 여 여 RMSE 서 유 럽 네덜란드 0.0330 0.0252 0.0226 0.0195 0.0191 0.0157 0.0122 0.0148 0.0114 0.0124 0.0170 0.0142 오스트리아 0.0354 0.0179 0.0176 0.0172 0.0173 0.0271 0.0114 0.0136 0.0094 0.0119 0.0088 0.0100 벨기에 0.0277 0.0180 0.0166 0.0151 0.0189 0.0200 0.0079 0.0080 0.0065 0.0078 0.0061 0.0078 프랑스 0.0099 0.0127 0.0102 0.0100 0.0094 0.0110 0.0048 0.0056 0.0068 0.0075 0.0068 0.0080 스위스 0.0162 0.0286 0.0221 0.0216 0.0278 0.0197 0.0085 0.0070 0.0074 0.0075 0.0093 0.0084 동 유 럽 체코 0.0326 0.0245 0.0270 0.0261 0.0364 0.0281 0.0165 0.0173 0.0184 0.0132 0.0176 0.0123 헝가리 0.0313 0.0222 0.0235 0.0195 0.0297 0.0211 0.0145 0.0184 0.0188 0.0114 0.0143 0.0104 슬로바키아 0.0612 0.0419 0.0428 0.0431 0.0438 0.0451 0.0247 0.0208 0.0188 0.0188 0.0145 0.0192 북 유 럽 덴마크 0.0337 0.0301 0.0235 0.0199 0.0233 0.0200 0.0110 0.0107 0.0150 0.0147 0.0140 0.0132 스웨덴 0.0221 0.0237 0.0208 0.0157 0.0152 0.0175 0.0141 0.0167 0.0147 0.0131 0.0135 0.0103 핀란드 0.0349 0.0296 0.0223 0.0198 0.0238 0.0243 0.0189 0.0201 0.0174 0.0162 0.0161 0.0159 노르웨이 0.0296 0.0223 0.0228 0.0197 0.0216 0.0187 0.0119 0.0125 0.0170 0.0124 0.0165 0.0132 남 유 럽 스페인 0.0192 0.0195 0.0168 0.0154 0.0186 0.0154 0.0166 0.0146 0.0095 0.0082 0.0085 0.0076 포르투갈 0.0220 0.0151 0.0153 0.0143 0.0168 0.0160 0.0193 0.0171 0.0110 0.0104 0.0093 0.0100 이탈리아 0.0197 0.0117 0.0107 0.0080 0.0154 0.0117 0.0056 0.0066 0.0159 0.0093 0.0101 0.0099 MAE 서 유 럽 네덜란드 0.0135 0.0107 0.0093 0.0082 0.0079 0.0064 0.0040 0.0049 0.0040 0.0041 0.0066 0.0051 오스트리아 0.0103 0.0054 0.0054 0.0060 0.0066 0.0095 0.0042 0.0052 0.0039 0.0054 0.0032 0.0042 벨기에 0.0091 0.0065 0.0060 0.0058 0.0066 0.0075 0.0028 0.0036 0.0028 0.0033 0.0020 0.0033 프랑스 0.0038 0.0043 0.0037 0.0046 0.0047 0.0051 0.0019 0.0024 0.0030 0.0034 0.0028 0.0035 스위스 0.0052 0.0087 0.0062 0.0058 0.0083 0.0060 0.0027 0.0028 0.0027 0.0026 0.0027 0.0026 동 유 럽 체코 0.0153 0.0100 0.0114 0.0093 0.0170 0.0115 0.0072 0.0081 0.0087 0.0044 0.0075 0.0048 헝가리 0.0117 0.0090 0.0090 0.0063 0.0128 0.0076 0.0059 0.0092 0.0089 0.0038 0.0052 0.0031 슬로바키아 0.0189 0.0113 0.0109 0.0098 0.0134 0.0107 0.0079 0.0082 0.0072 0.0058 0.0050 0.0073 북 유 럽 덴마크 0.0133 0.0113 0.0084 0.0068 0.0086 0.0071 0.0041 0.0036 0.0053 0.0052 0.0051 0.0049 스웨덴 0.0085 0.0087 0.0077 0.0057 0.0062 0.0066 0.0043 0.0051 0.0045 0.0038 0.0040 0.0031 핀란드 0.0105 0.0093 0.0081 0.0069 0.0105 0.0096 0.0058 0.0068 0.0063 0.0059 0.0054 0.0058 노르웨이 0.0126 0.0081 0.0085 0.0070 0.0087 0.0074 0.0036 0.0049 0.0058 0.0040 0.0054 0.0040 남 유 럽 스페인 0.0061 0.0051 0.0046 0.0059 0.0063 0.0078 0.0054 0.0059 0.0044 0.0041 0.0030 0.0036 포르투갈 0.0068 0.0051 0.0049 0.0050 0.0056 0.0067 0.0064 0.0068 0.0043 0.0047 0.0031 0.0038 이탈리아 0.0077 0.0049 0.0052 0.0040 0.0054 0.0064 0.0022 0.0033 0.0069 0.0046 0.0039 0.0046

(23)

참고문헌

김수영 (2011). 한국의 사망률 추계 : 통합 Lee-Carter 방법, <한국인구학>, 34(3), 157-177. 우해봉, 양지윤, 조성호, 안형석 (2016). 인구추계 방법론의 현황과 평가, <한국보건사 회연구원>, 연구보고서 2016-22. 통계청 (2011). 장래인구추계: 2010-2060, <통계청> 통계청 (2016). 장래인구추계: 2015-2065, <통계청>

d'Albis, H. Esso, L. J. & i Arolas, H. P. (2012). Mortality Convergence Across High-Income Countries: An Econometric Approach. Universite Pantheon-Sorbonne (Paris 1), Centre d'Economie de la Sorbonne, No. 12076.

Hatzopoulos, P. & Haberman, S. (2013). Common mortality modeling and coherent forecasts. An empirical analysis of worldwide mortality data. Insurance: Mathematics and Economics, 52(2), 320-337.

Human Mortality Database. University of California, Berkeley (USA), and Max Planck Institute for Demographic Research (Germany). http://www.mortality.org/에서 2017.9.13. 인출.

Hyndman, R. J. Ullah, M. S. (2007). Robust forecasting of mortality and fertility rates: a functional data approach. Computational Statistics & Data Analysis, 51(10), 4942-4956.

Hyndman, R. J. Booth, H. & Yasmeen, F. (2013). Coherent mortality forecasting: the product-ratio method with functional time series models. Demography, 50(1), 261-283.

Hyndman, R. J. Booth, H. & Tickle, L. & Maindonald, J. (2014). demography: Forecasting mortality, fertility, migration and population data. R package version 1.18. https://CRAN.R-project.org/package=demography.

Janssen, F. van Wissen, L. J. & Kunst, A. E. (2013). Including the smoking epidemic in internationally coherent mortality projections. Demography, 50(4), 1341-1362.

Kjærgaard, S. Canudas-Romo, V. & Vaupel, J. W. (2016). The importance of the reference populations for coherent mortality forecasting models. In European Population Conference.

Lee, R. D. Carter, L. R. (1992). Modeling and forecasting US mortality. Journal of the American statistical association, 87(419), 659-671.

Li, N. Lee, R. (2005). Coherent mortality forecasts for a group of populations: An extension of the Lee-Carter method. Demography, 42(3), 575-594.

Li, N. Lee, R. & Gerland, P. (2013). Extending the Lee-Carter method to model the rotation of age patterns of mortality decline for long-term

(24)

projections. Demography, 50(6), 2037-2051.

Oeppen, J. Vaupel, J. W. (2002). Broken limits to life expectancy. Science, 296(5570), 1029-1031.

Van Baal, P. Peters, F. Mackenbach, J. & Nusselder, W. (2016). Forecasting differences in life expectancy by education. Population studies, 70(2), 201-216.

White, K. M. (2002). Longevity advances in high‐income countries, 1955–96. Population and Development Review, 28(1), 59-76.

Wilson, C. (2001). On the scale of global demographic convergence 1950-2000. Population and Development Review, 27(1), 155-171.

(25)

Selection Problem of Reference Group in Li-Lee Model

HyeongSeok Ahn

1)

· Kyongpyo Ko

2)

Abstract

The selection of reference group in Li-Lee model is one of the important factors affecting prediction accuracy. There has been no clear criteria for selecting reference group, and discussion has not been done in-depth. In this study, we analysis many cases of selecting reference group based on the root mean square error using the mortality data of countries in Europe. We address the issue of selecting a local category to select the appropriate reference group, and we also consider that consideration of the reference group leads to good predictions. As a result, the prediction accuracy of male mortality rates is improved by expanding the category to the continent of Europe. However, it is confirmed that the prediction accuracy of female mortality rates is improved in the model considering combination the reference group of woman. These results provide evidences for improving the accuracy of prediction when selecting the reference group in the Li-Lee model.

Key words : Li-Lee Model, Reference Group, Mortality Rate, Prediction Error

1) (Corresponding author) Researcher, Social Insurance Research Department, KIHASA, (Building D) 370, Sicheong-daero, Sejong-si, Korea. E-mail: ahnhs55@kihasa.re.kr

2) (Co-author)Researcher, Social Insurance Research Department, KIHASA, (Building D) 370, Sicheong-daero, Sejong-si, Korea. E-mail: kogpdang@naver.com

참조

관련 문서

frequency of the first channel in the group is used as the fundamental frequency for all channels in the group, and all phase measurements are relative to the phase reference

1 John Owen, Justification by Faith Alone, in The Works of John Owen, ed. John Bolt, trans. Scott Clark, &#34;Do This and Live: Christ's Active Obedience as the

Fourth, reality therapy group counseling program was effective in improving prisoners' social relationships which is one of the sub factors of

§ Due to the late start of construction and frequent design changes during construction, the completion of the project has been one year delayed. of the project has been

Purpose: Calcaneal fracture is a rare fracture, which accounts for about 2% of all fractures, but is one of the most common fractures in the ankle bone.. There is

There are several factors that make proper English article use difficult for Korean speakers.. First, there is no article system

At the end of the study, a reevaluation of each study case was performed with the same questionnaire. The result shows there has been a meaningful result in the group

The smaller Li + ion binds water molecules more tightly than does the larger K + ion, so Li + has the larger hydrated diameter... 이온의 전하가 클수록 γ는 더