• 검색 결과가 없습니다.

TFT 전략을 통한 국민통합의 구체적 방법

대통령 선거 직후 국민통합의 기준과 방법

Ⅳ. TFT 전략을 통한 국민통합의 구체적 방법

액설로드(Robert Axelrod)의 1984년 저작 「The Evolution of Cooperation」에서 주목받은 TFT(Tit-for-Tat) 전략을 간단히 살펴보면 다음과 같다. TFT 전략은 크게 2단계이다. 우선 첫 번 째 게임에서 무조건 상대에 협조(C, cooperation)한다. 두 번째 게임부터는 상대가 협조(C)하면

53) 박종준, 상게논문, 170면.

54) r은 할인율(discount rate)을 의미한다. 할인율과 반대적 개념인 할인모수(discount parameter) w는 t기의 가치가 t+1시기 의 가치로 평가되는 비율을 의미하는데, 예컨대 현재 100원의 보상이 미래에는 80원으로 평가된다고 가정하면 할인모수 w=0.8이 된다. 할인모수와 할인율의 관계는 r(할인율)=1-W(할인모수)의 관계가 성립한다. 할인모수 w가 0.8이라는 말은 현 재가치가 미래시점에서는 80%로 평가(1-0.2)된다는 것을 의미한다. 할인모수가 현재가치가 미래에 얼마로 평가되는가를 알 려주는 비율이라면, 할인율은 미래가치가 현재가치로 얼마로 평가될 것인가를 알려주는 지표이다. 현재 120원의 가치는 미래 의 시점에서는 120×0.8=96원이며, 미래가치인 100원은 할인율이 0.2라면 100/(1+0.2)가 되어 83.3333원이 되는 것이 다. 김행범, “집합적 행위의 행정문제에 있어서 ‘Tit-For-Tat’ 전략과 그 안정성에 관한 연구”, 「한국사회와 행정연구」 11(1), 2000, 314면 각주 8번 참조.

55) 협조의 순이익 = 상호협조의 이익에서 상호 비협조의 이익을 뺀 것이고, 무임승차 순이익 = 상대방의 협조에 대한 일방적 비 협조의 이익에서 상호협조의 이익을 뺀 것이다.

협조(C)하고 상대가 배신(D, defection)하면 배신한다. 그리고 다시 상대가 협조(C)하면 협조(C) 하는 것이 최고의 결과를 도출한다는 것이다. 즉, 액설로드의 TFT 전략은 첫 게임에서 협조로 시 작하고 그 다음 게임부터는 상대의 이전 전략을 그대로 따라하는 것56)으로 단순하게 정리된다. 그 런데, 이 단순한 전략이 게임이론 전공자와 게임이론과 관련된 연구주제를 발표한 다양한 영역의 전문가들에게 죄수의 딜레마 상황에서 가장 승률이 높은 전략을 제출하는 ‘컴퓨터 죄수의 딜레마 대회’(Computer Prisoner’s Dilemma Tournament)에서 2차례 연속 우승한다. 액셀로드의 TFT 전략은 1차 대회에서는 참가한 14개의 프로그램들과 ‘C’와 ‘D’를 무작위로 연출하는 ‘랜 덤’(random)을 합해 모두 15개의 전략들이 게임을 벌였다. 각각의 대전 쌍은 200번의 게임을 반 복하는 형식의 전체 게임을 5회 치렀고 제출되어 경쟁한 전략들 중에서 TFT가 가장 높은 점수로 우승을 차지했으며, 2차 대회에서는 이 사실을 알리고 다시 참가자를 모집했다. 2차 대회에서는 그보다 훨씬 많은 62개의 프로그램 중에서 우승했다. 2차 대회 참가자들은 TFT가 매우 강한 전략 임을 이미 인지한 상태에서 전략을 제출했지만 결국 TFT보다 나은 전략을 찾아내지 못했다. 이후 6회에 걸친 대회에서 TFT는 5차례 우승했고 한번은 준우승했다.57)

액설로드는 이러한 결과를 통해 TFT는 대단히 탄탄한(robust) 전략이며, 안정적인 상호작용의 확률 w58)가 충분히 큰 경우, 그리고 오직 그런 경우에, 총체적으로 안정적인(collectively stable) 즉, ‘진화론적 안정성’(evolutionary stable strategy, ESS)59)을 가지며, “집단적으로 안정적인 전 략”(collectively stable strategy, CSS)은 두 참가자가 모두 이 전략을 사용하는 것이 내쉬균형60) 을 이룬다는 것에 해당한다. 즉, TFT가 집단적으로 안정적이라는 것은 전략조합(TFT;TFT)이 내쉬 균형을 이룬다는 것을 의미한다.61)

액설로드가 설명하는 “집단적으로 안정적인 전략”(collectively stable strategy, CSS)을 위한 8가지 명제를 증명한다.62) 우선, 액설로드가 사용한 게임의 보수행렬은 다음과 같다.

56) 박종준, 전게논문, 176-177면.

57) 박종준, 전게논문, 176-177면.

58) 액셀로드에 의하면 할인모수(discount parameter)가 클수록 미래가치가 높게 평가되는 것이고 그만큼 게임 전체 보상값은 장기간에 걸쳐 나타난다. 김행범, 전게논문, 314면.

59) 박종준, 전게논문, 177면.

60) 내쉬균형(Nash equilibria)에 관해서는 다수의 연구가 존재한다. 그중에서 김성현, “비 협조적 게임 모형 및 내쉬 균형의 수학 적 성질에 대한 해석”, 「사회과학연구논총」 13, 이화여자대학교, 2004, 61-78면 이하; 안일태・신혁승. “국가간 무역정책 선 택의 후생효과 분석”, 「국제경영리뷰」 16(1), 2012, 145면 이하에서 내쉬균형의 의미와 해석을 참조할 수 있다. 내쉬균형은 경제학뿐만 아니라 은행의 대출 심사기법(정형권, “게임모형을 통한 은행의 대출심사기법 선택에 관한 연구”, 「經濟分析」

8(3), 2002.)이나 다자게임 전력시장에서 송전과 발전에 대한 연구(이광호, “다자게임 전력시장에서 송전선 혼잡시의 복합전 략 내쉬균형 계산”, 「전기학회논문지A」 55(11), 2006; 이광호, “다자게임에서 발전력제약이 복합전략 내쉬균형에 미치는 영 향”, 「전기학회논문집」, 대한전기학회, 2008.)에까지 두루 활용되고 있다.

61) 정준표, “죄수의 딜레마 게임과 겁쟁이 게임에 관한 소고”, 「국제정치연구」 9(2), 동아시아국제정치학회, 2006, 64면.

62) 8가지 명제의 구체적인 내용은 Axelrod, Robert. 1984. The Evolution of Cooperation. New York: Basic Books., pp. 206-215의 내용을 중심으로 김행범, “집합적 행위의 행정문제에 있어서 ‘Tit-For-Tat’ 전략과 그 안정성에 관한 연구”,

「한국사회와 행정연구」 11(1), 2000, 315-326면; 박종준, “반복적 죄수의 딜레마(IPD) 모델과 공동체”, 「철학」 118, 2014, 178-181면의 분석을 참조하여 재구성하였다.

Player 2

협조(C) 변절(D)

Player 1 협조(C) R=3, R=3 S=0, T=5 변절(D) T=5, S=0 P=1, P=1

* R (reward for mutual cooperation) = 상호협조와 그에 따른 이익 T (temptation to defect) = 협조에 대한 변절의 유인과 그 이익 S (sucker) = 변절에 대한 협조와 그 이익

P (punishment for mutual defection) = 상호변절과 그에 따른 이익

① “할인모수 w가 충분할 정도로 크다면, 경쟁자의 전략과 무관한 유일의 전략은 존재하지 않는 다.”라는 것으로 미래의 상호관계의 확률이 높다고 하더라도 최선의 전략은 독립적으로 결정되는 것이 아니라 상대방의 전략에 직접적으로 의존한다는 것이고, 상대방의 전략과 관계없이 항상 최 선인 전략 자체가 존재하지 않는다는 것을 의미한다.63) 상대가 협조(C)하면 협조(C)하고 상대가 배신(D)하면 배신한다는 단순한 전략은 상대가 협조하느냐, 배신하느냐에 따라 완전히 달라지는 것이다.

② “할인모수 w가 아주 클 때만 TFT는 집단적으로 안정적인 전략” (collectively stable strategy, CSS)이 된다. 미래가치가 높을 때만 TFT가 “집단적으로 안정적인 전략”(collectively stable strategy, CSS)이 된다는 것을 의미한다. 만약, 대한민국이라는 민주공화국이 미래에 소멸 되거나, 쇠퇴할 가능성이 크다면 환언하면 할인모수 w가 매우 작고, 할인율 r이 매우 큰 것이고 TFT 전략은 사용할 수 없다.

③ NICE 전략 즉, 먼저 배신하지 않는 전략은 ②명제와 마찬가지로 할인모수 w가 아주 클 때만 TFT는 “집단적으로 안정적인 전략”(collectively stable strategy, CSS)이 된다.

④ NICE 전략 즉, 먼저 배신하지 않는 전략(=신사적 전략)은 상대방이 배신한 차기에 ‘즉각보 복’ 하는 전략만이 “집단적으로 안정적인 전략”(collectively stable strategy, CSS)이 된다. 즉, 신사적 전략이 총체적으로 안정되려면, 상대의 최초 배신을 ‘응징’해야 한다.

명제 ③과 ④가 의미하는 것은 협조가 시작되고 지속되기 위해서는 비협조적 변절자가 항상 성 공할 수 없어야 한다는 것이다. 변절자가 항상 성공하지 못하는 조건은 게임의 반복 그 자체에 있 는 것이 아니라 변절자에 대한 사회적 평판이 공유된다는 것이고, 변절자에 대한 인지가 어렵다면 TFT는 항상 첫 게임에서 이익 S를 얻게 되고 결국 안정될 수 없기 때문이다.64)

NICE 전략 즉, 먼저 배신하지 않는 전략(=신사적 전략) 가운데 인내력이 가장 적은 NICE 전략 인 TFT는 집합적으로 안정적임에 반해, TFTT 전략은 집합적으로 안정적이지 못한 전략이기 때문 이다. TFTT 전략은 특정한 기에만 배신하여 T의 성과를 누린 후에 다음기에는 얼른 협력으로 되 돌아가는 과정을 반복하는 전략(X전략)에 대해 침공당하기 때문이다. 또한, CSS 상태가 되려면,

63) 김행범, 전게논문, 316면.

64) 박종준, 전게논문, 176-180면.

상대의 배신에 대해 ‘즉각적으로’ 응징하는 전략이 더 우수하며 일단 상대의 배신이 있고 난 후에 계속 관용을 보이는 전략들은 CSS 상태가 될 수 없게 된다.65)

즉, 반헌법적인 행위를 지속해 온 정치세력에 대한 ‘보복’ 과 ‘응징’ 없이는 국가공동체의 존속을 보장할 수 없다는 것을 의미한다. 특정 정치세력이 지은 잘못에 대하여 적법절차에 의한 법치주의 의 실현을 통한 평판의 공유가 없으면 특정 정치세력은 반헌법적 태도를 지향하면서 사익만 추구 하는 괴물로 변할 뿐이고 결국 대한민국이라는 민주공화국은 사익 추구의 각축장으로 몰락하면서 국가의 존립 자체가 위태해질 수 있다.

⑤ “All D(항상 비협조하는 전략)는 항상 총체적으로 안정하다.” 이 명제는 일방의 협조에 대해 상대방이 협조하는 것을 어떻게 보장할 것인가의 문제이고 이는 일회적인 상호관계에서는 배신과 속임수에 취약할 수 있다는 것을 의미한다.66)

⑥ “All D(항상 비협조하는 전략)를 침공할 수 있는 전략 중 최소의 상호작용 비율 p값을 가지 는 것은 최대차별(maximally discriminating)전략이다.” 최대차별 전략이란 피아 식별 능력인데 지금까지 협조하지 않았으나 장래에 협력할 가능성이 있으면 협력하고 All D(항상 비협조하는 전 략)에 대해서는 오직 처음 1기에서만 협력한 후 다시 협력하지 않는다. 그리고 동일 전략과는 항상 협력한다.67) 정권이 바뀔 때마다 반복되는 적폐청산의 문제와 갈등의 일상화는 All D(항상 비협조 하는 전략)에 대해서는 오직 처음 1기에서만 협력한 후 다시 협력하지 않는다는 원칙을 잊고, All D 혹은 D 전략을 구사‘한’ 특정 정치세력에 대하여 법치주의를 통해 즉각 보복하거나 응징하지 못 함에서 기인하는 것일 수도 있다.

⑦ “NICE 전략 즉, 먼저 배신하지 않는 전략이 개인에 의해 침공당하지 않는다면, 이 전략은 집 단에 의해서도 침공되지 않는다.”

⑧ “집단적으로 ‘안정적’인 전략은 ‘영토적으로 안정적’인 전략이기도 하다.”

액설로드가 만들어 낸 아주 간단하지만 강력한 전략인 TFT(Tit-for-Tat) 전략은 양극화를 넘어 극단적인 진영 갈등을 겪고 있는 한국 사회에 2개의 커다란 시사점을 부여한다. 특히, 0.73%라는 역대 최소득표율 차이로 당선된 2022년 대통령 선거 직후 여・야 정치권, 학계를 중심으로 제기되 고 있는 (국민 혹은 사회) ‘통합’ 논의에서 갈등의 봉합이 아닌 대한민국이라는 민주공화국을 발전 시키고 영속시킬 수 있는 수단으로서의 ‘진정한 의미의 통합’을 정의하는데 중요한 원칙을 제시해 줄 수 있다. 액설로드의 TFT 전략은 대통령 선거 이후 (국민 혹은 사회)통합을 정의하는 데 있어 다음과 같이 활용될 수 있다.

65) ① TFTT에 대해 D・C를 반복적으로 사용하는 전략 X의 누적 성과,

      

  

 

② TFTT에 대해 TFTT를 선택한 경우의 누적 성과,

      

  

김행범, 전게논문, 320-321면.

66) 박종준, 전게논문, 179-181면.

67) 김행범, 전게논문, 323면.

첫째, 법치주의를 훼손하고 국가의 이익, 공공의 이익이 아닌 사익을 추구한 정치세력에 대한 용 서・포용은 통합의 전제조건이 아니며, ‘신속한’ 법치주의에 근거한 사법부를 통한 ‘즉각적 보복’과

‘응징’68)만이 진정한 의미의 통합을 위한 전제조건이다.

1987년 개헌69)을 통해 대통령 직선제 개헌이 부활한 이후 소위 우파와 좌파70)라는 색이 다른 정치세력 간의 정권교체는 네 차례 있었다. 노태우71)에서 김영삼72)・김대중73)・노무현74)으로의 정 권교체가 제1차 정권교체이고, 김영삼・김대중・노무현에서 이명박75)・박근혜76)로의 정권교체가 제 2차 정권교체이며, 이명박・박근혜에서 문재인으로의 정권교체가 제3차 정권교체이고, 문재인77)에 서 윤석열로의 정권교체가 제4차 정권교체이다.

주목해야 하는 것은 ①노태우→김영삼 정권교체 시기 ②노무현→이명박 정권교체 시기 ③박근혜

→문재인 정권교체 시기 ④문재인→윤석열 정권교체 시기이다.

①시기는 전직 대통령이었던 전두환과 노태우의 12・12 쿠데타의 사법처리로 ‘보복’과 ‘응징’이 이루어졌으나, 김영삼과 김대중의 권력 교체기에 사면을 통해 ‘용서’가 이루어졌다. 그러나 전두환 과 노태우는 사망할 때까지 대한민국의 어떤 정치세력으로부터도 용서를 받지 못했다. 이는 그들 이 제대로 응징되지 않았다는 것을 의미하거나 적절한 응징을 받았지만 특정 정치세력의 정치적

68) 여기서 즉각적 보복과 응징이란 특정 정치세력의 자의적인 판단에 의거 ‘죄가 없는 사람을 처벌’하거나 ‘죄가 있음에도 처벌하 지 않는 것’이 아니라 오로지 법치에 근거한 사법권에 의한 보복과 응징을 의미한다.

69) 1987.10.29. 개정, 1988.2.25. 시행.

70) 진보와 보수라는 표현은 정치세력 간 비교 특성을 나타내는 상대적인 표현이라서 자유를 보다 강조하는 우파, 평등을 보다 강조 하는 좌파라는 용어가 양분되어 있는 한국의 정치지형을 설명하기에 보다 적절하기에 본 연구에서는 우파와 좌파로 표현한다.

71) 노태우 1988.02.25.~1993.02.24. 재임.

대통령기록관, 대통령 이야기, https://www.pa.go.kr/online_contents/president/president13.jsp, 2022.08.26. 검색.

1997.4.17. 대법원 징역 17년 선고, 1995.11.16. 구속.

전두환 1980.09.01.~1988.02.24. 재임.

대통령기록관, 대통령 이야기, https://www.pa.go.kr/online_contents/president/president11.jsp, 2022.08.26. 검색.

1997.04.17. 대법원 무기징역 선고, 1995.12.03. 구속.

MBC 뉴스, 1997년 12월 20일자, “[전두환, 노태우사면] 구속에서 사면까지”, https://imnews.imbc.com/replay/1997/

nwdesk/article/1772224_30717.html, 2022.08.26. 검색.

72) 1993.02.25.~1998.02.24. 재임.

대통령기록관, 대통령 이야기, https://www.pa.go.kr/online_contents/president/president14.jsp, 2022.08.26. 검색.

73) 1998.02.25.~2003.02.24. 재임.

대통령기록관, 대통령 이야기, https://www.pa.go.kr/online_contents/president/president15.jsp, 2022.08.26. 검색.

74) 2003.02.25.~2008.02.24. 재임.

대통령기록관, 대통령 이야기, https://www.pa.go.kr/online_contents/president/president16.jsp, 2022.08.26. 검색.

75) 2008.02.25.~2013.02.24. 재임.

대통령기록관. 대통령 이야기, https://www.pa.go.kr/online_contents/president/president17.jsp, 2022.08.26. 검색.

2018.03.22. 구속.

연합뉴스, 2018년 3월 23일자, “‘뇌물・다스 횡령’ 이명박 구속…전직대통령 2명 동시구속 재연”, https://www.yna.co.kr/

view/AKR20180322117151004?input=1195m, 2022.08.26. 검색.

76) 2013.02.25.~2017.03.10. 재임.

대통령기록관, 대통령 이야기, https://www.pa.go.kr/online_contents/president/president18.jsp, 2022.08.26. 검색.

2017.03.10. 탄핵선고, 2017.03.31. 구속, 2021.12.31. 사면.

중앙일보, 2021년 12월 31일자, “박근혜 전 대통령 31일 0시 석방…사면・복권장 직접 수령”, https://www.joongang.co.

kr/article/25037145, 2022. 8. 26. 검색.

77) 2017.05.10.~2022.05.09. 재임.

대통령기록관, 대통령 이야기, https://www.pa.go.kr/online_contents/president/president19.jsp, 2022.08.26. 검색.

목적에 의해 끝까지 용서하지 않았다는 것을 의미한다.

②시기는 노무현과 그 가족에 대한 검찰 수사로 ‘보복’과 ‘응징’을 시작하였으나, 노무현의 자살 로 더 이상 수사를 진행하지 못했다. 오히려 김대중의 아들들과 노무현의 형인 노건평에 대한 수사 와 기소는 각각 자신들의 대통령 임기 중에 행해졌다는 점이 특징이라 할 것이다.

③시기에서의 ‘보복’과 ‘응징’은 이명박의 구속 및 박근혜의 탄핵과 구속이라는 극단적인 형태로 나타났고 ‘용서’ 또한 2022 대통령 선거 직전에 문재인 정권에서 이루어진 특징이 있다.

현재 우리는 ④시기에 있다. 그런데 이번 정권교체기는 앞서 우리가 경험했던 세 차례의 정권교 체기와는 다른 방향으로 전 정권의 反대한민국 행위에 대한 국가공동체의 법치주의에 의거한 ‘보 복’과 ‘응징’보다는 0.73%라는 박빙의 대통령 선거 결과에 의거 ‘보복’과 ‘응징’이 아닌 ‘용서’와

‘통합’만 강조되고 있는 상황이다.

TFT(Tit-for-Tat)가 추구하는 “집단적으로 안정적인 전략”(collectively stable strategy, CSS) 상태가 되기 위한 전제조건은 상대의 배신(D)에 대한 ‘즉각적인 보복’과 ‘응징’이다. 상대 정치세력 이 반헌법적으로 민주공화국 대한민국을 배신했다면 상대의 배신에 대해 ‘즉각적으로’ 응징하는 전 략이 더 우수하며 일단 상대의 배신이 있고 난 후에 계속 관용을 보이는 전략들은 CSS 상태가 될 수 없게 됨78)을 다시 한번 강조한다.

둘째, 액설로드의 TFT(Tit-for-Tat) 전략이 대통령 선거 이후 한국 정치 현실에서 빛날 수 있는 또 다른 중요한 이유는 상대 정치세력에 ‘즉각적인 보복’과 ‘응징’을 수행한 후 상대가 다시 민주공 화국 대한민국의 근본 가치에 동의하고 협조(C)하는 경우 상대의 과거 배신(D) 전략은 모두 잊고 또다시 협조(C)를 통해 항구적으로 영속적, 발전적인 대한민국을 함께 만들어나갈 수 있다는 점이 다. 소위 1987체제 이후 발생한 세 차례의 정권교체기에 발생한 세 차례의 ‘즉각적인 보복’과 ‘응 징’은 ①내란죄의 수괴에 대한 사형 선고 ②자살 ③현직 대통령 탄핵이라는 결과물을 만들어 냈다.

각각의 ‘즉각적인 보복’과 ‘응징’의 효과와 당위성은 보는 사람에 따라 다를 것이다. 중요한 것은 세 차례의 ‘즉각적인 보복’과 ‘응징’ 이 존재‘는’했다는 점이다.

전직 대통령 2명이 내란죄로 사형과 무기징역형을 선고받고, 전직 대통령이 스스로 목숨을 끊 고, 전직 대통령이 구속되고, 현직 대통령이 탄핵당하는 인류가 상상할 수 있는 최극단의 방식으로

‘즉각적인 보복’과 ‘응징’이 존재했음에도 불구하고, 그것도 한 차례가 아닌 세 차례의 극단적 보복 과 응징이 1987체제 이후 존재했음에도 불구하고 우리는 왜 아직 CSS 상태 즉, 대한민국 헌법 정 신에 합치하는 국가를 만들어 내지 못했는가에 대한 해답이 바로 여기에 있다. ‘즉각적인 보복’과

‘응징’ 이후에 응징당한 정치세력을 다시 대한민국 정치의 플레이어로 인정하지 않았기 때문이다.

한쪽의 정치세력은 다른 한쪽을 ‘토착왜구’라고 비난하며 사회의 구성원으로 인정하지 아니하고 다 른 한쪽의 정치세력을 상대 정치세력을 ‘빨갱이’로 칭하며 이익을 주고받아 서로가 서로를 보다 나

78) 각주 65) 수식 참조.