• 검색 결과가 없습니다.

Tit-for-Tat

N/A
N/A
Protected

Academic year: 2022

Share "Tit-for-Tat "

Copied!
24
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)
(2)

공공재 게임은 용의자의 딜레마를 다인 게임으로 확대한 것.

클라이드

기부한다 안 한다

보니 기부한다 (3. 3) (1, 4) 안 한다 (4, 1) (2, 2)

(3)

 유한한 반복 게임은 역진 귀납법으 로 풀 수 있다.

 비협력자를 응징하기 위해서는 Tit- for-Tat 전략이 유용하다.

관대한

Tit-for-Tat

Tit-for-2Tat

(4)

 방아쇠 전략(Trigger Strategy) : 무한 반복 게임에서 한 경기자의 비협조적 행동에 대해 희생자가 보복으로 비협 조적 행동을 하는 전략.

냉혹한 방아쇠 전략 : 한 번의 배신에 대하 여 이후의 모든 라운드에서 보복 행동을 선 택하는 전략. (Tit-for-Tat은 관대한 방아 쇠 전략)

(5)

사육사가 오리들에게 한 곳에서는 5 분마다 자주, 다른 곳에서는 10분마 다 가끔 먹이를 던져 준다. 오리의 최적전략은 무엇인가?

5분마다 자주 주는 곳에서는 ( ), 10 분마다 가끔 주는 곳에서는 ( )

(6)

 혼합전략 : 특정 빈도(확률)를 가 진 여러 순수전략들의 혼합

 홈즈와 모리아티/가위바위보

(7)

Player 2 = αL + (1-α)R

Player 1 = βU + (1-β)D

α = (d1-c1)/(d1-c1+a1-b1)

β = (d2-b2)/(d2-b2+a2-c2)

Player 2

L R

Player 1 U (a1, a2) (c1, c2)

D (b1, b2) (d1, d2)

(8)

메시 골키퍼 오른쪽 왼쪽

오른쪽 (0.4, 0.6) (0.9, 0.1) 왼쪽 (0.6, 0.4) (0.3, 0.7)

(9)

골키퍼는 q의 확률로 오른쪽을, (1-q)의 확률로 왼쪽을 선택.

메시가 오른쪽으로 찼을 때의 기댓값은 0.4×q + 0.9×(1-q) = -0.5q + 0.9

메시가 왼쪽으로 찼을 때의 기댓값은 0.6×q + 0.3×(1-q) = 0.3q + 0.3

골키퍼의 내쉬 균형은 -0.5q + 0.9 = 0.3q + 0.3 q = 3/4 오른쪽을 3/4, 왼쪽을 ¼

메시는 p의 확률로 오른쪽을, (1-p)의 확률로 왼쪽을 선택.

골키퍼가 오른쪽으로 뛸 때의 기댓값은 0.6p + 0.4(1-p) = 0.2p + 0.4 골키퍼가 왼쪽으로 뛸 때의 기댓값은 o.1p + 0.7(1-p) = -0.6p + 0.7 0.2p + 0.4 = -0.6p + 0.7

p = 3/8 오른쪽을 3/8, 왼쪽을 5/8

(10)

성 대결 게임/ 친구 만나기 게임/ 주행 게임 등은 조정 게임

남편

백화점 야구장

아내

백화점 (2, 1) (0, 0) 야구장 (0, 0) (1, 2)

(11)

(백화점, 백화점)과 (야구장, 야구장) 두 가지 모두 내쉬 균형임. 단 두 가지 가운 데 어느 것이 선택될지는 알 수 없음.

치킨 게임에서는 두 사람 가운데 한 사 람이 균형보다 불균형상태를 더 선호하 지만, 성 대결 게임에서는 두 사람 모두 균형상태를 더 선호함 = 따라서 성 대결 게임은 조정(공조) 게임임.

(12)

보수에 차이가 없는 다중 균형

아내

좌측 통행 우측 통행

남편

좌측 통행 (1, 1) (0, 0) 우측 통행 (0, 0) (1, 1)

(13)

(우, 우)와 (좌, 좌)는 두 가지 모두 내 쉬 균형이지만 (좌, 좌)가 초점(focal point)

아내

좌 우

남편

좌 (3, 3) (0, 0) 우 (0, 0) (1, 1)

(14)

춘향이

변학도

(1, -1) (-1, 1) (-1, 1) (1, -1)

(15)

춘향이

가위 바위

변학도

가위 (0, 0) (-1, 1) (1, -1) 바위 (1, -1) (0, 0) (-1, 1)

(-1, 1) (1, -1) (0, 0)

(16)

홀짝 게임/가위바위보 게임 등은 영합 게임이며 갈등 게임

홀짝 게임/가위바위보 게임에는 내쉬 균 형이 존재하지 않는다

치킨 게임/분배 게임 등은 갈등 게임이 지만 내쉬 균형이 존재한다

(17)

춘향이

0 1만 9만 10만

변학도

0 (0, 0) (0, 1만) (0, 9만) (0, 10만) 1만 (1만, 0) (1만, 1만) (1만, 9만) (0, 0)

(0, 0) (0, 0)

9만 (9만, 0) (9만, 1만) (0, 0) (0, 0) (0, 0) 10만 (10만, 0) (0, 0) (0, 0) (0, 0) (0, 0)

(18)

최적 전략은 p =1/2임

춘향이

변학도

(1, -1) (-1, 1) (-1, 1) (1, -1)

(19)

아내의 최적 전략은 백화점 2/3, 야구장=1/3 남편은 백화점 1/3, 야구장=2/3 임

남편

백화점 야구장

아내

백화점 (2, 1) (0, 0) 야구장 (0, 0) (1, 2)

(20)

남편의 최적 전략은 버스 ½, 걷기 ½

아내의 최적 전략은 버스 ¼, 걷기 ¾

남편

버스 걷기

아내

버스 (-3, 3) (-6, 6) 걷기 (-5, 5) (-4, 4)

(21)

이 게임의 내쉬 균형은?

새 B

매 비둘기

새 A

매 (-2, -2) (2, 0) 비둘기 (0, 2) (1, 1)

(22)

비둘기 마을에 매가 들어오면 살아 남지만

매 마을에 비둘기가 들어오면 살 지 못한다

아내

매 비둘기

남편

매 (-2, -2) (2, 0) 비둘기 (0, 2) (1, 1)

(23)

최적전략은 1/3은 매, 2/3는 비둘기

새 B

매 비둘기

새 A

매 (-2, -2) (2, 0) 비둘기 (0, 2) (1, 1)

(24)

관람자가 있는 경우에는?

아내

매 비둘기

남편

매 (-2, -2) (2, 0) 비둘기 (0, 2) (1, 1)

참조

관련 문서

- 대부분의 경우 행동은 개인의 기질적 특성과 상황요소가 결합되어 나타나는 경우 가 많은데 상황이 행동에 강력한 영향력을 행사함. 불행한 상황에 처해 있는 사람은

문제 5의 답] 일반적으로 다른 경기자의 행동에 관계없이 다른 경기자를 능가하 는 자기만의 비법이 있을 때 절대 우위의

 행동에 대해 스스로를 교육, 숙달하기 위한 기술들을 개 발, 숙달한 경험들을 성공적으로 수행함으로써 구두적인 강화를

반응의 효율성을 평가하여 차기 전략 수립을 위 한

 주제 통각 검사(TAT: Thematic Apperception Inventory).. 성격과

The intent of the Strategy is to design, foster and build synergies for activities and investments in geospatial information management in the United Nations

전통주와 지역경제활성화 전략 전통주와 지역경제활성화 전략 전통주와 지역경제활성화 전략 전통주와 지역경제활성화 전략 전통주와 지역경제활성화

0프로그램을 이용하여 분석하였다.분석기법으로는 동화의 도덕적 주제를 활용 한 통합교육활동이 유아의 도덕적 판단력과 친사회적 행동에 미치는