• 검색 결과가 없습니다.

Tit-for-Tat

N/A
N/A
Protected

Academic year: 2022

Share "Tit-for-Tat "

Copied!
24
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)
(2)

공공재 게임은 용의자의 딜레마를 다인 게임으로 확대한 것.

클라이드

기부한다 안 한다

보니 기부한다 (3. 3) (1, 4) 안 한다 (4, 1) (2, 2)

(3)

 유한한 반복 게임은 역진 귀납법으 로 풀 수 있다.

 비협력자를 응징하기 위해서는 Tit- for-Tat 전략이 유용하다.

관대한

Tit-for-Tat

Tit-for-2Tat

(4)

 방아쇠 전략(Trigger Strategy) : 무한 반복 게임에서 한 경기자의 비협조적 행동에 대해 희생자가 보복으로 비협 조적 행동을 하는 전략.

냉혹한 방아쇠 전략 : 한 번의 배신에 대하 여 이후의 모든 라운드에서 보복 행동을 선 택하는 전략. (Tit-for-Tat은 관대한 방아 쇠 전략)

(5)

사육사가 오리들에게 한 곳에서는 5 분마다 자주, 다른 곳에서는 10분마 다 가끔 먹이를 던져 준다. 오리의 최적전략은 무엇인가?

5분마다 자주 주는 곳에서는 ( ), 10 분마다 가끔 주는 곳에서는 ( )

(6)

 혼합전략 : 특정 빈도(확률)를 가 진 여러 순수전략들의 혼합

 홈즈와 모리아티/가위바위보

(7)

Player 2 = αL + (1-α)R

Player 1 = βU + (1-β)D

α = (d1-c1)/(d1-c1+a1-b1)

β = (d2-b2)/(d2-b2+a2-c2)

Player 2

L R

Player 1 U (a1, a2) (c1, c2)

D (b1, b2) (d1, d2)

(8)

메시 골키퍼 오른쪽 왼쪽

오른쪽 (0.4, 0.6) (0.9, 0.1) 왼쪽 (0.6, 0.4) (0.3, 0.7)

(9)

골키퍼는 q의 확률로 오른쪽을, (1-q)의 확률로 왼쪽을 선택.

메시가 오른쪽으로 찼을 때의 기댓값은 0.4×q + 0.9×(1-q) = -0.5q + 0.9

메시가 왼쪽으로 찼을 때의 기댓값은 0.6×q + 0.3×(1-q) = 0.3q + 0.3

골키퍼의 내쉬 균형은 -0.5q + 0.9 = 0.3q + 0.3 q = 3/4 오른쪽을 3/4, 왼쪽을 ¼

메시는 p의 확률로 오른쪽을, (1-p)의 확률로 왼쪽을 선택.

골키퍼가 오른쪽으로 뛸 때의 기댓값은 0.6p + 0.4(1-p) = 0.2p + 0.4 골키퍼가 왼쪽으로 뛸 때의 기댓값은 o.1p + 0.7(1-p) = -0.6p + 0.7 0.2p + 0.4 = -0.6p + 0.7

p = 3/8 오른쪽을 3/8, 왼쪽을 5/8

(10)

성 대결 게임/ 친구 만나기 게임/ 주행 게임 등은 조정 게임

남편

백화점 야구장

아내

백화점 (2, 1) (0, 0) 야구장 (0, 0) (1, 2)

(11)

(백화점, 백화점)과 (야구장, 야구장) 두 가지 모두 내쉬 균형임. 단 두 가지 가운 데 어느 것이 선택될지는 알 수 없음.

치킨 게임에서는 두 사람 가운데 한 사 람이 균형보다 불균형상태를 더 선호하 지만, 성 대결 게임에서는 두 사람 모두 균형상태를 더 선호함 = 따라서 성 대결 게임은 조정(공조) 게임임.

(12)

보수에 차이가 없는 다중 균형

아내

좌측 통행 우측 통행

남편

좌측 통행 (1, 1) (0, 0) 우측 통행 (0, 0) (1, 1)

(13)

(우, 우)와 (좌, 좌)는 두 가지 모두 내 쉬 균형이지만 (좌, 좌)가 초점(focal point)

아내

좌 우

남편

좌 (3, 3) (0, 0) 우 (0, 0) (1, 1)

(14)

춘향이

변학도

(1, -1) (-1, 1) (-1, 1) (1, -1)

(15)

춘향이

가위 바위

변학도

가위 (0, 0) (-1, 1) (1, -1) 바위 (1, -1) (0, 0) (-1, 1)

(-1, 1) (1, -1) (0, 0)

(16)

홀짝 게임/가위바위보 게임 등은 영합 게임이며 갈등 게임

홀짝 게임/가위바위보 게임에는 내쉬 균 형이 존재하지 않는다

치킨 게임/분배 게임 등은 갈등 게임이 지만 내쉬 균형이 존재한다

(17)

춘향이

0 1만 9만 10만

변학도

0 (0, 0) (0, 1만) (0, 9만) (0, 10만) 1만 (1만, 0) (1만, 1만) (1만, 9만) (0, 0)

(0, 0) (0, 0)

9만 (9만, 0) (9만, 1만) (0, 0) (0, 0) (0, 0) 10만 (10만, 0) (0, 0) (0, 0) (0, 0) (0, 0)

(18)

최적 전략은 p =1/2임

춘향이

변학도

(1, -1) (-1, 1) (-1, 1) (1, -1)

(19)

아내의 최적 전략은 백화점 2/3, 야구장=1/3 남편은 백화점 1/3, 야구장=2/3 임

남편

백화점 야구장

아내

백화점 (2, 1) (0, 0) 야구장 (0, 0) (1, 2)

(20)

남편의 최적 전략은 버스 ½, 걷기 ½

아내의 최적 전략은 버스 ¼, 걷기 ¾

남편

버스 걷기

아내

버스 (-3, 3) (-6, 6) 걷기 (-5, 5) (-4, 4)

(21)

이 게임의 내쉬 균형은?

새 B

매 비둘기

새 A

매 (-2, -2) (2, 0) 비둘기 (0, 2) (1, 1)

(22)

비둘기 마을에 매가 들어오면 살아 남지만

매 마을에 비둘기가 들어오면 살 지 못한다

아내

매 비둘기

남편

매 (-2, -2) (2, 0) 비둘기 (0, 2) (1, 1)

(23)

최적전략은 1/3은 매, 2/3는 비둘기

새 B

매 비둘기

새 A

매 (-2, -2) (2, 0) 비둘기 (0, 2) (1, 1)

(24)

관람자가 있는 경우에는?

아내

매 비둘기

남편

매 (-2, -2) (2, 0) 비둘기 (0, 2) (1, 1)

참조

관련 문서

본 장에서는 임피던스 연성을 이용한 결합 구조물 의 진동 응답 해석 예로서 무한 길이 원통형 실린더 와 그 내부에 설치된 유한 길이 평판 구조물의 연성 을

양육자의 적절한 보호행동은 아동의 안전과 건강한 성장에 필 요하고, 아동이 양육자와 안정적인 애착을 형성하는데 도움이 되 며, 아동으로 하여금 자신과 타인에 대해

보상을 주지 않는 것을 통해 어떤 행동이 생기지 않게, 즉 소 멸되게 할 수 있는데, 지각과 같은 바람직하지 않은 행동을 지 각하지 않은 것에 대해 주는 보상을 주지 않음으로써

본 장에서는 임피던스 연성을 이용한 결합 구조물 의 진동 응답 해석 예로서 무한 길이 원통형 실린더 와 그 내부에 설치된 유한 길이 평판 구조물의 연성 을

예를 들면 비록 일부 세균에서 QS-비의존적인 생물막 형성 메커니즘이 존재할 수 있지만, 다양한 Anti-QS 전략은 막을 이용한 수처리 공정에서 문제가 되고 있는

예를 들면 비록 일부 세균에서 QS-비의존적인 생물막 형성 메커니즘이 존재할 수 있지만, 다양한 Anti-QS 전략은 막을 이용한 수처리 공정에서 문제가 되고

CFS는 1993년 AT&T Bell 연구소의 Matt Blaze가 NFS 파일시스템 내에 암호화 기능을 추가 한 것으로, 암호화된 파일에 대해 표준 유닉스 파일 시스템

본 논문에서는 저 비트율 압축영상의 블록킹 현상을 제거하기 위하여 공간 영역에서의 후처리 방식에 기반 한 적응적 필터링 방법을 제안한다.. 블록 경계를 포함