since 1992

대한민국 최고 금융경제지

닫기
한국금융신문 facebook 한국금융신문 naverblog

2025.10.16(목)

죄수의 딜레마게임과 인간관계 [마음을 여는 인맥관리 63]

기사입력 : 2025-10-16 09:24

  • kakao share
  • facebook share
  • telegram share
  • twitter share
  • clipboard copy
ad
죄수의 딜레마게임과 인간관계 [마음을 여는 인맥관리 63]이미지 확대보기
죄수의 딜레마
경찰이 A, B 두명의 범죄자를 체포했는데 조사과정에서 죄질이 나쁜 또 다른 범죄가 있을 것이라는 심증은 있지만 증거가 부족해 반드시 자백을 받아야만 기소할 수 있다. 경찰은 두 사람이 말을 맞추지 못하도록 각각 다른 취조실로 분리한 다음 제안을 한다. A와 B 누구도 자백을 하지 않으면 각각 1년형을 살아야 하고, A와 B중 한 명이 자백을 하면 자백한 사람은 특별히 풀어주고 자백하지 않은 사람은 9년형을, 둘 다 자백을 하면 각각 5년형을 살아야 한다고 제안한다. 상대가 자백을 하지 않는다는 가정에서는 자백하는 것이 본인에게는 유리하므로 각각 자백을 하게 되면 서로가 손해를 감수하고 의리를 지키는 것보다 안 좋은 결과가 나오게 된다.

상대방이 선택을 바꾸지 않는다는 가정에서 이성적으로 취할 수 있는 최선의 선택을 내시 균형(Nash Equilibrium)라 부른다. 문제는 내시 균형이 반드시 최선의 결과를 가져오는 것은 아니라는 데 있다. 그러면 어떻게 해야 할까? 한 가지 방법은 의리를 지키는 것, 즉 협력의 미덕을 지키는 것이다. 자신은 조금 손해를 보더라도 다른 사람을 위해서 희생하고 협력하는 것이다

죄수의 딜레마 게임으로 상대방이 착한 사람인지 나쁜 사람인지를 판단
죄수의 딜레마를 반복적으로 진행하면 상대방이 착한 사람인지 나쁜 사람인지를 파악하고 그에 맞는 전략을 세울 수 있는데 이를 죄수의 딜레마게임이라 한다. 이 게임에서는 참가자수를 2인으로 제한할 필요가 없고 많은 사람이 참여하여 무작위로 실행이 가능하다. 1990년대 중반, 이 질문에 흥미를 느낀 미국의 정치학자 로버트 엑설로드(Robert Axelrod)는 당시 최첨단 연구수단으로 대두된 컴퓨터를 통한 모의 시뮬레이션대회를 세계 각 국의 정치학자, 경제학자. 수학자, 심리학자를 대상으로 열고 최고의 전략을 요청했다. 대회의 규칙은 간단했다. 자기 자신을 포함한 모든 참여자가 반복해서 대결하고 그 과정에서 얻는 이익의 총합으로 정해진다. 여기서 이익이란 형량의 마이너스 개념으로 일종의 보수라 생각할 수 있다.

<평가기준>
참여자 A와 B가 모두 협력을 하면 각각 3점을 받고 모두 배신을 선택하면 각각 1점을, 한사람은 협력하고 한사람은 배신하면, 협력한 사람은 0점 배신한 사람은 5점을 받는다. 개인의 입장에서 최선의 선택, 즉 내시 균형은 둘 다 배신을 선택하고 각각 1점을 받는 것이다.

<주요 전략>
다음은 반복되는 죄수의 딜레마 대회에 실제로 제출되었거나 가능한 전략의 일부다 (대회는 두 번 개최되었는데 제출된 프로그램의 수는 첫번째 대회는 14개, 두번째 대회는 63개였다)

1. 모두 배신 전략: 상대방이 어떻게 나오든 무조건 배신한다. 단발적인 죄수의 딜레마에서는 최선이었지만 반복되는 게임인 실제 대회에서는 제출되지 않았다.

2. 모두 협력전략: 상대방이 어떻게 나오든 무조건 협력하는 착한 전략이지만 그리 성공적일 것 같지 않아 실제 대회에서는 제출되지 않았다.

3. 팃포탯(Tit-For-Tat 또는 눈에는 눈, 이에는 이) 전략: 처음에는 항상 협력한다. 이후에 상대방이 이전 단계에서 했던 행동을 똑같이 따라한다. 상대방이 이전 단계에서 배신하면 다음 단계에서는 똑 같이 배신함으로써 보복한다. 하지만 다음 단계에서 상대방이 다시 협력하면 그 다음 단계에서는 협력함으로써 용서한다. 먼저 배신을 하지 않기 때문에 기본적으로는 선한 전략이지만 배신에 대해서는 바로 보복하는 철두철미한 전략이기도 하다. 그리고 적극적으로 용서함으로써 협력을 도모한다. 의도가 아주 명료하게 드러나는 전략이다.

4. 그러저Grudger 또는 뒤끝 작렬 전략: 그러저는 처음에는 팃포탯처럼 항상 협력한다. 그리고 상대방이 협력하는 한 계속 협력한다. 하지만 상대방이 한번 배신하면 게임이 끝날 때까지 상대방이 어떤 행동을 하든 무조건 배신함으로써 계속 보복한다.

5. 다우닝 Downing 또는 통계적 판단 전략: 처음에는 협력한다. 이후에는 이전 단계에서 상대방이 했던 행동을 통계적으로 분석해 협력 가능성을 확률로 계산한다. 이 확률에 따라서 협력 가능성이 50%이상이면 협력하고 그 미만이면 배신한다.

6. 테스터 Tester 또는 기회주의자 전략: 처음에는 배신한다. 그리고 이에 대해 상대방이 어떻게 행동하는지를 분석한다. 즉 적당히 배신해보고 상대방이 보복하는 패턴을 관찰한다. 상대방이 만만해 보이면 가혹하게 착취하고 상대방이 강경하게 보복한다고 판단되면 태도를 바꾸어 적극 협력한다.

7. 트랭퀼라이저 Tranquilizer 또는 장기적인 사기꾼 전략: 처음에는 착한 척하며 지속적으로 협력한다. 충분히 신뢰가 쌓였다고 생각되면 어느 단계부터는 확률이 25%가 넘지 않는 선에서 가끔씩 먼저 배신한다. 보복이 들어오면 다시 착한 척하며 얼마간 협력한다. 그러면서 다음에 배신할 기회를 노린다.

8. 자비로운 팃포탯전략: 기본적으로는 팃포탯전략이지만 용서에 조금 더 관대하다. 즉 상대방이 배신했을 때 곧 바로 보복하지 않고 기회를 몇 번 더 주고 계속 배신하면 보복하는 것이다. 또 다른 방법은 상대방이 배신했을 때 어떻게 대응할 지를 확률로 결정한다. 예를 들어 10%의 확률로 용서하고 90%의 확률로 보복하는 것이다.

9. 랜덤Random 전략: 그야 말로 아무렇 게나 행동하는 것이다. 복잡한 상황에서는 때때로 아무렇 게나 행동하는 것이 더 나을 수 있다. 상대방이 내 전략을 전혀 파악할 수 없기 때문이다.

죄수의 딜레마 게임과 인간관계의 상관성
자, 이 가운데 어떤 전략이 가장 좋은 성과를 거두었을까? 놀랍게도 엑설로드의 시뮬레이션대회에서 두 차례 모두 우승한 전략은 팃포탯모델이었다. 팃포탯의 전략에는 다음과 같은 네가지 특징이 있다

1. 선량함: 절대로 먼저 배신하지 않는다
2. 단호함: 상대방이 배신하면 단호하게 보복한다
3. 관대함: 상대방이 협력의 손을 내밀면 관대하게 용서하고 곧바로 협력한다
4. 명료함: 상대방이 내 전략을 쉽게 이해할 수 있게 함으로써 상대방의 현명한 선택, 즉 협력을 유도한다

팃포탯전략에는 인생의 교훈이 있다. 착하게 살자. 하지만 나쁜 사람에게는 단호하게 대처하자. 그리고 혹시 나쁜 사람이 다시 착해지면 관대하게 용서하자.

인용 및 출처: 일어날 일은 일어난다 (저자 박권)

윤형돈 운을 부르는 인맥관리연구소 대표

가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~

데일리 금융경제뉴스 Copyright ⓒ 한국금융신문 & FNTIMES.com

저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지

issue
issue

윤형돈 FT인맥관리지원센터장기사 더보기

오피니언 BEST CLICK