Wyklad - dylemat wi¦Ö+¦nia.pdf

(122 KB) Pobierz
Microsoft Word - Teoria Decyzj nr 11 .doc
Teoria Decyzji
Wykład 11
Dwuosobowe gry kooperacyjne - Dylemat eksploatacji zasobów.
Dylemat wiĘŹnia.
Na poprzednim wykładzie omawialiśmy własności gier nieściśle konkurencyjnych na
przykładzie walki płci. Innym przykładem gry o sumie niezerowej jest gra znana pod nazwą
dylematu więźnia . Państwo zapoznali się z nią na wykładach ubiegłorocznych. Macierz
wypłat tej gry moŜe wyglądać następująco:
( ) ( )
( ) ( )
0
10
10
0,
11
RóŜnorodne problemy rzeczywiste prowadzą do takiej macierzy wypłat. Opis jednego
z nich (tłumaczący nazwę) moŜe być następujący. Dwu podejrzanych – złapanych w
samochodzie, którym uciekli z banku rabusie - zostaje zamkniętych w areszcie i
odseparowanych. Prokurator jest pewny, Ŝe są oni winni napadu, a nie ma dostatecznych
dowodów dla sądowego uznania ich winnymi – twierdzą, Ŝe samochód stał opodal i się nim
zainteresowali bo był otwarty. Prokurator w tę bajeczkę nie wierzy -
ale moŜe im udowodnić tylko kradzieŜ samochodu. Tłumaczy
kaŜdemu więźniowi, Ŝe mają dwie alternatywy: przyznać się do
przestępstwa, co do którego jest przekonany, Ŝe je popełnili, albo nie
przyznać się. JeŜeli obydwaj się nie przyznają dostaną relatywnie
niską karę - za kradzieŜ. JeŜeli obydwaj się przyznają, to zostaną
skazani sądownie, ale wyrok będzie złagodzony – sąd uwzględni ich
współpracę z policją. JeŜeli jednak jeden z nich się przyzna, a drugi
nie, to ten który się przyzna będzie traktowany łagodnie, bo inaczej będzie się tłumaczyło
materiał dowodowy, podczas gdy drugi będzie miał spraw przegraną w zupełności.
WyraŜając to w latach więzienia, problem strategiczny moŜna przedstawić tabelką:
99
647636960.023.png
Więzień 2
Nie przyznać się
Przyznać się
Nie przyznać się
więzień 1: 2 lata
więzień 1: 10 lat
Więzień 1
więzień 2: 2 lata
więzień 2: 3 miesiące
Przyznać się więzień 1: 3 miesiące
więzień 1: 8 lat
więzień 2: 10 lat
więzień 1: 8 lat
JeŜeli przez a 1 i b 1 będziemy rozumieli strategie „nie przyznać się”, a przez a 2 i b 2
„przyznać się”, to pod warunkiem, Ŝe Ŝaden z podejrzanych nie ma skrupułów moralnych ani
nie obawia się zdrady, wyŜej podana macierz wypłat uŜyteczności dobrze oddaje dylemat
więźnia. Zagadnienie dla kaŜdego więźnia polega na tym, czy się przyznać, czy nie. Prowadzi
to do wcześniej podanej macierzy wypłat. Oczywiście, gdyby oprócz kary więzienia takŜe
„wypłaty uboczne” typu kara za brak lojalności ze strony pozostałych członków grupy
przestępczej miały zostać uwzględnione, to problem byłby inny , najbardziej interesujący jest
jednak w omawianej postaci. Wszak nie chodzi nam o model zachowań aresztantów, ale o
pewne waŜne i ciekawe implikacje sytuacji opisanej przez nasza grę.
Rozpatrzmy najpierw grę z punktu widzenia gracza I. NiezaleŜnie od tego czy gracz II
wybierze b 1 czy b 2 , dla gracza I bardziej uŜyteczna jest strategia a 2 , poniewaŜ 10 jest większe
niŜ 9 w przypadku pierwszym, a 1 jest większe od 0 w przypadku drugim. Wobec tego a 2
dominuje ściśle a 1 . Podobnie b 2 dominuje dokładnie b 1 . poniewaŜ kaŜdy gracz chce
maksymalizować uŜyteczność, dlatego a 2 i b 2 są ich wyborami rozsądnymi.
Jest trochę niewygodne dla naszej intuicji, Ŝe dwaj gracze „nierozsądni’ będą w
lepszej sytuacji niŜ gracze „rozsądni”. Widzimy, Ŝe gdyby obaj zagrali swoje pierwsze
strategie to dostaliby wypłatę po 9 zamiast po 1. Zastanówmy się jednak czy przy takim
modelu i takich wypłatach jest moŜliwa kooperacja w celu uzyskania wypłat po 9. Ktoś powie
nic prostszego. ZałóŜmy, Ŝe gracze gry G mogą współpracować. naturalnie porozumieliby się
co do trzymania się ( a 1 , b 1 ), poniewaŜ jedyną alternatywą jest ( a 2 , b 2 ), której Ŝaden z nich nie
chce. Na przykład spotykają się na korytarzu – wyobraźmy sobie - i umawiają, Ŝe do końca,
bez względu na wszystko, będą zaprzeczać, Ŝe brali udział w napadzie. Wyobraźmy sobie
zatem co dalej. Idą do swoich cel i myślą: tak, ja będę zaprzeczał, a on? Czy moŜna mu ufać?
Ha, nie wiadomo, zatem lepiej zrobię przyznając się! Nie dam się zrobić. Hm, jeśli on
dotrzyma umowy, to trudno - sam sobie frajer winien.
Po prostu strategia ( a 1 , b 1 ) nie jest w równowadze, a to znaczy, Ŝe kaŜdy z graczy
moŜe mieć słuszne powody do zerwania umowy. Powody są następujące: jeŜeli któryś z
647636960.024.png
graczy zerwie umowę, a przeciwnik nie, to traci gracz I więcej niŜ wtedy, gdyby obydwaj nie
dotrzymali umowy.
I tak dochodzimy do strategii wcześniej wybranej – po prostu pozostanie prawdą, Ŝe
gracz rozsądny wychodzi zawsze lepiej niŜ gracz nierozsądny. Jako dalsze uzasadnienie tych
wyborów strategii moŜna powiedzieć, Ŝe ( a 2 , b 2 ) jest w tej grze jedyną parą strategii w
równowadze oraz, Ŝe a 2 i b 2 są równieŜ jedynymi strategiami maksymiowymi odpowiednio
dla graczy I i II. WaŜnym faktem jest to, Ŝe a 2 ściśle dominuje nad a 1 , a b 2 nad b 1 .
Na zakończenie tej bajeczki moŜna jeszcze raz powrócić do kontekstu kryminalnego,
w którym takie „oszustwo” moŜe spowodować powaŜne represje i wobec tego moŜna by
argumentować, Ŝe gra nie jest warta świeczki. To jednak zaprzecza interpretacji
uŜyteczności, jaką daliśmy liczbom. JeŜeli zignorowaliśmy tego rodzaju rozwaŜania, to
znaczy, Ŝe w tym przypadku te konsekwencje nie odgrywaja roli. Gdyby było inaczej to
uczynilibyśmy lepiej, gdybyśmy zawarli fakt łamania wiąŜącego układu jako integralną część
gry rozszerzonej, która miałaby na celu odzwierciedlić ten konflikt interesów. Oczywiście
wtedy nie byłaby to gra zwana dylematem więźnia!
Na temat tego problemu napisano wiele artykułów – wynika to z tego, Ŝe opisuje on
wiele sytuacji z rzeczywistości społeczno – gospodarczej. W takim kontekście problemy te
nazywamy dylematem eksploatacji wspólnych zasobów. Oto kolejny przykład.
Dylemat eksploatacji zasobów
RozwaŜmy sytuację związaną z rynkiem pewnego dobra. Aby nawiązać do klimatu
przykładu poprzedniego wyobraźmy sobie, Ŝe chodzi o produkcję i sprzedaŜ whisky w
okresie prohibicji. W pewnym mieście – nazwijmy je Buffalo - cały rynek tego produktu
zaspakajany jest przez czterech otrębnych producentów prowadzących tzw. interes rodzinny .
Wiadomo, Ŝe cena produktu dla takiego rynku na którym funkcjonuje oligopol moŜe
być wyraŜona w postaci:
cena = A - k ( łączna podaŜ )
gdzie stała A reprezentuje hipotetyczną cenę dobra w sytuacji całkowitego braku dostępu do
niego (nie ma whisky, a gdyby się pojawiła to ile byś dał, Ŝeby ją kupić?), k to pewien
współczynnik mówiący jak szybko spada cena w związku ze wzrostem dostępności do dobra
(na skutek zwiększania podaŜy)
Niech x i - podaŜ i- tego producenta, wtedy
Przychód = wielkość produkcji . cena =x i cena = x i [ A - k ( łączna podaŜ )]
oznacza przychód (utarg) i- tego producenta. Zakładamy, Ŝe w warunkach ograniczonej
dostępności do dobra całość wyprodukowanego dobra znajdzie nabywców. Pomijając koszty
– jedynie dla uproszczenia rachunków, istota problemu się nie zmienia - moŜemy uznać utarg
producenta za proporcjonalny do jego zysku.
Wielkość produkcji moŜna wyrazić w rozmaitych jednostkach – my dla uproszczenia
zapisu utoŜsamiamy wielkość podaŜy dobra pochodzącą od danego producenta z liczbą
uruchomianych przez niego linii produkcyjnych. Dalej, dla konkretyzacji przykładu
przyjmiemy konkretne wielkości poszczególnych stałych. Niech na przykład:
cena = 30 - 2 ( łączna podaŜ )
Przyjmijmy, Ŝe kaŜdy z czterech producentów moŜe uruchomić co najwyŜej 3 linie o
zbliŜonej wydajności. Prowadzi to do gry symetrycznej - takiej samej dla kaŜdego z graczy-
producentów. KaŜdy z ich ma podjąć decyzję o wielkości produkcji, czyli ile linii
produkcyjnych uruchomić. Ma zatem cztery strategie : 0,1,2,3. Ich wypłaty są proporcjonalne
do zysków (czyli do utargu). Zgodnie z przyjętym modelem rynku wielkość tej wypłaty
zaleŜy od tego ile uruchomi producent linii ale teŜ od tego ile linii łącznie uruchomią
pozostali. Zatem w funkcji wypłaty i-tego gracza nie musimy odrębnie traktować graczy
pozostałych. Zatem kaŜdy z graczy ma przed sobą następującą macierz gry:
Łączna liczba linii uruchomionych przez pozostałych producentów
0
1
2
3
4
5
6
7
8
9
strategie
i -tego
producenta
0
0
0
0
0
0
0
0
0
0
0
1
28 26 24 22 20 18 16 14 12 10
2
52 48 44 40 36 32 28 24 20 16
3
72 66 60 54 48 42 36 30 24 18
ZauwaŜmy, Ŝe strategia uruchom 3 linie produkcyjne dominuje wszystkie pozostałe –
niezaleŜnie od tego co zrobią pozostali gracze, gracz i -ty ma najwięcej uruchamiając
maksymalizując produkcję. Ale to znaczy, Ŝe kaŜdy gracz powinien - we własnym interesie –
maksymalizować produkcję. Oznacza to, Ŝe kaŜdy uruchomi po 3 linie, czyli kaŜdy otrzyma
wypłatę 18 odpowiadającą sytuacji gdy producent uruchamia 3 linie a pozostali łącznie 9
(kaŜdy po 3). No i tu pojawia się problem, bo widzimy, Ŝe gdyby kaŜdy uruchomił po dwie
linie ( czyli i -ty 2 pozostali łącznie 6) to otrzymane przez nich wypłaty wynosiłyby 28 (!)
I znowu – podobnie jak w dylemacie więźnia – moŜna zastanowić się nad tym, czy nie
mogliby kooperować. No tak, tylko, Ŝe o ile kooperacja nie będzie wymuszona – tzn. o ile nie
647636960.025.png 647636960.026.png 647636960.001.png 647636960.002.png 647636960.003.png 647636960.004.png 647636960.005.png 647636960.006.png 647636960.007.png 647636960.008.png 647636960.009.png 647636960.010.png 647636960.011.png 647636960.012.png 647636960.013.png 647636960.014.png 647636960.015.png 647636960.016.png 647636960.017.png 647636960.018.png 647636960.019.png 647636960.020.png 647636960.021.png 647636960.022.png
zmieni się macierz wypłat - zawsze będzie się opłacało nie dotrzymać umowy!
Takich sytuacji jest w Ŝyciu społecznym i gospodarczym wiele. Związane są one ze
wspólnym uŜytkowaniem ograniczonych zasobów . W naszym przykładzie tym zasobem był
rynek o ograniczonej zdolności wchłonięcia produkowanego dobra. Ale tym zasobem mogą
być np. ulice miast, woda w kranach, gaz w sieci energetycznej itp. Wyobraźmy sobie np.
miasto w którym jest za duŜy ruch samochodowy i przejazd przez kilka skrzyŜowań zajmuje
godziny. Burmistrz ogłasza apel o pozostawienie samochodów w domu i obiecuje uruchomić
bardzo tani transport komunalny. Ludzie myślą sobie: bardzo dobry pomysł – będą puste
ulice, autobusy zatem będą szybko jeździły i wszystko się usprawni . Przychodzi ranek dnia w
którym samochody – stosownie do apelu – miały zostać w domu. I co myśli sobie Michał.
Ano myśli sobie – albo pojadę swoim samochodem albo zastosuję się do apelu burmistrza i
pojadę szybko autobusem. Hm, ale jeszcze szybciej swoim samochodem-wszak ulice są puste!
A jeśli inni tez pojadą samochodami i ulice nie będą puste? Ha, to tym bardziej bym wyszedł
na naiwniaka, gdybym poszedł na autobus, który jak zwykle nie dojedzie bo będą korki. No i
Michał jedzie swoim samochodem do miasta, a tam same korki!
Problem ten bywa określany jako konflikt między indywidualną racjonalnością a
interesem zbiorowym . Problem nie ma rozwiązania. Jedyne co moŜna zrobić by sytuację
rzeczywistą rozwiązać to zmienić warunki (reguły gry). Jedną z metod jest wprowadzenie
dodatkowych opłat za wykorzystanie zasobu tak, by zmienić strukturę wypłat na tyle, aby
nadmierne wykorzystanie zasobu przestało być indywidualnie opłacalne. W naszym
przykładowym mieście burmistrz zamiast ogłaszania apelu, mógłby ogłosić wprowadzenie
opłat za korzystanie z samochodów w określonych godzinach. Z kolei producenci whisky
mogliby się umówić, Ŝe uruchamiają tylko i pod rygorem kar zwyczajowych (znamy je z
filmów z epoki) realizować umowę. Oczywiście musieliby jeszcze wprowadzić mechanizm
kontrolny (inspekcja). Jednym z takich mechanizmów przyjętych w społeczeństwach są
podatki. Przyjrzyjmy się temu rozwiązaniu, na przykładzie naszych producentów.
Rola podatków w problemach eksploatacji zasobów
Wyobraźmy sobie, Ŝe w Buffalo wprowadzono podatek za uruchomienie trzeciej linii
w wysokości 20. Otrzymujemy wtedy grę:
Zgłoś jeśli naruszono regulamin