Čiste i mješovite strategije. Teorija igara i statističke odluke

Pretplatite se
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Čista strategija igrač I treba da izabere jedan od n redova isplatne matrice A, a čista strategija igrača II je da odabere jedan od stupaca iste matrice.

Optimalne čiste strategije igrača razlikuju se od mešovitih po prisustvu obavezne jedinice p i = 1, q i = 1. Na primer: P(1,0), Q(1,0). Ovdje je p 1 = 1, q 1 = 1.

Problem 1
Koristeći matricu plaćanja, pronađite optimalne čiste strategije koristeći princip stroge dominacije. Kao odgovor, zapišite vektore P*, Q*.



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

S4

0

-2

-2

1

Rješenje:

Sve probleme rješavamo koristeći kalkulator Matrix igru.

Pretpostavljamo da igrač I bira svoju strategiju na način da maksimizira svoju isplatu, a igrač II bira svoju strategiju na način da minimizira isplatu igrača I.

IgračiB 1B 2B 3B 4a = min(A i)
A 13 1 2 5 1
A 22 0 0 3 0
A 3-3 -5 -5 -2 -5
A 40 -2 -2 1 -2
b = max(B i)3 1 2 5
Pronalazimo zagarantovanu isplatu određen nižom cijenom igre a = max(a i) = 1, što ukazuje na maksimalnu čistu strategiju A 1 .
Gornja cijena igre b = min(b j) = 1.
Sedlo (1, 2) označava rješenje za par alternativa (A1,B2). Cijena igre je 1.
2. Provjerite matricu plaćanja za dominantne redove i dominantne kolone.
Ponekad, na osnovu jednostavnog ispitivanja matrice igre, može se reći da se neke čiste strategije mogu uključiti samo u optimalnu mješovitu strategiju sa nultom vjerovatnoćom.
Kažu to i-th Strategija igrača 1 dominira njime kth strategija ako je a ij ≥ a kj za sve j E N i za najmanje jednog j a ij > a kj . U ovom slučaju se takođe kaže da i-th strategija (ili linija) – dominantna, k-th– dominirao.
Kažu to j-i Strategija drugog igrača dominira njime lth strategija ako za svakoga j E M a ij ≤ a il i za najmanje jedan i a ij< a il . В этом случае j-th strategija (kolona) se naziva dominantna, lth– dominirao.
Strategija A 1 dominira strategijom A 2 (svi elementi reda 1 su veći ili jednaki vrijednostima 2. reda), stoga isključujemo 2. red matrice. Vjerovatnoća p 2 = 0.
Strategija A 1 dominira strategijom A 3 (svi elementi reda 1 su veći ili jednaki vrijednostima 3. reda), stoga isključujemo 3. red matrice. Vjerovatnoća p 3 = 0.
3 1 2 5
0 -2 -2 1

Iz perspektive gubitaka igrača B, strategija B 1 dominira strategijom B 2 (svi elementi kolone 1 više elemenata kolona 2), stoga isključujemo 1. kolonu matrice. Vjerovatnoća q 1 = 0.
Iz perspektive gubitaka igrača B, strategija B 4 dominira strategijom B 1 (svi elementi kolone 4 su veći od elemenata kolone 1), stoga isključujemo 4. kolonu matrice. Vjerovatnoća q 4 = 0.
1 2
-2 -2

Sveli smo igru ​​4 x 4 na igru ​​2 x 2.



Rješenje igre ( 2 x n


p 1 = 1
p 2 = 0
Cijena igre, y = 1
Sada možemo pronaći minimax strategiju igrača B pisanjem odgovarajućeg sistema jednačina
q 1 = 1
q 1 + q 2 = 1
Rešavajući ovaj sistem nalazimo:
q 1 = 1.
odgovor:
Cijena igre: y = 1, vektori strategije igrača:
Q(1, 0), P(1, 0)

∑a ij q j ≤ v
∑a ij p i ≥ v
M(P 1 ;Q) = (1 1) + (2 0) = 1 = v
M(P 2 ;Q) = (-2 1) + (-2 0) = -2 ≤ v
M(P;Q 1) = (1 1) + (-2 0) = 1 = v
M(P;Q 2) = (2 1) + (-2 0) = 2 ≥ v

Pošto su redovi i stupci uklonjeni iz originalne matrice, pronađeni vektori vjerovatnoće mogu se zapisati kao:
P(1,0,0,0)
Q(0,1,0,0)

Problem 2
Pomoću matrice plaćanja pronađite donju i gornju cijenu igre. Ako postoji sedla, zapišite vektore optimalnih čistih strategija P*, Q*.



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

Rješenje:
1. Provjerite da li matrica plaćanja ima sedlo. Ako da, onda ćemo rješenje za igru ​​ispisati u čistim strategijama.
IgračiB 1B 2B 3a = min(A i)
A 1-6 -5 0 -6
A 2-8 -3 -2 -8
A 3-3 -2 3 -3
b = max(B i)-3 -2 3

Pronalazimo zagarantovanu isplatu određen nižom cijenom igre a = max(a i) = -3, što ukazuje na maksimalnu čistu strategiju A 3 .
Gornja cijena igre b = min(b j) = -3.
Sedlo (3, 1) označava rješenje za par alternativa (A3,B1). Cijena igre je -3.
Odgovor: P(0,0,1), Q(1,0,0)

Problem 3
Koristeći matricu plaćanja, pronađite vektore optimalnih strategija P*, Q* i cijenu igre. Koji igrač pobjeđuje?



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

Rješenje:
1. Provjerite da li matrica plaćanja ima sedlo. Ako da, onda ćemo rješenje za igru ​​ispisati u čistim strategijama.
Pretpostavljamo da igrač I bira svoju strategiju na način da maksimizira svoju isplatu, a igrač II bira svoju strategiju na način da minimizira isplatu igrača I.
IgračiB 1B 2B 3B 4a = min(A i)
A 1-6 -6 2 4 -6
A 22 -2 7 -1 -2
b = max(B i)2 -2 7 4

Pronalazimo zagarantovanu isplatu određen nižom cijenom igre a = max(a i) = -2, što ukazuje na maksimalnu čistu strategiju A 2 .
Gornja cijena igre b = min(b j) = -2.
Sedlo (2, 2) označava rješenje za par alternativa (A2,B2). Cijena igre je -2.
3. Pronađite rješenje za igru ​​u mješovitim strategijama.
Rešimo problem pomoću geometrijske metode, koja uključuje sljedeće korake:
1. U Kartezijanskom koordinatnom sistemu, duž apscisne ose je iscrtan segment čija je dužina jednaka 1. Lijevi kraj segmenta (tačka x = 0) odgovara strategiji A 1, desni kraj strategiji A 2 (x = 1). Međutačke x odgovaraju vjerovatnoćama nekih mješovitih strategija S 1 = (p 1 ,p 2).
2. Isplate strategije A 1 su ucrtane na lijevoj ordinati. Na liniji paralelnoj sa ordinatom, od tačke 1, ucrtani su dobici strategije A 2.
Rješenje igre ( 2 x n) izvodimo iz pozicije igrača A, pridržavajući se maksiminske strategije. Nijedan od igrača nema dominantne ili duplirane strategije.

Maksimalna optimalna strategija igrača A odgovara tački N, za koju možemo napisati sljedeći sistem jednadžbi:
p 1 = 0
p 2 = 1
Cijena igre, y = -2
Sada možemo pronaći minimaks strategiju igrača B pisanjem odgovarajućeg sistema jednačina, isključujući strategiju B 1,B 3,B 4, koja jasno daje veći gubitak igraču B, pa je stoga q 1 = 0,q 3 = 0,q 4 = 0 .
-2q 2 = -2
q 2 = 1
Rešavajući ovaj sistem nalazimo:
q 2 = 1.
odgovor:
Cijena igre: y = -2, vektori strategije igrača:
Q(0, 1, 0, 0), P(0, 1)
4. Provjerimo ispravnost rješenja igre pomoću kriterija optimalnosti strategije.
∑a ij q j ≤ v
∑a ij p i ≥ v
M(P 1 ;Q) = (-6 0) + (-6 1) + (2 0) + (4 0) = -6 ≤ v
M(P 2 ;Q) = (2 0) + (-2 1) + (7 0) + (-1 0) = -2 = v
M(P;Q 1) = (-6 0) + (2 1) = 2 ≥ v
M(P;Q 2) = (-6 0) + (-2 1) = -2 = v
M(P;Q 3) = (2 0) + (7 1) = 7 ≥ v
M(P;Q 4) = (4 0) + (-1 1) = -1 ≥ v
Sve nejednakosti su zadovoljene kao jednakosti ili stroge nejednakosti, stoga je rješenje igre pronađeno ispravno.

Problem 4
Dajte detaljan odgovor na pitanje

"Čiste" strategije

Već smo upoznati sa dovratnicima. Međutim, šta se događa ako se uklone dovratnici iz lanca bilo koje strategije? Dobićemo „čistu strategiju“. Čiste strategije su one u čijem lancu delovanja, od samog korena do efektivnog dela, nema neefikasnih supstrategija (dovratnika), a to se često može dokazati samo prisustvom svih karika u svesti.

Naravno, sa stanovišta svih mogućih ishoda korišćenja strategije, teško nam je govoriti o najefikasnijoj, jer možda jednostavno nemamo određeno iskustvo, pa samim tim i određene međustrategije, ali je upravo od stanovište našeg iskustva da strategija treba da bude što je moguće efikasnija.

Koncept čistih strategija je također jedan od ključnih u ovim materijalima, pa ću dati primjer:

Večernje. Vi ste u svom rodnom kraju i žurite kući. Mlijeko bježi. Proleteći pored „mnogo sumnjivih tipova“ čujete da vam se obraćaju: „Hej, ti, [izrezano cenzurom]. Ne hodajte ovamo, pašće vam snijeg na glavu!”

Šta ćeš uraditi? Može biti mnogo opcija. Neko će otići da sredi stvari, neko će se uplašiti i ubrzati korak, neko će nešto viknuti. Međutim, razmislimo o tome koja je čista strategija ponašanja u ovom slučaju?

Osoba koju ne poznajete viče vam nešto na ulici. Imate svoje poslove, kojima se zapravo bavite. Sudeći po tekstu, pozitivne koristi za vas od komunikacije s ovom osobom su malo vjerovatne. Logičan zaključak: mirno nastavite sa svojim poslom. Skrećem pažnju šta je tačno „mirno“, bez senke negativne emocije, ali sa zdravom ravnodušnošću prema onome što se dešava. Koliko bi ljudi to uradilo? Pretpostavljam da je velika manjina. Zašto?

Jer većina ljudi ima čitav sloj podsvjesnih strategija vezanih u nižim slojevima za samoodržanje, a posebno to mogu biti: „Uvijek odgovorite grubošću“, „Ako neko kaže ružne stvari, onda morate bježati“, „Ako neko ako je bezobrazan, treba ga udariti šakom u lice”, “Ako je neko bezobrazan, onda postoji opasnost” i slično u različitim varijantama. Naravno, neće svi poduzeti neku aktivnu akciju, ali će to emocionalno utjecati na gotovo sve. A ovo je dovratak.

Čiste strategije su uvijek emocionalno neutralne ili pozitivne, i to je ugrađeno u vaš mozak, samo to morate koristiti.

Možete pročitati malo o čistim strategijama u bilješkama „Zašto čiste strategije?“ i "House, Hopkins, itd."

Iz knjige Strategije genija. Albert Einstein autor Dilts Robert

Strategije 1. Definicija pojma „strategija“: a) Dolazi iz grčka riječ“strategos”, što znači: “vojskovođa”, “nauka, umjetnost ratovanja”, “umjetnost vođenja društvene, političke borbe”. b) Detaljan plan za postizanje cilja ili prednosti

Iz knjige Strategije genija (Aristotel Sherlock Holmes Walt Disney Wolfgang Amadeus Mozart) od Diltsa Roberta

Iz knjige Možeš li dobro učiti?! Korisna knjiga za neoprezne studente autor Karpov Aleksej

STRATEGIJE Vaše studije će se odvijati na potpuno drugačijem nivou kvaliteta ako razmislite i odaberete akcionu strategiju. opšti plan. Ovo je generalna linija koja uzima u obzir stvarne uslove. To su ciljevi, rokovi, vodeći računa o nepredvidivosti i različitosti... To je sam osjećaj pulsa

Iz knjige Strategija uma i uspjeha autor Antipov Anatolij

Iz knjige Emocionalna inteligencija od Daniela Golemana

Koeficijent mentalni razvoj I emocionalni intelekt: IQ Pure Types i emocionalna inteligencija nisu u suprotnosti, već su odvojene kompetencije. Svi mi kombinujemo inteligenciju sa akutnim iskustvom; ljudi sa visokim

Iz knjige 12 kršćanskih vjerovanja koja vas mogu izluditi by Townsend John

Ispravne namjere ili čiste misli Ispravna namjera je odluka da se učini ispravna stvar. Odabiremo dobru akciju koja se sviđa Bogu, obično bez razmišljanja o tome da li to zaista želimo učiniti. Samo to radimo - to je sve. Mnogi evanđeoski propovednici

Iz knjige Ulazak u život: zbirka autor autor nepoznat

Rudolf Ivanovič ABEL: „ZAPAMTITE KAKO JE DŽERŽINSKI REKAO: „ČISTE RUKE, HLADNA GLAVA I TOPLO SRCE...“ Rudolf Ivanovič Abel proveo je više od trideset godina radeći u sovjetskoj obaveštajnoj službi. Odlikovan je Ordenom Lenjina, dva ordena Crvene zastave, Ordenom rada

Iz knjige Homo sapiens 2.0 [Homo Sapiens 2.0 http://hs2.me] od Sapiens Homo

Strategije

Iz knjige Homo Sapiens 2.0 od Sapiens 2.0 Homo

„Čiste“ strategije Već smo upoznati sa dovratnicima. Međutim, šta se događa ako se uklone dovratnici iz lanca bilo koje strategije? Dobićemo „čistu strategiju“. Čiste strategije su one u čijem lancu delovanja, počevši od samog korena do efektivnog dela, nema

Iz knjige Započnite. Udarite strah u lice, prestanite biti „normalni“ i uradite nešto vrijedno truda. od Acuff John

Iz knjige Čovjek kao životinja autor Nikonov Aleksandar Petrovič

Strategije Opšti koncept strategija U principu, svako u ovoj ili onoj meri razume šta je strategija. Posjedujući određeni skup znanja stečenih kao rezultat sticanja i obrade iskustva, gradimo određene modele ponašanja.Strategija je model za postizanje cilja.

Iz knjige Uključite svoju radnu memoriju do njenog punog potencijala od Alloway Tracy

Zašto čiste strategije? Lavovski dio materijala ovog projekta stalno ističe da je potrebno koristiti čiste strategije za rewriting i na njima obavezno tražiti dovratak. Ovaj trenutak nije očigledno na prvi pogled i

Iz knjige Introvert u ekstrovertnom svijetu autor Romantseva Elizaveta

Iz knjige autora

Iz knjige autora

Strategije Kompjuterske strategije zahtevaju koncentraciju od igrača, sposobnost planiranja svojih akcija i rešavanja raznih problema. Nedavna istraživanja sugeriraju da strategije mogu pomoći u poboljšanju kognitivnih vještina igrača svih uzrasta. Prema

Iz knjige autora

Čiste vrste Postoji takav koncept - „čisto psihološki tip" Zapravo, koncept postoji, ali praktično nema objekata, odnosno ljudi koji se idealno uklapaju u ovaj koncept. Ne postoje čisti introverti i čisti ekstroverti. Štaviše, složili smo se

teorija igre strategija mješovita

Mješovite strategije

Ako matrična igra nema sedlo u čistim strategijama, tada se pronalaze gornja i donja cijena igre. Oni pokazuju da igrač 1 neće dobiti isplatu veću od gornje cijene igre, a da je igraču 1 zagarantovana isplata koja nije manja od najniže cijene igre.

Mešovita strategija igrača je kompletan skup njegovih čistih strategija kada se igra ponavlja mnogo puta pod istim uslovima sa datim verovatnoćama. Hajde da sumiramo ono što je rečeno i navedemo uslove za korišćenje mešovitih strategija:

  • * igra bez sedla;
  • * igrači koriste nasumičnu mješavinu čistih strategija sa datim vjerovatnoćama;
  • * igra se ponavlja više puta pod sličnim uslovima;
  • * tokom svakog poteza nijedan igrač nije obavešten o izboru strategije od strane drugog igrača;
  • * Usrednjavanje rezultata igre je dozvoljeno.

Koriste se sljedeće oznake za mješovite strategije.

Za igrača 1, mješovita strategija se sastoji u korištenju čistih strategija A 1, A 2, ..., A t sa odgovarajućim vjerovatnoćama p 1, p 2, ..., p t.

Za igrača 2

q j je vjerovatnoća korištenja čiste strategije B j .

U slučaju kada je p i = 1, za igrača 1 imamo čistu strategiju

Čiste strategije igrača su jedini mogući nekompatibilni događaji. U matričnoj igri, znajući matricu A (odnosi se i na igrača 1 i na igrača 2), možemo odrediti kada dati vektori i prosječne dobitke ( očekivanu vrijednost efekat) igrač 1:

gdje i su vektori;

p i i q i su komponente vektora.

Primjenom njihovih mješovitih strategija, igrač 1 nastoji maksimizirati svoju prosječnu isplatu, a igrač 2 nastoji smanjiti ovaj učinak na najmanju moguću vrijednost. Igrač 1 nastoji da dostigne

Igrač 2 osigurava da je uvjet ispunjen

Označimo i vektore koji odgovaraju optimalnim mješovitim strategijama igrača 1 i 2, tj. takve vektore i za koje će jednakost biti zadovoljena

Cijena igre je prosječna isplata igrača 1 kada oba igrača koriste mješovite strategije. Dakle, rješenje matrične igre je:

  • - optimalna mješovita strategija igrača 1;
  • - optimalna mješovita strategija za igrača 2;

Cijena igre.

Mješovite strategije će biti optimalne (i) ako formiraju sedlo za funkciju, tj.

Postoji osnovna teorema za matematičke igre.

Za matričnu igru ​​sa bilo kojom matricom A veličine

postoje i jednaki su jedno drugom: = = .

Treba napomenuti da će prilikom odabira optimalnih strategija igraču 1 uvijek biti zagarantovana prosječna isplata, ne manja od cijene igre, za bilo koju fiksnu strategiju igrača 2 (i, obrnuto, za igrača 2). Aktivne strategije igrača 1 i 2 su strategije koje su dio optimalnih mješovitih strategija odgovarajućih igrača sa vjerovatnoćama različitim od nule. To znači da optimalne mješovite strategije igrača možda ne uključuju sve njihove a priori zadane strategije.

Rješavanje igre znači pronalaženje cijene igre i optimalne strategije. Započnimo naše razmatranje metoda za pronalaženje optimalnih mješovitih strategija za matrične igre najjednostavnija igrica, opisan u matrici 22. Igre sa tačkom sedla neće se posebno razmatrati. Ako se dobije sedlo, to znači da postoje neisplative strategije koje treba napustiti. U nedostatku sedla mogu se dobiti dvije optimalne mješovite strategije. Kao što je već napomenuto, ove mješovite strategije su napisane na sljedeći način:

To znači da postoji matrica plaćanja

a 11 p 1 + a 21 p 2 = ; (1.16)

a 12 p 1 + a 22 p 2 = ; (1.17)

p 1 + p 2 = 1. (1.18)

a 11 p 1 + a 21 (1 - p 1) = a 12 p 1 + a 22 (1 - p 1); (1.19)

a 11 p 1 + a 21 - a 21 p 1 = a 12 p 1 + a 22 - a 22 p 1 , (1.20)

gde dobijamo optimalne vrednosti:

Znajući i, nalazimo:

Nakon izračunavanja nalazimo:

a 11 q 1 + a 12 q 2 = ; q 1 + q 2 = 1; (1.24)

a 11 q 1 + a 12 (1 - q 1) = . (1.25)

u 11 do 12 . (1.26)

Problem je riješen, jer su pronađeni vektori i cijena igre. Imajući matricu plaćanja A, problem možete riješiti grafički. Sa ovom metodom, algoritam rješenja je vrlo jednostavan (slika 2.1).

  • 1. Segment jedinične dužine iscrtan je duž ose apscise.
  • 2. Y-osa prikazuje dobitke za strategiju A 1 .
  • 3. Na liniji paralelnoj sa ordinatnom osom, u tački 1, ucrtani su dobici za strategiju a 2.
  • 4. Krajevi segmenata su označeni za a 11 -b 11, a 12 -b 21, a 22 -b 22, a 21 -b 12 i nacrtane su dvije prave linije b 11 b 12 i b 21 b 22.
  • 5. Određuje se ordinata tačke preseka sa. Ona je jednaka. Apscisa tačke c jednaka je p 2 (p 1 = 1 - p 2).

Rice. 1.1.

Ova metoda ima prilično široko područje primjene. Ovo se zasniva na općem svojstvu TP igara, a to je da u bilo kojoj TP igri svaki igrač ima optimalnu mješovitu strategiju u kojoj broj čistih strategija nije veći od min(m, n). Iz ovog svojstva možemo dobiti dobro poznatu posljedicu: u svakoj igri 2n i m2 optimalna strategija i ne sadrži više od dvije aktivne strategije. To znači da se bilo koja igra 2n i m2 može svesti na igru ​​22. Posljedično, igre 2n i m2 mogu se riješiti grafički. Ako matrica konačne igre ima dimenziju mn, gdje je m > 2 i n > 2, tada se linearno programiranje koristi za određivanje optimalnih mješovitih strategija.

Postoje čiste i mješovite strategije. Čista strategija
prvi igrač (čista strategija
drugi igrač) je mogući potez prvog (drugog) igrača, koji je on izabrao sa vjerovatnoćom jednakom 1.

Ako prvi igrač ima m strategija, a drugi igrač ima n strategija, tada se za bilo koji par strategija prvog i drugog igrača čiste strategije mogu predstaviti kao jedinični vektori. Na primjer, za par strategija
,
Čiste strategije prvog i drugog igrača biće napisane kao:
,
. Za par strategija ,čiste strategije se mogu napisati kao:

,

.

Teorema: U matričnoj igri donja neto cijena igre ne prelazi gornju neto cijenu igre, tj.
.

definicija: Ako se radi o čistim strategijama ,igrači A i B, respektivno, postoji jednakost
, zatim par čistih strategija ( ,) se naziva sedlo matrične igre, element matrica, koja stoji na raskrsnici i-tog reda i j-te kolone je sedlasti element matrice plaćanja, a broj
- čista cijena igre.

primjer: Pronađite donju i gornju neto cijenu, utvrdite prisutnost sedla u matričnoj igri

.

Odredimo donju i gornju neto cijenu igre: , ,
.

U ovom slučaju imamo jednu tačku sedla (A 1 ; B 2), a element sedla je 5. Ovaj element je najmanji u 1. redu i najveći u 2. koloni. Odstupanje igrača A od maksimalne strategije A 1 dovodi do smanjenja njegovog dobitka, a odstupanje igrača B od minimalne strategije B 2 dovodi do povećanja njegovog gubitka. Drugim riječima, ako matrična igra ima element sedla, tada su najbolje strategije za igrače njihove minimaks strategije. I ove čiste strategije, koje formiraju sedlo i naglašavaju element sedla a 12 =5 u matrici igre, su optimalne čiste strategije I igrači A i B, respektivno.

Ako matrična igra nema tačku sedla, tada rješavanje igre postaje teško. U ovim igrama
. Upotreba minimaks strategija u takvim igrama dovodi do činjenice da za svakog igrača isplata ne prelazi , a gubitak nije ništa manji . Za svakog igrača se postavlja pitanje povećanja dobitaka (smanjenje gubitaka). Rješenje se pronalazi korištenjem mješovitih strategija.

definicija: Mješovita strategija prvog (drugog) igrača je vektor
, Gdje
I
(
, Gdje
I
).

Vektor p(q) označava vjerovatnoću korištenja i-te čiste strategije od strane prvog igrača (j-te čiste strategije od strane drugog igrača).

Budući da igrači biraju svoje čiste strategije nasumično i nezavisno jedni od drugih, igra je nasumična i iznos dobitaka (gubitaka) postaje nasumičan. U ovom slučaju prosječna vrijednost pobjeda (gubitak) – matematičko očekivanje – funkcija je mješovitih strategija p, q:

.

definicija: Funkcija f(r, q) se zove funkcija isplate matrične igre
.

definicija: Strategije
,
nazivaju se optimalnim ako za proizvoljne strategije
,
uslov je ispunjen

Upotreba optimalnih mješovitih strategija u igri daje prvom igraču isplatu ne manju nego kada koristi bilo koju drugu strategiju p; drugi igrač ne gubi ništa više nego ako je koristio bilo koju drugu strategiju q.

Kombinacija optimalnih strategija i cijene igre čini rješenje igre.

Čista strategija- deterministički (isključujući slučajnost) akcioni plan. U prethodnom poglavlju razmatrali smo samo čiste strategije. O mješovitim strategijama će biti riječi u Odjeljku 2.2, ali za sada, osim ako nije drugačije navedeno, pod strategijom uvijek podrazumijevamo čistu strategiju.

Vrlo često ćemo tokom prezentacije koncepte rješenja ilustrirati primjerima bimatričnih igara, pa ćemo dati odgovarajuće definicije.

Definicija 2.1. Vrhunska igra je igra u kojoj skup igrača i skup strategija svakog igrača sadrži konačan broj elemenata. Konačna igra dvije osobe naziva se bimatrična igra.

Prezime dolazi od zgodnog oblika bilježenja dobitaka u takvoj igri - korištenjem dvostruke matrice.

Za kasniju analizu, zgodno je podijeliti strategije u proizvoljnom profilu strategije s na strategiju nekog i-tog igrača s, i strategije svih ostalih igrača s_ (. Formalno, s = (.u, s,). Ovdje se ne misli na zamjenu koordinata profila strategije, mi samo uvodimo drugi način da ga označimo.

Prvi koncept rješenja igre koji ćemo pogledati je ravnoteža u dominantnim strategijama.

Definicija 2.2. Strategija /-og igrača striktno dominira njegova strategija je ako Uj(s jt s ,) > h,(s", s ,) za bilo koji skup s, strategije preostalih igrača. U ovom slučaju, strategija s" se naziva striktno dominirana.

U suštini, to znači da za bilo koga fiksno u skupu strategija ostalih igrača, i-ti igrač, birajući strategiju s, dobija striktno veća pobeda nego pri odabiru strategije s". Logično je pretpostaviti da racionalni igrač ne bi trebao birati strogo dominirane strategije. Takva pretpostavka u najjednostavnijim igrama može biti dovoljna da se pronađe rješenje za igru.

Definicija 2.3. Strategies Profil s* =(s*, s^,..., s*) se poziva balans u (strogo) dominantne strategije, ako za bilo kog i-og igrača strategija s" striktno dominira nekom od njegovih drugih strategija.

Može se činiti da ovaj koncept rješenja može dovesti samo do trivijalnih zaključaka. Svaki igrač među svojim strategijama ima onu koja će mu dati više dobitaka od bilo koje druge, bez obzira na to kako se njegovi protivnici ponašaju. Tada će primijeniti upravo ovu strategiju u ravnoteži. Sve je prilično očigledno. Ali upravo je to situacija tipična za, možda, najpoznatiju i veoma važnu igru ​​za analizu niza praktičnih situacija, „zatvoreničku dilemu“.

Primjer 2.1 (dilema zatvorenika). Dvojica kriminalaca su u pritvoru u odvojenim ćelijama i ne mogu da komuniciraju. Istraga ima dovoljno dokaza da svakog od njih osudi za lakši zločin na godinu dana. Ali za veliki zločin, za koji kriminalcima prijeti deset godina zatvora, istraga nema dovoljno dokaza. Predstavnici istrage nude svakom od kriminalaca dogovor: kriminalac će dobiti kaznu od

godinu manje ako svedoči protiv svog partnera, što će biti dovoljno da ga optuži za teško krivično djelo. Pod pretpostavkom da je kriminalcima stalo samo do broja godina koje provedu u zatvoru, svaka dodatna godina proizvodi minus jednu korist. Tada se dobici kriminalaca mogu predstaviti sljedećom dvostrukom matricom:

U slučaju da učesnici u igri nisu imenovani, pretpostavićemo da različite strategije prvog učesnika odgovaraju redovima dvostruke matrice, a strategije drugog učesnika odgovaraju kolonama. Ako u našem primjeru prvi zatvorenik svjedoči, a drugi ne, onda će prvi biti pušten, a drugi će dobiti deset godina zatvora.

Lako je vidjeti da je, bez obzira na to kako se drugi zatvorenik ponašao, isplata veća (zatvorska kazna je kraća) ako svjedočite (za prvog igrača prve koordinate u prvom redu dvostruke matrice su striktno veće nego u drugom redu, za drugog igrača druge koordinate su u prvom stupcu dvostruka matrica je strogo veća od druge kolone). Tada će ravnoteža u dominantnim strategijama biti profil strategija (svjedočiti, svjedočiti).

Zanimljivo u u ovom primjeru da igrači, birajući ponašanje koje povećava njihovu isplatu, završavaju u situaciji u kojoj su njihove isplate niske u odnosu na suprotnu situaciju - gdje obojica odlučuju da šute. Objašnjenje leži u prisustvu jakog vanjskog efekta, tj. snažan uticaj akcija jednog igrača na dobitke drugog igrača. Kao rezultat toga, ispostavlja se da je ravnotežni profil strategija jedini Pareto-neefikasan profil u ovoj igri. Imajte na umu da Pareto efikasnost, poželjna sa stanovišta učesnika u igri, možda nije poželjna sa socijalnog stanovišta, kao u ovom slučaju.

Situacije poput dileme zatvorenika često se javljaju prilikom analize ekonomskih situacija. Zamislite, na primjer, konkurenciju između dvije trgovine koje prodaju sličan set proizvoda. Radi jednostavnosti, pretpostavimo da trgovine mogu naplaćivati ​​samo dva nivoa cijena - visoku ili nisku. Potrošači prirodno radije kupuju u prodavnici sa nižim cijenama. Tada dobici trgovina, koje karakterizira njihov profit, mogu izgledati, na primjer, ovako:


Sa stanovišta ravnoteže, ovde je situacija slična dilemi zatvorenika – ravnoteža u dominantnim strategijama (niske cene, niske cene) je jedini Pareto-neefikasan profil (i poželjan sa socijalnog stanovišta).

Već spomenuta široka popularnost dileme zatvorenika bila je razlog što su na njenom primjeru pokušali eksperimentalno provjeriti ispravnost predviđanja teorije igara. Provjera je bila ta dva stranci ponudio je da igra igru ​​za novac sa nagradama (na primjer, u dolarima) bliskim onima naznačenim za igru ​​dvije trgovine. Svaki učesnik je doneo odluku zasebno (često anonimno) i nije znao odluku drugog igrača sve dok nije dobio pobedu. Pokazalo se da u takvim uslovima, u mnogim igrama igre, igrači nisu došli do ravnotežnog rezultata, ako pretpostavimo da novčane nagrade ispravno procijeniti svoj dobitak. Naravno, iz rezultata ovih eksperimenata ne proizilazi da su predviđanja teorije igara netačna, već samo da su igrači pri procjeni svog dobitka uzeli u obzir nenovčane faktore – razmatranje altruizma, pravde itd. Ako su isplate igrača ispravno procijenjene, onda bi igrači trebali preferirati dominantnu strategiju i stoga je izabrati (u duhu otkrivenih preferencija u mikroekonomiji). Dakle, vrijednost eksperimenata ove vrste nije u testiranju teoretskih predviđanja igara, već u procjeni uloge nematerijalne motivacije u postupcima pojedinaca.

Mnogo manje od koncepta stroge dominacije, koncept slabe dominacije se koristi u teoriji igara.

Definicija 2.4. Strategija i-tog igrača, slabo dominira njegova strategija je ako m, (s, s ,) > m ; (sJ, s,) za bilo koji skup strategija preostalih igrača s_j,Štaviše, za barem jedan skup strategija drugih igrača, nejednakost je striktno zadovoljena. Tada se poziva strategija s slabo dominira.

U slučaju nestriktnih nejednakosti, više se ne može reći da racionalni igrač neće izabrati strategiju sa slabom dominacijom, iako se takvo ponašanje čini sasvim logičnim. Postoji, iako se rijetko koristi, definicija ravnoteže u slabo dominantnim strategijama slična slučaju striktne dominacije.

Definicija 2.5. Poziva se profil strategije s* = (s*, Sj,..., s*). ravnoteža u slabo dominantnim strategijama, ako za bilo kog i-og igrača strategija s" slabo dominira nekom od njegovih drugih strategija.

Primjer 2.2 (zatvorena aukcija druge cijene). Zatvorena aukcija druge cijene održava se između dvije osobe. Aukcija je strukturirana na sljedeći način. Svaki učesnik naznači nenegativnu ponudu ne znajući ponude ostalih učesnika (u koverti). Učesnik koji je napravio najviša ponuda, uplaćuje maksimalni iznos među okladama drugih učesnika (tj. iznos drugog ali veličinu opklade) i prima neki predmet. Ako su, na primjer, ponude igrača bile 100 i 90, onda učesnik koji je ponudio 100 pobjeđuje na aukciji i kupuje predmet za 90 – u veličini druge ponude. Neka svaki učesnik ima procjenu stavke izražene u novčanim jedinicama, v 2> 0. Ove procjene su poznate svim učesnicima. U ovom slučaju, radi jednostavnosti u opisivanju igre, ako oba učesnika naznače istu opkladu, onda stavka ide prvom učesniku.

U ovoj igri, strategija prvog igrača će biti veličina njegove opklade. Pošto je opklada nenegativna, skup svih mogućih strategija

5, = ispunjeno 0 = u,(o, s 2) > w,(s, s 2) = = q, - s 2 v x slabo dominira strategijom s,.

Pokazali smo da za prvog igrača strategija pozivanja njegove procjene kao opklade slabo dominira bilo kojom drugom strategijom. Lako je provjeriti da li je slična izjava tačna i za drugog igrača. Imajte na umu da u našem obrazloženju nikada nismo koristili činjenicu da igrač zna procjenu drugog igrača, što znači da u slučaju igre s nepotpunim informacijama na zatvorenoj aukciji druge cijene, pozivanje vaše procjene neće biti ništa manje isplativo nego davanje bilo koje druge ponude.

Može se činiti da je neisplativo za prodavca da organizuje drugu aukciju cena kada može da organizuje prvu aukciju cena i dobije vrednost ne druge, već prve ponude. Međutim, vrijednost ponuda u slučaju aukcije prve cijene u ravnoteži će biti niža. Više o isplativosti aukcija ćemo govoriti u poglavlju. 5. Za sada, napominjemo da je druga aukcija cijena veoma popularna i da je naširoko koriste, na primjer, kompanije Google i "Yandex" prilikom prodaje kontekstualno oglašavanje na internetu.

Ravnoteža u dominantnim strategijama postoji samo u maloj klasi igara. Obično igrači nemaju jednu strategiju koja dominira svim ostalima. Ali koncept dominacije nam omogućava da pronađemo rješenja u široj klasi igara. Da biste to učinili, morate voditi dosljedno razmišljanje o postupcima igrača. Već smo primijetili da racionalni igrač neće izabrati strategiju striktno dominirane. Ali to znači da drugi igrač može analizirati igru, zanemarujući mogućnost da njegov protivnik odabere takvu strategiju. Možda će ova analiza otkriti da drugi igrač ima dominantnu strategiju koja nije bila dominantna u originalnoj igri. I tako dalje. Hajde da damo formalnu definiciju.

Proces dosljedno isključivanje strogo dominiranih strategija je dato kako slijedi. Isključimo iz razmatranja sve striktno dominirane strategije igrača, tj. Razmislite o novoj igri u kojoj su sve dominirane strategije isključene iz skupa mogućih strategija igrača. Onda u ovome nova igra isključimo sve strogo dominirane strategije itd.

Moguće je da će se takav proces završiti kada igračima ostane nekoliko strategija, ali je moguće da će svaki igrač imati samo jednu neisključenu strategiju, tada je logično smatrati skup ovih strategija rješenjem za igra.

Definicija 2.6. Ako, kao rezultat uzastopnog eliminacije strogo dominiranih strategija, svakom igraču ostane jedna strategija, tada se profil ovih strategija naziva ravnoteža dominacije.

U primjeru 1.1 dobili smo upravo takvu ravnotežu. Pogledajmo još jedan primjer.


Strateški profil (N, P) predstavlja jedinu Nashovu ravnotežu u ovoj igri. Ali imajte na umu: da bi izabrao P, drugi igrač mora biti siguran da prvi igrač neće izabrati B. Ali isplata prvog igrača je ista ako drugi igrač odabere II. Štaviše, nakon što je izabrao B, prvi igrač se ne mora bojati da će drugi igrač izabrati A. Možda će racionalni drugi igrač razmisliti o odabiru strategije C.

Drugo pitanje, za koje još nije pronađen nedvosmislen odgovor: kako igrači dolaze do Nešove ravnoteže?

Idealan teoretski scenario je ovaj. Igrači samostalno formiraju očekivanja o akcijama drugih igrača, a zatim biraju akcije koje maksimiziraju njihovu isplatu s obzirom na njihova očekivanja. Ako očekivanja odgovaraju akcijama koje su igrači stvarno odabrali, tada dobijamo Nashovu ravnotežu. Ova linija rasuđivanja nam omogućava da Nashovu ravnotežu nazovemo situacijom samoispunjavajuća očekivanja. Ali odakle dolaze sama očekivanja? A koja će od Nashovih ravnoteža, ako ih ima nekoliko, biti izabrana kao rezultat opisanog procesa? U razmatranom scenariju, ova pitanja ostaju bez odgovora.

Drugi pristup uključuje obuku igrača. Igrači ili uče teoretski kako da igraju određenu igru ​​(mislite na studente ekonomije) ili imaju iskustvo sličnih interakcija (na primjer, iskusni radnik dolazi do novi tim), što im omogućava da pravilno formuliraju očekivanja i odaberu optimalno ponašanje. Ovaj scenario pomaže da se objasni formiranje očekivanja, ali, prvo, smanjuje obim primene gaming modeli samo na standardne, proučavane i učestale interakcijske situacije, a drugo, može dovesti do toga da se situacije jednokratne i ponovljene interakcije ne razlikuju, a da se potonje značajno razlikuju sa stanovišta strategija i metoda rješavanja unutar okvir teorije igara, o čemu će se detaljnije govoriti u pogl. 4.

Treći scenario je da postoji prethodni dogovor između igrača, ili carina, ili zakoni, ili uputstva trećih strana koja regulišu interakciju igrača. U ovom slučaju dogovori ili instrukcije možda nisu obavezni, ali ako se preporučuje igranje Nash ekvilibrijuma, onda niko od igrača nema želju (sam) da odstupi od propisanog ponašanja. Jasno je da takav scenario nije moguć u svakoj situaciji. Osim toga, sam proces sklapanja sporazuma ili uključivanja trećih strana može postati dio igre.

Konačno, treće prirodno pitanje koje se nameće prilikom proučavanja koncepta Nashove ravnoteže je: postoje li empirijski dokazi da pravi igrači da li obično biraju ravnotežne strategije? I ovdje je izuzetno teško dati kratak i nedvosmislen odgovor. U isto vrijeme, priroda problema koji se pojavljuju više je u skladu s temama eksperimentalne ekonomije. Stoga ćemo se ograničiti na preporuku da se okrenemo stručnoj literaturi, na primjer, knjizi, u kojoj se odlično razmatraju pitanja eksperimentalne metodologije i prezentiraju brojni rezultati.

Postoje igre koje nemaju čistu strategijsku ravnotežu (vidi primjer 3.1), pa se postavlja pitanje: koji su uslovi dovoljni da takva ravnoteža postoji? Formulirajmo i dokažimo tvrdnju o postojanju Nashove ravnoteže u čistim strategijama u igrama koje nisu konačne.

Izjava 2.3. Ako su setovi strategija za svakog igrača S t su neprazni konveksni kompaktni skupovi u Euklidskom prostoru, i funkcija isplate svakog igrača I- kontinuirano u s i kvazikonkavna je u 5, tada igra ima Nashovu ravnotežu u čistim strategijama.

Dokaz. Prisjetimo se formulacije Kakutaijeve teoreme, koji ćemo koristiti u dokazu. Neka X- neprazan konveksan kompaktan set in R n , X* je skup njegovih podskupova i/ je gornje polukontinuirano preslikavanje iz X V X*, to za svaku tačku x e X gomila f(x) neprazna, zatvorena i konveksna. Tada preslikavanje / ima fiksnu tačku.

Ideja dokazivanja naše tvrdnje je da se konstruiše preslikavanje koje zadovoljava uslove Kakutanijeve teoreme. Da bismo to učinili, malo redefinirajmo prikaz najboljeg odgovora. Pretpostavimo, čisto tehnički, da najbolji odgovor ne zavisi samo od strategija drugih igrača, već i od same igračeve strategije s y (s). Sa promenom sopstvene strategije igrača, s obzirom na fiksne strategije drugih igrača, najbolji odgovor se, naravno, neće promeniti. Sada uvodimo notaciju da prikažemo najbolji odgovor za sve igrače kao kartezijanski proizvod s(s) = s,(s) x s2(s) x... x s n (s). Ovo mapiranje svakom profilu dodjeljuje skup profila u kojima svaki igrač najbolji način odgovara na strategije drugih igrača. Fiksna tačka preslikavanja S, tj. profil s takav da s e s(s)> po definiciji je Nashova ravnoteža. Pokažimo da preslikavanje 5 zadovoljava uslove Kakutanijeve teoreme. Provjera svakog uslova će predstavljati posebnu tačku dokaza.

  • 1. Pokažimo da je skup S svi profili - konveksno kompaktni. Pošto je skup strategija svakog igrača S neprazan konveksan kompakt skup, onda je Dekartov proizvod S = S t X S 2 X...x S n je konveksan kompakt.
  • 2. Displej s ima neprazne slike. Prema Weierstrassovoj teoremi kontinuirana funkcija I- dostiže svoju maksimalnu vrijednost na zatvorenom ograničenom skupu 5. dakle, s ima neprazne slike.
  • 3. Prikažite slike s zatvorena i konveksna. Budući da je isplatna funkcija svakog igrača u t kvazi-konkavno u s ako zatim, prema svojstvu kvazi-konkavne funkcije, skup $. = (s. | u t (s i9 s .) > k) na fiksni s .i k zatvoreno u zatvorenom prostoru definicije i konveksan je ako nije prazan. Pošto ovo važi za svakoga k, tada je takođe tačno da je skup 5. = (5/1 u t(s", 5 ,) > maxw.(s., s .)}

konveksan. Ali tada je kartezijanski proizvod 5(5) = s x (s) X s 2(S) x... X s n CS) je zatvoren i konveksan.

4. Pokažimo da je preslikavanje § polukontinuirano odozgo. Koristimo uslov kontinuiteta funkcije i, od s. Mi ćemo to dokazati kontradikcijom. Pretpostavimo da je mapiranje § ns je gornji polukontinuiran. Zatim postoje nizovi strateških profila s m I s m Gdje T - broj elementa sekvence, takav da za bilo koji T s"" e S, s m e s(s""), lim s"" = s° e S, ali lim s"" = s° g lim s(s""). To znači da postoji igra

t~* oo t->/I -? oo

sudbina za koju strategija s f ° nije najbolji odgovor na s 0, tj. postoji strategija s" takav da i,(e), s 0 ,) > u,(s] s° ;). Tada možemo naći e > 0 tako da je m,(s/, s 0 ,) > m,(s ; °, s 0 ,) + Ze, odakle

Kako je po uslovu funkcija m kontinuirana, lim s m = s°, lim s"” = s°,

m*oo m-*oo

sa dovoljno velikim m u pravu

Kombinujući nejednačine (2.8)-(2.10) u jedan lanac, dobijamo

Iz relacija (2.11) slijedi da je u,(s", s"") > m,(s/", s"") + s, ali ovo je u suprotnosti sa uslovom s"" e s(s""), pošto s" daje striktno veću isplatu od s/", kao odgovor na s"". Došli smo do kontradikcije. Stoga je naša početna pretpostavka da mapa s nije polukontinuirana u gornjem dijelu bila netačna.

Pokazali smo da je mapiranje S zadovoljava sve uslove Kakutanijeve teoreme, što znači da ima fiksnu tačku. Ova fiksna tačka je Nashova ravnoteža. Tvrdnja 2.3 je dokazana. ?

Tvrdnja 2.3, posebno, garantuje postojanje Nash-ove ravnoteže u primjeru 2.7, ali ne i u primjeru 2.8, gdje su funkcije isplate igrača diskontinuirane.

„Primjer sa posla.

Povratak

×
Pridružite se zajednici parkvak.ru!
U kontaktu sa:
Već sam pretplaćen na zajednicu “parkvak.ru”