Rješavanje matrične igre. Matrica plaćanja igre

Tabela koja prikazuje isplate svakom učesniku u dvosmjernoj igri. Redovi tabele odražavaju rezultate svakog izbora strategije od strane jednog učesnika, a kolone odražavaju rezultate izbora drugog učesnika. Može postojati jedna matrica koja prikazuje isplatu svakom igraču, a alternativno, svaki kvadrat u višedimenzionalnoj matrici isplate može sadržavati dva broja koja prikazuju isplatu oba igrača. U igri sa nultom sumom, isplata drugom igraču će biti jednaka isplati prvom igraču; dakle, samo jedan red treba detaljno zabilježiti.

Kraj rada -

Ova tema pripada sekciji:

Ograničavanje rizika u poslovnom sistemu naziva se upravljanje rizikom

Pod rizikom se podrazumevaju svi unutrašnji i eksterni preduslovi koji mogu negativno uticati na postizanje strateških ciljeva tokom tačno određenog perioda posmatranja, na primer operativnog perioda.

Ako vam je potreban dodatni materijal na ovu temu, ili niste pronašli ono što ste tražili, preporučujemo da koristite pretragu u našoj bazi radova:

Šta ćemo sa primljenim materijalom:

Ako vam je ovaj materijal bio koristan, možete ga spremiti na svoju stranicu na društvenim mrežama:

Sve teme u ovoj sekciji:

Vrste rizika. Faktori koji utiču na nastanak rizika
Klasifikacija: A) Po prirodi posljedica: · Čisto (uzrokuje samo gubitak-rizik od požara ili poplave); · Špekulativno (može donijeti i gubitke i

Faktori koji utiču na nastanak rizika
Svi faktori rizika se mogu podeliti u 2 grupe: · interni faktori koji nastaju u toku aktivnosti preduzeća; · spoljni faktori, u suštini

Organizacija procesa upravljanja rizicima u organizaciji
Prva faza organizovanja upravljanja rizicima je određivanje cilja rizika i cilja ulaganja rizičnog kapitala. Svrha rizika je rezultat koji treba dobiti. Možda jesu

Upravljanje informacijskim rizikom
Rad na minimiziranju informacionih rizika uključuje sprečavanje neovlašćenog pristupa podacima, kao i nesreće i kvarove opreme. Minimizirati informacijske rizike sa

Karta rizika
Mapa rizika – jednostavan metod procene rizika Predstavnici različitih sektora privrede često postavljaju, poput konsultanta za upravljanje rizicima, pitanje: da li postoje jednostavne i

Opis strukture karte rizika
Ova mapa rizika prikazuje vjerovatnoću ili učestalost na vertikalnoj osi i uticaj ili značaj na horizontalnoj osi. U ovom slučaju povećava se vjerovatnoća nastanka rizika

Izrada mape rizika
Provodi se kao dio implementacije sistema upravljanja rizicima na nivou cijele organizacije, što je teško, a često i nemoguće interno ostvariti. D

Osnovni koraci procesa mapiranja vlastitih rizika
1. početni trening 2. definisanje granica analize 3. formiranje sastava tima 4. analiza scenarija i rangiranje 5. definisanje granica tolerancije rizika

Metode upravljanja rizikom
Same metode upravljanja rizikom su prilično različite. To je zbog dvosmislenosti koncepta rizika i prisutnosti veliki broj kriterijume za njihovu klasifikaciju. U sljedećem dijelu

Parametrijska metoda
Zasnovan je na pretpostavci normalne distribucije vjerovatnoće faktora rizika koji se razmatra i zahtijeva, u procesu konstruisanja modela za izračunavanje VAR-a, samo procjenu parametara ovog

Modeliranje na osnovu istorijskih podataka
Metoda historijske simulacije zasniva se na korištenju povijesnih podataka o promjenama faktora tržišnog rizika kako bi se dobila distribucija budućih fluktuacija cijena

Monte Carlo metoda
iz udžbenika: Monte Karlo metoda podrazumeva definisanje statističkih modela za portfolio aktivu i njihovu simulaciju generisanjem slučajnih putanja. Z

Metoda analize scenarija
Metodom analize scenarija ispituje se učinak promjena portfolio kapitala u zavisnosti od promjena u veličini faktora rizika (npr. kamatna stopa, volatilnost) ili parametri modela. Model

Glavne kvantitativne karakteristike rizika
Rizik kome je preduzeće izloženo je verovatna opasnost od propasti ili nanošenja takvih finansijskih gubitaka koji bi mogli zaustaviti celo poslovanje. Jer će postojati šansa za neuspjeh

Izbor projekata na osnovu matematičkog očekivanja i standardne devijacije
Osnovni cilj svakog investitora je ostvarivanje očekivane dobiti od rezultata ulaganja. Ovaj profit je očekivan u smislu da je u fazi ulaganja njegova vrijednost

Zakon normalne distribucije (Gaussov zakon)
Normalna distribucija (Gaussova distribucija) se koristi za procjenu pouzdanosti proizvoda na koje utječe niz slučajnih faktora, od kojih svaki ima blagi utjecaj na rezultirajući rezultat.

Vrste matematičkih igara
Kooperativna i nekooperativna Igra se naziva kooperativna ili koaliciona, ako se igrači mogu udružiti u grupe, preuzimajući određene obaveze prema drugim igračima i koordinirajući

Čiste strategije u matematičkoj igri

Mješovite strategije u matematičkoj igri
U teoriji igara, igračeva strategija u igri ili poslovnoj situaciji je potpuni plan akcije za sve moguće situacije koje se mogu pojaviti. Strategija određuje igračeve akcije u bilo kom trenutku igre

Pitanje #24
Glavna teorema teorije matričnih igara, ili minimaks teorema. Ako je matrica

Pitanje br. 25
Grafička metoda primjenjivo na one igre u kojima barem jedan od igrača ima dvije strategije. Glavne faze pronalaženja rješenja za igru 2×n ili m×2: 1. Konstruirati prave linije, coo

Analitičko rješenje mješovite igre
Da pronađemo optimalno mešovita strategija igrač A: i odgovarajuća cijena igre ν, je potrebna

Metodologija strategija majorizacije
Majorizacija predstavlja odnos između strategija, čije prisustvo u mnogim praktičnim slučajevima omogućava smanjenje veličine originalne matrice isplate igre. Razmislite

Korištenje stabla odlučivanja
U praksi nas rezultat jedne odluke tjera da donesemo sljedeću odluku itd. Kada treba donijeti više odluka u uvjetima neizvjesnosti, kada svaka odluka zavisi od ishoda

Neumann-Morgenstern funkcija korisnosti
Osnovne definicije i aksiomi Metodologija racionalnog donošenja odluka u uslovima neizvesnosti, zasnovana na funkciji korisnosti pojedinca, zasniva se na pet aksioma koji odražavaju m

Koncept VAR vrijednosti pod rizikom
Jedan od glavnih zadataka finansijskih institucija je procena tržišnih rizika koji nastaju usled fluktuacija (povoljnih događaja) cena akcija, roba, kurseva, kamatnih stopa.

Suština svake odluke koju donosi menadžment je izbor najbolje od nekoliko alternativa prema određenim, unaprijed utvrđenim kriterijima. (Ako se želite prisjetiti razmatranja ograničenja i kriterija za donošenje odluka, pogledajte Poglavlje 6). Matrica plaćanja je jedna od metoda statističke teorije odlučivanja, metoda koja može pomoći menadžeru u odabiru jedne od nekoliko opcija. Posebno je korisno kada menadžer mora odrediti koja će strategija najviše doprinijeti postizanju ciljeva.

Matrica plaćanja – jedna od metoda statističke teorije odlučivanja koja pomaže u odabiru jedne od nekoliko opcija. Matrica isplate je korisna kada:

· postoji ograničen broj alternativa ili strategija za izbor;

vjerovatnoća da će se događaji dogoditi je poznata

· rezultati doneta odluka zavisi od toga kakva je odluka doneta i koji se događaji dešavaju.

Vjerovatnoća ovog ili onog vremena Magla (0.1)Vedro vrijeme (0.9)

Strategija 1: Avion+2000$+4500$

Strategija 2: Vlak+3000$+3000$

Zamislimo situaciju prodajnog agenta koji odlučuje da li će letjeti avionom ili vlakom van grada u kojem se nalazi potrošač. Ako je lepo vreme može da leti i provede 2 sata na celom putu od kapije do kapije, a ako mora da ide vozom - 7 sati.Ako ide vozom izgubiće jedan dan na radnom mestu , što bi, prema njegovoj procjeni, moglo povećati prodaju za 1.500 dolara.Prema procjenama, potrošač izvan grada trebao bi mu naručiti 3.000 dolara ako lično posjeti klijenta. Ako planira da leti do klijenta, a onda avion bude prinudno sleteo zbog magle, ličnu posetu će morati da zameni telefonskim pozivom. Ovo će smanjiti narudžbu klijenta izvan grada na 500 USD, ali će agent moći da daje narudžbe za 1.500 USD kod kuće.

Gore navedeni podaci matrice isplate odražavaju procjenu posljedica različitih pravaca djelovanja. Dodatno, predstavljene su i neke pretpostavke o vjerovatnoći pojave magle (koja bi utjecala na avion, ali ne i na voz) i vedrog vremena. Vidimo da je vjerovatnoća vedrog vremena 10 puta veća od magle. Nadalje, matrica pokazuje da će, djelujući na osnovu prve opcije strategije (avion), ako je vrijeme dobro (9 šansi od 10), agent prodaje prodati robu u vrijednosti od 4.500 dolara (ovo je rezultat ili posljedice). Tri druge moguće posljedice mogu se objasniti na isti način; ove argumente izostavljamo.

RICE. 8.4. Matrica plaćanja

Izvor: MagVp K. StorrandIrvmgStein, ThtPraetiuofManiyfnuntScience (EnglewoodCliffs, N.Y.: Prentice-Hall, 1976), str. 1 Uz dopuštenje.

Rečima N. Paula Loombe: "Isplata predstavlja novčanu nagradu ili korisnost koja je rezultat određene strategije u kombinaciji sa određenim okolnostima. Kada su isplate predstavljene u obliku tabele (ili matrice), dobijamo matricu isplate",24 kao što je prikazano na slici 1. 8.4. Riječi "u kombinaciji sa određenim okolnostima" vrlo su važne za razumijevanje kada se matrica plaćanja može koristiti i za procjenu kada je vjerovatno da će odluka donesena na osnovu nje biti pouzdana. U svom najopštijem obliku, matrica znači da plaćanje zavisi od određenih događaja koji se stvarno dešavaju. Ako se takav događaj ili prirodno stanje zaista ne dogodi, plaćanje će neminovno biti drugačije.

Općenito, matrica plaćanja je korisna kada:

1. Postoji razumno ograničen broj alternativa, ili opcija, strategija za izbor između njih.

2. Šta se može dogoditi nije poznato sa potpunom sigurnošću.

3. Rezultati donesene odluke zavise od toga koja je alternativa odabrana i koji se događaji zapravo dešavaju.

Osim toga, menadžer mora biti u stanju objektivno procijeniti vjerovatnoću relevantnih događaja i izračunati očekivanu vrijednost takve vjerovatnoće. Lider rijetko ima potpunu sigurnost. Ali isto tako retko deluje u uslovima potpune neizvesnosti. U gotovo svim slučajevima donošenja odluka, menadžer mora procijeniti vjerovatnoću ili mogućnost nekog događaja. Podsjetimo se iz prethodne rasprave da se vjerovatnoća kreće od 1, kada će se događaj definitivno dogoditi, do 0, kada se događaj definitivno neće dogoditi. Vjerovatnoća se može objektivno odrediti prema tome kako se igrač ponaša

na ruletu, klađenje na neparne brojeve. Izbor njegove vrijednosti može biti zasnovan na prošlim trendovima ili subjektivnoj procjeni menadžera koji polazi od toga sopstveno iskustvo akcije u takvim situacijama.

Ako vjerovatnoća nije uzeta u obzir, odluka će uvijek kliziti prema najoptimističnijem ishodu. Na primjer, ako pretpostavimo da investitori u uspješan film mogu imati 500% uloženog kapitala, a kada ulažu u trgovački lanac u najpovoljnijem slučaju samo 20%, onda bi odluka uvijek trebala biti u korist filmske produkcije. Međutim, ako uzmete u obzir da je vjerovatnoća velikog uspjeha filma vrlo mala, ulaganje u trgovine postaje privlačnije, jer je vjerovatnoća da se postigne navedenih 20% vrlo značajna. Da uzmemo jednostavniji primjer, isplate za opklade u utrci na velika udaljenost više na konjskim trkama jer postoji veća šansa da nećete osvojiti baš ništa

Vjerovatnoća direktno utiče na određivanje očekivane vrijednosti, centralnog koncepta u matrici isplate. Očekivana vrijednost alternativne, ili opcije, strategije je zbir mogućih vrijednosti pomnoženih odgovarajućim vjerovatnoćama. Na primjer, ako vjerujete da će vam ulaganje (kao akciona strategija) u kiosk sa sladoledom sa vjerovatnoćom od 0,5 obezbijediti godišnji profit od 5.000 dolara, sa vjerovatnoćom od 0.2 - 10.000 dolara, i sa vjerovatnoćom od 0.3 - 3.000 dolara , tada će očekivana vrijednost biti:

5000 (0,5) + 10 000 (0,2) + 3000 (0,3) = 5400 $

Određivanjem očekivane vrijednosti svake alternative i slaganjem rezultata u obliku matrice, menadžer može lako odrediti koji je izbor najatraktivniji s obzirom na date kriterije. To će, naravno, odgovarati najvišoj očekivanoj vrijednosti. Istraživanja pokazuju da kada se uspostave točne vrijednosti vjerovatnoće, metode stabla odlučivanja i matrice isplate donose bolje odluke od tradicionalnih pristupa25.

Matrica plaćanja je jedna od metoda statističke teorije odlučivanja, metoda koja može pomoći menadžeru u odabiru jedne od nekoliko opcija. Posebno je korisno kada menadžer mora odrediti koja će strategija najviše doprinijeti postizanju ciljeva.

Općenito, matrica plaćanja je korisna kada:

1. Postoji razumno ograničen broj alternativa ili strategija koje možete izabrati.

2. Šta se može dogoditi nije poznato sa potpunom sigurnošću.

3. Rezultati donesene odluke zavise od toga koja je alternativa odabrana i koji se događaji zapravo dešavaju.

pristupi:

a) bez uzimanja u obzir numeričkih vrijednosti vjerovatnoća ishoda

b) uzimajući u obzir numeričke vrijednosti vjerovatnoća ishoda

Nakon konstruisanja matrice, odabire se opcija akcije koja daje optimalnu vrijednost kriterija.

A) - Pravila za odabir opcija akcije:

1)maksimalno rješenje – maksimizacija kriterija maksimuma. Profit ili prihod kao kriterijum

2) maksimalno rešenje - maksimiziranje minimalnog kriterijuma (kriterijum - profit ili prihod)

3) minimaks rješenje - minimiziranje maksimuma kriterija.

Minimax rješenje je pristup srednjeg rizika.

b) – sve odluke će biti optimistične, jer su usmjerene na povoljniji ishod događaja.

pristupi:

1) maksimizacija kriterijuma

2) minimiziranje kriterijuma

Matrica plaćanja koja uzima u obzir vjerovatnoću ishoda događaja:

– vjerovatnoća i – ta varijanta ishoda događaja

– očekivanu vrijednost kriterijum pri izboru i – ta opcija akcionih alternativa

Algoritam za odabir rješenja:

1) Maksimizacija najvjerovatnijih vrijednosti kriterija

2) Na osnovu pravila maksimalne vjerovatnoće za minimiziranje najvjerovatnijih vrijednosti kriterija

3) Zasnovano na pravilu maksimiziranja matematičkog očekivanja

4) Zasnovano na pravilu minimiziranja matematičkog očekivanja kriterija.

35. Postojanje metode “Stablo odlučivanja”.

Primjeri impliciraju jednu odluku, ali u praksi rezultat jedne odluke tjera da se prihvati posljedica. Ovaj slijed se ne može izraziti matricom plaćanja, stoga, kada trebate donijeti nekoliko odluka, od kojih svaka zavisi od ishoda prethodne, koristimo šemu „stabla odluka“.

Kada sastavljate „Stablo odlučivanja“, možete nacrtati „deblo“ i „grane“ koje prikazuju strukturu problema. “Drveće” se nalazi s lijeva na desno. "Ogranci" predstavljaju moguće alternativne odluke koje se mogu donijeti i moguće ishode koji proizlaze iz tih odluka , grane izlaze iz čvorova, koji su dva tipa:

1. Kvadratni čvor predstavlja mjesto na kojem se donose odluke

2. Kvadratni čvor označava mjesto gdje se pojavljuju različite opcije za ishod kvadrata.

Dvije vrste "grana":

Isprekidane linije koje izlaze iz kvadrata mogućih rješenja, kretanje po njima ovisi o donošenju odluke. Svi troškovi nastali odlukom su označeni na odgovarajućoj isprekidanoj „granici“.

Pune linije koje izlaze iz krugova mogućih ishoda, kretanje po njima određeno je ishodom događaja. Puna linija označava vjerovatnoću datog ishoda.

Kvadrat je čvor odluke.

Krug je čvor grananja za moguće ishode događaja.

Isprekidana linija – grane, kretanje duž kojih zavisi od odluke koja se donosi

Linija – grane, kretanje duž koje zavisi od ishoda događaja.

3 faze pronalaženja rješenja:

1. “Drvo” se gradi kada su sva rješenja a njihovi ishodi su naznačeni na „drvetu“, izračunava se svaka od opcija, a na kraju je naznačen njen novčani prihod.

2. Izračunava se i stavlja na odgovarajuće “grane” vjerovatnoće svakog ishoda.

3. S desna na lijevo, izračunavaju se i unose novčani rezultati svakog čvora. Svi nastali troškovi se odbijaju od očekivanih prihoda.

Nakon što se prijeđu kvadrati rješenja, odabire se „grana“ koja vodi do najvećeg mogućeg rezultata. ovu odluku očekivani prihod. Druga “grana” je precrtana, a očekivani prihod je upisan iznad kvadrata rješenja.

Tako se na kraju treće etape formira niz odluka koje vode do maksimalnog prihoda, a kao kriterij mogu djelovati i maksimizacija matematičkog očekivanja i matematičko očekivanje gubitaka.

36. Karakteristike metode “Ringiranje rješenja”..

Ova metoda uključuje 3 opcije za strategije: 1. opreznu (pesimističnu), 2. optimističnu, 3. racionalnu (izračunato za prosječno stanje)

Poznato je da metoda matrice plaćanja, ne uzimajući u obzir vjerovatnoću ishoda, također pretpostavlja 3 opcije radnji u smislu njihove rizičnosti.

Optimistična strategija u metodi matrice plaćanja može se smatrati maksimizacijskim pristupom, pesimistična – maksimalnim, a racionalna – minimalnim pristupom.

Suština pesimističke strategije je da donosilac odluke mora da računa na najgore pri izboru rešenja (odluka ne zahteva poznavanje verovatnoće odluke)

Optimalno rješenje prema kriteriju pesimizma određuje se tako što se za svako rješenje pronađe najgora procjena za sve situacije, a zatim izabere najbolje od njih (najbolje od najgorih rješenja).

Primjer algoritma za odabir rješenja na osnovu kriterija pesimizma.

Imamo n-opcija akcija, Aj i m – opcije, Si – (događaji?).

Za svako od rješenja Aj (j=1+n) određuju se rangovi bij.

Ako se događaji razvijaju prema opciji Si u istoj fazi, rangovi se mogu odrediti pojedinačno od strane donosioca odluke ili kolektivnom metodom stručna procjena. Rezultat rangiranja je sažet u tabeli.

		Opcije




Koeficijenti važnosti Kj

Aj (j=1 ÷n), za sve situacije Si (i=1÷m)

Koeficijent važnosti Kj odgovara maksimalnoj AO apsolutnoj vrijednosti vrijednosti ranga rješenja za sve situacije ( najgora ocjena). Kj=max bij po i.

Odabire se optimalno rješenje koje odgovara minimalnoj, u apsolutnoj vrijednosti, vrijednosti Kj svih rješenja (najbolja procjena). I pesim.=min Kj od j.

Optimistička strategija ispunjava kriterijum optimizma. U ovom slučaju, donosilac odluka treba da se nada najboljem.

Optimalno rješenje, prema kriteriju optimizma, utvrđuje se pronalaženjem za svako rješenje najbolje procjene za sve situacije i naknadnim odabirom najboljeg od njih (najbolje rješenje). Pravilo za izbor optimalnog rješenja u ovom slučaju ima oblik: Kj=min bij za i, A =min Kj za j.

Optimalno rješenje min A1 i A2. Optim. – A1 i A2.

Racionalna strategija implementacije zasnovana na kriteriju maksimalnog prosječnog dobitka.

Donosilac odluke mora izračunati odluku za najveću vjerovatnoću stanja. Za implementaciju racionalne strategije potrebno je poznavanje vjerovatnoća Pi ishoda i događaja Si.

Koeficijent važnosti u ovom slučaju predstavlja prosječan dobitak koji se dobija svakom odlukom u svim situacijama.

Var-t ishod	Akcija var.	Var-t ishod. R
Var-t ishod		Var-t ishod. R



Coef. važan Kj

Mj=∑i aij*Pi. Optimalno rješenje odgovara maksimalnoj vrijednosti koeficijenta važnosti. Arac.=max Kj po j. Optimalno rješenje u ovom slučaju će biti A3, jer odgovara vrijednosti maksimalne važnosti (K3 = 2,8)

Matrica plaćanja- jedna od metoda statističke teorije odlučivanja koja pomaže menadžeru da odabere jednu od nekoliko opcija. Posebno je koristan u situaciji kada menadžer mora odrediti koja strategija će najviše doprinijeti postizanju ciljeva. U samom opšti pogled matrica znači da plaćanje zavisi od određenih događaja koji se stvarno dešavaju. Ako se događaj ili prirodno stanje stvarno ne dogodi, plaćanje će uvijek biti drugačije.

Općenito, matrica plaćanja je korisna kada:

· postoji razumno ograničen broj alternativa ili strategija za izbor između.
· šta se može dogoditi nije poznato sa potpunom sigurnošću.

Rezultati odluke zavise od toga koja je alternativa odabrana i koji se događaji zapravo dešavaju.

Osim toga, menadžer mora biti u stanju objektivno procijeniti vjerovatnoću relevantnih događaja i izračunati očekivanu vrijednost takve vjerovatnoće.

Vjerovatnoća direktno utiče na određivanje očekivane vrijednosti – osnovni koncept matrice isplate. Očekivana vrijednost alternative ili opcije je zbir mogućih vrijednosti pomnožen odgovarajućim vjerovatnoćama.

Određivanjem očekivane vrijednosti svake alternative i slaganjem rezultata u obliku matrice, menadžer može lako izabrati najoptimalniju opciju. relevantna matrica plaćanja

Po riječima N. Paula Loombe: „Plaćanje predstavlja novčana nagrada ili korisnost koja proizlazi iz određene strategije u kombinaciji sa određenim okolnostima. Ako su plaćanja prikazana u obliku tabele (ili matrice), dobijamo matricu plaćanja." Reči "u kombinaciji sa specifičnim okolnostima" su veoma važne za razumevanje kada se matrica plaćanja može koristiti i za procenu kada je odluka doneta na osnovu nje U svom najopštijem obliku, matrica znači da plaćanje zavisi od određenih događaja koji se stvarno dešavaju. Ako se takav događaj ili prirodno stanje zaista ne dogodi, plaćanje će neminovno biti drugačije.

Lider rijetko ima potpunu sigurnost. Ali retko se dešava da on deluje u uslovima potpune neizvesnosti. U gotovo svim situacijama donošenja odluka, menadžer mora procijeniti vjerovatnoću ili mogućnost nekog događaja.

Matrica plaćanja predstavlja plaćanja u kombinaciji sa specifičnim okolnostima u obliku tabele ili matrice.

Za upotrebu ovu metodu menadžer treba da odredi vjerovatnoću događaja, koja varira od 1 do 0. Izbor njegove vrijednosti može se zasnivati na prošlim trendovima ili subjektivnoj procjeni menadžera, koji proizilazi iz vlastitog iskustva djelovanja u sličnim situacijama.

Vjerovatnoća direktno utiče na određivanje očekivane vrijednosti, centralnog koncepta u matrici isplate. Očekivana vrijednost alternative ili opcije strategije je zbir mogućih vrijednosti pomnožen odgovarajućim vjerovatnoćama.

Određivanjem očekivane vrijednosti svake alternative i slaganjem rezultata u obliku matrice, menadžer može lako odrediti koji je izbor najpoželjniji s obzirom na date kriterije. To će, naravno, odgovarati najvišoj očekivanoj vrijednosti.

Vjerovatnoća se može objektivno odrediti, baš kao što to čini igrač ruleta kada se kladi na neparne brojeve. Odabir njegove vrijednosti može biti zasnovan na prošlim trendovima ili subjektivnoj procjeni menadžera, koji polazi od vlastitog iskustva djelovanja u sličnim situacijama.

Ako vjerovatnoća nije uzeta u obzir, odluka će uvijek kliziti prema najoptimističnijem ishodu.

Predavanje 9. Koncept od gaming modeli. Matrica plaćanja.

§ 6 ELEMENTI TEORIJE IGRE

6.1 Koncept modela igre.

Matematički model konfliktna situacija pozvao igra , strane uključene u sukob - igrači, a ishod sukoba je pobijediti .

Za svaku formalizovanu igru, pravila , one. sistem uslova koji određuje: 1) opcije za akcije igrača; 2) količinu informacija koje svaki igrač ima o ponašanju svojih partnera; 3) dobitak do kojeg vodi svaki niz radnji. Obično se dobitak (ili poraz) može kvantifikovati; na primjer, možete procijeniti gubitak kao nula, pobjedu kao jedan, a neriješeno kao 1/2. Kvantifikacija rezultata igre se zove plaćanje .

Igra se zove parna soba , ako uključuje dva igrača, i višestruko , ako je broj igrača veći od dva. Razmotrićemo samo igre parova. Uključuju dva igrača A I IN,čiji su interesi suprotni, a pod igrom podrazumevamo niz akcija od strane A I IN.

Igra se zove igra sa nultom sumom ili antagonistički nebo , ako je dobitak jednog od igrača jednak gubitku drugog, tj. zbir dobitaka obe strane je nula. Da biste izvršili zadatak igre, dovoljno je naznačiti vrijednost jednog od njih . Ako odredimo A– dobitak jednog od igrača, b – dobitke drugog, zatim za igru sa nultom sumom b = –A, stoga je dovoljno razmotriti npr A.

Izbor i provedba jedne od radnji predviđenih pravilima naziva se napredak igrač. Potezi mogu biti lični I nasumično . Lični potez – ovo je svjestan izbor igrača jedne od mogućih radnji (na primjer, potez u partiji šaha). Skup mogućih opcija za svaki osobni potez reguliran je pravilima igre i ovisi o ukupnosti prethodnih poteza na obje strane.

Slučajni potez – to je nasumično odabrana akcija (na primjer, odabir karte iz promiješanog špila). Da bi igra bila matematički definisana, pravila igre moraju naznačiti za svaki slučajni potez raspodjela vjerovatnoće mogući ishodi.

Neke igre se mogu sastojati samo od nasumičnih poteza (tzv. čisto kockanje) ili samo od ličnih poteza (šah, dame). Većina kartaških igara spada u igre mješovitog tipa, odnosno sadrže i nasumične i lične poteze. U budućnosti ćemo razmatrati samo lične poteze igrača.

Igre se klasifikuju ne samo po prirodi poteza (lični, slučajni), već i po prirodi i količini informacija dostupnih svakom igraču u vezi sa akcijama drugog. Posebna klasa igara su takozvane “igre s potpunim informacijama”. Igra sa kompletnim informacijama je igra u kojoj svaki igrač, svakim ličnim potezom, zna rezultate svih prethodnih poteza, ličnih i nasumičnih. Primjeri igara s potpunim informacijama uključuju šah, dame i poznata igra"krstovi i prsti". Većina igara od praktične važnosti ne spada u klasu igara sa potpunim informacijama, budući da je neizvjesnost o akcijama neprijatelja obično bitan element konfliktnih situacija.

Jedan od glavnih koncepata teorije igara je koncept strategije .

Strategija Igrač je skup pravila koja određuju izbor njegove akcije pri svakom ličnom potezu, ovisno o trenutnoj situaciji. Obično tokom igre, svakim ličnim potezom, igrač pravi izbor u zavisnosti od konkretne situacije. Međutim, u principu je moguće da sve odluke igrač donosi unaprijed (kao odgovor na bilo koju situaciju). To znači da je igrač odabrao određenu strategiju, koja se može specificirati kao lista pravila ili program. (Na ovaj način možete igrati igru pomoću računara.) Igra se zove krajnji , ako svaki igrač ima konačan broj strategija, i beskrajno .– inače.

Da bi odlučiti igra , ili pronađite rešenje igre , za svakog igrača treba izabrati strategiju koja zadovoljava uslov optimalnost , one. jedan od igrača mora primiti maksimalna pobeda, kada se drugi drži svoje strategije, u isto vrijeme drugi igrač mora imati minimalni gubitak , ako se prvi drži svoje strategije. Takve strategije se nazivaju optimalno . Optimalne strategije takođe moraju zadovoljiti uslov održivost , one. Mora da je nepovoljno za bilo kojeg igrača da napusti svoju strategiju u ovoj igri.

Ako se igra ponovi dosta puta, onda igrači možda neće biti zainteresirani za pobjedu i poraz u svakoj određenoj igri, ali Aprosječna pobjeda (gubitak) u svim serijama.

Cilj teorije igara je odrediti optimalnu strategiju za svakog igrača.

6.2. Matrica plaćanja. Donja i gornja cijena igre

Vrhunska igra u kojoj igrač A Ima T strategije i igrača V – str strategija se zove igra.

Razmotrite igru
dva igrača A I IN(“mi” i “neprijatelj”).

Pustite igrača A ima T lične strategije, koje označavamo
. Pustite igrača IN dostupan n lične strategije, označimo ih
.

Neka svaka strana izabere specifičnu strategiju; za nas će biti , za neprijatelja . Kao rezultat toga što igrači biraju bilo koji par strategija I (
) ishod utakmice je jednoznačno određen, tj. dobitke igrač A(pozitivan ili negativan) i gubitak
igrač IN.

Pretpostavimo da su vrijednosti poznat po bilo kojem paru strategija ( ,). Matrix
,
, čiji elementi su dobici koji odgovaraju strategijama I , pozvao matrica plaćanja ili matrica igre. Redovi ove matrice odgovaraju strategijama igrača A, a kolone – strategije igrača B. Ove strategije se nazivaju čistim.

Game Matrix
ima oblik:

Razmotrite igru
sa matricom

i odrediti najbolju među strategijama
. Odabir strategije , igrač A mora očekivati da igrač INće odgovoriti koristeći jednu od strategija , za koji je isplata za igrača A minimalno (igrač IN nastoji da "povredi" igrača A).

Označimo sa najmanji dobitak igrača A prilikom odabira strategije za sve moguće strategije igrača IN(najmanji broj u i red matrice plaćanja), tj.

(1)

Među svim brojevima (
) izaberite najveće:
.

Hajde da pozovemo
najniža cijena ngra, ili maksimalni dobici (maxmin). Ovo je zagarantovana pobeda za igrača A za bilo koju strategiju igrača B. dakle,

. (2)

Strategija koja odgovara maksiminu se zove maksiminska strategija . Player IN zainteresovani za smanjenje dobitaka igrača A, odabir strategije , uzima u obzir maksimalnu moguću dobit za A. Označimo

. (3)

Među svim brojevima izaberimo najmanju

i hajde da pozovemo najviša cijena igre ili minimax pobjeda (minimax). Ego je garantovao gubitak igrača B . stoga,

. (4)

Poziva se strategija koja odgovara minimaksu minimax strategija.

Princip koji nalaže igračima da izaberu "najopreznije" minimax i maximin strategije naziva se princip minimaksa . Ovaj princip proizilazi iz razumne pretpostavke da svaki igrač teži da postigne cilj suprotan od cilja njegovog protivnika.

Teorema.Donja cijena igre uvijek ne prelazi gornju cijenu igre
.

Ako su gornja i donja cijena igre iste, onda je ukupna vrijednost gornje i donje cijene igre
pozvao čista cijena igre, ili po cijenu igre. Minimaks strategije koje odgovaraju cijeni igre su optimalne strategije , i njihova ukupnost - optimalno rešenje ili rješenje igre. U ovom slučaju igrač A dobija maksimum zagarantovanog (nezavisno od ponašanja igrača) IN) dobitke v, i plejer IN postiže zagarantovani minimum (bez obzira na ponašanje igrača A) gubljenje v. Kažu da rješenje za igru ima stabilnost , one. Ako se jedan igrač drži svoje optimalne strategije, onda ne može biti isplativo za drugog da odstupi od svoje optimalne strategije.

Ako jedan od igrača (npr A) drži se svoje optimalne strategije, a drugi igrač (IN) tada će odstupiti od svoje optimalne strategije na bilo koji način za igrača koji je napravio odstupanje, to nikada ne može biti isplativo; takvo odstupanje igrača IN može u najboljem slučaju ostaviti dobitak nepromijenjen. i u najgorem slučaju– povećati.

Naprotiv, ako IN pridržava se svoje optimalne strategije, i A odstupa od svog, onda to ni na koji način ne može biti od koristi A.

Par čistih strategija I daje optimalno rješenje igri ako i samo ako je odgovarajući element je i najveći u svojoj koloni i najmanji u svom redu. Ova situacija, ako postoji, zove se sedlo. U geometriji, tačka na površini koja ima svojstvo da ima istovremeno minimum u jednoj koordinati i maksimum u drugoj zove se sedlo Poenta, po analogiji se ovaj termin koristi u teoriji igara.

Igra za koju
, pozvao igra sa sedlom. Element , koje ima ovo svojstvo, je sedlo matrice.

Dakle, za svaku igru sa sedlom postoji rješenje koje određuje par optimalnih strategija za obje strane, koje se razlikuju u sljedećim svojstvima.

1) Ako se obje strane pridržavaju svojih optimalne strategije, tada je prosječan dobitak jednak neto cijeni igre v, što je istovremeno njegova donja i gornja cijena.

2) Ako se jedna od strana pridržava svoje optimalne strategije, a druga odstupi od svoje, strana koja odstupa može samo izgubiti i ni u kom slučaju ne može povećati svoj dobitak.

Klasa igara koje imaju sedlo je od velikog interesa i sa teorijske i sa praktične tačke gledišta.

U teoriji igara je dokazano da, posebno, svaka igra sa kompletnom informacijom ima sedlo, pa stoga svaka takva igra ima rješenje, tj. postoji par optimalnih strategija obje strane, koje daju prosječnu isplatu jednak trošku igre. Ako se igra sa potpunim informacijama sastoji samo od ličnih poteza, onda kada svaka strana primijeni svoju optimalnu strategiju, uvijek bi trebala završiti dobro definiranim ishodom, odnosno pobjedom točno jednakom cijeni igre.