Dom » rafters » Reflektivne igre. Zbirka igrica za odraz slučaja. Tipologija refleksivnih igara

Reflektivne igre. Zbirka igrica za odraz slučaja. Tipologija refleksivnih igara

Uz refleksivne igre, moguća metoda teoretskog modeliranja igara u uvjetima nepotpune svijesti je bayes igre, predložena kasnih 1960-ih. J. Harshanyi. U Bayesovim igrama, sve privatne (tj. ne opšte poznate) informacije koje agent ima u trenutku kada odabere svoju akciju nazivaju se tip agent. Štaviše, svaki agent, znajući svoj tip, takođe ima pretpostavke o tipovima drugih agenata (u obliku distribucije verovatnoće). Formalno, Bayesova igra se opisuje sljedećim skupom:

- mnogo N agenti;
- skupovi /?, mogući tipovi agenata, gdje je tip /-og agenta

mnogi X' = J-[ X x dozvoljeni vektori akcije agensa

-skup ciljnih funkcija /: R'x X'-> 9? 1 (ciljna funkcija agenta općenito ovisi o vrstama i akcijama svih agenata);
- reprezentacije F, (-|r,) e D(/?_,), /" e N, agenti (ovdje, /?_ označava skup mogućih skupova tipova svih agenata, osim /-tog, R.j= P R t , a D(/?_,) označava skup

u svim mogućim distribucijama vjerovatnoće na /?_,). Rješenje za Bayesovu igru je Bayes-Nash ravnoteža, definiran kao skup strategija agenata forme X*: R, -> X h i e N,

koji maksimiziraju matematička očekivanja odgovarajućih ciljnih funkcija:

gdje jc označava skup strategija svih agenata, osim j-tog. Naglašavamo da u Bayesovoj igri agentova strategija nije akcija, već funkcija zavisnosti akcije agenta od njenog tipa.

Model J. Harshanyija može se tumačiti na različite načine (vidi). Prema jednom tumačenju, svi agenti poznaju apriornu distribuciju tipova F(r) e D (R') i, nakon što su naučili svoj vlastiti tip, izračunavaju uvjetnu distribuciju iz njega koristeći Bayesovu formulu Fj(r.i| G,). U ovom slučaju nazivaju se reprezentacije agenata (F,(-|-)), sW pristao(a, posebno, opšte je poznato - svaki agent može da ih izračuna, zna šta drugi mogu da urade, itd.).

Drugo tumačenje je sljedeće. Neka postoji neki skup potencijalnih učesnika u igri raznih vrsta. Svaki takav “potencijalni” agent bira svoju strategiju ovisno o svom tipu, nakon čega nasumično bira P"stvarnih" učesnika u igri. U ovom slučaju, reprezentacije agenata, općenito govoreći, nisu nužno konzistentne (iako su općepoznate). Imajte na umu da se ovo tumačenje zove igrajući Seltena(R. Zelgen - Nobelova nagrada za ekonomiju 1994, zajedno sa J. Nashom i J. Harshanyijem).

Sada razmotrite situaciju u kojoj uslovne distribucije nisu nužno opštepoznate. Zgodno je to opisati na sljedeći način. Neka isplate agenata zavise od njihovih postupaka i od nekog parametra v e 0 (“prirodna stanja”, koja se takođe mogu tumačiti kao skup tipova agenata), čija vrijednost nije opšte poznata, tj. ciljna funkcija /-og agenta ima oblik f i (0,x x ,...,x n): 0 x X'- ""L 1, /" e N. Kao što je napomenuto u drugom poglavlju ovog rada, agentovom izboru njegove strategije logično prethodi informaciona refleksija - agentova razmišljanja o tome šta svaki agent zna (pretpostavlja) o parametru 0, kao i o pretpostavkama drugih agenata, itd. Tako dolazimo do koncepta strukture svijesti agenta, koja odražava njegovu svijest o nepoznatom parametru, reprezentacijama drugih agenata, itd.

U okviru probabilističke svijesti (reprezentacije agenata uključuju sljedeće komponente: probabilističku distribuciju na skup prirodnih stanja; probabilističku distribuciju na skup stanja prirode i distribucije na skup stanja prirode koja karakteriziraju reprezentacije stanja prirode drugi agenti, itd.), univerzalni prostor mogućih međusobnih reprezentacija (prostor univerzalnih vjerovanja). Istovremeno, igra se formalno svodi na neku vrstu "univerzalne" Bayesove igre, u kojoj je tip agenta cjelokupna struktura njegove svijesti. Međutim, predložena konstrukcija je toliko glomazna da je očigledno nemoguće pronaći rješenje za "univerzalnu" Bayesovu igru u općem slučaju.

U ovom odeljku ćemo se ograničiti na razmatranje igara sa dve osobe, dok su reprezentacije agenata date tačkastom strukturom svesti (agenti imaju dobro definisane ideje o vrednosti neodređenog parametra; o tome šta je protivnik (takođe dobro -definisane) reprezentacije su, itd.) Ova pojednostavljenja, pronalaženje Bayes-Nash ravnoteže se svodi na rješavanje sistema od dvije relacije koje definiraju dvije funkcije, od kojih svaka zavisi od prebrojivog broja varijabli (vidi dolje).

Dakle, neka u igri učestvuju dva agenta sa objektivnim funkcijama

i funkcije f i mnogi X b 0 je opšte poznato. Prvi agent ima sljedeće reprezentacije: nedefinirani parametar je jednak 0 e 0; drugi agent vjeruje da je nedefinirani parametar jednak u 2 e 0; drugi agent misli da prvi agent misli da je nedefinirani parametar u 2 e 0, itd. Dakle, tačkasta struktura svesti prvog agenta /, data je beskonačnim nizom elemenata skupa 0; neka, shodno tome, drugi agent takođe ima tačkastu strukturu svesti 1 2:

Pogledajmo sada refleksivnu igru (2)-(3) sa "bajesovske" tačke gledišta. Tip agenta u ovom slučaju je njegova struktura svijesti /, /=1, 2. Da bi se pronašla Bayes-Nashova ravnoteža, potrebno je pronaći ravnotežna djelovanja agenata svih mogućih tipova, a ne samo nekih fiksnih tipova (3) .

Lako je vidjeti kakve će biti distribucije F,(-|-) u ovom slučaju iz definicije ravnoteže (1). Ako je, na primjer, tip prvog agenta 1={6, 0 !2 , 0w, ...), tada distribucija Fi(-|/i) dodjeljuje vjerovatnoću 1 vrsta protivnika / 2 =(0 | 2 , 012b 0W2, ) i vjerovatnoća 0 za druge tipove. Prema tome, ako je tip drugog agenta ^2 = (02> $2b Fig*)> onda distribucija F 2 (-|/ 2) dodjeljuje vjerovatnoću 1 protivniku 1=(u 2 , 0 212 , 02:2i ) i vjerovatnoća 0 za druge tipove.

Da bismo pojednostavili notaciju, koristit ćemo sljedeću notaciju:

Hajde da uvedemo i notaciju

U ovim notacijama tačka Bayes-Nashova ravnoteža (1) je zapisana kao par funkcija ((pi-), i//(-)) koji zadovoljava uslove

Imajte na umu da je unutar tačkaste strukture svijesti, 1. agent siguran da je vrijednost neodređenog parametra 0 (bez obzira na ideje protivnika).

Dakle, da bi se pronašla ravnoteža, potrebno je riješiti sistem funkcionalnih jednadžbi (4) za određivanje funkcija (R(-) i!//( ), od kojih svaka zavisi od prebrojivog broja varijabli.

Moguće strukture svjesnosti mogu imati konačnu ili beskonačnu dubinu. Pokažimo da primjena Bayes-Nash koncepta ravnoteže na agente sa strukturom svijesti o beskonačnoj dubini daje paradoksalan rezultat - svaka dopuštena radnja je za njih ravnotežna.

Definirajmo koncept konačnosti dubine strukture svijesti u odnosu na slučaj igre sa dva učesnika, kada je struktura svijesti svakog od njih beskonačan niz elemenata od 0.

Neka sekvenca T= (t j) " =[ elemente od 0 i nenegativan cijeli broj To. Sequence (o k (T) = (t t) /=i+1

zvaćemo k-završetak sekvence T.

Reći ćemo da je sekvenca T Ima beskrajna dubina ako za bilo koji P tamo će biti k>n takav da je niz sa do (T) ne poklapa se (što znači uobičajeno podudaranje po elementima) ni sa jednom sekvencom u skupu a>u(T)=T, (0 (T),..., (o n (T). Inače, sekvenca T Ima konačna dubina.

Drugim riječima, niz konačne dubine ima konačan broj po paru različitih završetaka, dok niz beskonačne dubine ima beskonačan broj njih. Na primjer, niz (1, 2, 3, 4, 5, ...) ima beskonačnu dubinu, dok niz (1, 2, 3, 2, 3, 2, 3, ...) ima konačnu dubinu.

Razmotrimo igru (2) u kojoj cilj funkcionira f, f2 i mnogi X, X 2, 0 imaju sljedeće svojstvo:

(5) za bilo koje A" | e X, x 2 e X 2, in e 0 kompleta

Uslovi (5) znače da za bilo koje u e© i svaka radnja Xi e X drugi agent ima barem jedan najbolji odgovor i, zauzvrat, samu akciju X je najbolji odgovor na neku akciju drugog agenta; isto tako, bilo koju radnju

X 2 G X 2 .

Ispada da pod uslovima (5) u igri (2) bilo koji djelovanje agenta sa beskonačnom strukturom svijesti o dubini je ravnotežno (tj. komponenta je neke ravnoteže (4)). Ego je istinit za oba agenta; radi određenosti formuliramo i dokazujemo tvrdnju za prvu.

Tvrdnja 2.10.1 Neka igra (2) u kojoj su ispunjeni uslovi (5) ima Bayes-Nashovu ravnotežu (4) barem u jednoj tački. Zatim za bilo koju informacijsku strukturu beskonačne dubine 1 i bilo koji % e X postoji ravnoteža (*,*( ) > x*(-)), u kojoj je x*(/,) =x-

Ideja dokaza je da se konstruktivno konstruiše odgovarajuća ravnoteža. Popravimo proizvoljnu ravnotežu (1. Na osnovu uslova (4), vrijednost funkcije φ ( ) poprimila je strukturu 1 značenje X-

Dokaz tvrdnje 2.10.1 uvodimo sa četiri leme, za čiju formulaciju uvodimo zapis: ako p=(p,...,/>„) je konačan, i T=(/.)", - beskonačan niz elemenata

od 0, onda pT= 0, h, ...)

Lema 2.10.1. Ako sekvenca T ima beskonačnu dubinu, ali za bilo koji konačan niz R i bilo koji To sekvenca rso k (T) takođe ima beskonačnu dubinu.

Dokaz. Ukoliko T ima beskonačnu dubinu, ima beskonačan broj različitih završetaka u paru. Kada se krećete iz T To s k (t) njihov broj se smanjuje za najviše To, i dalje ostaje beskonačan. Kada se krećete iz sa do (T) To ry to (T) broj odvojenih završetaka u paru očito se ne smanjuje.

Lema 2.10.2. Neka sekvenca T predstavljaju u formi T=rrr gdje R - neki neprazan konačni niz. Onda T ima konačnu dubinu.

Dokaz. Neka R ima oblik p=(p, Zatim elementi niza T povezani odnosima t i+nk = t, za sve cijele brojeve / > 1 i do > 0. Uzmite proizvoljan y-završetak, y > P. Broj j jedinstveno predstavljen u obliku j = i + p k, gdje je /e(1, ..., "), A" > 0. To je lako pokazati a>(T) = (o,(T) za bilo koju celinu m> 0 trčanje = t i+ „ k+m =

S obzirom na proizvoljnost j pokazali smo da je sekvenca T dosta P po paru različite završetke, tj. njegova dubina je konačna.

Lema 2.10.3. Neka za niz T identitet T = p T, gdje R je neki neprazan konačan niz. Onda T ima konačnu dubinu.

Dokaz. Neka p =(/? b ...,R"). Imamo:

T=r T=rr T=rrr T=rrrr T=... . Dakle, za bilo koji cijeli broj k> 0 podudaranja fragmenata (/„*+, ..., /„*+„). (str b Dakle

T predstavljaju u formi T = prr... i, prema lemi 2.10.2, ima konačnu dubinu.

Lema 2.10.4 Neka je niz T identitet p T = q T, gdje R i q su neki neidentični neprazni konačni nizovi. Onda T ima konačnu dubinu.

Dokaz. Neka R= (/;, . i q = (qb ..., qk). Ako n = k, th, očigledno, identitet pT=q T ne može se izvršiti. Stoga, razmotrite slučaj pFc. Neka za određenost n > k. Onda p = (q u ..., q k ,p k+ , ...,R"), i od stanja pT=q T sledi to d T \u003d T, gdje d = (j) k+ 1 , ...,p p). Primjenom leme 2.10.3 dobijamo da je dubina niza T konačan.

Dokaz izjave 2.Yu.L. Neka postoji proizvoljna informaciona struktura prvog agenta beskonačne dubine - radi uniformnosti sa lemama 2.10-2L0.4, označićemo je ne /, već T \u003d (t, t 2,. Prema uslovu tvrdnje, postoji barem jedan par funkcija!//( )) koji zadovoljava relacije (4); popravi bilo koji od ovih parova. Postavljamo vrijednost funkcije f( ) na nizu T jednaka

X". φ(T) = x(u daljem tekstu, za "novo definisane" funkcije koristićemo notaciju f( ) i f( )) Zamjena T kao argument funkcije f( ) u relacijama (4), dobijamo da je vrijednost f(t) = x je povezan (zbog (4)) sa vrijednostima funkcije f( ) na nizu (0 (T), kao i na svim takvim sekvencama 7”,

ZA KOJI CO(T')= T.

Biramo vrijednosti funkcije f( ) na ovim nizovima na način da su ispunjeni uslovi (4):

gdje t e Q; iz (5) slijedi da se ego može napraviti. Ako je set BR"(t, x) ili BR2(t,x) sadrži više od jednog elementa, uzmite bilo koji od njih.

p(* 3 ,/ 4 ,...) € BR 2 "(t 2, a, zamjena (t, t2, t2,...), izaberite

Nastavljajući da već dobijene vrijednosti zamjenjujemo u relacije (4), možemo sukcesivno odrediti vrijednosti funkcije f( ) na svim nizovima forme

gdje (t + k)- neparne i funkcijske vrijednosti f(?) na nizovima oblika (6) sa parom (t + k). Nadalje, pretpostavit ćemo da u (6) at t> 1 u toku F t m ., - tada je reprezentacija u obliku (6).

nedvosmisleno.

Algoritam za određivanje vrijednosti funkcija na nizovima oblika (6) sastoji se od dvije faze. U prvoj fazi, pretpostavljamo f(T)=x i odrediti vrijednosti odgovarajućih funkcija na nizovima w,n(r) = ( t„„ t m+ 1, ...), m> 1 (tj. u k= 0) naizmjeničnim primjenom preslikavanja DD, 1 i 5/?, 1 .

U drugoj fazi, odrediti vrijednost odgovarajućih funkcija na sekvencama (6) sa do > 1 polazimo od vrijednosti određene u prvoj fazi niza (t„„ t„,+ 1, ...), primjenjujući naizmenično preslikavanja BR i BR2.

Prema lemi 1, svi nizovi oblika (6) imaju beskonačnu dubinu. Prema lemi 4, svi su parovi različiti (ako se bilo koja dva niza oblika (6) poklapaju, to bi bilo u suprotnosti sa beskonačnošću dubine). Dakle, određivanje vrijednosti funkcija f( ) i f( ), ne rizikujemo da istom argumentu dodijelimo različite vrijednosti funkcije.

Dakle, odredili smo vrijednosti funkcija f( ) i f( ) na nizove oblika (6) na takav način da ove funkcije i dalje zadovoljavaju uslove (4) (tj. one su tačkasta Bayes-Nashova ravnoteža) i, štaviše, f(T) =%. Tvrdnja 2. K). 1 je dokazano.

Dakle, gore je uveden pojam Bayes-Nash-ove ravnoteže. Dokazano je da ako su ispunjeni dodatni uslovi (5), svako dopušteno djelovanje agenta sa strukturom svijesti o beskonačnoj dubini je ravnotežno. (Sva razmatranja su sprovedena za igru sa dva učesnika, međutim, može se pretpostaviti da se dobijeni rezultat može generalizovati na slučaj igre sa proizvoljnim brojem učesnika.) Ova okolnost, očigledno, ukazuje na necelishodnost razmatranja strukture beskonačne dubine kako u smislu informacijske ravnoteže, tako iu smislu Bayes-Nash ravnoteže.

Općenitije, može se primijetiti da je dokazana tvrdnja argument (a ne jedini, vidi, na primjer, odjeljke 2.6 i 3.2) u korist neizbježnog ograničenja ranga refleksije informacija subjekata odlučivanja.

Možete napisati recenziju knjige i podijeliti svoja iskustva. Druge čitaoce će uvijek zanimati vaše mišljenje o knjigama koje ste "pročitali. Bez obzira da li vam se knjiga svidjela ili ne, ako date svoja iskrena i detaljna razmišljanja, ljudi će pronaći nove knjige koje im odgovaraju.

Ruska akademija nauka V.A. Trapeznikova D.A. NOVIKOV, A.G. CHKHARTISHVILI REFLEKTIVNE IGRE SINTEG Moskva - 2003 UDK 519 BBC 22.18 N 73 Novikov D.A., Chkhartishvili A.G. Reflexive H 73 igre. M.: SINTEG, 2003. - 149 str. ISBN 5-89638-63-1 Monografija je posvećena raspravi o savremenim pristupima matematičkom modeliranju refleksije. Autori uvode u razmatranje novu klasu teoretskih modela igara – refleksivne igre koje opisuju interakciju subjekata (agenata) koji donose odluke na osnovu hijerarhije ideja o bitnim parametrima, idejama o reprezentacijama itd. Analiza ponašanja fantomskih agenata koji postoje u prikazima drugih stvarnih ili fantomskih agenata i svojstva informacijske strukture koja odražava međusobnu svijest stvarnih i fantomskih agenata omogućava nam da predložimo informacijsku ravnotežu kao rješenje za refleksivnu igru. , što je generalizacija brojnih dobro poznatih koncepata ravnoteže u nekooperativnim igrama. Reflektivne igre omogućavaju: - modeliranje ponašanja refleksivnih subjekata; - proučavati zavisnost isplata agenata od ranga njihove refleksije; - postavljaju i rješavaju probleme refleksivnog upravljanja; - ujednačeno opisuju mnoge pojave vezane za refleksiju: skrivenu kontrolu, kontrolu informacija putem medija, refleksiju u psihologiji, umjetnička djela itd. Knjiga je namijenjena stručnjacima iz oblasti matematičkog modeliranja i upravljanja društveno-ekonomskim sistemima, kao i kao studenti univerziteta i postdiplomci. Recenzenti: doktor tehničkih nauka, prof. V.N. Burkov, doktor tehničkih nauka, prof. A.V. Ščepkin UDK 519 BBC 22.18 N 73 ISBN 5-89638-63-1 Ó D.A. Chkhartishvili, 2 2003 SADRŽAJ UVOD ................................................ ........................................................ .......... 4 POGLAVLJE 1. Informacija u donošenju odluka .......................... ........ 21 1.1. Individualno donošenje odluka: model racionalnog ponašanja.................................................. ........................................................................ ........................................................ ..... 21 1.2. Interaktivno odlučivanje: igre i ravnoteže ................................. 24 1.3. Opšti pristupi opisivanju svijesti ................................................ ..... 31 POGLAVLJE 2. Strateška refleksija.......... ................................ ................. 34 2.1. Strateška refleksija u igrama za dvije osobe .............................................. ... 34 2.2. Refleksija u bimatričnim igrama. ................................................. . ......... 41 2.3. Ograničenje ranga refleksije ................................................. ........................................ 57 POGLAVLJE 3. Informativna refleksija ......... ........................................ 60 3.1. Informativna refleksija u igricama za dvoje .............................................. ... 60 3.2. Informaciona struktura igre ................................................. ........................................ 64 3.3. Bilans informacija ................................................................ ........................ 71 3.4. Grafikon refleksivne igre ................................................. .................................................... 76 3.5. Redovne strukture svijesti.................................................................. ............... 82 3.6. Rang refleksije i informaciona ravnoteža .............................................. ... 91 3.7. Reflektirajuća kontrola ................................................................ ......................................... 102 POGLAVLJE 4. Primijenjeni modeli refleksivnih igara .................................... 102 ................. 106 4.1 . Skrivena kontrola ................................................................ ................................................................ .. 106 4.2. Upravljanje masovnim medijima i informacijama ................................................. ........................ 117 4.3. Refleksija u psihologiji ................................................................. ........................................ 121 4.3.1. Psihologija šahovskog stvaralaštva........................................................ 121 4.3 .2. Transakciona analiza ................................................................ .................................... 124 4.3.3. Johari prozor ................................................ .................................................... 126 4.3.4. Model etičkog izbora ................................................. ................................... 128 4.4. Refleksija u umjetničkim djelima.................................................................. .. 129 ZAKLJUČAK..................................................... ........................................................ 137 LITERATURA .. ........................................................ ........................................................ ........ 142 3 - Minovci se slobodno vesele, ovo je njihova radost! - Ti nisi riba, kako znaš šta je njena radost? "Ti nisi ja, kako ti znaš šta ja znam, a šta ne znam?" Iz taoističke parabole - Poenta je, naravno, poštovani nadbiskupe, da verujete u ono u šta verujete jer ste tako vaspitani. - Možda je tako. Ali ostaje činjenica da i vi vjerujete da ja vjerujem u ono što vjerujem, jer sam tako vaspitan, iz razloga što ste vi tako vaspitani. Iz knjige "Socijalna psihologija" D. Myersa bitni parametri, predstave o predstavama itd. Refleksija. Jedno od temeljnih svojstava ljudske egzistencije je da, uz prirodnu („objektivnu“) stvarnost, postoji i njen odraz u svijesti. Istovremeno, između prirodne stvarnosti i njene slike u umu (tu ćemo sliku smatrati dijelom posebne – refleksivne stvarnosti) postoji neizbježan jaz, neusklađenost. Svrsishodno proučavanje ovog fenomena tradicionalno se vezuje za termin „refleksija“, koji je u Filozofskom rečniku definisan na sledeći način: „REFLEKSIJA (lat. reflexio – okretanje unazad). Termin koji označava refleksiju, kao i proučavanje kognitivnog čina. Termin "refleksija" uveo je J. Locke; u raznim filozofskim sistemima (J. Locke, G. Leibniz, D. Hume, G. Hegel i dr.) imao je drugačiji sadržaj. Sistematski opis refleksije sa stanovišta psihologije započeo je 60-ih godina XX vijeka (škola 4 V.A. Lefebvrea). Osim toga, treba napomenuti da postoji razumijevanje refleksije u drugačijem značenju vezanom za refleks - "reakcija tijela na ekscitaciju receptora". Ovaj rad koristi prvu (filozofsku) definiciju refleksije. Da bismo razjasnili razumijevanje suštine refleksije, prvo razmotrimo situaciju s jednom temom. On ima ideje o prirodnoj stvarnosti, ali može biti i svjestan (reflektirati, reflektirati) te ideje, kao i biti svjestan svijesti o tim idejama, itd. Tako nastaje reflektivna stvarnost. Refleksija subjekta o njegovim vlastitim idejama o stvarnosti, principima njegovog djelovanja itd. naziva se autorefleksija ili refleksija prve vrste. Treba napomenuti da se u većini humanitarnih studija radi, prije svega, o autorefleksiji, koja se u filozofiji podrazumijeva kao proces razmišljanja pojedinca o onome što se dešava u njegovom umu. Refleksija druge vrste odvija se u pogledu ideja o stvarnosti, principa odlučivanja, autorefleksije itd. drugim predmetima. Navedimo primjere refleksije druge vrste, ilustrirajući da se u mnogim slučajevima ispravni vlastiti zaključci mogu donijeti samo ako zauzmemo stav drugih subjekata i analiziramo njihovo moguće rezoniranje. Prvi primjer je klasična igra prljavih lica, koja se ponekad naziva problemom mudraca i šešira ili problemom muževa i nevjernih žena. Mi to opisujemo na sljedeći način. „Zamislimo da su Bob i njegova nećakinja Alis u kupeu viktorijanske kočije. Svačija lica su zbrkana. Međutim, niko ne crveni od srama, iako bi svaki putnik iz Viktorije pocrveneo znajući da ga druga osoba vidi prljavog. Iz ovoga zaključujemo da niko od putnika ne zna da mu je lice prljavo, iako svi vide prljavo lice njegovog saputnika. U to vrijeme, kondukter gleda u kupe i javlja da se u kupeu nalazi čovjek prljavog lica. Nakon toga, Alice je pocrvenjela. Shvatila je da joj je lice prljavo. Ali zašto je ovo shvatila? Nije li joj Vodič rekao ono što je već znala? 5 Pratimo lanac Alisinog rezonovanja. Alice: Pretpostavimo da mi je lice čisto. Tada bi Bob, znajući da je jedan od nas prljav, trebao zaključiti da je prljav i pocrvenjeti. Ako on ne pocrveni, onda je moja premisa o mom čistom licu lažna, moje lice je prljavo i trebalo bi da pocrvenim. Dirigent je dodao informaciji poznatim Alice podatke o Bobovom znanju. Do tada nije znala da Bob zna da je jedan od njih prljav. Ukratko, kondukterova poruka je saznanje da se u kupeu nalazi čovjek prljavog lica pretvorila u opšte znanje. Drugi primjer iz udžbenika je problem koordiniranog napada; postoje bliski problemi oko optimalnog protokola za razmjenu informacija - Electronic Mail Game, itd. (pogledajte recenzije u ). Situacija je sljedeća. Dvije divizije smještene su na vrhovima dva brda, a neprijatelj je smješten u dolini. Možete pobijediti samo ako obje divizije napadnu neprijatelja u isto vrijeme. General - komandant prve divizije - šalje generalu - komandantu druge divizije - glasnika sa porukom: "Napadamo u zoru." Budući da neprijatelj može presresti glasnika, prvi general mora čekati poruku od drugog generala da je prva poruka primljena. Ali pošto drugu poruku može presresti i neprijatelj, drugi general treba da dobije potvrdu od prvog generala da je primio potvrdu. I tako u nedogled. Zadatak je utvrditi nakon kojeg broja poruka (potvrda) generalima ima smisla da napadnu neprijatelja. Zaključak je da je u opisanim uslovima koordinirani napad nemoguć, a izlaz je korištenje vjerojatnosnih modela. Treći klasični problem je "problem dva brokera" (vidi i spekulativne modele u ). Pretpostavimo da dva berzanska brokera imaju svoje ekspertne sisteme koji se koriste za podršku donošenju odluka. Dešava se da administrator mreže nezakonito kopira oba ekspertska sistema i proda ekspertski sistem svog protivnika svakom brokeru. Nakon toga, administrator pokušava svakom od njih prodati sljedeću informaciju - "Vaš protivnik ima vaš stručni sistem." Tada administrator pokušava 6 prodati informaciju - "Vaš protivnik zna da imate njegov ekspertski sistem", i tako dalje. Postavlja se pitanje kako brokeri treba da koriste informacije koje dobiju od administratora i koje informacije su relevantne u kojoj iteraciji? Nakon što smo završili razmatranje primjera refleksije druge vrste, razmotrit ćemo u kojim situacijama je refleksija neophodna. Ako je jedini refleksivni subjekt ekonomski subjekt koji nastoji maksimizirati svoju ciljnu funkciju odabirom jedne od etički prihvatljivih radnji, tada prirodna stvarnost ulazi u ciljnu funkciju kao određeni parametar, a rezultati refleksije (predstave o reprezentacijama itd. ) nisu argumenti ciljne funkcije. Tada možemo reći da autorefleksija "nije potrebna", jer ne mijenja akciju koju izabere agent. Imajte na umu da se ovisnost radnji subjekta o refleksiji može dogoditi u situaciji kada su radnje etički nejednake, odnosno, uz utilitarni aspekt, postoji i deontološki (etički) - vidi. Međutim, ekonomske odluke su obično etički neutralne, pa razmotrimo interakciju nekoliko aktera. Ako postoji više subjekata (situacija odlučivanja je interaktivna), onda ciljna funkcija svakog subjekta uključuje radnje drugih subjekata, odnosno te radnje su dio prirodne stvarnosti (iako su same, naravno, uslovljene refleksivna stvarnost). Istovremeno, refleksija (i, posljedično, proučavanje reflektivne stvarnosti) postaje neophodna. Razmotrimo glavne pristupe matematičkom modeliranju efekata refleksije. Teorija igara. Formalni (matematički) modeli ljudskog ponašanja stvaraju se i proučavaju više od stoljeće i po (vidi pregled u ) i sve se više koriste kako u teoriji menadžmenta, ekonomiji, psihologiji, sociologiji itd., tako i u rješavanju specifičnih primijenjenih probleme. Najintenzivniji razvoj uočen je od 40-ih godina XX vijeka - od trenutka kada se pojavila teorija igara, koja se obično datira u 1944. (prvo izdanje knjige Johna von Neumanna i Oscara Morgensterna "Teorija igara i ekonomsko ponašanje" ). 7 Pod igrom u ovom radu shvatićemo interakciju strana čiji se interesi ne poklapaju (napomenimo da je moguće i drugo shvatanje igre – kao „vrste neproduktivne aktivnosti čiji motiv ne leži u njenim rezultatima, već u samom procesu" - vidi i , gdje se pojam igre tumači mnogo šire). Teorija igara je grana primijenjene matematike koja proučava modele odlučivanja u uvjetima nepodudarnosti interesa strana (igrača), kada svaka strana nastoji utjecati na razvoj situacije u svojim interesima. Nadalje, izraz "agent" se koristi za označavanje donosioca odluke (igrača). U ovom radu razmatramo nekooperativne statičke igre u normalnom obliku, odnosno igre u kojima agenti biraju svoje akcije jednom, istovremeno i nezavisno. Dakle, glavni zadatak teorije igara je da opiše interakciju nekoliko agenata čiji se interesi ne poklapaju, a rezultati aktivnosti (pobjeda, korisnost, itd.) svakog zavise u opštem slučaju o akcijama svih. Rezultat takvog opisa je prognoza razumnog ishoda igre - takozvanog rješenja igre (ravnoteže). Opis igre sastoji se u postavljanju sljedećih parametara: - set agenata; - preferencije agenata (ovisnosti isplata od akcija): pretpostavlja se (a to odražava svrsishodnost ponašanja) da je svaki agent zainteresiran da maksimizira svoju isplatu; - skupovi dozvoljenih radnji agenata; - svijest agenata (informacije koje posjeduju u trenutku donošenja odluka o odabranim radnjama); - redosled funkcionisanja (redosled poteza - redosled izbora radnji). Relativno govoreći, skup agenata određuje ko učestvuje u igri. Preference odražavaju ono što agenti žele, skupove dozvoljenih radnji šta mogu učiniti, svijest odražava ono što znaju i redoslijed rada kada biraju akcije. 8 Navedeni parametri definišu igru, ali nisu dovoljni da se predvidi njen ishod – rešenje igre (ili ravnoteža igre), odnosno skup akcija agenata koji su racionalni i stabilni iz jedne tačke od pogled ili drugi. Do danas, u teoriji igara ne postoji univerzalni koncept ravnoteže - uzimajući određene pretpostavke o principima donošenja odluka od strane agenata, možete dobiti različita rješenja. Stoga je glavni zadatak svakog teoretskog istraživanja igara (uključujući i ovaj rad) izgradnja ravnoteže. Budući da se refleksivne igre definiraju kao takva interaktivna interakcija agenata u kojoj oni donose odluke na osnovu hijerarhije svojih reprezentacija, svijest agenata je od suštinskog značaja. Stoga ćemo se detaljnije zadržati na njegovoj kvalitativnoj raspravi. Uloga svijesti. Opšte znanje. U teoriji igara, filozofiji, psihologiji, distribuiranim sistemima i drugim poljima nauke (vidi pregled u ), ne samo da su vjerovanja (vjerovanja) agenata o bitnim parametrima bitna, već i njihova uvjerenja o vjerovanjima drugih agenata, itd. Skup ovih reprezentacija naziva se hijerarhija vjerovanja i modeliran je u ovom radu stablom informacijske strukture refleksivne igre (vidi Odjeljak 3.2). Drugim riječima, u situacijama interaktivnog odlučivanja (po modelu teorije igara), svaki agent mora predvidjeti ponašanje protivnika prije nego što odabere svoju akciju. Da bi to učinio, mora imati određene ideje o viziji igre od strane protivnika. Ali protivnici moraju učiniti isto, pa neizvjesnost oko toga koja će se utakmica igrati stvara beskrajnu hijerarhiju reprezentacija učesnika u igri. Dajemo primjer hijerarhije pogleda. Pretpostavimo da postoje dva agenta - A i B. Svaki od njih može imati svoje nerefleksivne ideje o neodređenom parametru q, koji ćemo dalje zvati stanje prirode (stanje prirode, stanje svijeta). Ove reprezentacije označavamo sa qA i qB, respektivno. Ali svaki od agenata, u okviru procesa refleksije prvog ranga, može razmišljati o idejama protivnika. Ove reprezentacije (reprezentacije drugog reda) će biti označene sa qAB i qBA, gdje su qAB reprezentacije agenta A agenta B, 9 qBA su reprezentacije agenta B agenta A drugog ranga) može razmišljati o tome šta je protivnik ideje o njegovim idejama su. Ovako se generišu reprezentacije trećeg reda, qABA i qBAB. Proces generisanja reprezentacija viših redova može se nastaviti neograničeno (nema logičkih ograničenja za povećanje ranga refleksije). Ukupnost svih reprezentacija - qA, qB, qAB, qBA, qABA, qBAB, itd. - formira hijerarhiju pogleda. Poseban slučaj svjesnosti je kada sve reprezentacije, predstave o reprezentacijama itd. poklapaju se u beskonačnost - opšte je poznato. Tačnije, termin „opštepoznato“ se uvodi da označi činjenicu koja ispunjava sledeće uslove: 1) poznata je svim agentima; 2) svi agenti znaju 1; 3) svi agenti znaju 2 i tako dalje. ad infinitum Formalni model opšteg znanja predložen je i razvijen u mnogim radovima - vidi . Modeli svesnosti agenata – hijerarhija reprezentacija i opšte znanje – u teoriji igara su, zapravo, u potpunosti posvećeni ovom radu, pa ćemo navesti primere koji ilustruju ulogu opšteg znanja u drugim oblastima nauke – filozofiji, psihologiji itd. (vidi i recenziju). Sa filozofske tačke gledišta, opšte znanje je analizirano u proučavanju konvencija. Razmotrite sljedeći primjer. U Pravilima puta piše da se svaki učesnik u saobraćaju mora pridržavati ovih pravila, a takođe ima pravo da očekuje da ih se pridržavaju i ostali učesnici u saobraćaju. Ali i drugi učesnici u saobraćaju moraju da budu sigurni da drugi poštuju pravila itd. do beskonačnosti. Stoga bi dogovor o "poštivanju saobraćajnih pravila" trebao biti opštepoznat. U psihologiji postoji koncept diskursa – „(od latinskog discursus – rasuđivanje, argument) – verbalno mišljenje osobe posredovano prošlim iskustvom; djeluje kao proces povezanog logičkog 10 zaključivanja, u kojem je svaka naredna misao uvjetovana prethodnom. Uloga općeg znanja u razumijevanju diskursa ilustrovana je u sljedećem primjeru. Dvoje ljudi napušta bioskop. Jedan pita drugog: "Kako ti se sviđa film?". Da bi druga osoba razumjela pitanje, mora shvatiti da ga pitaju o filmu koji su upravo zajedno gledali. Osim toga, on mora shvatiti da prvi to razumije. Ispitivač, zauzvrat, mora biti siguran da će drugi shvatiti da je pitanje o filmu koji su gledali, itd. Odnosno, za adekvatnu interakciju (komunikaciju) "film" mora biti opštepoznat (ljudi moraju postići dogovor o upotrebi jezika). Međusobna svijest o agentima je također neophodna u distribuiranim računarskim sistemima, u umjetnoj inteligenciji i drugim oblastima. U teoriji igara, po pravilu, pretpostavlja se da su svi 1 parametri igre opšte poznati, odnosno da svaki agent poznaje sve parametre igre, kao i da je poznat svim agentima itd. do beskonačnosti. Takva pretpostavka odgovara objektivnom opisu igre i omogućava korištenje koncepta Nashove ravnoteže2 kao predvidljivog ishoda nekooperativne igre (tj. igre u kojoj su pregovori između agenata nemogući kako bi se stvorile koalicije). , razmjenu informacija, zajedničke akcije, preraspodjelu isplata itd. ). Dakle, opštepoznata pretpostavka sugeriše da svi agenti znaju koju igru igraju, a njihove ideje o igri su iste. Umjesto akcije agenta, možemo razmotriti nešto složenije - njegovu strategiju, odnosno mapiranje informacija dostupnih agentu u skup njegovih dozvoljenih radnji. Primjeri su: strategije u igri sa više faza, mješovite strategije, strategije u Hauardovim metaigrama (vidi i informacije) nijedna od njih nema koristi od jednostranog (tj. pod uslovom da drugi agenti odaberu odgovarajuće komponente ravnoteže) odstupanja iz ravnoteže - vidi tačnu definiciju ispod. Međutim, čak i u ovim slučajevima pravila igre su opšte poznata. Konačno, možemo smatrati da je igra izabrana nasumično prema nekoj distribuciji, što je opšte poznato - takozvane Bayesove igre. U opštem slučaju, svaki od agenata može imati svoje ideje o parametrima igre, od kojih svaki odgovara nekom subjektivnom opisu igre. Istovremeno, ispada da agenti učestvuju u igri, ali objektivno ne znaju koji, ili predstavljaju igru koja se igra na različite načine – njena pravila, ciljeve, uloge i svijest protivnika itd. Danas u teoriji igara ne postoje univerzalni pristupi konstrukciji ravnoteže sa nedovoljnim opštim znanjem. S druge strane, u okviru „refleksivne tradicije“ humanističkih nauka, za svakog agenta, svijet oko njega sadrži (uključuje) druge agente, a ideje o drugim agentima se odražavaju u procesu refleksije (razlike u idejama mogu posebno zbog nejednake svijesti). Međutim, do sada nisu dobijeni konstruktivni formalni rezultati u ovoj oblasti. Stoga postoji potreba za razvojem i proučavanjem matematičkih modela igara u kojima svijest agenata nije opštepoznata i agenti donose odluke na osnovu hijerarhije svojih reprezentacija. Ovu klasu igara nazivamo refleksivnim igrama (formalna definicija je data u odeljku 3.2 ovog rada). Treba priznati da je termin "refleksivne igre" uveo V.A. Lefebvre 1965. godine u . Međutim, u ovom radu, kao i u radovima istog autora, uglavnom se vodi kvalitativna rasprava o efektima refleksije u interakciji subjekata, a nije predložen opšti koncept rješenja za ovu klasu igara. Ista primjedba vrijedi i za , u kojem je razmatran niz konkretnih slučajeva svijesti učesnika u igri. Stoga je relevantno proučavanje refleksivnih igara i izgradnja jedinstvenog koncepta ravnoteže za njih, što motivira ovu studiju. 12 Prije nego što pređemo na prezentaciju glavnog sadržaja rada, razmotrićemo na kvalitativnom nivou glavne pristupe koji se koriste u nastavku. Osnovni pristupi i struktura rada. Prvo poglavlje "Informacije u donošenju odluka", koje je uglavnom pregledne i uvodne prirode, daje modele za individualno i interaktivno donošenje odluka, analizira informacije potrebne za implementaciju određenih poznatih ravnotežnih koncepata i razmatra poznate modele opšteg znanja i hijerarhije pogleda. . Kao što je gore definirano, refleksivna igra je ona u kojoj svijest agenata nije podijeljeno znanje3 i agenti donose odluke na osnovu hijerarhije svojih reprezentacija. Sa stanovišta teorije igara i modela refleksivnog odlučivanja, preporučljivo je odvojiti stratešku i informatičku refleksiju. Informativna refleksija je proces i rezultat agentovog razmišljanja o tome koje su vrijednosti neizvjesnih parametara, šta njegovi protivnici (drugi agenti) znaju i misle o tim vrijednostima. Istovremeno, sama komponenta "igre" je odsutna, jer agent ne donosi nikakve odluke. Strateška refleksija je proces i rezultat agentovog razmišljanja o tome koje principe odlučivanja njegovi protivnici (drugi agenti) koriste u okviru svijesti koju im on pripisuje kao rezultat refleksije informacija. Dakle, informaciona refleksija se obično povezuje sa nedovoljnom međusobnom svešću, a njen rezultat se koristi u donošenju odluka (uključujući i strateško promišljanje). Strateška refleksija se odvija i u slučaju potpune svijesti, predviđajući odluku agenta o odabranoj akciji. Drugim riječima, informatička i strateška refleksija se mogu proučavati samostalno, ali u uslovima nepotpune i nedovoljne svijesti, oba se odvijaju. 3 Ako je u razmatranom modelu svijest općepoznata, onda se svi rezultati proučavanja refleksivnih igara prenose na odgovarajuće klasične rezultate teorije igara - vidi dolje. 13 O strateškoj refleksiji se govori u drugom poglavlju ovog rada. Ispada da ako pretpostavimo da agent, modelirajući ponašanje svojih protivnika, njima i sebi pripisuje određene rangove refleksije, onda se originalna igra pretvara u novu igru u kojoj je agentova strategija odabir ranga refleksije. Ako razmotrimo proces refleksije u novoj igri, dobijamo novu igru, itd. Istovremeno, čak i ako je u originalnoj igri skup mogućih akcija bio konačan, onda je u novoj igri skup mogućih akcija - broj različitih rangova refleksije - beskonačan. Shodno tome, glavni zadatak koji treba riješiti u proučavanju strateške refleksije je određivanje maksimalnog svrsishodnog ranga refleksije. Odgovor na ovo pitanje dobijen je u drugom poglavlju za bimatrične igre (odjeljak 2.2) i modele koji uzimaju u obzir ograničenja sposobnosti osobe da obradi informacije (odjeljak 2.3). Navedimo primjer strateškog promišljanja - "Kazna" (vidi i primjere "Sakrivanje" i "Rušenje na škrtu" u odjeljku 2.2). Agenti su šuter i golman. Pretpostavimo radi jednostavnosti da igrač ima dvije akcije - "da pogodi lijevi ugao gola" i "da pogodi desni ugao gola". Golman ima i dve akcije - "uhvati loptu u levom uglu" i "uhvati loptu u desnom uglu". Ako golman pogodi koji korner igrač pogađa, onda hvata loptu. Modelirajmo rezonovanje agenata. Neka golman zna da ovaj igrač obično šutira u desni ugao. Zbog toga treba da uhvati loptu u desnom uglu. Ali, ako golman zna da igrač zna da golman zna kako se igrač obično ponaša, onda bi golman trebao modelirati igračevo rezonovanje. Možda razmišlja ovako: „Igrač zna da ja znam njegovu uobičajenu taktiku. Tako da očekuje da uhvatim loptu u desnom uglu i da pogodim levi ugao. U ovom slučaju, moram uhvatiti loptu u lijevom uglu. Ako igrač ima dovoljnu dubinu refleksije, tada može pogoditi golmanovo rezonovanje i pokušati ga nadmudriti udarcem u desni ugao. Isti lanac razmišljanja može izvesti i golman i na osnovu toga uhvatiti loptu u desnom uglu. I igrač i golman mogu da povećaju dubinu refleksije do beskonačnosti razmišljajući jedan o drugom, a nijedan od njih nema racionalnog razloga da se zaustavi na nekom završnom koraku. Stoga je u okviru modeliranja međusobnog zaključivanja nemoguće a priori odrediti ishod igre koja se razmatra. Sama igra, u kojoj svaki od agenata ima dvije moguće akcije, može se zamijeniti drugom igrom u kojoj agenti biraju rangove refleksije koji su dodijeljeni protivniku. Ali čak ni u ovoj igri nema razumnog rješenja, jer svaki agent može modelirati protivničko ponašanje uzimajući u obzir "dvostruko refleksivnu" igru, itd. do beskonačnosti. Jedini način da se pomogne agentima u situaciji koja se razmatra jeste da se ograniči dubina njihove refleksije, uz napomenu da počevši od drugog ranga refleksije (zbog konačnosti početnog skupa mogućih radnji), situacija počinje da se ponavlja – da se i na nuli i na drugom (i, generalno, na bilo kom parnom) nivou refleksije, igrač će pogoditi u desni ugao. Stoga, ostaje na golmanu da pogodi paritet nivoa refleksije igrača. Maksimalni rang refleksije koji agent treba da ima da bi pokrio čitav niz ishoda igre (gubeći iz vida neke od protivničkih strategija, agent rizikuje da smanji svoju isplatu), nazvaćemo maksimalnim svrsishodnim rangom refleksije. Pokazalo se da je u mnogim slučajevima ovaj rang konačan – odgovarajući formalni rezultati dati su u odjeljcima 2.2 i 3.6). U primjeru "Kazna", maksimalni svrsishodni rang refleksije agenata je dva. Ako golman nema informaciju o tome gdje napadač obično pogađa, akcije potonjeg su simetrične (lijevi i desni ugao su „ekvivalentni“). Međutim, ostaju prilike za umjetno uvođenje asimetrije kako biste je pokušali iskoristiti za svoje potrebe. Na primjer, golman se može kretati prema jednom od uglova, kao da poziva napadača da udari drugi (i juri u taj „dalji“ ugao). Složenija strategija je sljedeća. Prilazi mu igrač golmanove ekipe i pokazuje gde će napadač da udari, a on to čini tako da napadač to vidi (nakon čega, u trenutku udarca, golman hvata loptu koja nije u ugao koji mu je saigrač prkosno pokazao, ali u suprotnom) . Imajte na umu da su obje opisane tehnike preuzete "iz života" i pokazale su se uspješnim. Prvi se dogodio u međunarodnoj utakmici reprezentacije SSSR-a, drugi - u finalu Kupa SSSR-a u fudbalu u izvođenju penala. 15 Treće poglavlje je posvećeno proučavanju formalnih modela refleksije informacija. Budući da je ključni faktor u refleksivnim igrama svijest o agentima - hijerarhija reprezentacija, onda se za njen formalni opis uvodi koncept informacijske strukture - stablo (u opštem slučaju beskonačno), čiji vrhovi odgovaraju informacije (reprezentacije) agenata o bitnim parametrima, reprezentacije drugih agenata, itd. .d. (pogledajte gornji primjer hijerarhije pogleda). Koncept strukture svesti (informacione strukture) omogućava nam da damo formalnu definiciju nekih intuitivno jasnih pojmova, kao što su: adekvatna svest jednog agenta o drugom, međusobna svest, jednaka svest, itd. Jedan od ključnih koncepata koji se koristi u ovaj rad za analizu refleksivnih igara je koncept fantomskog agenta. Hajde da o tome razgovaramo na kvalitativnom nivou (odlažući rigoroznu matematičku definiciju do odeljka 3.2). Neka dva agenta, A i B, komuniciraju u nekoj situaciji. Sasvim je prirodno da u glavama svakog od njih postoji određena slika o drugom: A ima sliku B (nazovimo je AB), a B ima sliku A (nazovimo je BA). Ove slike se mogu poklapati sa stvarnošću, a mogu se razlikovati od nje. Drugim riječima, agent, na primjer, A, može ili ne mora imati adekvatnu predstavu o B (ova činjenica se može napisati kao identitet AB = B). Ovdje se odmah postavlja pitanje - može li se u principu ispuniti identitet AB = B, jer je B realan agent, a AB samo njegova slika? Ne ulazeći u raspravu o ovom suštinski filozofskom pitanju, napominjemo sljedeće dvije okolnosti. Prvo, ne govorimo o potpunom razumijevanju ličnosti u cjelini, već o njenom modeliranju u konkretnoj situaciji. Na običnom, svakodnevnom nivou ljudske komunikacije, stalno se suočavamo sa situacijama kako adekvatne tako i neadekvatne percepcije jedne osobe od strane druge. Drugo, u okviru formalnog (teorijskog) modeliranja ljudskog ponašanja, agent – učesnik u situaciji – opisuje se relativno malim skupom karakteristika. A ove karakteristike mogu biti potpuno poznate drugom agentu u istoj mjeri u kojoj su poznate istraživaču. 16 Razmotrimo detaljnije slučaj kada postoji razlika između B i AB (ova razlika može proizaći, formalno govoreći, iz nepotpunosti A-ovih informacija o B, ili iz povjerenja u lažne informacije). Tada A, kada odlučuje o bilo kojoj svojoj radnji, ima na umu ne B, već sliku o njemu koju ima, odnosno AB. Možemo reći da subjektivno A stupa u interakciju sa AB. Stoga se AB može nazvati fantomskim agentom. Ona ne postoji u stvarnosti, ali je prisutna u umu stvarnog agenta A i, shodno tome, utiče na njegove postupke, odnosno stvarnost. Uzmimo jednostavan primjer. Neka A vjeruje da su on i B prijatelji, a B je, znajući to, neprijatelj A (ova situacija se može opisati riječju "izdaja"). Tada je, očigledno, u situaciji fantomski agent AB, koji se može opisati na sljedeći način: “B, koji je prijatelj A”; u stvarnosti, takav entitet ne postoji. Imajte na umu da je u ovom slučaju B adekvatno informiran o A, odnosno BA = A. Dakle, pored stvarnih agenata koji stvarno učestvuju u igri, predlaže se uzeti u obzir i fantomske agente, odnosno agente koji postoje u umovima. stvarnih i drugih fantomskih agenata. Stvarni i fantomski agenti, u okviru svoje refleksije, daju fantomskim agentima određenu svijest, koja se ogleda u strukturi informacija. U igri može biti beskonačan broj stvarnih i fantomskih agenata, što znači potencijalnu beskonačnost implementacije činova refleksivnog odraza (beskonačna dubina stabla strukture svijesti). Zaista, čak iu najjednostavnijoj situaciji, beskonačno širenje rezonovanja u obliku „znam...“, „znam da znaš...“, „znam da znaš da ja znam...“, „ Znam da ti znaš da ja znam da znaš...” itd. Međutim, u praksi se takva „loša beskonačnost” ne dešava, jer se od određenog trenutka reprezentacije „stabilizuju”, a rang se povećava. refleksije ne daje ništa novo. Dakle, u stvarnim situacijama, struktura svijesti ima konačnu složenost: odgovarajuće stablo ima konačan broj parno različitih podstabala - 17 ev. Drugim riječima, igra uključuje konačan broj stvarnih i fantomskih agenata4. Uvođenje koncepta fantomskih agenata omogućava da se refleksivna igra definiše kao igra stvarnih i fantomskih agenata, kao i da se definiše informaciona ravnoteža kao generalizacija Nashovog ekvilibrijuma za slučaj refleksivne igre, u kojoj pretpostavlja se da svaki agent (stvarni i fantomski) pri izračunavanju svoje subjektivne ravnoteže (ravnoteže u igri koju igra sa svoje tačke gledišta) koristi svoju postojeću hijerarhiju ideja o objektivnoj i refleksivnoj stvarnosti. Zgodan alat za proučavanje informacijske ravnoteže je graf refleksivne igre u kojem vrhovi odgovaraju stvarnim i fantomskim agentima, a svaki vrh agenta uključuje lukove (njihov broj je za jedan manji od broja stvarnih agenata) koji dolaze iz vrhova agenata, na čije akcije isplata zavisi od subjektivne ravnoteže ovog agenta. Graf refleksivne igre može se konstruirati bez konkretizacije ciljnih funkcija agenata. Istovremeno, on odražava, ako ne kvantitativni odnos interesa, onda kvalitativni odnos svesti o reflektivnim agensima, i predstavlja pogodno i ekspresivno sredstvo za opisivanje efekata refleksije (videti odeljak 3.4). Za primjer dva gore opisana agenta, graf refleksivne igre ima oblik: B ¬ A « AB - pravi agent B (izdajnik) je adekvatno informisan o agentu A, koji stupa u interakciju sa fantomskim agentom AB (B, koji je A-ov prijatelj). Navedimo još jedan primjer grafa koji odražava refleksivnu interakciju (iako formalno nije graf refleksivne igre u smislu definicije uvedene gore). Na koricama ove knjige nalazi se slika E. Burne-Jones "Death's Head", napisana 1886-1887. zasnovan na mitu o Perseju i Andromedi. U situaciju su uključena tri stvarna agenta: Persej (označimo ga slovom P), Andromeda (A) i gorgona Meduza (M). Osim toga, 4 U ograničavajućem slučaju - kada je opšte poznato - fantomski agent prvog nivoa se poklapa sa svojim stvarnim prototipom i stablo ima jediničnu dubinu (tačnije, sva druga podstabla ponavljaju stabla višeg nivoa). 18, postoje sljedeći "fantomski" agensi: odraz Perseja (OP), odraz Andromede (OA) i odraz Meduze (OM). Grafikon je prikazan na slici 1. M P A OP OA OM Fig. 1. Grafikon slike E. Burne-Jonesa "Smrtonosna glava" (vidi naslovnicu) 19 Svijest o stvarnim agentima u primjeru koji se razmatra je sljedeća: Persej vidi Andromedu; Andromeda ne vidi Perseja, ali vidi njegov odraz, svoj vlastiti odraz i odraz Gorgone Meduze; odraz Perseja vidi odraz Andromede; Andromedin odraz vidi sve stvarne agente. Srećom, niko od pravih agenata ne vidi samu gorgonu Meduzu. Uvođenje informacijske strukture, informatičke ravnoteže i grafa refleksivne igre, prvo, omogućava da se sa jedinstvene metodološke pozicije i uz pomoć jedinstvene metode opisuju i analiziraju različite situacije kolektivnog odlučivanja agenata različite svijesti. matematički aparat, proučavanje uticaja rangova refleksije na isplate agenata, proučavanje uslova postojanja i izvodljivosti informacionih ravnoteža, itd. U nastavku su dati brojni primjeri primijenjenih modela. Drugo, predloženi model refleksivne igre omogućava proučavanje uticaja rangova refleksije (dubine informacione strukture) na isplate agenata. Rezultati dobijeni u odjeljcima 2.2, 3.5 i 3.6 ovog rada pokazuju da je, pod minimalnim pretpostavkama, moguće pokazati da je maksimalni svrsishodni rang refleksije ograničen. Drugim riječima, u mnogim slučajevima neograničeno povećanje ranga refleksije nije svrsishodno sa stanovišta isplativosti agenata. Treće, prisustvo modela refleksivne igre omogućava nam da odredimo uslove za postojanje i svojstva informacione ravnoteže, kao i da konstruktivno i ispravno formulišemo problem refleksivnog upravljanja, koji se sastoji u traženju takve informacijske strukture od strane organ upravljanja da je informaciona ravnoteža ostvarena u njemu najkorisnija sa njegove tačke gledišta. Problem refleksivne kontrole postavljen je i riješen za brojne slučajeve u Odjeljku 3. 7. Teorijski rezultati njegovog rješenja koriste se u nizu primijenjenih modela predstavljenih u četvrtom poglavlju - skrivena kontrola, kontrola informacija putem medija itd. I, konačno, četvrto, jezik refleksivnih igara (informacione strukture, grafovi refleksivna igra itd.) pogodno je za opisivanje efekata refleksije kako u psihologiji (što je ilustrovano na primjeru šahovske partije, transakcione analize, 20 modela etičkog izbora itd.), tako i u umjetničkim djelima – v. četvrto poglavlje ovog rada. Nakon što smo završili kvalitativni pregled sadržaja rada, napominjemo da se može predložiti nekoliko pristupa za upoznavanje sa materijalom ove knjige. Prvi je linearan i sastoji se od uzastopnog čitanja sva četiri poglavlja. Drugi je namenjen čitaocu koji je više zainteresovan za formalne modele i sastoji se od čitanja drugog i trećeg poglavlja i površnog upoznavanja sa primerima iz četvrtog poglavlja. Treći je namenjen čitaocu koji ne želi da ulazi u matematičke suptilnosti, a sastoji se od čitanja uvoda, četvrtog poglavlja i zaključka. POGLAVLJE 1. INFORMACIJE U ODLUČIVANJU U prvom poglavlju ovog rada predstavljamo model individualnog odlučivanja (odjeljak 1.1), razmatramo glavne koncepte rješavanja nekooperativnih igara, razmatramo pretpostavke koje se koriste u ovim konceptima o svijesti i međusobne svijesti agenata (odjeljak 1.2), te analizirati svijest o poznatim modelima i opće znanje (odjeljak 1.3). 1.1. INDIVIDUALNO ODLUČIVANJE: MODEL RACIONALNOG PONAŠANJA Opišimo, slijedeći, model donošenja odluka od strane jednog agenta. Neka agent može izabrati neku akciju x iz skupa X dozvoljenih akcija. Kao rezultat odabira akcije x n X, agent prima isplatu f(x), gdje je f: X ® V1 realnovrijedna ciljna funkcija koja odražava preferencije agenta. Prihvatimo hipotezu racionalnog ponašanja, a to je da agent, uzimajući u obzir sve informacije koje su mu dostupne, bira radnje koje su najpoželjnije u smislu vrijednosti njegove objektivne funkcije (ova hipoteza nije jedina moguća - vidi, na primjer, koncept ograničene racionalnosti). U skladu sa hipotezom racionalnog ponašanja, agent bira alternativu iz skupa "najboljih" alternativa. U slučaju koji se razmatra, ovaj skup je skup alternativa na kojima se postiže maksimum funkcije cilja. Stoga je izbor akcije od strane agenta određen pravilom individualnog racionalnog izbora P(f, X) n X, koje izdvaja skup akcija koje su najpoželjnije sa stanovišta agenta5: P( f, X) = Arg max f(x). xO X Zakomplikujmo model, naime, pretpostavimo da je isplativost agenta određena ne samo njegovim vlastitim postupcima, već i vrijednošću neodređenog parametra q n W, stanje prirode. To jest, kao rezultat odabira akcije x n X i ostvarivanja prirodnog stanja q n W, agent prima isplatu f(q, x), gdje je f: W ´ X ® Â1. Ako agentov dobitak zavisi, pored njegovih radnji, od neodređenog parametra - prirodnog stanja, onda u opštem slučaju ne postoji jedinstveno "najbolja" akcija - kada odlučuje o odabranoj radnji, agent mora "predvidjeti" stanje prirode. Stoga uvodimo hipotezu determinizma, koja se sastoji u tome da agent nastoji eliminirati, uzimajući u obzir sve informacije koje su mu dostupne, postojeću nesigurnost i donositi odluke u uvjetima potpune informacije (drugim riječima, konačni kriterij koji vodi agenta u donošenju odluka ne treba da sadrži nesigurne parametre). Odnosno, agent mora, u skladu sa hipotezom determinizma, eliminisati nesigurnost oko parametara nezavisnih od njega (možda uvođenjem određenih pretpostavki o njihovim vrednostima). U zavisnosti od informacija I koje agent ima o neizvesnim parametrima, postoje: - intervalna nesigurnost (kada je poznat samo skup W mogućih vrednosti neizvesnih parametara); 5 Kada se koriste visoki i niski nivoi, pretpostavlja se da su dostignuti. 22 - vjerovatnoća nesigurnosti (kada je, pored skupa W mogućih vrijednosti neizvjesnih parametara, poznata njihova raspodjela vjerovatnoće p(q)); - nejasna nesigurnost (kada je, pored skupa W mogućih vrijednosti neizvjesnih parametara, poznata funkcija pripadnosti njihovih vrijednosti). U ovom radu razmatramo najjednostavniji – „tačkasti“ slučaj, kada agenti imaju ideje o specifičnom značenju prirodnog stanja. U zaključku se razmatra mogućnost generalizacije dobijenih rezultata na slučaj intervalne ili probabilističke nesigurnosti. Uvodimo sljedeću pretpostavku u vezi sa postupcima eliminacije nesigurnosti koje koristi agent: intervalna nesigurnost se eliminiše izračunavanjem maksimalnog garantovanog rezultata (MGR), vjerovatnoća je očekivana vrijednost ciljne funkcije, rasplinuta je skup maksimalnih nedominirane alternative, od ciljne funkcije f(q, x) do ciljne funkcije f(x), koja ne ovisi o neizvjesnim parametrima. U skladu sa uvedenom pretpostavkom, u slučaju intervala) nesigurnost f (x) = min f(q, x), u slučaju vjerovatnoće nesigurnosti f (x) = q nW ò f (x,q) p(q )dq i sl. . W Eliminirajući neizvjesnost, dobijamo deterministički model, odnosno pravilo individualnog racionalnog izbora ima oblik:) P(f, X, I) = Arg max f (x), xn X 6 Uvedene pretpostavke nisu jedine mogućih. Korištenje drugih pretpostavki (na primjer, hipoteza MHR može se zamijeniti hipotezom optimizma, ili hipotezom „ponderirani optimizam-pesimizam“ itd.) dovest će do drugih koncepata rješenja, ali proces njihovog dobivanja će slijediti opće shema implementirana u nastavku. 23 gdje je I informacija koju agent koristi kada eliminira nesigurnost f Þ f . I Do sada smo gledali na individualno donošenje odluka. Razmotrimo sada nesigurnost igre, unutar koje agentove pretpostavke o skupu mogućih vrijednosti okruženja igre (akcije drugih agenata koje su oni odabrali u okviru određenih netočnih principa ponašanja poznatih agentu koji se razmatra) su suštinski. 1.2. INTERAKTIVNO ODLUČIVANJE: IGRE I RAVNOTEŽE Model igre. Da bismo opisali kolektivno ponašanje agenata, nije dovoljno posebno odrediti njihove preferencije i pravila individualnog racionalnog izbora. Kao što je gore navedeno, u slučaju kada sistem ima jednog agenta, hipoteza njegovog racionalnog (individualnog) ponašanja pretpostavlja da se agent ponaša na takav način da izborom akcije maksimizira vrijednost svoje ciljne funkcije. U slučaju kada postoji više agenata, potrebno je voditi računa o njihovom međusobnom uticaju: u ovom slučaju nastaje igra - interakcija u kojoj isplata svakog agenta zavisi kako od njegove akcije, tako i od akcija drugih agenata. . Ako, na osnovu hipoteze racionalnog ponašanja, svaki od agenata nastoji maksimizirati svoju ciljnu funkciju odabirom akcije, onda je jasno da u slučaju više agenata individualno racionalno djelovanje svakog od njih ovisi o radnji. drugih agenata7. Razmotrimo teorijski model interakcije između n agenata. Svaki agent bira akciju xi koja pripada dozvoljenom skupu Xi, i n N = (1, 2, …, n) – skup agenata. Odabir radnji agenata vrši se jednom, istovremeno i nezavisno. 7 U modelima teorijske igre pretpostavlja se da je racionalnost igrača, odnosno slijedeći njihovu hipotezu o racionalnom ponašanju, opšte poznato. Ova pretpostavka je prihvaćena iu ovom radu. 24 Isplata i-tog agenta zavisi od njegove sopstvene akcije xi O Xi, od vektora akcija xi = (x1, x2, …, xi-1, xi+1, …, xn) O Xi= H X j protivnika N\(i ) i iz prirodnog stanja8 q n W, a jnN \ (i ) je opisan realnovrijednom isplatnom funkcijom fi = fi(q, x), gdje je x = (xi, xi) = ( x1, x2, …, xn) n X" = H X j je vektor djelovanja svih jnN agenata. Za fiksnu vrijednost prirodnog stanja, skup G = (N, (Xi)i n N, ( fi(×))i n N) skupa agenata, skupova njihovih dozvoljenih akcija i ciljnih funkcija naziva se igra u normalnom obliku.Rješenje igre (ravnoteža) je skup vektora akcija agenti koji su stabilni u ovom ili onom smislu. Na osnovu hipoteze racionalnog ponašanja, svaki agent će nastojati da izabere najbolje akcije za sebe (u smislu vrijednosti njegove objektivne funkcije) u datoj situaciji. ukupnost okruženja igre xi O Xi i prirodno stanje q O W. napišite kako slijedi (BR označava najbolji odgovor): (1) BRi(q, xi) = Arg max fi(q, xi, xi), i n N. xi n X i iz čega se generiše odgovarajući koncept ravnoteže, da je, određuje u kom smislu bi predviđeni ishod utakmice trebao biti stabilan. Paralelno ćemo razgovarati o svijesti koja je neophodna za uspostavljanje ravnoteže. Ravnoteža u dominantnim strategijama. Ako za nekog agenta skup (1) ne zavisi od situacije, onda on čini skup njegovih dominantnih strategija (skup dominantnih strategija agenata naziva se ravnoteža u dominantnim strategijama - RDS). Ako svaki od agenata ima dominantnu strategiju, onda može samostalno donositi odluke, odnosno birati akcije bez ikakvih informacija i bez ikakvih 8 Prirodno stanje može biti, između ostalog, vektor čije komponente odražavaju individualne karakteristike agenata. 25 pretpostavke o situaciji. Nažalost, RDS ne postoji u svim igrama. Da bi agenti ostvarili ravnotežu u dominantnim strategijama, ako ova druga postoji, dovoljno je da svaki od njih zna samo svoju ciljnu funkciju i dozvoljene skupove X" i W. sve igre: (2) xig Î Arg max min min fi(q , xi, xi), i n N. xi n X i x -i n X -i q nW Ako za barem jednog od agenata skup (1) zavisi od situacije (tj. ne postoji RDS), onda je situacija složenija. Hajde da istražimo relevantne slučajeve. Nash equilibrium. Definirajmo višeznačno preslikavanje (3) BR(q, x) = (BR1(q, x-1); BR2(q, x-2), …, BRn(q, x-n)). Nashova ravnoteža pod prirodnim stanjem q (tačnije, parametarska Nashova ravnoteža) je tačka x*(q) n X" koja zadovoljava sljedeći uvjet: (4) x*(q) n BR(q, x*( q)). Ugrađivanje (4) se takođe može zapisati kao: " i n N, " yi n Xi fi(q, x*(q)) ³ fi(q, yi, x-* i (q)). skup EN(q) svih tačaka oblika (4) može se opisati na sljedeći način: (5) EN(q) = (x n X' | xi n BRi(q, xi), i n N) Za slučaj dva agenata, alternativni ekvivalentan način definisanja skupa EN(q) je njegovo dodeljivanje u obliku skupa parova tačaka (x1* (q), x2* (q)) koji istovremeno zadovoljavaju sledeće uslovne odnose: (6) x1* (q) n BR1(q, BR2(q, BR1(q, ..BR2(q, x2* (q)))...))), (7) x2* (q) n BR2(q , BR1(q, BR2(q, ...BR1(q, x1* ( q))...))). Razmotrimo šta informacioni agenti moraju imati da bi sproveli Nashovu ravnotežu tako što će istovremeno i nezavisno birati svoje Po definiciji, Nashova ravnoteža je tačka od koje je jednostrano odstupanje nepovoljno od agenata (pod uslovom da preostali agenti odaberu odgovarajućih 26 komponenti Nashovog ravnotežnog vektora akcija). Ako agenti više puta biraju akcije, tada je Nashova tačka stabilna u određenom smislu (vidi detalje u ) i može se smatrati ostvarivom u okviru znanja, kao u slučaju RDS-a, od strane svakog agenta samo o svojoj ciljnoj funkciji i dopuštenoj skupovi X" i W (istovremeno, međutim, potrebno je uvesti dodatne pretpostavke o principima donošenja odluka agenata o izboru akcija u zavisnosti od istorije igre). i W da bi se ostvarila Nasheva ravnoteža je više nije dovoljno. Stoga uvodimo sljedeću pretpostavku, koju ćemo smatrati ispunjenom u toku cijelog daljnjeg izlaganja: informacije o igri G, skupu W i racionalnosti agenata su opšte poznate. Sadržajno uvedena pretpostavka znači da je svaki od agenata racionalan, poznaje skup sudionika igre, funkcije cilja i dopuštene skupove svih agenata, a poznaje i skup mogućih vrijednosti prirodnih stanja. Osim toga, on zna da to znaju i drugi agenti, i da oni znaju da on to zna i tako dalje. do beskonačnosti (vidi gore). Takva svijest se posebno može postići javnim (tj. istovremeno svim okupljenim agentima) saopštavanjem relevantnih informacija, čime se osigurava moguće postizanje beskonačnog ranga refleksije informacija od strane svih agenata. Napominjemo da uvedena pretpostavka ne govori ništa o svijesti agenata o specifičnoj vrijednosti prirodnog stanja. Ako je značenje prirodnog stanja opšte poznato, onda je to dovoljno da se implementira Nasheva ravnoteža. Da bismo potkrijepili ovu tvrdnju, modelirajmo, na primjeru igre dvoje ljudi, rezonovanje prvog agenta (drugi agent argumentira na potpuno sličan način, a njegova razmišljanja će se posebno razmatrati samo ako se razlikuju od rasuđivanja prvog agenta). On tvrdi kako slijedi (vidi izraz (6)): "Moja radnja, na osnovu (1), treba da bude najbolji odgovor na djelovanje drugog agensa u datom prirodnom stanju. Stoga, moram modelirati njegovo ponašanje O njemu (na osnovu pretpostavki da su objektivne funkcije i dozvoljeni skupovi opštepoznati) znam da će delovati u okviru (1), odnosno da će tražiti najbolji odgovor na moje postupke za dato stanje prirode (vidi (7)). on treba da modelira moje postupke, i on će (opet, na osnovu uvedenih pretpostavki da su objektivne funkcije i dopušteni skupovi opštepoznati) razmišljati na isti način kao i ja, i tako dalje ad infinitum (vidi (6))." U teoriji igara, za takvo razmišljanje, koristi se uspješna fizička analogija refleksije u ogledalima - vidi, na primjer,. Dakle, za implementaciju Nashove ravnoteže dovoljno je da svi parametri igre, kao i vrijednost prirodnog stanja, budu opštepoznati (slabljenje ove pretpostavke razmatra se u ). Refleksne igre koje se razmatraju u ovom radu odlikuju se činjenicom da vrijednost prirodnog stanja nije općepoznata, te da svaki agent općenito ima svoje ideje o toj vrijednosti, ideje drugih agenata itd. subjektivna ravnoteža. Razmatrani tipovi ravnoteže su posebni slučajevi subjektivne ravnoteže, koja se definiše kao vektor delovanja agenata, čija je svaka komponenta najbolji odgovor odgovarajućeg agenta na okruženje igre koji se može realizovati sa njegove subjektivne tačke gledišta. Hajde da razmotrimo moguće slučajeve. Pretpostavimo da i-ti agent računa na realizaciju situacije) igre x-Bi ("B" označava vjerovanja; ponekad se koriste izrazi "pretpostavka", "pogoditi" - pretpostavka) i stanja) prirode qi , onda će izabrati)) (8 ) xiB n BRi(qi , x-Bi), i n N. Vektor xB je tačka subjektivne ravnoteže. Imajte na umu da ova definicija "ravnoteže" ne zahtijeva valjanost pretpostavki agenata o akcijama protivnika, odnosno može se ispostaviti da $ i n N: x-Bi ¹ x-Bi . Opravdana subjektivna ravnoteža, tj. takva da je x-Bi = x-Bi , i n N, Nashova ravnoteža (za ovo je, posebno, dovoljno da su svi parametri igre opšte poznati i da svaki agent na 28 ) konstruisanjem x-Bi modelira se racionalno ponašanje protivnika). U posebnom slučaju, ako najbolji odgovor svakog agenta ne zavisi od pretpostavki o situaciji, onda je subjektivna ravnoteža ravnoteža u dominantnim strategijama. U opštijem slučaju, i-ti agent može računati na izbor akcija protivnika iz skupa X -Bi n Xi i ostvarenje prirodnog stanja iz skupa Wi n Wi n N. Tada će najbolji odgovor garantovati subjektivnu ravnotežu:) (9) xi (X -Bi , Wi) O Arg max minB min) fi(q, xi, xi), i O N. xi O X i B -ix OX q OW i -i - i) = Xi, Wi = W, i n N, tada xi(X -Bi) = xig, i n N, tj. garantujuća subjektivna ravnoteža je „klasična“ garantujuća ravnoteža. Varijanta garantirajuće subjektivne ravnoteže je P-balans, detaljno opisan u. U još generalnijem slučaju, kao najbolji odgovor i-tog agenta, možemo smatrati raspodjelu vjerovatnoće pi(xi), gdje je pi(×) n D(Xi) skup svih mogućih distribucija na Xi koji maksimizira očekivanu isplatu agenta, uzimajući u obzir njegove ideje o distribuciji vjerovatnoća mi(xi) n D(Xi) akcija koje su odabrali drugi agenti i raspodjelu vjerovatnoće qi(q) n D(W) prirodnog stanja ( dobijamo Bayesov princip odlučivanja): (10) pi(mi(×), qi( ×), ×) = = arg max ò fi (q, xi, xi) pi (xi) qi (q) mi (xi) dq dx , i n N. pi nD (X i) X", W da bi se ostvarila subjektivna ravnoteža, agenti moraju biti minimalno informisani – svaki od njih mora znati svoju ciljnu funkciju fi(×) i dozvoljene skupove W i X'. , odnosno, da bi pretpostavke bile opravdane, dodatno valjane pretpostavke o međusobnoj svijesti agenata. Najjača je pretpostavka opšteg znanja, koja subjektivnu tačku ravnotežu pretvara u Nashovu ravnotežu, a skup Bayesovih principa odlučivanja u Bayes-Nashovu ravnotežu. Bayes-Nashova ravnoteža. Ako igra ima nepotpune informacije (vidi ), tada je Bayesova igra opisana sljedećim skupom: - skupom od N agenata; - skup od K mogućih tipova agenata, pri čemu je tip i-tog agenta ki n Ki, i n N, vektor tipova k = (k1, k2, …, kn) n K' = Õ K i ; - skup X' = Õ Xi iON dozvoljenih vektora djelovanja iON agenata; - skup funkcija korisnosti ui: K' ´ X' ® Â1; - reprezentacije mi(×|ki) n D(K-i), i n N, agenti. Bayes-Nashova ravnoteža u igri s nepotpunim informacijama definira se kao skup strategija agenata oblika si: Ki ® Xi, i n N, koji maksimiziraju odgovarajuće očekivane korisnosti (11) Ui(ki, si(×) , si(×)) = ò ui (k, si(ki), si(ki)) mi(ki| ki) dk-i, i Î N. k -i ÎÕ K jj ¹i U Bayesovim igrama obično je pretpostavio da su reprezentacije (mi(×| ×))i n N opšte poznate. Za to je posebno dovoljno da su konzistentni, odnosno da ih svaki od agenata izvodi prema Bayesovoj formuli iz distribucije m(k) Î D(K’), što je opšte poznato. Za Bayesove igre, u kojima je (mi(×|×))in N opštepoznat, pojam racionalizabilnih strategija (racionalizacijskih strategija) Di n D(Xi), i n N, tako da je Di n BRi(Di), i O N. U igrama za dvoje, skup strategija koje se mogu racionalizovati poklapa se sa skupom strategija dobijenim kao rezultat iterativne eliminacije snažno dominiranih strategija9. Generalizacija racionalizabilnih strategija na slučaj Maksimina 9. Podsjetimo da se strategija agenta naziva snažno dominiranom tako da postoji druga strategija agenta koja u bilo kojoj situaciji ovom agentu daje striktno veću isplatu. Iterativno eliminisanje strogo dominiranih strategija se sastoji u njihovom sekvencijalnom (generalno beskonačnom) isključenju iz skupa strategija agenata koji se razmatra, što dovodi do pronalaženja „najslabijeg“ rešenja igre – skupa nedominiranih strategija. 30 (garantujuća) ravnoteža se ostvaruje u . Moguće je zakomplikovati konstrukcije subjektivne ravnoteže zbog uvođenja zabrana određenih kombinacija djelovanja agenata itd. Dakle, implementacija RDS, garantirajuće i subjektivne ravnoteže (ako postoje) zahtijeva da svaki agent ima barem informaciju o svojoj objektivnoj funkciji i svim dopuštenim skupovima, a implementacija Nashove ravnoteže, ako postoji, dodatno zahtijeva da vrijednosti svih bitnih parametara bile su opšte poznate. Još jednom napominjemo da realizibilnost Nashove ravnoteže podrazumijeva sposobnost agenata (i kontrolnog tijela - centra, odnosno istraživača operacija, ako imaju odgovarajuće informacije) da a priori i samostalno izračunaju Nashovu ravnotežu i odmah izaberu Akcije Nashove ravnoteže u igri u jednom koraku (u ovom slučaju, posebno pitanje je u kojoj od ravnoteža agenti i centar biraju ako postoji nekoliko Nashovih ravnoteža). Kvalitativno, zajedničko znanje je neophodno kako bi svaki od agenata (i centar) mogao modelirati principe donošenja odluka drugih agenata, uključujući i one koji uzimaju u obzir njegove vlastite principe odlučivanja itd. Stoga možemo zaključiti da je koncept rješavanja igre usko povezan sa svijesti agenata. Takvi koncepti odlučivanja kao što su RDS i Nash ravnoteža su, na neki način, ograničavajući slučajevi - prvi zahtijeva minimalnu svijest, drugi zahtijeva beskonačnost ranga refleksije informacija svih agenata. Stoga ćemo u nastavku opisati druge („srednje“) slučajeve svjesnosti agenata – reprezentacijske hijerarhije – i konstruirati rješenja igre koja im odgovaraju. Prije implementacije ovog programa, pogledajmo poznate modele zajedničkog znanja i hijerarhiju predstavljanja. 1.3. OPŠTI PRISTUPI OPISU INFORMACIJA U konceptima ravnoteže o kojima se raspravljalo u prethodnom odeljku (sa mogućim izuzetkom Nash-ove i Bayes-Nash-ove ravnoteže, u kojima se pretpostavlja prisustvo opšteg znanja), nema refleksije, jer svaki agent čini ne pokušavajte da zauzmete poziciju protivnika. Refleksija se dešava kada agent ima i koristi hijerarhiju reprezentacija pri donošenju odluka – svoje vlastite reprezentacije reprezentacija drugih agenata, njihove reprezentacije svojih reprezentacija i međusobne reprezentacije itd. Analiza ideja o neizvjesnim faktorima odgovara refleksiji informacija, a ideje o principima odlučivanja – strateškoj refleksiji. U smislu subjektivne ravnoteže, strateška refleksija odgovara pretpostavkama agenta da će protivnik izračunati jednu ili drugu specifičnu, na primjer, subjektivnu garantujuću ravnotežu, a informacijska refleksija - koje će specifične pretpostavke o situaciji protivnik koristiti. Razmotrimo trenutno poznatih10 pristupa opisivanju hijerarhije reprezentacija i opšteg znanja. Kao što je navedeno u, postoje dva pristupa opisivanju svijesti - sintaktički i semantički (podsjetimo da je "sintaksa sintaksa znakovnih sistema, odnosno struktura kombinacije znakova i pravila za njihovo formiranje i transformaciju, bez obzira na njihovo značenje". i funkcije znakovnih sistema“, „Semantika – proučava znakovne sisteme kao sredstvo izražavanja značenja, glavni predmet mu je tumačenje znakova i kombinacija simbola“). Temelji ovih pristupa postavljeni su u matematičkoj logici. Uz sintaktički pristup, hijerarhija reprezentacija je eksplicitno opisana. Ako su reprezentacije date distribucijom vjerovatnoće, tada hijerarhije reprezentacija na određenom nivou hijerarhije odgovaraju distribucijama na proizvodu skupa prirodnih stanja i distribucija koje odražavaju reprezentacije prethodnih nivoa. Alternativa je upotreba "formula" (u logičkom smislu), odnosno pravila za transformaciju elemenata originalnog skupa na osnovu upotrebe logičkih 10 Treba napomenuti da su hijerarhije predstavljanja i opšte znanje postali predmet istraživanja. u teoriji igara sasvim nedavno - gore pomenuta knjiga D. Lewisa je pionirska (1969) i članak R. Aumanna (1976). Analiza hronologije publikacija (vidi bibliografiju) ukazuje na sve veći interes za ovu problematičnu oblast. 32 operacije i operatori oblika "igrač i vjeruje da vjerovatnoća događaja ... nije manja od a" . Istovremeno, znanje se modelira rečenicama (formulama) konstruisanim u skladu sa određenim sintaksičkim pravilima. U okviru semantičkog pristupa, reprezentacije agenata date su distribucijama vjerovatnoće na skupu prirodnih stanja. Hijerarhija reprezentacija se tada generiše samo na osnovu ovih distribucija. U najjednostavnijem determinističkom slučaju, znanje je predstavljeno skupom W mogućih vrijednosti neizvjesnog parametra i particija (Ri)i O N ovog skupa. Element particije Ri, koji uključuje q n W, predstavlja znanje i-tog agenta, odnosno skup vrijednosti neodređenog parametra koje se ne mogu razlikovati s njegove tačke gledišta s obzirom na poznatu činjenicu q. Korespondencija (relativno govoreći, "ekvivalencija") između sintaktičkog i semantičkog pristupa je uspostavljena u . Posebno treba istaći eksperimentalne studije hijerarhije reprezentacije u - vidi pregled u . Ovaj kratki pregled pokazuje da postoje dvije „krajnosti“. Prvi “ekstrem” je opšte znanje (zasluga J. Harshanyja je u tome što je sve informacije o agentu koji utiču na njegovo ponašanje sveo na njegovu jedinu karakteristiku – tip – i izgradio ravnotežu (Bayes-Nash) pod hipotezom da je distribucija verovatnoće vrste je opšte poznato). Drugi "ekstrem" je beskrajna hijerarhija dosljednih ili nekonzistentnih pogleda. Primjer potonjeg je konstrukcija data u , koja, s jedne strane, opisuje sve moguće Bayesove igre i sve moguće hijerarhije reprezentacija, a, s druge strane, (zbog svoje općenitosti) je toliko glomazna da ne može omogućavaju konstruktivno postavljanje i rješavanje konkretnih problema. Većina studija o svijesti posvećena je odgovoru na pitanje: u kojim slučajevima hijerarhija reprezentacija agenata opisuje opšte znanje i/ili adekvatno odražava svijest agenata. Ovisnost rješenja igre od konačne hijerarhije konzistentnih ili nekonzistentnih reprezentacija agenata (tj. čitav raspon između dva gore navedena „ekstrema“) praktično nije proučavana. Izuzetak je, prvo, rad u kojem su Bayes-Nashove ravnoteže za trostepene hijerarhije nekonzistentnih probabilističkih predstava dvaju agenata izgrađene na pretpostavci da se reprezentacije na nižem nivou hijerarhije poklapaju sa reprezentacijama prethodnog nivoa – vidi također pretpostavke tipa Pm i odgovarajuće ravnoteže u . Drugo, treće poglavlje ovog rada, koje opisuje proizvoljne (konačne ili beskonačne, konzistentne ili nekonzistentne) hijerarhije "tačkastih" reprezentacija, za koje se konstruiše i proučava informaciona ravnoteža - ravnoteža refleksivne igre (mogućnost i svrsishodnost generaliziranje dobijenih rezultata na slučaj intervalnih ili probabilističkih reprezentacija agenata razmatra se u zaključku). Dakle, i proučavanje strateške refleksije (poglavlje 2 ovog rada), i konstrukcija rješenja refleksivne igre, i proučavanje ovisnosti ove ravnoteže od hijerarhije reprezentacija agenata (poglavlje 3 ovog rada) su relevantni. POGLAVLJE 2. STRATEŠKA REFLEKSIJA Ovo poglavlje istražuje teorijske modele strateške refleksije. U Odjeljku 2.1 proučavamo model strateške refleksije u igri za dva igrača, koji nam u Odjeljku 2.2 omogućava rješavanje problema maksimalnog svrsishodnog ranga strateške refleksije u bimatričnim igrama. Odjeljak 2.3 posvećen je raspravi o konačnosti ranga refleksije, generisane ograničenim sposobnostima osobe da obradi informacije. 2.1. STRATEŠKA REFLEKSIJA U IGRAMA DVIJE OSOBE Razmotrimo uzastopno, u redoslijedu povećanja svijesti, refleksivne modele odlučivanja u igrama za dvoje. Nulti rang refleksije. Razmotrimo problem donošenja odluke od strane agenta u slučaju potpunog odsustva informacija o prirodnom stanju (podsjetimo da se pretpostavka da su ciljne funkcije i dopušteni skupovi opštepoznati smatra ispunjenom). S jedne strane, čini se razumnim koristiti princip odlučivanja na osnovu maksimalno garantovanog rezultata, prema kojem će i-ti agent izabrati garantujuću (prema prirodnom stanju i akciji protivnika) strategiju ( 12) 1 xig = arg max min min fi(q, xi , xi). xi n X iq nW x -i n X -i može izračunati protivničku garantujuću strategiju). Tada je najbolji odgovor (13) 2 xig = arg max min fi(q, xi, 1 x-g i). xi n X i q nW Ali protivnik agenta koji se razmatra može argumentirati na sličan način. Ako agent koji se razmatra dozvoljava takvu mogućnost, tada će njegova garantna strategija biti (14) 13) zamjenom indeksa "i" sa "i" i obrnuto. Lanac povećanja „ranga refleksije“ (pretpostavke agenta o rangu refleksije protivnika) može se nastaviti dalje (vidi analogije u dinamičkim modelima razmatranim u ) rekurzivnim određivanjem (15) xi i), k = 2, 3, . .., xi n X iq nW g 1 i gdje su x , i = 1, 2, određene (12). Skup akcija tipa (15) nazvaćemo skupom refleksivnih garantujućih strategija. Razmotrimo ilustrativan primjer. Primjer 1. Neka ciljne funkcije agenata imaju oblik: f1(x1, x2) = x1 – x12 /2x2, f2(x1, x2) = x2 – x22 /2(x1 + d), gdje je d > 0. Sa u odnosu na dopuštene skupove, pretpostavimo da je X1 = X2 = , 0< e < 1. Будем считать, что каждая из констант e и 35 d много меньше единицы. Гарантирующие стратегии агентов приведены в таблице 1. Табл. 1. Гарантирующие стратегии агентов в примере 1 k г k x1 1 e 2 e+d 3 e+d 4 e + 2d 5 e + 2d 6 e + 3d 7 e + 3d ... ... x2г e+d e+d e + 2d e + 2d e + 3d e + 3d e + 4d ... k Видно, что, во-первых, значения гарантирующих действий увеличиваются с ростом «ранга рефлексии». Во-вторых, различным «рангам рефлексии» агентов соответствуют в общем случае различные гарантирующие действия (отметим, что равновесием11 Нэша в данном примере является вектор (1; 1)) ·12. Вопрос о том, какое действие следует выбирать агенту, остается открытым. Единственно, можно констатировать, что, обладая информацией только о множестве возможных значений состояния природы, i-ый агент может выбирать одно из действий k xiг, i = 1, 2; k = 1, 2, ..., определяемых выражениями (12) и (15). Доопределить рациональный выбор агента в рассматриваемой модели можно следующим образом. Если агенту неизвестна целевая функция оппонента (что исключено в рамках предположения о том, что целевые функции и допустимые множества являются общим знанием), то единственным его рациональным действием является выбор (12), то есть классический МГР. В рамках введенных предположений агенту известна целевая функция оппонента, а также известно, что оппоненту известен этот факт и т.д. Поэтому с точки зрения агента нерационально использование классического МГР, и ему следует рассчитывать, как минимум, что оппонент будет ис11 В качестве отступления заметим, что, если в рассматриваемом примере целевая 2 функция второго агента имеет вид f2(x1, x2) = x2 + x2 /2x1, то у него существует доминантная стратегия (равная единице), и последовательность гарантирующих стратегий первого агента стабилизируется уже на втором члене: 2 г i x x 2 xiг. Символ «·» здесь и далее обозначает окончание примера или доказательства. 36 = e, = 1/2. Если первый агент может вычислить доминантную стратегию своего оппонента, то представляется рациональным выбор им действия 12 г 1 i пользовать МГР, что приведет к выбору 2 xiг. Но, опять же, в силу того, что целевые функции являются общим знанием, агент может предположить, что такой ход его рассуждений может быть восстановлен оппонентом, что сделает целесообразным выбор 3 xiг и т.д. до бесконечности. Следовательно, с точки зрения агента остается неопределенность относительно «ранга рефлексии» оппонента13. Относительно этого параметра он не имеет никакой информации (если у агента имеются некоторые убеждения по этому поводу, то может реализоваться соответствующее субъективное равновесие), что делает рациональным использование гарантированного результата по «рангу рефлексии» оппонента: (16) x’i = arg max min min fi(q, xi, j x-г i). xi Î X i j =1, 2,... q ÎW Отметим, что, во-первых, x’i может отличаться от классической гарантирующей стратегии 1 xiг, определяемой выражением (12). Вовторых, при использовании стратегии (16) факт наличия доминантной стратегии оппонента будет учтен агентом (см. сноску в примере 1). В таблице 2 приведены значения целевой функции первого агента в примере 1 в зависимости от «ранга рефлексии» оппонента и соответствующие действия оппонента. Видно, что при использовании стратегии (16) выигрыш i-го агента равен e + d, что превышает выигрыш e, получаемый при использовании классического МГР. Табл. 2. Выигрыши первого агента в примере 1 j г 2 г 2 2 f1(BR1(j x), j x) j x2г 1 2 3 4 5 6 7 e+d e+d e + 2d e + 2d e + 3d e + 3d e + 4d e+d e+d e + 2d e + 2d e + 3d e + 3d e + 4d 13 Другими словами, исходная игра может быть заменена на игру, в которой агенты выбирают ранги своей рефлексии. Для новой игры могут быть также построены рефлексивные аналоги и т.д. до бесконечности (см. примеры: «Пенальти» – во введении, «Игра в прятки» и «Снос на мизере» – в разделе 2.2). Одним из возможных способов борьбы с подобной «бесконечностью» является использование гарантированного результата по рангу рефлексии оппонента. Другим возможным способом, эффективным для конечных игр, является определение максимального целесообразного ранга рефлексии агентов – см. раздел 2.2. 37 Таким образом, рациональным в рассматриваемой модели можно считать использование агентом стратегии (15) или (16). Первый ранг рефлексии. Предположим теперь, что агент обладает определенной информацией о состоянии природы, которую считает истинной, и больше ему ничего достоверно не известно. В рамках существующей неопределенности в силу принципа детерминизма у агента, осуществляющего стратегическую рефлексию, имеются две альтернативы – либо предположить, что его оппонент не обладает никакой информацией, либо считать, что последний обладает той же информацией, что и он сам14. Если агент не вводит никаких предположений об информированности и принципах поведения оппонента, то он вынужден применять принцип максимального гарантированного результата (МГР) – никакой дополнительной (по сравнению с рассмотренной выше моделью нулевого ранга рефлексии) информации об оппоненте у агента не добавилось15 – то есть рассчитывать на наихудший для него выбор второго агента из множества стратегий типа (16). Гарантирующей стратегией будет: (17) xiг (qi) = arg max min fi(qi, xi, j x-г i). xi Î X i j =1, 2,... Отметим, что, находясь в информационной ситуации, соответствующей рассматриваемой модели, вычисляя (17), агент рассматривает оппонента как находящегося в информационной ситуации, соответствующей предыдущей модели. Этот общий принцип – обладая некоторой информацией, агент может рассматривать оппонента как имеющего либо тот же, либо на единицу меньший ранг рефлексии – будет использован и в ряде других рефлексивных моделей принятия решений. Если первый агент считает, что его оппонент обладает той же информацией, что и он сам (аналогично может рассуждать и второй агент – см. предположение П1 в ), то он вычисляет субъективное 14 Данный принцип (и его обобщения) будет широко использоваться ниже при определении конечных информационных структур – действительно, обладая информацией Ii, i-ый агент может в случае неопределенности приписывать другим агентам только информированность, согласованную с Ii. 15 Конечно, агент может предполагать, что оппонент обладает некоторой информацией, но, так как эта информация не фигурирует в модели, то рассматривать подобные предположения мы не будем. 38 равновесие (то есть «равновесие Нэша» для соответствующего субъ* * ективного описания игры) EN(q1) = {(x11 (q1), x12 (q1))} следующего вида: * * * (18) " x1 Î X1 f1(q1, x11 (q1), x12 (q1)) ³ f1(q1, x1, x12 (q1)), * * * " x2 Î X2 f2(q1, x11 (q1), x12 (q1)) ³ f1(q1, x11 (q1), x2). Содержательно, приведенные системы неравенств отражают вычисление первым агентом «своего» равновесия Нэша и выбор соответствующей координаты этого равновесия. В общем случае агент и его оппонент вычислят разные равновесия – совпадение возможно, если информированность такова, что xij* (qi) = x*jj (qj), i, j = 1, 2. Таким образом, рациональным в модели первого ранга рефлексии можно считать выбор агентом либо рефлексивной гарантирующей стратегии (17), либо субъективного равновесия (18). Субъективное равновесие (18), определяемое первым агентом, может быть условно изображено в виде графа с двумя вершиx12 x1 нами x1 и x12, соответствующими первому агенту и его представлениям о втором агенте16 (см. рисуРис. 1. Субъективное нок 1). Входящие стрелки при равновесие в модели первого этом отражают ту информацию, ранга стратегической которую использует каждый из рефлексии агентов об оппоненте. Второй ранг рефлексии. В модели второго ранга рефлексии iый агент обладает информацией о представлениях qij оппонента о состоянии природы и о собственных представлениях qii о состоянии природы (будем считать, что qi = qii – см. аксиому автоинформированности ниже). Агент может рассчитывать, что его оппонент выберет гарантирующую (в рамках знания qij) стратегию. Тогда наилучшим ответом будет 16 Подобные агенты, существующие в представлениях других агентов, называются фантомными агентами. 39 (19) 2 xiг = arg max fi(qi, xi, x-г i (qij)), xi Î X i г -i где x (qi,-i) определяется (17). Помимо гарантирующей стратегии (19), первый агент может вычислить субъективное равновесие * * EN(q1, q12) = {(x11 (q1, q12), x12 (q1, q12))} следующего вида: * * * (q1,q12), x12 (q1,q12)) ³ f1(q1, x1, x12 (q1,q12)), (20) " x1 Î X1 f1(q1, x11 * * * " x2 Î X2 f2(q12, x121 (q1,q12), x12 (q1,q12)) ³ f2(q12, x121 (q1,q12), x2), * * * " x1 Î X1 f1(q12, x121 (q1,q12), x12 (q1,q12)) ³ f2(q12, x1, x12 (q1,q12)). Как и в предыдущей модели, в общем случае первый агент и его оппонент вычислят разные равновесия. Таким образом, рациональным в модели второго ранга рефлексии можно считать выбор агентом либо рефлексивной гарантирующей стратегии (19), либо субъективного равновесия (20). Отметим, что первые две системы неравенств в (20) отражают равновесие Нэша с точки зрения x12 x1 первого агента, а вторая и третья система неравенств – равновесие Нэша, которое должен определить второй агент с точки зрения перx121 вого агента – см. граф на рисунке 3, на котором пунктиром обведена Рис. 3. Субъективное «модель» второго агента, которую использует первый агент при равновесие в модели RDM2 принятии решений. Проведенный анализ простейших моделей стратегической рефлексии первых нескольких рангов свидетельствует, что в случае нескольких агентов и недостаточной их информированности можно рассматривать процессы принятия ими решений независимо – каждый из них моделирует поведение своих оппонентов, то есть стремится построить собственную замкнутую модель игры (см. обсуждение различий субъективного и объективного описания игры в ). В случае общего знания субъективные модели совпадают. 40 Выше мы рассмотрели рефлексию нулевого, первого и второго рангов. Наращивание рангов рефлексии можно по аналогии производить и дальше. Существенными во всех моделях являются предположения агента о том, какой ранг рефлексии имеет его оппонент, то есть, фактически, ранг рефлексии агента определяется тем, какой ранг рефлексии он приписывает оппоненту. Никаких разумных рекомендаций, ограничивающих рост ранга собственной рефлексии, априори агенту предложить нельзя. С этой точки зрения можно констатировать, что не существует универсальной концепции равновесия для игр со стратегической рефлексией. Единственным выходом является использование в этом случае либо МГР по рангам рефлексии оппонента, либо субъективного равновесия, в рамках которого каждый агент вводит определенные предположения о ранге рефлексии оппонента и выбирает свое действие, оптимальное в рамках этих предположений. Поэтому сконцентрируем основное внимание на изучении случаев, когда неограниченного роста ранга рефлексии не происходит. Существуют две причины, по которым ранг рефлексии может оказаться конечным. Во-первых, это – нецелесообразность увеличения ранга рефлексии, свыше некоторого, с точки зрения выигрыша агента (когда дальнейшее увеличение ранга рефлексии заведомо не приводит к увеличению выигрыша). Во-вторых, возможности человека по переработке информации ограничены, и бесконечный ранг рефлексии является не более чем математической абстракцией. Поэтому в последующих разделах настоящей главы приводятся модели, учитывающие обе приведенные причины – в разделе 2.2 на примере биматричных игр определяется максимальный целесообразный ранг стратегической рефлексии, а в разделе 2.3 исследуется роль информационных ограничений. 2.2. РЕФЛЕКСИЯ В БИМАТРИЧНЫХ ИГРАХ Основная идея, развиваемая в настоящем разделе, заключается в том, что в биматричных играх17, в которых не существует равновесия Нэша, или в которых при существующем равновесии Нэша агенты выбирают субъективные гарантирующие стратегии (см. 17 Напомним, что биматричными называются конечные игры двух лиц. 41 предыдущий раздел настоящей работы) выигрыш каждого из агентов зависит как от его ранга рефлексии, так и от ранга рефлексии оппонента. Кроме того, показывается, что неограниченное увеличение ранга стратегической рефлексии не приводит к увеличению выигрыша. Перейдем к формальному описанию. Рассмотрим биматричную игру18, в которой выигрыши первого и второго агентов задаются матрицами A = ||aij|| и B = ||bij|| размерности n ´ m соответственно. Обозначим19 I = {1, 2, …, n} – множество действий первого агента (выбирающего строку), J = {1, 2, …, m} – множество действий второго агента (выбирающего столбец). В рассматриваемой игре гарантирующие стратегии агентов следующие: i0 Î Arg max min aij, j0 Î Arg max min bij. iÎI jÎJ jÎJ iÎI Введем следующие предположения. Пусть матрицы выигрышей таковы, что каждое действие каждого агента является наилучшим ответом на некоторое действие оппонента, и пусть, кроме того, наилучший ответ на каждое действие оппонента единственен (если наилучших ответов несколько, то можно ввести правило, доопределяющее выбор агента).20 Следовательно, при определении наилучших ответов вместо выражений «i… Î Arg max …» и iÎI «j… Î Arg max …» можно использовать, соответственно, выражения jÎJ «i… = arg max …» и «j… = arg max …». iÎI jÎJ Обозначим a0 = max min aij, b0 = max min bij – максимальiÎI jÎJ jÎJ iÎI ные гарантированные результаты (МГР) первого и второго агентов соответственно. 18 Так как матричные игры (антагонистические конечные игры двух лиц) являются частным случаем биматричных игр, то все приведенные в настоящем разделе результаты справедливы и для матричных игр. 19 Будем надеяться, что использование одного и того же (исторически сложившегося) обозначения для информационной структуры и множества действий первого агента не приведет к путанице. 20 Если отказаться от этих предположений, то все полученные в настоящем разделе результаты останутся в силе, так как вводимые предположения позволяют получить для максимального целесообразного ранга стратегической рефлексии оценку сверху. 42 Определим рефлексивную биматричную игру MGkl (matrix game) как биматричную игру с матрицами A и B, в которой первый и второй агенты имеют ранги рефлексии, равные k и l соответственно, k, l Î À, где À – множество натуральных чисел. Поясним, что будет пониматься под рангом рефлексии (точнее – под рангом стратегической рефлексии) в биматричных играх. В биматричных (и не только биматричных – см. ) играх выбор действий агентами может осуществляться на основании знания рангов рефлексии оппонента. Ранги рефлексии определяются следующим образом. «Агент имеет нулевой ранг рефлексии, если он знает только матрицу платежей. Агент обладает первым рангом рефлексии, если он считает, что его противники имеют нулевой ранг рефлексии, то есть знают только матрицу платежей. Вообще, агент с k-ым рангом рефлексии предполагает, что его противники имеют k– 1-й ранг рефлексии. Он проводит за них необходимые рассуждения по выбору стратегии и выбирает свою стратегию на основе знания матрицы платежей и экстраполяции действий своих противников» . Приведем иллюстративный пример. Пример 2 (Игра в прятки) . Первый агент прячется в одной из нескольких комнат разной освещенности, а другой агент должен выбрать ту комнату, где будет его искать. Степени освещенности известны обоим агентам. Стратегии агентов следующие. Ищущий при прочих равных условиях предпочитает искать, где светлее (там проще найти). Прячущемуся понятно, что в более темной комнате шансов найти его меньше, чем в освещенной. Возрастание ранга рефлексии означает, что агенту становится понятно, что это понятно и его противнику, и т.д. Представим ранги рефлексии агентов и соответствующие действия по выбору комнат в виде таблицы 3. Табл. 3. Ранг рефлексии агентов и соответствующие действия по выбору комнат Ранг рефлексии агента Комната, выбираемая прячущимся 0 Самая темная 1 Любая, кроме самой светлой 2 Любая, кроме самой темной 3 Самая светлая 4 Самая темная 43 Комната, выбираемая ищущим Самая светлая Самая темная Любая, кроме самой светлой Любая, кроме самой темной Самая светлая Можно видеть, что после второго ранга рефлексии исчерпывается все множество допустимых действий, а после третьего ранга рефлексии стратегии выбора комнат начинают повторяться. Этот факт являлся иллюстрацией того, что в игре двух лиц увеличение рангов рефлексии выше определенного объективно не дает ничего нового, хотя субъективное нарастание сложности может продолжаться. Несоответствие рангов рефлексии успешности деятельности состоит в следующем. Пусть прячущийся имеет 0-й ранг (прячется в самой темной комнате). Если при этом ищущий имеет 1-й ранг, то он всегда выигрывает (ищет в самой темной комнате). Но если ищущий имеет 3-й ранг (ищет в любой комнате, кроме самой темной), то он всегда проигрывает прячущемуся с 0-м рангом, поскольку тот, как мы помним, не затрудняясь рассуждениями о том, что думает противник, прячется именно в этой самой темной комнате, куда ищущий, проведя серию рефлексивных рассуждений, никогда не заглянет. Таким образом, невозможно однозначно утверждать, что более высокий ранг рефлексии лучше более низкого. Предпочтительность того или иного ранга определяется его взаимодействием с рангом рефлексии противника. · Так как в биматричных играх предполагается, что каждый агент имеет некое убеждение о ранге рефлексии оппонента , то это позволяет использовать понятие субъективной гарантирующей стратегии. Определим субъективные гарантирующие стратегии в биматричной игре MGkl: (21) ik = arg max aijk -1 , jl = arg max bil -1 j , k, l Î À. iÎI jÎJ Таким образом, игра MG00 совпадает с исходной игрой, а «равновесием» в игре MGkl является (aik jl ; bik jl), k, l Î À. Отметим два любопытных факта. Во-первых, выигрыш любого агента в игре MGkl при k ³ 1, l ³ 1 может оказаться меньше максимального гарантированного (см. пример «Снос на мизере» ниже). Во-вторых, приписы44 вание каждым агентом оппоненту ранга рефлексии на единицу меньше его собственного противоречиво, так как в игре MGkl при k ³ 1, l ³ 1 это означает, что должно одновременно выполняться l = k – 1 и k = l – 1, что, очевидно, невозможно. Следовательно, равновесие в рефлексивной игре является существенно субъективным, и априори агенты не знают в какую игру они играют (ранги рефлексии обоих агентов не могут быть общим знанием, так как это противоречило бы самому определению ранга рефлексии). Поэтому перспективным направлением будущих исследований представляется изучение информационной рефлексии относительно рангов рефлексии агентов в биматричных играх. Внутренняя противоречивость стратегической рефлексии в биматричных играх может быть проиллюстрирована следующей схемой – на рисунке 4а приведено субъективное описание игры MGkl в терминах графа рефлексивной игры с точки зрения первого агента, на рисунке 4б – субъективное описание той же игры с точки зрения второго агента. i0 j0 i0 j0 i1 j1 i1 j1 … … ik-2 jk-2 il-2 jl-2 ik-1 jk-1 il-1 jl-1 ik ? Рис. 4а. Субъективное описание игры MGkl с точки зрения первого агента? jl Рис. 4б. Субъективное описание игры MGkl с точки зрения второго агента 45 Несколько забегая вперед (см. раздел 3.4), отметим, что граф рефлексивной игры обладает тем свойством, что число дуг, входящих в каждую его вершину, должно быть на единицу меньше, чем число агентов (то есть в биматричных играх равняться единице). Субъективные равновесные действия выделены жирным шрифтом и приводят к «равновесию» (ik, jl). Действия ik-1 для первого агента и jl-1 для второго не используются в соответствующих субъективных описаниях игры (см. знаки вопроса на рисунке 4), то есть каждое из них оказывается внутренне незамкнутым. Завершив краткое обсуждение внутренней противоречивости определения ранга стратегической рефлексии в биматричных играх, вернемся к исследованию зависимости субъективного равновесия и выигрышей агентов от рангов их рефлексии. Обозначим IK = ik , JL = jl , K = 0, 1, 2, …, U U k =0 ,1,...,K l =0 ,1,...,L L = 0, 1, 2, … . Под I¥ и J¥ будем понимать соответствующие объединения по всем рангам рефлексии от нуля до бесконечности. Если одному агенту (или обоим агентам) неизвестен ранг рефлексии оппонента, то целесообразно рассмотрение игры MG¥¥, в которой каждый агент вычисляет гарантированный результат по рангу рефлексии оппонента. Введем гарантирующие стратегии, соответствующие полной неопределенности относительно ранга рефлексии оппонента: (22) i¥ = arg max min aij, j¥ = arg max min bij. iÎI jÎJ ¥ jÎJ iÎI ¥ Аналогично можно определить гарантирующие стратегии в рамках информации о том, что ранг рефлексии оппонента не превышает известной величины (то есть первый агент считает, что ранг рефлексии второго не выше L, а второй – что ранг рефлексии первого не выше K): (23) iL = arg max min aijl , jK = arg max min bik j . iÎI lÎJ L jÎJ kÎI K Отметим, что в (23), в отличие от (21), стратегия каждого из агентов не зависит от его собственного ранга рефлексии, а определяется информацией о ранге рефлексии оппонента. Выражения (21)-(23) не исчерпывают всего многообразия возможных ситуаций, так как, например, первый агент может предпо46 ложить, что второй выберет j¥, и тогда его наилучшим ответом будет arg max aij¥ , и т.д. Кроме того, хотя к увеличению ранга рефлексии iÎI способны лишь «сильные» агенты, интуитивно понятно, что при росте этого ранга, то есть при удлинении цепочки рассуждений «я думаю, что он думает, что я думаю...» есть опасность «перемудрить». Сильный агент с высоким рангом рефлексии переоценивает противника, предполагая, что у него ранг рефлексии тоже высокий. Но, если ранг соперника на самом деле низкий, это приводит к проигрышу более слабому противнику – см. примеры «Игра в прятки» и «Снос на мизере». Следовательно, необходимо систематическое исследование соотношения выигрышей агентов в зависимости от типа разыгрываемой игры. Приведем результаты этого исследования. Существенным для нашего рассмотрения является наличие или отсутствие равновесия Нэша, а также выбор агентами (и использование при построении субъективных равновесий) гарантирующих стратегий или действий, равновесных по Нэшу. Таким образом, возможны следующие четыре ситуации. Вариант 1 (равновесие Нэша в чистых стратегиях существует, и агенты ориентируются на равновесные по Нэшу действия). Обозначим (i*; j*) – номера равновесных по Нэшу чистых стратегий. Тогда, если по аналогии с (21) считать, что в рефлексивной игре каждый агент выбирает свой наилучший ответ на выбор оппонентом соответствующей компоненты равновесия, то получим, что (24) ik = arg max aij* , jl = arg max bi* j , k, l Î À. iÎI jÎJ Из (24) в силу определения равновесия Нэша следует, что ik = i*, jl = j*, k, l Î À, то есть в рамках варианта 1 стратегическая рефлексия бессмысленна21 (за исключением, быть может, случая, когда наилучшие ответы определяются таким образом, что агенты выбирают компоненты различных равновесий Нэша в случае, когда последних несколько). Вариант 2 (равновесие Нэша в чистых стратегиях существует, но агенты выбирают гарантирующие стратегии (21)). 21 Под бессмысленностью стратегической рефлексии в биматричных играх будем понимать случай, когда равновесие в рефлексивной игре с любой комбинацией ненулевых рангов рефлексии агентов совпадает с равновесием в исходной игре. 47 Если гарантирующие стратегии образуют равновесие Нэша (как это имеет место в антагонистических играх с седловой точкой), то попадаем в условия варианта 1. Следовательно, стратегическая рефлексия имеет смысл, только если в рамках варианта 2 равновесие Нэша не совпадает с равновесием в гарантирующих стратегиях (i0, j0). Вариант 3 (равновесия Нэша в чистых стратегиях не существует, и агенты ориентируются на равновесные по Нэшу смешанные стратегии22). Если агенты при определении своих наилучших ответов по аналогии с (24) рассчитывают на то, что оппонент выберет равновесные по Нэшу смешанные стратегии, то легко показать, что максимум ожидаемого выигрыша каждого агента будет достигаться при выборе им также соответствующей равновесной по Нэшу смешанной стратегии. Следовательно, в рамках варианта 3 любое равновесие совпадает с равновесием Нэша в смешанных стратегиях, то есть стратегическая рефлексия в этом случае бессмысленна. Вариант 4 (равновесия Нэша в чистых стратегиях не существует, и агенты ориентируются на гарантирующие стратегии (21)). В четвертом варианте анализ рефлексии, очевидно, имеет смысл. Таким образом, рассмотрев все четыре возможных варианта поведения агентов, получаем, что обоснована справедливость следующего утверждения. Утверждение 1. Стратегическая рефлексия в биматричных играх имеет смысл, если агенты используют субъективные гарантирующие стратегии (21), которые не являются равновесными по Нэшу. Обозначим (25) Kmin = min {K Î À | IK = I¥}, (26) Lmin = min {L Î À | JL = J¥}. Содержательно, Kmin и Lmin – минимальные ранги рефлексии первого и второго агентов, при которых их множества субъективных равновесных действий совпадают с максимально возможными в рассматриваемой игре множествами субъективных гарантирующих стратегий. 22 Напомним, что в биматричных играх равновесие Нэша в смешанных стратегиях всегда существует. 48 В силу определения " K, L Î À IK Í IK+1, JL Í JL+1. Значит " K ³ Kmin IK = I¥, " L ³ Lmin JL = J¥. Если ранг рефлексии первого и второго агентов не превышает K и L соответственно, то множества субъективных гарантирующих стратегий первого и второго агентов с точки зрения оппонента равны IL-1 и JK-1 соответственно. Значит, увеличение рангов рефлексии может приводить к расширению множества субъективных гарантирующих стратегий, если (27) L – 1 < Kmin, (28) K – 1 < Lmin. Отметим, что с рассматриваемой точки зрения максимальный целесообразный ранг рефлексии23 первого агента зависит от свойств субъективных гарантирующих стратегий второго агента (см. (28)), и наоборот. С другой стороны, агенту не имеет смысла увеличивать ранг своей рефлексии, если он уже «исчерпал» собственное множество возможных субъективных равновесных действий. С этой точки зрения увеличение рангов рефлексии может приводить к расширению множества субъективных гарантирующих стратегий, если (29) K < Kmin, (30) L < Lmin. Объединяя (28) и (29), а также (27) и (30), получаем, что первому агенту не имеет смысла увеличивать свой ранг рефлексии выше (31) Kmax = min {Kmin, Lmin + 1}, а второму агенту не имеет смысла увеличивать свой ранг рефлексии выше (32) Lmax = min {Lmin, Kmin + 1}. Обозначим (33) Rmax = max {Kmax, Lmax}. Таким образом, доказана справедливость следующего утверждения. 23 Под максимальным целесообразным рангом рефлексии агента будем понимать такое его значение, что увеличение ранга рефлексии выше данного не приводит к появлению новых субъективных (с точки зрения данного агента) равновесий. 49 Утверждение 2. Использование агентами в биматричной игре рангов стратегической рефлексии выше, чем (31) и (32), не имеет смысла24. Утверждение 2 дает возможность в каждом конкретном случае (для конкретной разыгрываемой игры) каждому агенту (и исследователю операций) вычислить максимальные целесообразные ранги стратегической рефлексии обоих агентов. Так как величины (31)-(33) зависят от игры (матриц выигрышей), то получим оценки зависимости этих величин от размерности матриц выигрышей (очевидно, что |I¥| £ |I| = n, |J¥| £ |J| = m, а для игр размерности два справедлива более точная оценка – см. утверждение 3). Для этого введем в рассмотрение граф наилучших ответов. Графом наилучших ответов G = (V, E) назовем конечный двудольный ориентированный граф, в котором множество вершин V = I È J, а дуги проведены от каждой вершины (соответствующей действию одного из агентов) к наилучшему на нее ответу оппонента. Опишем свойства введенного графа: 1. Из каждой вершины множества I выходит дуга в вершину множества J (у второго агента есть наилучший ответ на любое действие первого агента), из каждой вершины множества J выходит дуга в вершину множества I (у первого агента есть наилучший ответ на любое действие второго агента). 2. В каждую вершину множества V входит ровно одна дуга (так как каждое действие каждого агента является наилучшим ответом на какое-либо действие оппонента). 3. Если любой путь дважды прошел через одну и ту же вершину, то по определению наилучших ответов его часть является контуром, и в дальнейшем новых вершин в этом пути не появится. 4. Максимальное число попарно различных действий первого агента, содержащихся в пути, начинающемся в вершине i0, равно min (n; m + 1). 5. Максимальное число попарно различных действий второго агента, содержащихся в пути, начинающемся в вершине i0, равно min (n; m). 24 То есть для любого ранга рефлексии, превышающего указанные оценки, найдется ранг рефлексии, удовлетворяющий указанным оценкам и приводящий к тому же субъективному равновесию. 50 6. Максимальное число попарно различных действий первого агента, содержащихся в пути, начинающемся в вершине j0, равно min (n; m). 7. Максимальное число попарно различных действий второго агента, содержащихся в пути, начинающемся в вершине j0, равно min (n + 1; m). Выявленные свойства графа наилучших ответов позволяют получить оценки сверху целесообразных рангов стратегической рефлексии в биматричных играх. Утверждение 3. В биматричных играх 2 ´ 2, в которых не существует равновесия Нэша, I¥ = I, J¥ = J. Доказательство. Рассмотрим произвольную биматричную игру 2 ´ 2, в которой не существует равновесия Нэша. Пусть X1 = {x1, x2}, X2 = {y1, y2}. Вычислим гарантирующие стратегии i0 и j0. Положим для определенности x1 = i0, y1 = j0. Возможны два взаимоисключающих варианта: j1 = y1 и j1 = y2. Если j1 = y1, то i1= i2 = x2 (иначе (x1, y1) – равновесие Нэша). Тогда j2 = j3 = y2 (иначе (x2, y1) – равновесие Нэша). Следовательно, i3 = i4 = x1 (иначе (x2, y2) – равновесие Нэша). То есть в первом случае I¥ = I, J¥ = J. Если j1 = y2, то i2 = x2 (иначе (x1, y2) – равновесие Нэша). Тогда j3 = y1 (иначе (x2, y2) – равновесие Нэша). Следовательно, i4 = x1 (иначе (x2, y1) – равновесие Нэша). То есть во втором случае также I¥ = I, J¥ = J. · Качественно, утверждение 3 означает, что в биматричной игре 2 ´ 2, в которой не существует равновесия Нэша, любой исход может быть реализован как субъективное равновесие. Перспективным направлением дальнейших прикладных исследований можно считать анализ субъективных равновесий в базовых ординарных играх двух лиц 2 ´ 2 (напомним, что существуют 78 структурно различных ординарных игр, то есть игр, в которых оба агента, каждый из которых имеет два допустимых действия, может строго упорядочить собственные выигрыши от лучшего к худшему ). Утверждение 3 наводит на мысль, что, быть может, во всех биматричных играх, в которых не существует равновесия Нэша, выполнено I¥ = I, J¥ = J. Контрпримером служит приведенный на 51 рисунке 5 граф наилучших ответов в игре 4 ´ 4, в котором вершины i0 и j0 затенены. I¥ I J¥ J Рис. 5. Пример графа наилучших ответов в биматричной игре 4 ´ 4, в которой I¥ Ì I, J¥ Ì J Имея грубые оценки сверху (|I¥| £ n, |J¥| £ m) «размеров» множеств I¥ и J¥, исследуем, как быстро (при каких минимальных рангах стратегической рефлексии) эти множества «покрываются» соответствующими субъективными равновесиями. Третье свойство графа наилучших ответов означает, что в биматричной игре целесообразное увеличение ранга стратегической рефлексии, начиная со второго шага, обязательно изменяет множество стратегий, которые должны быть субъективными гарантирующими при рангах рефлексии меньших или равных данному. Так как в биматричных играх множества допустимых действий конечны, то конечны множества I¥ и J¥, следовательно, в силу свойств 4-7 графа наилучших ответов конечны и величины Lmin и Kmin, то есть в биматричных играх неограниченное увеличение ранга рефлексии заведомо нецелесообразно. Опять же в силу конечности допустимых множеств, величины (31) и (32), определяющие максимальные целесообразные ранги рефлексии, могут быть легко рассчитаны для любой конкретной биматричной игры. Но свойства графа наилучших ответов позволяют получить конкретные оценки сверху максимальных целесообразных рангов рефлексии. 52 В биматричной игре n ´ m гарантированные оценки25 величин (31)-(33), очевидно, будут зависеть от размерности матриц выигрышей, то есть Kmin = Kmin(n), Lmin = Lmin(m). Следовательно, (34) Kmax(n, m) = min {Kmin(n), Lmin(m) + 1}, (35) Lmax(n, m) = min {Lmin(m), Kmin(n) + 1}. Выражение (33) примет при этом вид: (36) Rmax(n, m) = max {Kmax(n, m), Lmax(n, m)}. Из свойств 4-7 графа наилучших ответов и выражений (34)-(36) следует справедливость следующего утверждения. Утверждение 4. В биматричных играх n ´ m максимальные целесообразные ранги стратегической рефлексии первого и второго агентов удовлетворяют следующим неравенствам (37) Kmax(n, m) £ min {n, m + 1}, (38) Lmax(n, m) £ min {m, n + 1}, (39) Rmax(n, m) £ max {min {n, m + 1}, min {m, n + 1}}. Следствие 1. В биматричной игре n ´ n, n ³ 2, максимальный целесообразный ранг стратегической рефлексии любого агента26 Rmax(n, n) £ n. Для случая двух допустимых действий (в силу его распространенности в прикладных моделях) сформулируем отдельное следствие. Следствие 2. В биматричной игре 2 ´ 2 максимальный целесообразный ранг рефлексии не превосходит двух. Еще раз отметим, что оценки (37)-(39) являются оценками сверху – существование нескольких наилучших ответов на одно и то же действие, наличие в исходной игре равновесия Нэша или доминируемых стратегий может привести

Refleksne poslovne igre

Efikasno rješavanje unutarškolskih problema umnogome je određeno stepenom uključenosti u ovaj proces svih učesnika u obrazovnom procesu, njihovom zainteresovanošću za uspjeh predmeta, mogućnošću sticanja ličnog uspjeha u rješavanju zajedničkih problema. U tom smislu, poslovne igre se mogu smatrati jednim od optimalnih oblika kolektivnog organizovanja za rješavanje sadašnjih i budućih problema škole.

Razmotrite najčešće igre koje se koriste u praksi.

Organizacione i aktivnosti igre. Tvorac ove vrste produktivnih igara bio je. Osnovni cilj i svrha organizaciono-aktivnih igara je razvoj mentalne aktivnosti samih učesnika u igri. Ovu igru karakteriše napet ritam rada, broj učesnika dostiže 600, rezultat igre je, pre svega, neko novo znanje, razumevanje. Glavne metode uključuju "brainstorming", diskusiju, "okrugli sto", analizu konkretnih situacija, sinektiku (figurativno izražavanje problema), pozicioni sukob. Refleksija djeluje kao sredstvo svijesti i refleksije igrača o vlastitom mišljenju.

Inovativne igre razvijen. Ovaj oblik poslovne igre proizašao je iz organizaciono-aktivnog, međutim, u igri akcenat nije na proučavanju problema, već na njihovom rješavanju (pitanje „zašto?” miješa se s pitanjem „kako?” Broj učesnika je 25 osoba, koriste se edukativne i konsultantske sobe, a takođe i transformisane klasične metode igre (diskusija, brainstorming).

Prvo su se igrale i objašnjavale praktične poslovne igre. Poziciona priroda praktične poslovne igre ne zasniva se na razlikama u subjektivnom razmišljanju, već na sučeljavanju interesa konkurenata. U ovoj igri se aktiviraju različiti oblici grupnog rada.

Problemske poslovne igre– prvi put su sproveli stručnjaci sa Saratovskog univerziteta. U fazi igre koriste se sljedeće metode kolektivne mentalne aktivnosti: brainstorming, simulacijske igre, socio-psihološki trening, sinektika, refleksija na više nivoa, konferencija za novinare itd.

Igre problemske aktivnosti počeo se razvijati i testirati 90-ih godina na Moskovskom i Čeljabinskom pedagoškom univerzitetu. Svrha problemsko-aktivne igre kao metode unutarškolskog upravljanja je pronalaženje efikasnog rješenja za aktuelne probleme obrazovnog procesa uključivanjem školskih nastavnika u prostor igre.

Jedna od varijanti problemsko-aktivnih igara su str reflektirajuće poslovne igre.

Refleksna poslovna igra (RDG) je moderan aktivni oblik rada sa učesnicima u obrazovnom procesu, a to je organizacija posebnog refleksivnog okruženja u kojem svaki učesnik ne samo da stiče novo kognitivno, bihejvioralno iskustvo, već postaje i pokretač njihov lični razvoj, kao i razvoj njihovih partnera.

Za razliku od navedenih produktivnih poslovnih igara, RDI je prvenstveno usmjeren na učesnike u obrazovnom procesu. Istovremeno, rješavanje problema poslovnog obrazovanja obezbjeđuje se korištenjem i razvojem mogućnosti refleksivne svijesti učesnika. Zadaci društvenog razvoja i razvoja ličnosti u ovoj vrsti igara su od istog značaja kao i dobijanje poslovno kreativnog proizvoda. Integraciju poslovnih i razvojnih zadataka obezbjeđuje posebna tehnologija implementacije, u kojoj se velika pažnja poklanja realizaciji refleksivnih oblika interakcije.

Osnovni koncept koji određuje značenje takve organizacije prostora za učenje je refleksija. Prema riječima, refleksija je proces samospoznaje od strane čovjeka unutrašnjih psihičkih stanja, kao i svijesti o tome kako ga drugi ljudi ili zajednica ljudi zapravo doživljavaju i procjenjuju. Prema PM. Andreeva, refleksija nije samo znanje i razumijevanje drugog, već znanje o tome kako me drugi razumije, svojevrsni dvostruki proces ogledala odraza ljudi jedni o drugima. Da bismo dali potpuniju sliku o suštini refleksije, daćemo još jednu definiciju refleksije koju daje: „Refleksija je ljudska sposobnost koja omogućava osobi da svoje misli, emocionalna stanja, postupke, odnose, sebe učini predmetom posebno razmatranje (analiza i evaluacija) i praktična transformacija.

Gore navedene definicije refleksije omogućavaju nam da istaknemo neke karakteristike refleksivnog okruženja, a time i refleksivne poslovne igre, koje ga razlikuju od tradicionalnih okruženja za učenje.

Dakle, refleksivnu prirodu poslovne igre obezbjeđuje:

Pokretanje problemskih situacija koje proširuju razumijevanje učesnika o sebi i drugima;

Smatrajući svaki problem ne kao poteškoću, „barijeru, već kao priliku za dalji razvoj;

Stvaranje uslova za saradnju, interakciju, razmjenu mišljenja i druge oblike društvenog djelovanja;

Modeliranje situacija koje maksimalno odgovaraju zadacima i interesima učesnika;

Upotreba pozicione interakcije, u kojoj se problem koji se razmatra proučava sa različitih uloga, konceptualnih pozicija;

Stvaranje uslova za duboko razumevanje, analizu i preispitivanje od strane učesnika svog empirijskog iskustva;

Podsticanje inovativnih pristupa rješavanju problema;

Razvoj sposobnosti učesnika za međusobno razumijevanje, aktivno slušanje, otvorenost za iskustvo;

Pokretanje holističke percepcije ljudi i situacija, što nam omogućava da kao izvore razvoja sagledamo polarne mogućnosti i opcije za njihove međusobne tranzicije.

Poslovna orijentacija igre određena je njenim fokusom na performanse u odnosu na postavljene zadatke orijentisane na praksu. Poslovni zadaci igre mogu biti usmjereni na sticanje stručnih znanja, vještina i sposobnosti učesnika; za razvoj određenog kreativnog proizvoda (u obliku projekta, modela, preporuka, obrazovno-metodičkog kompleksa i sl.); za procjenu stručne kompetencije, nivoa znanja, vještina i sl.; rješavanje konkretnih problema tima (izrada pravila ponašanja u timu, odabir predstavnika iz grupe, formiranje administrativnog tima, osmišljavanje modela psihološke službe obrazovne ustanove, određivanje konkretnih načina rješavanja grupe sukoba, izrada školske povelje, itd.).

Integracija poslovne orijentacije igre i refleksivne prirode okruženja u kojem se odvija rješavanje zadataka usmjerenih na praksu osigurava u maksimalnoj mjeri ne samo efektivnost njihovog rješavanja, već i osobnu orijentaciju.

prirodu organizacije ovog procesa, kao i zadovoljstvo učesnika mogućnošću da daju svoj poseban doprinos rješavanju postavljenih zadataka.

Prilikom pripreme refleksivno-poslovne igre, vođa treba obratiti posebnu pažnju na sljedeće tačke koje osiguravaju uspjeh njene implementacije:

Usklađenost ciljeva igre sa interesima i potrebama učesnika. To se osigurava jasnom orijentacijom igre na mogući društveni poredak (od strane nastavnika, učenika, uprave obrazovne ustanove itd.).

Detaljan razvoj scenarija igre, koji treba da obezbedi ne samo jasnu korespondenciju između ciljeva svake faze ukupnog cilja igre, oblika rada, već i regulisanje faza i vežbi, dostupnost materijala.

Ako RDI predviđa razvoj bilo kojeg kreativnog proizvoda, tada domaćin prvo mora razviti kriterije za njegovu evaluaciju, približne komponente koje će omogućiti usmjeravanje tijeka igre u konstruktivnom smjeru.

Za jasniju organizaciju RDI-a i održavanje kreativne aktivnosti učesnika važno je obezbijediti im takve materijale koji će im omogućiti da ne rasipaju pažnju na rutinski rad (crtanje tabela, grafikona, sastavljanje dugih rečenica itd.). ), ali produktivno fiksirajte ideje na kompetentno pripremljenom materijalu.

Za šire iniciranje inovativnih pristupa rješavanju postavljenih zadataka važno je da voditelj unaprijed pripremi problemska pitanja koja bi uništila stereotipe o percepciji problema i situacija učesnika, podstakla njihovu sposobnost pronalaženja smisla u besmislicama, sigurnosti. u neizvjesnosti, harmoniji u haosu i stabilnosti u fluidnosti i obrnuto.

Kako bi učesnici bolje procijenili efikasnost i obim svog rada, možete koristiti velike listove whatman papira, svijetle flomastere kako biste vizualno efektno demonstrirali rad pred cijelom publikom.

Porast kreativne aktivnosti sudionika RDI-a često je povezan s korištenjem pozivanja na kulturno-povijesne slike u igri (pretraga i odabir kulturnog analoga - povijesnog heroja ili zapleta koji u potpunosti odražava fenomen koji se proučava), vizualnog reprezentacija problema koji se proučava - u obliku sociodramske improvizacije, crteža: otkrivanje implicitnih značenja i konteksta prikazanih slika.

Najvažniji oblik u RDI je poziciona interakcija. Organizuje se na različite načine: dodjeljivanjem vodećih pozicija unutar svake mikrogrupe, biranjem od strane članova mikrogrupe onih pozicija uloga koje su im najinteresantnije, dodjeljivanjem pozicije mikrogrupi (u ovom slučaju članovi jedne mikrogrupe razgovaraju iz iste pozicije) itd.

Glavne funkcije vodećeg RDI uključuju:

Organizacija svrsishodne kolektivne aktivnosti učesnika;

Strogo poštivanje faza igre i kontrola nad propisima za realizaciju zadataka;

Podsticanje inovativnih pristupa rješavanju problema;

Pomozite učesnicima da izraze svoje gledište;

Fiksiranje (ako je potrebno) rezultata diskusije;

Objašnjenje i pojašnjenje izjava učesnika;

Pomoć u prikupljanju podataka potrebnih za rješavanje problema;

Rezimiranje rasprave o pitanju;

Sprečavanje pokušaja da se tok igre skrene u nekonstruktivan

Jasna i razumljiva izjava konačnog i srednjeg

zaključci i rezultati;

Ulivanje povjerenja učesnicima u važnost njihovog mišljenja i odluka.

Prilikom realizacije ovih funkcija, vođa IRI ne treba da nameće svoje mišljenje, pretpostavke, zaključke učesnicima. Za voditelja je, s jedne strane, važno da dosljedno implementira strategiju igre, da je drži zagrejanom, da ga publika ne vodi u pitanjima generalnog postavljanja ciljeva, as druge strane da vješto koristi rezultate grupnog rada, da čuje i razumije učesnike, da bude fleksibilan i spreman za taktičke promjene u igri.

Efikasnost, šarenilo, praktičnu vrijednost refleksivno-poslovnoj igri daju one vježbe, tehnike, metode rada koje je, zapravo, ispunjavaju sadržajem. Navodimo najčešće od njih: rasprava o problemu u mikrogrupama, kreiranje grafičkih slika, tehnika pozicionog rješenja, lično-perspektivna refleksija, individualna i grupna analiza timskog rada, rangiranje rezultata grupnog rada, analitički mikro eseji, grupni crtanje, refleksivna dijagnostika, socijalni dizajn, metode refleksivnih inverzija, grafičko modeliranje, refleksivna analiza prepreka, trening ponašanja, identifikacija očekivanja, igra uloga, dramatizacija, fokus intervjui itd.

Refleksne poslovne igre mogu se smatrati prilično novim, ali izuzetno relevantnim oblikom rada sa učesnicima obrazovnog procesa. Njihova upotreba omogućava ne samo povećanje profesionalne kompetencije nastavnika, već i uvođenje aktivnih, demokratskih oblika interakcije u pedagošku praksu, čiji dirigenti mogu biti oni nastavnici i administratori obrazovnih institucija koji su osjetili djelotvornost kolektivnih oblika problema. rješavanje u toku refleksivnih poslovnih igara.

Po našem mišljenju, refleksivno-poslovna igra (RDG) je jedan od modernih obrazovnih oblika rada sa školarcima, koji omogućava ne samo stvaranje situacije za lični razvoj djeteta kroz širenje njegove slike o "ja", već i doprinijeti formiranju dječije zajednice koju karakteriše međusobno povjerenje, odgovornost, sposobnost za konstruktivnu saradnju njenih članova.

Refleksivno-poslovna igra aktuelizuje širok spektar izvora za razvoj svojih učesnika: refleksivnu svest, pozitivan „ja“ koncept, lični stav prema prihvatanju, razumevanju i otvorenosti partnera. Ova igra pruža učenicima priliku ne samo da razmišljaju, već i da djeluju kako u vlastitim interesima tako iu interesu grupe.

Refleksivnost igara osigurava se organizacijom takvog komunikativnog prostora u kojem se u mikrogrupama aktivno raspravlja o problematičnim pitanjima vezanim za poslovne i lične ciljeve igre; stvaraju se uslovi za bolje samoprepoznavanje od strane školaraca, za međusobno upoznavanje, da dijete otkrije sebe za drugoga i druge za sebe.

Predloženi projekti refleksivnih poslovnih igara mogu se preporučiti za implementaciju u razrednim grupama, školskim aktivima, odborima školske uprave itd.

Razvoj GRUPA pravila ponašanja

Predstavljeni RDI se može održati na početku školske godine u učionici, u jezgru škole, u timu KVN, itd. Omogućava školarcima da se osjećaju odgovornim za svoje postupke, koji pripadaju normama školskog života. Takva igra može postati korak ka demokratizaciji unutarškolskih odnosa i, u nekoj fazi, pretvoriti se u školsku igru razvijanja unutarškolskih normi ponašanja.

Treba napomenuti da se algoritam igre "Razvoj grupnih pravila ponašanja" može koristiti za izradu pravila rukovanja knjigom, pravila za odnose među ljudima, pravila zdravog načina života itd.

Ciljevi utakmice:

Izrada pravila ponašanja u razredu (grupi);

Razvoj refleksivne svijesti učenika i širenje njihove

slika "ja"

Razvoj vještina saradnje.

Broj učesnika: od 6 do 24 osobe (jedan razred, grupa).

Starost učesnika: 2-11. razred.

Faze igre

1. Zagrijte se

Uklanjanje emocionalne napetosti;

Razvoj pozitivnog interesa za partnera;

Širenje predstava učenika o sebi, o drugovima, o razrednom životu.

Grupni razvoj skupa pravila ponašanja čije poštovanje treba da doprinese koheziji odeljenja (grupe);

Sredstva: grupni problemski rad; rangiranje rezultata grupnog rada.

Očekivani rezultat: skup pravila ponašanja u razredu (grupi); pozitivan stav svih prema primljenoj listi pravila.

Z. Refleksivno

Proširenje slike "ja" učesnika;

Razvoj reflektivne svijesti;

Razvijanje spremnosti za postupanje u skladu sa pravilima i spremnost za unapređenje ovih pravila;

Razvoj imidža "mi".

Sredstva: samoprocjena i međusobna procjena, lično-perspektivna refleksija.

Očekivani rezultat: spremnost da se postupa u skladu sa pravilima; spremnost da uči od drugova i nauči drugove da poštuju pravila kroz sopstveno ponašanje; proširenje razumijevanja sebe i drugih; spremnost za dalju saradnju.

Napredak igre

1. Zagrijte se. "Komunikacioni pinwheel"

Učesnici formiraju dva kruga: unutrašnji i vanjski, sjedeći jedan prema drugom u parovima. Na znak vođe, učesnici koji sede u spoljašnjem krugu obavljaju zadatak vođe u odnosu na partnera nasuprot (u parovima), zatim učesnik iz unutrašnjeg kruga čini isto i na kraju razmena utisaka. Važno je da partner koji se opisuje ne ometa govor govornika, a možda čak i zapisuje za njega lično važne informacije. Nakon završetka svakog zadatka, učesnici u vanjskom krugu se pomjeraju za jedno mjesto (na primjer, u smjeru kazaljke na satu). Tako se formiraju novi parovi.

1) opisati izgled partnera;

2) pogodi njegov hobi;

H) navedite jaku stranu karaktera partnera;

4) navedite slabu stranu njegovog karaktera;

5) pretpostaviti da partner najviše cijeni ljude;

6) sugeriše šta ga kod ljudi najviše nervira;

7) navedite ulogu koju partner najčešće igra u grupi;

8) opiše svoj doprinos poslovima odeljenja ili škole;

9) daje savjete partneru;

10) predložite šta možete naučiti od svog partnera.

2. Razvoj grupnih pravila ponašanja

Facilitator poziva svaku mikrogrupu (u toku diskusije) da napiše 6-7 pravila ponašanja u grupi (razredu), koja bi, po njihovom mišljenju, doprinijela udobnosti učenika u učionici i njihovoj koheziji. Istovremeno, voditelj skreće pažnju školarcima da se pravila formulišu kroz radnje, a ne kroz implementaciju nekih ličnih kvaliteta učenika. Na primjer, pravilo „Budite pažljivi prema prijatelju“ ne može se smatrati konstruktivnim, jer svaka osoba stavlja svoje značenje u riječ „pažljiv“. Kao rezultat, ovo pravilo postaje nejasno i može se implementirati kroz mnoge radnje. U tom smislu, u početku je teško implementirati. Alternativa tome bi moglo biti konstruktivnije pravilo: "Ponudi pomoć ako vidiš da je prijatelju potrebna."

Za rad u mikrogrupama predviđeno je 10-12 minuta.

Facilitator poziva predstavnika svake mikrogrupe da navede pravila ponašanja koja su nastala kao rezultat diskusije. Voditelj ih zapisuje na ploču. Duplicirana pravila se ne snimaju. Kao rezultat toga, u prosjeku je 13-20 pravila fiksirano na tabli.

Voditelj poziva svakog učesnika u igri da sa liste primljenih pravila odabere tri, po njihovom mišljenju, najvažnija. Svaki učesnik može zapisati ova pravila (ili njihov redni broj) na posebnom listu.

Zatim voditelj rangira listu pravila koju je grupa razvila koristeći sljedeću tehniku: prvo zamoli one učenike koji su odabrali prvo pravilo da podignu ruke - i stavlja odgovarajući broj glasova na ploču pored njegovog teksta, zatim one koji su izabrali drugo pravilo dižu ruke - i na tabli je označen odgovarajući broj glasova i tako dalje. Kao rezultat toga, pored teksta svakog pravila, na tabli treba da stoji broj koji karakteriše broj izbora za ovo pravilo.

Domaćin, uz podršku grupe, bira sa liste 6-7 pravila koja su dobila najviše glasova, a ostala pravila jednostavno briše sa table. Kao rezultat, 6-7 pobjedničkih pravila ostaju na tabli.

Zatim, voditelj poziva svakog učenika da zapiše pobjednička pravila u bilježnicu, a zatim zaključuje da su ova pravila ponašanja razvili sami učenici i tako su preuzeli. odgovornost za njihovo poštovanje. Sada razred, po zajedničkom dogovoru, mora naučiti da živi po ovim pravilima, podržavajući jedni druge.

Na kraju glavne pozornice možete pozvati učenike da izvedu neku vrstu ritualne radnje: zaklinjajte se naglas da slijede ova pravila, vizualizirajte ih (možete s ilustracijama) i objesite ih u učionici.

H. Reflektivna faza

Voditelj poziva svakog učesnika u igri da radi sa ličnim listovima pravila kako slijedi:

Stavite uzvičnik uz ta pravila čija implementacija neće biti teška za učenika;

Stavite znak pitanja pored onih pravila za čije bi poštovanje trebalo uložiti određene napore i, eventualno, unutrašnji rad na sebi;

Uz upitnike upišite imena ili prezimena onih ljudi (drugovi, učitelji, roditelji itd.) koji vas mogu naučiti pridržavanju ovih pravila. Bolje je da nastavnik zamoli učenike prije svega da obrate pažnju na svoje drugove iz razreda kao nastavnike u poštovanju pravila.

Nakon što se završi rad koji je predložio voditelj sa listovima pravila, svaki učesnik u igri izgovara svoje odgovore. Općenito, učinak svakog učenika može izgledati ovako: „Najlakše mi je da poštujem... pravila. Poteškoće mogu uzrokovati... pravila. Ali prvo pravilo ću naučiti od tebe Sveta, jer... . I biće mi lakše da naučim treće pravilo od Ćirila, pošto. ."

Voditelj, završavajući igru, podsjeća učenike da se izrađena lista pravila ne može smatrati konačnom. Za mjesec dana potrebno je ponovo da se sastanemo i razgovaramo o djelotvornosti ovih pravila i stepenu njihovog uticaja na udobnost boravka u grupi (razredu).

Izbor vođe (predstavnika) iz razreda

Refleksivno-poslovna igra "Odabir vođe (predstavnika) iz razreda" po algoritmu je slična prethodno predstavljenoj igri, samo se mijenja refleksivna faza. Ova igra se može koristiti kao sredstvo za demokratski izbor predstavnika iz razreda u Školsko vijeće, na reprezentativni događaj, biranje unutarrazrednih pozicija itd. Ovakva igra se može koristiti više puta ovisno o ciljevima reprezentacije. Ovo će vam omogućiti da identifikujete mnoge pozitivne lidere u razredu koji će moći da ostvare svoje sposobnosti u svom području kompetencija. Takva igra pomaže školarcima da bolje upoznaju i razumiju sebe, obogaćujući to znanje mišljenjem i stavom svojih drugova; razmislite o svojim sposobnostima, o svojoj ulozi u životu razreda i škole.

Ciljevi utakmice:

Izbor vođe koji odgovara ciljevima reprezentacije;

Proširivanje slike učesnika o sebi;

Otvaranje i prezentacija od strane učesnika vlastitog vodstva

Razvoj pozitivnog stava prema partneru;

Razvoj sposobnosti za saradnju;

Razvoj spremnosti da bude pod kontrolom pozitivnog lidera;

Razvoj grupne kohezije.

Broj učesnika: od b do 24 osobe (jedan razred, grupa).

Starost učesnika: 2-11. razred.

Faze igre

1. Zagrijte se

Razvoj pozitivnog interesa za partnera;

Širenje predstava učenika o sebi, o drugovima, o životu razreda i škole.

Sredstva: psiho-trening vježbe.

Očekivani rezultat: stvaranje prijateljske atmosfere u grupi i povećanje interesovanja za dalji rad.

Razvoj kompleksa ličnih kvaliteta koji odgovaraju lideru-predstavniku;

Razvoj grupne diskusije i vještina aktivnog slušanja.

Sadržaji:

Grupni problemski rad;

Rangiranje rezultata grupnog rada.

Očekivani rezultat:

Razvoj kompleksa ličnih kvaliteta lidera - predstavnika klase;

Pozitivan stav svakoga prema rezultirajućoj listi kvaliteta.

Z. Refleksivno

Proširenje slike „Ja sam učesnici;

Povezivanje vaše ideje o sebi sa idealnom slikom lidera-predstavnika;

Razvoj imidža "mi".

Sadržaji:

Samoprocjena i uzajamna procjena;

Odraz lične perspektive.

Očekivani rezultati:

Jednoglasna saglasnost grupe u izboru pozitivnog lidera prema prethodno razvijenim ličnim kvalitetima;

Spremnost da se veruje odlukama lidera i delegira odgovornost u okviru cilja;

Proširivanje razumijevanja sebe i drugih;

Spremnost za dalju saradnju.

NAPREDAK IGRE

1. Zagrijte se

Kao vježbu za zagrijavanje, možemo ponuditi školarcima da prikažu ljudsko tijelo u obliku grupne „skulpture“. Svaki učesnik, kao rezultat grupne rasprave ili na vlastitu inicijativu, bira neki organ, dio tijela čiju funkciju obavlja u grupi (ili možda želi da obavlja npr. srce, kralježnicu, ruke, oči, koža...). Skulptura možda ne sadrži vodiča, koji će potom objasniti razlog boravka svakog učesnika u ovoj skulpturi. Skulptura može biti i statična i dinamička. Vođa se ne meša u proces raspodele uloga unutar grupe, već posmatra ponašanje svakog učesnika. Ako je grupa velika (na primjer, klasa), preporučljivo je podijeliti je u dvije podgrupe. Treba napomenuti da voditelj može dati zadatak da prikaže grupu, razred kakav je sada (učesnici obavljaju upravo one funkcije u grupi, na primjer "Moj razred je sada"), a idealnu grupu, razred , čemu možete težiti - „Razred, koji bismo željeli da vidimo idealno (učesnici bi mogli obavljati ove funkcije kako bi grupa radila efikasnije).

Nakon što je skulptura napravljena, vodič objašnjava zašto je upravo ovaj učesnik postao upravo ovaj „organ“. Zatim se voditelj okreće svakom učesniku u skulpturi i pita ga koliko se ugodno osjeća u ovoj ulozi i koji bi “organ” sam izabrao.

Kao vježbu možete ponuditi model Sunčevog sistema sa planetama i satelitima, model automobila itd.

2. Izbor predstavnika iz razreda

Grupa je podijeljena u mikrogrupe od po 4-5 osoba. Listovi i olovke se dijele malim grupama.

Voditelj poziva svaku mikrogrupu (nakon diskusije) da zapiše 3 karakterne osobine i 3 vještine koje osoba koja je najvrijednija da bude predstavnik razreda treba da posjeduje. Preporučljivo je unaprijed podijeliti listove raspoređene u mikrogrupe u dva dijela: “Svoje karaktera” i “Vještine”. Raditi

u mikrogrupama je predviđeno 10-12 minuta.

Facilitator poziva predstavnika svake mikrogrupe da navede karakterne osobine i vještine budućeg vođe koje su razvijene kao rezultat diskusije. Voditelj ih zapisuje na ploču, dijeleći ih u dvije kolone. Kao rezultat toga, na ploči se u prosjeku bilježi 10 karakternih osobina i 10 vještina, koje su, prema grupi, svojstvene budućem vođi.

Voditelj poziva svakog učesnika u igri da izabere sa liste od 3 karakterne osobine i 3 vještine koje, po njihovom mišljenju, najbolje odgovaraju njihovoj ideji o idealnom predstavniku.

Zatim voditelj rangira listu koju je grupa razvila koristeći sljedeću tehniku: zamoli učenike koji su odabrali prvu karakternu osobinu na listi da podignu ruke, a pored nje stavlja odgovarajući broj glasova; zatim oni koji su odabrali drugu osobinu dižu ruke i tako dalje. Kao rezultat, pored svake osobine karaktera i uz svaku vještinu, biće broj koji karakteriše broj izbora na tabli.

Domaćin, uz podršku grupe, bira sa liste 3 karakterne osobine i 3 veštine koje su dobile najviše glasova, ostale se jednostavno brišu sa table. Tako se na tabli nalaze imena tri karakterne osobine i tri vještine koje bi, po mišljenju grupe, trebao posjedovati njihov budući vođa.

Nadalje, voditelj ih, koristeći konačno odabrane karakteristike budućeg predstavnika, sintetiše u emocionalno obojen psihološki portret, vodeći računa da je takav psihološki portret idealan za ovu grupu i za zadate ciljeve.

3. Reflektirajuća faza

Grupa je podijeljena u mikrogrupe. Voditelj poziva sve učesnike u igri da nacrtaju sljedeću tabelu u svojim bilježnicama (tabela se može unaprijed pripremiti i podijeliti učesnicima).

Samovrednovanje i međusobno ocenjivanje učesnika

U krajnjoj lijevoj koloni tabele, učesnici igre prepisuju listu od 3 karakterne osobine i 3 vještine reprezentativnog vođe koju je sastavila grupa na tabli. Zatim svaki učenik ocjenjuje ozbiljnost ovih kvaliteta kod sebe na skali od 7 bodova i rezultate upisuje u 2. kolonu (Samoprocjena) tabele.

Svakog učesnika na skali od 7 poena ocjenjuju članovi njegove mikrogrupe za stepen ispoljavanja kvaliteta lidera-predstavnika. Rezultati evaluacije se upisuju u 3. kolonu tabele (Evaluacija ostalih).

Drugi postupak se može izvesti na različite načine. Iskustvo je pokazalo da su najefikasniji sljedeći:

Učenik koji se ocjenjuje odlazi na određenu udaljenost od mikrogrupe, ostali učesnici ga ocjenjuju, zapisuju rezultat u njegovu tabelu, a zatim pozivaju prijatelja i pokazuju mu dobivene bodove:

Svaki član mikrogrupe ocjenjuje suborca, zatim se pronalazi aritmetička sredina svih procjena, koja se upisuje u treću kolonu ocjenjivanog. Predložene metode omogućavaju objektivnije, uz minimalnu intervenciju osobe koja se ocjenjuje, da se provede postupak procjene. Dakle, druga i treća kolona tabele su popunjene. Svaki učesnik zatim zbraja ukupan broj bodova za svakog

kvalitet i vještinu i dijeli sa 2 da bi se dobila konačna vrijednost (4. stupac). U suštini, konačna vrijednost za svaki kvalitet je aritmetička sredina učenikove samoprocjene, izražena u bodovima, i ocjena ovog kvaliteta od strane njegovih drugova. Dakle, četvrta ukupna kolona je popunjena. Nakon što dobiju konačne ocjene za svaki kvalitet, učenici ih vertikalno sumiraju. Uopšteni rezultat se bilježi u redu "Ukupno". Jasno je da maksimalna konačna vrijednost, koja pokazuje ozbiljnost odabranih k” kvaliteta, treba da bude b x 7 = 42 boda.

Voditelj poziva pet učesnika koji su osvojili najveći ukupan broj bodova da dođu na ploču.

Voditelj napominje da svršeni studenti objektivno u maksimalnoj mjeri odgovaraju ulozi lidera-predstavnika (po bodovima). Međutim, da bi izabrali najbolje od njih, moraju ostaviti pozitivan utisak na druge, da zaista pokažu kvalitete koje je grupa istakla. Da bi to učinio, svaki kandidat mora održati govor u roku od jednog minuta u kojem uvjerava druge zašto bi trebao biti izabran.

Nakon što se saslušaju govori svih kandidata, grupa glasa za jednog od njih. Postupak glasanja može se provesti na ovaj način: svakom kandidatu se dodjeljuje broj, a učesnicima se dijele papirnati kvadrati. Učesnik mora na jednoj od strana ovog polja upisati broj koji odgovara broju kandidata koji je sam izabrao. Zatim se kvadrati savijaju u kutiju. Voditelj slaže kvadrate u hrpe koje odgovaraju broju kandidata (možete izabrati komisiju za brojanje). Izabranim se smatra kandidat sa najviše glasova. Dakle, grupa bira svog vođu-predstavnika.

Hajde da se dogovorimo

Ova igra je, po našem mišljenju, prilično relevantna za školarce različitog uzrasta, što je zbog sljedećih faktora.

Učešćem u igri kod školaraca se aktuelizuje osjećaj odraslosti, koji se ostvaruje kroz njegovo istinski odraslo ponašanje (odgovorno, partnersko, s poštovanjem, konstruktivno) u procesu pregovaranja.

Pregovaranje u igri, koje se odvija u uslovima vremenskog pritiska i odsustva konkurencije, smanjuje dejstvo zaštitnih mehanizama učesnika i podstiče njihove kreativne mogućnosti.

Boravak učenika na tri različite pozicije u istoj situaciji omogućava učesnicima da nauče da razumiju i poštuju interese partnera.

Uloga posmatrača, koja se koristi u pozicionoj interakciji i igri, čini početni analitički čin usmeren na radnju drugog, koji služi kao osnova da učenici analiziraju svoj doživljaj ponašanja u nekoj interakcijskoj situaciji.

Refleksivna faza igre kod učenika aktuelizuje želju da više pregovaraju u problemskim situacijama, da svoje drugove iz razreda smatraju ne samo potencijalnim poslovnim partnerima, već i učiteljima u veštini pregovaranja.

Opisana igra se može modificirati u odnosu na sastav mikrogrupa. Roditelji i nastavnici mogu biti uključeni u mikrogrupe, mogu se stvarati ne proizvoljno, već u skladu sa pedagoškim ciljevima (npr. autsajderi se mogu kombinovati u jednu mikrogrupu sa onim učenicima koje su odabrali u postupku sociometrijskog istraživanja).

Igru se može diverzificirati sadržajem pozicionih kartica, koje učenici mogu postaviti sami na osnovu tipičnih problemskih situacija sa kojima se susreću kod kuće i u školi.

Ciljevi utakmice:

Sticanje iskustva učenika o partnerskom ponašanju u situacijama sa suprotstavljenim interesima partnera;

Razvijanje pozitivnog emocionalnog stava prema ugovoru kao načinu saradnje.

Broj učesnika: od I2 do 24 osobe (broj učesnika mora biti višestruki od 3).

Starost učesnika: 2-11. razred.

Faze igre

1. Pripremna faza

Svrha: psihoemocionalno zagrijavanje, raspoloženje za interakciju igranja uloga.

Znači: psihološke vježbe.

Očekivani rezultat: pozitivan odnos učesnika jedni prema drugima, uklanjanje emocionalne i mišićne napetosti, razvoj koherentnosti u grupnim akcijama.

Mini etape:

Poznanstvo;

Emancipacija motoričke aktivnosti;

Reinkarnacija;

Konzistentnost akcija.

2. Glavna pozornica

Stvaranje uslova za partnersku interakciju školaraca;

Proširivanje znanja školaraca o načinima saradnje u poslovnoj komunikaciji;

Razvoj zapažanja i fleksibilnosti ponašanja.

Sredstva: poziciona interakcija, analiza pozicijske interakcije, prezentacija rezultata rada, materijali za grupnu analizu u obliku protokola posmatranja i pozicionih kartica.

Očekivani rezultat: iskustvo poslovne interakcije, iskustvo posmatranja vođenja pregovora, iskustvo reinkarnacije uloga, proširenje znanja o načinima ponašanja u pregovaračkom procesu.

H. Reflektivna faza

Svrha: osvještavanje učesnika o značenju stečenog iskustva, razvijanje kognitivnog i pozitivnog stava učesnika prema sebi i prema partnerima.

Znači: grupna i individualna refleksija stečenog iskustva.

Očekivani rezultat: spremnost učesnika na partnersku saradnju, spremnost da svoje drugove iz razreda doživljavaju kao potencijalne partnere, želju za učenjem novih načina saradnje.

4. Dijagnostička faza

Svrha: procijeniti emocionalni stav učenika prema partnerskoj interakciji i obliku izvođenja nastave.

Sredstva: vizuelni posteri na kojima se bilježe rezultati individualnog ocjenjivanja.

Očekivani rezultat: ukupno zadovoljstvo učesnika igrom.

NAPREDAK IGRE

1. Pripremna faza

Pripremna faza se sastoji od niza mini-etapa koje su logički povezane i usmjerene na ostvarenje cilja ove faze.

Poznanstvo.

Tradicionalno, upoznavanje se odvija u krugu, gdje je svaki učesnik pozvan da ukratko ispriča o sebi ono što, po njegovom mišljenju, malo ljudi zna. To mogu biti hobiji, interesovanja, prilika i život itd.

Vježbe za emancipaciju motoričke aktivnosti.

Svrha ove faze je smanjenje napetosti mišića, razvijanje prijateljskih, otvorenih odnosa u grupi (razredu). Glavne vježbe su:

Motor (kretanje oko stolice, hvatanje raznih „mentalnih objekata: „jabuke”, „cigle”, „balon” itd.),

Snaga (guranje ramenima, kukovima, "isprobavanje snage ruku" itd.),

Respiratorni.

Vježbe transformacije.

Vježbe za reinkarnaciju imaju za cilj razvijanje sposobnosti djece da kontroliraju vlastito tijelo, na emocionalnu otvorenost, kreativnu maštu, fleksibilnost ponašanja.

Preporučljivo je takve vježbe izvoditi u određenom slijedu, uz komplikacije. Na primjer, shema za kompliciranje unosa slike može biti sljedeća: Slika („Orao“) - Slika u kombinaciji sa svojstvom („Umorni orao“) - Slika u nekoj situaciji („Orao u kavezu“) - Složena slika .

Najoptimalniji oblik organizacije ove vrste vježbi je ponuditi učenicima kartice na kojima je na jednoj strani ispisano ime slike u koju će se morati reinkarnirati, a na drugoj - ista slika, ali komplicirana kvalitetom. ili situaciju. Na primjer, "Vjetar2 - "Vjetar u pustinji", "sofa" - "sofa na deponiji", "Medvjed" - "Nahranjeni medvjed", "Roditelj" - "Roditelj nakon roditeljskog sastanka" itd. Kao složene slike , možete predložiti sljedeće: “Moj otac”, “Moja majka”, “Šta želim da budem”, “Kako me drugi vide” itd.

Prije nego što pređu na vježbe za koherentnost radnji, školarcima se može ponuditi da izraze različita emocionalna stanja koja su zabilježena na karticama pomoću gestikulacije i izraza lica: umor nakon časa, ljubav prema psu, ogorčenost zbog nezaslužene procjene, utjeha nekoga itd. .

Efikasna vježba u ovoj mini fazi je uvježbavanje ponašanja učesnika u poznatim životnim situacijama. Na primjer, učenicima koji stoje u krugu ponuđene su karte koje sadrže radnje koje treba izvršiti u odnosu na susjeda s lijeve strane: skrenuti pažnju na sebe, napraviti kompliment, zatražiti nešto itd.

Vežbe i koherentnost delovanja omogućavaju učeniku da se oseti kao deo grupe, da uvidi mogućnosti svog uticaja na drugove, da sagleda odnos uspeha grupe i ličnog uspeha svakog od njih.

Kao vježbe u ovoj fazi mogu se predložiti sljedeće: tapkanje ili lupkanje ritma u krug, sastavljanje priče u krug, grupno crtanje, kreiranje skulpture grupe itd.

2. Glavna pozornica

Prije nego što pređemo na opis toka glavne faze, predstavit ćemo forme materijala za igru.

Protokol.

Broj protokola je jednak broju učesnika.

PARTNER #1	PARTNER #2

ponašanja	ponašanja

pozicione kartice.

Facilitator dijeli 2 pozicijske kartice za svaku situaciju (u svakoj mikrogrupi). Svaki od njih sadrži naziv pozicije ili uloge određenog partnera i njegov interes u ovoj situaciji. Mogući primjeri pozicijskih kartica su

nijedan ispod.

Pozicione kartice situacije "A"

Pozicione kartice situacije "B"

Pozicioni kartoni situacije "G"

Facilitator govori studentima o posebnostima ugovornih odnosa, skrećući pažnju na glavne stavove o kojima svaka od ugovornih strana mora unaprijed razmisliti za efikasno vođenje budućih pregovora. Dakle, svaki partner bi trebao razmisliti o sljedećim pitanjima:

Šta je moj interes (moj cilj) u pregovorima;

Šta da "žrtvujem" zarad sklapanja ugovora;

Ono što ne mogu "žrtvovati" u ugovoru ni pod kojim okolnostima;

Koji je (vjerovatno) interes mog partnera u ovim pregovorima;

Šta (verovatno) moj partner može "žrtvovati" zarad ugovora;

Nešto (verovatno) moj partner ni pod kojim okolnostima neće moći da "žrtvuje".

Facilitator skreće pažnju učesnicima na raznovrsnost oblika ponašanja partnera u ugovoru (verbalno i uz pomoć gesta i izraza lica) i zapisuje na tabli (uz komentar) neke moguće načine saradnje. Ovo je neophodno kako bi se olakšao kasniji rad školaraca u mikrogrupama.

Sljedeća lista se može koristiti kao polazna tačka:

Transfer informacija

koncesija,

Ponuda pomoći,

Pojašnjenje riječi i pozicije partnera,

vjerovanje,

zahtjev za pomoć,

Donošenje argumenata

pohvala,

Slažem se sa uslovom

Ponuda pomoći,

Tapšanje po ramenu.

Facilitator poziva učenike da se podijele u troje, a zatim postavlja ciljeve i pozicije učesnika u nastalim mikrogrupama.

Svrha grupnog rada za školarce je nastojanje da se dogovore u situacijama koje predlaže voditelj sa suprotnim interesima partnera. Školcima treba skrenuti pažnju da ne moraju da se dogovore oko konačne verzije u datom roku. Glavna stvar je učešće u pregovaračkom procesu, težnja ka rezultatima.

Pozicije učesnika trija: partner br. 1, partner br. 2, posmatrač.

Zadatak partnera: složiti se u situaciji koju je predložio prezenter na pozicijskoj kartici.

Zadatak posmatrača: da kompletira protokol posmatranja za partnere #1 i #2 tokom pregovaračkog procesa u trojci. U zapisniku, posmatrač mora prvo (u prvom redu) upisati ulogu svakog partnera navedenog u pozicijskoj kartici i njegovo pravo ime. U drugom redu protokola posmatrač upisuje interese partnera koristeći pozicijsku karticu. Najteži dio posla posmatrača je da u zapisnik zabilježi načine ponašanja koje partneri trija koriste u predloženoj situaciji. Naravno, posmatrači mogu koristiti listu načina saradnje ispisanu na tabli. Međutim, prvenstveno bi se trebali fokusirati na načine ponašanja koje partneri zapravo pokazuju. Kako bi se olakšao rad posmatrača, voditelj ukazuje grupi na njihova prava:

Mogućnost zaustavljanja pregovaračkog procesa u bilo kom trenutku kako bi se u protokol zabilježilo ponašanje partnera;

Imajte svoje mišljenje u tumačenju ponašanja partnera prilikom popunjavanja protokola.

Facilitator svakoj mikrogrupi dijeli 3 protokola posmatranja, kao i pozicionu karticu (sastoji se od 2 kartice sa pozicijama i interesima partnera). Primjeri pozicijskih kartica su dati gore. Facilitator određuje vrijeme za pregovore i poziva znak (na primjer, pljeskanje) koji će signalizirati učesnicima da je njihov posao završen.

Facilitator poziva studente da odaberu poziciju u procesu pregovaranja. Nakon toga svaki član trija uzima odgovarajući list: posmatrač - protokol posmatranja, partner broj 1 i partner broj 2 - njihovi dijelovi pozicijske karte.Vođa daje znak za početak pregovora.

Nakon predviđenog vremena, domaćin bilježi da su pregovori završeni i daje posmatračima malo vremena da finaliziraju protokole.

Facilitator poziva učesnike da razmijene stavove unutar trija i ponovo počnu pregovarati u istoj situaciji.

Ponavljanje tačke broj 6.

Ponavljanje tačke broj 7.

Ponavljanje tačke broj 6.

Facilitator skreće pažnju učesnicima na činjenicu da u ovom trenutku svaki trio ima 3 protokola posmatranja u kojima se evidentiraju metode pregovaranja učesnika trija. Voditelj svakoj mikrogrupi daje zadatak: analizirati sve zabilježene načine ponašanja i iz njih ispisati one koji se ne ponavljaju na poseban list. Zatim predstavnik svake mikrogrupe čita rezultujuću listu, a voditelj zapisuje metode na tabli, nastavljajući originalnu listu. Naravno, voditelj ne treba samo da zapiše predložene metode, već i, ako je potrebno, razjasni njihovo značenje i preformuliše. Na kraju biste trebali dobiti takvu listu načina pregovaranja, koju odlikuje raznolikost, konstruktivnost i djelotvornost.

Voditelj predlaže da svaki učesnik u igrici dobijenu listu pregovaračkih metoda zapiše u svoju bilježnicu, a zatim razmisli i odgovori na sljedeće pitanje: koji od ovih metoda je najefikasniji u sklapanju sporazuma (koji od ovih metoda je najvjerovatnije vodio vi na zajednički dogovor)?

Predstavnik svake mikrogrupe imenuje najefikasnije metode, izražavajući mišljenje svog trija, a vođa ove metode na listi (na tabli) označava nekim znakom: “!”, “+”.

Na osnovu efektivnih metoda pregovaranja koje su učenici uočili, voditelj sumira glavnu fazu igre, donoseći zajedno sa učenicima zaključak o potrebi poštovanja interesa partnera u procesu pregovaranja, kompromisu kao najvažnijem. indikator ugovornih odnosa.

3. Reflektirajuća faza

U ovoj fazi, voditelj nastoji da stvori uslove za nastup svakog učesnika u igri, čije riječi razred treba da sluša s razumijevanjem i dobrom voljom.

Tokom diskusije učesnici rade sa spiskom metoda koje su zapisali na kraju prethodne faze i sa protokolima posmatranja.

Facilitator predlaže sljedeća pitanja za diskusiju:

Koje ste kvalitete partnera otkrili u sebi?

Koje kvalitete partnera biste željeli istaknuti kod svojih drugova sa kojima ste se dogovorili?

Koje metode sa liste najčešće koristite? Označite ih.

Šta od sljedećeg želite naučiti sa liste? Istaknite ih.

S kim biste sada, nakon što ste savladali neke načine saradnje, željeli pregovarati?

Iskustvo je pokazalo da je faza refleksije zanimljivija kada svaki član trija priča o tome kako su se njegovi partneri pokazali u procesu pregovora, kao i šta od njih mogu naučiti.

4. Dijagnostička faza

Predmet dijagnostike može biti emocionalni odnos učesnika prema procesu njihovog pregovaranja i prema formi časa.

Da biste procijenili stav učenika prema lekciji, možete koristiti A4 list sa sljedećim dizajnom.

Učesnici igre označavaju svoj stav prema lekciji u jednom od 4 polja bilo kojim simbolom.

Odnos sa procesom ugovaranja može se identificirati korištenjem sljedeće tehnike. Na vodoravnom listu nacrtan je koordinatni sistem sa dvije skale. Horizontalna skala odražava pozicije učesnika, vertikalna - bodove kojima je svaki od učesnika ocijenio igru. Praksa je pokazala efektivnu skalu od 7 tačaka. Ovaj koordinatni sistem bi mogao izgledati ovako.

Brojevi učesnika

Svaki učesnik stavlja neki znak (u ovom slučaju) ispred odgovarajućeg, po njegovom mišljenju, broja bodova.

Ako prosječna ocjena emocionalnog stava prema ugovoru (za grupu) prelazi 5 poena, onda se igra može smatrati prilično efikasnom

Sastanak pridošlice

Ova igra, kao i ona gore opisana, ima za cilj razvijanje pravila ponašanja. Međutim, tokom njegove realizacije akcenat je stavljen na vizuelne, imitacione metode rada učesnika. To je u velikoj mjeri uvjetovano uzrasnim karakteristikama učesnika, kojima je ova igra namijenjena. U ovoj igri je veoma važna naknadna vizuelna prezentacija rezultata u vidu zidnih novina, postera, koji demonstriraju efikasnost i korisnost igre za život razreda.

Ciljevi utakmice:

Razvoj pozitivnog stava učenika jedni prema drugima;

Izrada i testiranje pravila ponašanja u odnosu na nove članove razrednog tima;

Razvijanje sposobnosti saradnje i međusobnog razumijevanja.

Broj učesnika: učenika u istom razredu.

Starost učesnika: 2-11. razred.

Faze igre

1. Zagrijte se

Uklanjanje emocionalne napetosti;

Razvijanje sposobnosti pozitivnog interesovanja za partnera;

Širenje predstava učenika o sebi, o drugovima, o razrednom životu.

Sredstva: psiho-trening vježbe.

Očekivani rezultat: stvaranje prijateljske atmosfere u grupi i povećanje interesovanja za dalji rad.

2. Izrada pravila ponašanja u odnosu na pridošlice

Grupna izrada pravila ponašanja školaraca u odnosu na različite vrste pridošlica;

Uvježbavanje izrađenih pravila;

Razvoj grupne diskusije i vještina aktivnog slušanja;

Razvoj fleksibilnosti ponašanja.

Sredstva: grupni problemski rad; "brainstorming" igre uloga; grupna poziciona analiza.

Očekivani rezultat:

Izrada pravila ponašanja učenika prema pridošlicama u različitim školskim situacijama;

Pozitivan stav svakog prema primljenoj listi pravila.

Z. Refleksivno

Proširenje slike "Ja sam učesnici";

Razvijanje volje da se postupa u skladu sa pravilima i unapređuje ih.

Znači: grupna refleksija; dizajniranje vizuelnog prikaza rezultujućih pravila.

Očekivani rezultat:

Spremnost da se postupi u skladu sa pravilima;

Spremnost da učimo od drugova i da ih naučimo da poštuju pravila kroz sopstveno ponašanje;

Poboljšano razumijevanje sebe i drugih;

Razvoj spremnosti za saradnju.

Napredak igre

1. Pripremna faza

Voditelj poziva učenike da završe vježbu „Počasni gost. dva učesnika igre izlaze na vrata. Jedan od njih je počasni gost, drugi pratilac, koji učesnicima igre najavljuje koji je počasni gost ispred njih. Četiri takmičara se biraju da formiraju žiri koji će ocjenjivati ponašanje ostalih na skali od 7 bodova.

Pratnja dovodi gosta u sobu i upoznaje ga. Tada svaki učesnik igre (osim žirija) redom dočekuje počasnog gosta, kaže mu neku frazu, općenito, čini sve što je moguće da se gost osjeća ugodno. Žiri ocjenjuje ponašanje svakog učesnika.

2. Glavna pozornica

Voditelj poziva učenike da se podijele u 3 mikrogrupe.

Svaka grupa mora razviti pravila ponašanja školaraca u odnosu na karakter novog učenika. Prva mikrogrupa razvija pravila ponašanja u odnosu na novog nasilnika. Druga mikrogrupa - u odnosu na potpuno nove skromne, stidljive. Treći - u odnosu na nove veseli i društveni. Radi lakše registracije pravila, svakoj mikrogrupi je dat oblik tabele sa sljedećim sadržajem:

Odnos prema novom

U prvom redu svaka mikrogrupa upisuje svoj tip pridošlice. Zatim se razmatraju i evidentiraju u prvoj koloni mogući postupci ovog pridošlice u odnosu na drugove i nastavnike. Shodno tome, u drugoj koloni se bilježe takve moguće reakcije drugova iz razreda na ovakvo ponašanje koje će pomoći početniku da poštuje norme ponašanja u razredu i da se lakše uklopi u razredni tim. U trećoj koloni mikrogrupa formuliše pravila ponašanja učenika u odnosu na pridošlicu na osnovu analize njegovih postupaka i reakcija na njih. Dakle, mikrogrupa u ovoj fazi popunjava samo prve tri kolone. Za rad je predviđeno 15-20 minuta.

Predstavnik svake mikrogrupe izlaže popunjene tabele pred svim učesnicima, ali se o njihovom sadržaju ne raspravlja.

Voditeljica poziva svaku mikrogrupu da odigra akcije svojih kolega iz razreda koje je istakla, a preostale dvije mikrogrupe treba da procijene svoje reakcije s pozitivne i negativne strane (jedna mikrogrupa ocjenjuje pozitivne aspekte izgubljene reakcije, a druga mikrogrupa ocjenjuje negativne strane). Predstavnici evaluativnih mikrogrupa imenuju pozitivne i negativne aspekte scena koje su istakli, a moderator ih zapisuje u četvrtu i petu kolonu odgovarajućih tabela. Nakon toga, učesnici po potrebi koriguju prvobitno pravilo, a voditelj ga upisuje u šestu kolonu u novom tekstu.

Voditelj poziva predstavnika svake mikrogrupe da vizualizira pravila koja su izmislili i objesi ih u uredu.

3. Reflektirajuća faza

Voditelj predlaže da se učesnicima igre kaže da li su morali biti novi u razredu ili grupi? Kako su se upoznali? Kako bi voljeli da budu pozdravljeni? Na šta se bilo najteže prilagoditi? Koje su pouke izvučene iz ove situacije?

u slučaju dolaska novog učenika na čas, nacrtati poster na koji je zalijepljena njegova fotografija i ispisati pravila postupanja sa novim učenikom od strane drugova iz razreda sa liste onih koje su izrađene tokom igre.

Izbor roditeljskog odbora razreda

Predstavljena igra omogućava razrednom starešini da stvara

efikasan roditeljski odbor zainteresovan za zajedničko vođenje vaspitno-obrazovnih poslova.

Ciljevi utakmice:

Sastavljanje liste zajedničkih vaspitnih poslova sa roditeljima;

Izbor roditeljskog odbora odeljenja.

Broj učesnika: odgovara broju roditelja

u razredu.

Faze igre

1. Pripremna faza

Upoznavanje roditelja;

Identifikacija očekivanja roditelja u pogledu vaspitno-obrazovnog rada u učionici;

Izrada liste oblasti zajedničkog rada roditelja i učenika na određeno vrijeme (šest mjeseci, godinu dana).

Sredstva: psiho-trening vježba, grupni problemski rad.

Očekivani rezultat: lista oblasti zajedničkih vaspitnih poslova za koje su zainteresovani sami roditelji; pozitivan odnos roditelja jedni prema drugima; utvrđivanje mogućnosti i želja svakog roditelja da učestvuje u vaspitno-obrazovnom radu odeljenja i škole.

2. Glavna pozornica

Saznavanje mogućnosti i interesa učesnika u odnosu na

na dodijeljene obrazovne smjerove i poslove;

Stvaranje privremenih interesnih grupa roditelja za obrazovne poslove;

Raspodjela funkcija za efikasno provođenje obrazovno-vaspitnog rada;

izbor predstavnika u roditeljski odbor kao vođe iz grupe roditelja.

Sredstva: grupna analiza, grupna evaluacija. Očekivani rezultat:

Formiranje timova roditelja zainteresovanih za obrazovne poslove određenog tipa;

Raspoređivanje vođa u grupe roditelja;

Izbor roditeljskog odbora.

H. Reflektivna faza

Svrha: analizirati zadovoljstvo učesnika učešćem u konkretnom slučaju.

Znači: individualno-grupna refleksija.

Očekivani rezultat: zadovoljstvo rezultatom utakmice.

Napredak igre

1. Pripremna faza

Roditelji sjede u krugu. Voditelj poziva svakog roditelja da se redom predstavi, a zatim odgovori na dva pitanja.

Koja je, po Vašem mišljenju, uloga roditelja u organizaciji vaspitno-obrazovnog rada u razredu?

Kako možete pomoći razredniku u organizaciji vaspitno-obrazovnog rada u učionici?

Voditelj poziva roditelje da se podijele u mikrogrupe od po 4-5 osoba i daje im zadatak: tokom diskusije svaka mikrogrupa treba da istakne glavne oblasti rada budućeg roditeljskog odbora. Za rad se daje 12-15 minuta.

Predstavnik svake grupe imenuje uputstva koja su primljena, a voditelj ih zapisuje na tabli, pojašnjavajući značenje svakog od njih, a ne zapisujući ona koja se ponavljaju. Kao rezultat toga, glavni pravci rada budućeg roditeljskog odbora su fiksirani na odboru. Možete ih prikazati u obliku tabele (prva kolona je popunjena).

2. Glavna pozornica

Voditelj stavlja znak sa nazivom smjera rada u svakoj mikrogrupi. Zatim poziva one roditelje koji mogu biti korisni razredu u okviru ovog smjera i pokazati interesovanje za to da se udruže u jednu mikrogrupu.

Svaki novostvoreni vođa mikrogrupe daje zadatak: 1

kroz grupnu diskusiju osmisliti 1-2 zajednička slučaja u okviru datog smjera (roditelji + školarci + razredni starešina).

Zatim roditelji, nakon što u mikrogrupi razgovaraju o svojim mogućnostima u organizovanju predloženih slučajeva, raspoređuju funkcije unutar svakog slučaja (pregovaraju s nekim, nešto dogovaraju, pronalaze, provode itd.). Istovremeno, u svakom slučaju se bira koordinator koji je prvenstveno odgovoran za realizaciju slučaja i održava komunikaciju između tima i razrednog starešine.

Predstavnik svake mikrogrupe čita rezultirajuće slučajeve, a voditelj ih zapisuje u prethodno predloženu tabelu u drugoj koloni. Pored toga, u tabeli (treća kolona) se upisuje ime odgovorne osobe, odnosno koordinatora izabranog u mikrogrupu.

Domaćin, koji je upisan u tabeli sa imenima svih koordinatora, poziva ih da izađu i poziva ih da postanu članovi roditeljskog odbora, jer su im sami roditelji ukazali najveće povjerenje kada je riječ o razrednim poslovima. Ako koordinator ne pristane da postane član roditeljskog odbora, tada mikrogrupa mora predložiti zamjenu.

H. Reflektivna faza

Roditelji, nalazeći se u krugu, izražavaju svoj stav prema ovakvoj praksi izbora. Članovi mikrogrupe imenuju one kvalitete koordinatora i izabranih članova matičnog odbora, zahvaljujući kojima im je ukazano povjerenje mikrogrupe.

Nakon utakmice koordinatori zajedno sa razrednim starešinom razgovaraju o sadržaju i raspodjeli ovlasti u predloženim zajedničkim slučajevima (to je urađeno u mikrogrupama tokom igre), a zatim ocrtavaju redoslijed realizacije.

obrazovne poslove.

Polina Astanakulova
Igre za djecu od 5-7 godina. Reflektirajući krugovi "Mystery of my self"

IGRE ZA DJECU 5-7 godina

REFLEKSNI KRUGOVI

« TAJNA MOGA JA»

"Ja i drugi".

Target:

1. Razvijajte samopouzdanje, sposobnost da izrazite svoje mišljenje, sposobnost da pažljivo slušate svoje drugove.

2. Razvijajte maštu.

3. Negujte prijateljski odnos jedni prema drugima

Materijal: klupko konca, mirna muzika.

Sadržaj: Djeca u krug. U rukama nastavnika je klupko konca. negovatelj: Hajde da saznamo šta najviše voliš. Zvuči muzika i učiteljica kaže da volim da šetam šumom. Zatim dodaje loptu djetetu i svako iznosi svoje mišljenje, zatim se lopta vraća učitelju. Ispala je takva paučina. Mreža nas je utkala u jedinstvenu cjelinu. Sada smo jedno sa vama. Veoma je tanak i može se slomiti u svakom trenutku. Zato hajde da se pobrinemo da se niko nikada ne svađa jedni sa drugima i raskine naše prijateljstvo. Djeca zatvaraju oči i zamišljaju da su jedno (paučina je namotana u klupko).

"Ja sam kroz oči drugih".

Target: Dati djeci predstavu o individualnosti. Jedinstvenost svakog od njih, razvija samopouzdanje, formira sposobnost prihvatanja drugačije tačke gledišta.

Materijal: šljunak, tepisi.

Rečima: "Dajem ti kamen jer ti..."

Ishod: uz pomoć kamenčića rekao si puno dobrih i dobrih stvari.

« Tajna mog "ja"» .

Target: Stvoriti okruženje povjerenja u grupi koje omogućava djeci da izraze svoja osjećanja i govore o njima, razvijaju empatične komunikacijske vještine, sposobnost prihvatanja i slušanja druge osobe; razviti sposobnost razumijevanja sebe.

Materijal: svijećnjak sa svijećama, šibice, ogledalo, klasična muzika.

Kraljica je izvadila magično ogledalo i naručila njega: „Moja svetlost je ogledalo, reci mi, ali reci celu istinu. Jesam li slađa od svih na svijetu, sva rumenila i bjelja? Učiteljica pokazuje djeci "magično ogledalo" i priča: Imam i magično ogledalo uz koje također možemo naučiti mnogo zanimljivih stvari jedni o drugima i odgovoriti pitanje: "Ko sam ja?". Pogledajmo plamen svijeće. Pomoći će nam da zapamtimo osjećaje - uspjehe i neuspjehe. Zvuči muzika i učitelj priča o sebi, a zatim pričaju djeca. Dakle, razgovarali smo o našim prednostima i nedostacima i možemo ih ispraviti. Hajde da se bolje brinemo jedni o drugima. Djeca se spajaju za ruke i duvaju svijeću.

"Ja i moje emocije".

Target: Teach djeca razgovarajte o svojim osjećajima, razvijajte sposobnost prepoznavanja emocija iz shematskih slika, obogatite vokabular djeca.

Materijal: piktogram, prostirka, muzika.

Sadržaj: Djeca sjede krugovi na ćilimima. U sredini kartice sa slikom različitih nijansi raspoloženja. Učitelj nudi da uzmete karte koje najbolje odgovaraju vašem raspoloženju. Nakon toga djeca uzimaju odgovarajuću kartu za sebe. Nastavnik donosi zaključak o raspoloženju djeca - tužna, smiješan, promišljen. Šta vam je potrebno da popravite raspoloženje? Nasmijmo se i zaboravimo na loše raspoloženje.

"Ja i drugi".

Target: formirati prijateljski odnos jedni prema drugima,

Razvijati kod djece sposobnost da izraze svoj stav prema drugima, (ako je potrebno kritički, ali taktično.)

Materijal: klupko konca, mirna muzika.

Sadržaj: Djeca u krug. Učitelj ima klupko konca u rukama. negovatelj O: Prijatelji ste dugi niz godina i svi se poznajete. Svi ste različiti, znate jedni druge prednosti i mane. I šta biste mogli poželjeti jedno drugom da postanemo bolji? Zvuči muzika, djeca jedni drugima izgovaraju želje. Učitelj kaže želju djetetu koje sjedi pored njega (primjer: kako bi manje plakao i više se igrao sa djecom.) Tada odrasla osoba dodaje loptu djetetu (dijete izgovara želju osobi koja sjedi pored njega) itd., onda se lopta vraća učitelju. Djeca zatvaraju oči i zamišljaju da su jedno.

"Svijet moje fantazije".

Target: Razvijati maštu, opuštenost, komunikacijske vještine, razvijati prijateljski odnos jedni prema drugima.

Materijal: visoka stolica za svako dijete, cvijet - sedmocvijet.

Leti, leti, latice,

Preko zapada na istok

Kroz sjever, kroz jug,

Vratite se radeći krug,

Čim dodirnete tlo

Da budem po mom mišljenju vođen!

negovatelj: Zamislite da postoji mađioničar koji će ispuniti svaku želju. Da biste to učinili, morate otkinuti jednu laticu i zaželiti želju i ispričati svoj san. “Djeca naizmjence otkidaju latice i govore šta bi željela”.

negovatelj: Djeco, koja vam se želja najviše dopala?

Svi su imali različite želje, neki za sebe, za druge su povezani sa prijateljima, sa roditeljima. Ali sve vaše želje će se sigurno ostvariti.

"Kako mogu promijeniti svijet na bolje?"

Target: Develop at dječija mašta, sposobnost da se sasluša mišljenje drugog, da se zauzme drugačija tačka gledišta, različita od sopstvenog, da se formira grupna kohezija.

Materijal: "magija"čaše.

Sadržaj: djeca sjede krug. Učitelj pokazuje "magija" čaše: „Onaj ko ih obuče, videće samo ono dobro u drugim ljudima, čak i ono što nije uvek odmah uočljivo. Svako od vas će isprobati naočare i pregledati ostale. Djeca naizmjenično stavljaju naočale i nazivaju prednosti jedni drugima. negovatelj: „A sada ćemo opet staviti naočare i gledati na svijet drugim očima. Šta biste željeli promijeniti u svijetu da ga učini boljim? (odgovor djece)

Sve nam to pomaže da vidimo nešto dobro u drugima.

"Šta je radost?"

Target: Razvijati sposobnost adekvatnog izražavanja svog emocionalnog stanja, razumijevanja emocionalnog stanja druge osobe.

Materijal: Fotografije radosnih lica djeca, piktogram "radost", sunce, crveni flomaster.

negovatelj:

Kakav je osjećaj oslikan na njima? (osmijeh)

Šta treba učiniti za ovo? (osmijeh)

Pozdravite jedni druge. Svako dijete se okreće prijatelju s desne strane, zove ga imenom i kaže da mu je drago što ga vidi.

negovatelj: A sad mi reci šta je radost? Završi rečenica: "Drago mi je kada...". (Djeca završavaju rečenice). Učitelj zapisuje želje na papirićima i pričvršćuje ih na zrake. Svako ima svoju radost, ali ona se prenosi jedni na druge.

Koji "JA SAM"»

Target: stvara pozitivno emocionalno raspoloženje, formira grupu i povećava lično samopoštovanje.

Materijal: ogledalo.

Koje su boje oči?

Šta su oni (veliki, mali);

Koje je boje kosa?

Šta su oni (dugo, kratko, ravno, valovito);

Kakav je oblik lica (round, ovalni).

"Moje ime"

Target: igra pomaže zapamtiti imena svojih drugova, izaziva pozitivne emocije i formira osjećaj jedinstva grupe.

Sadržaj: djeca sjede krug. Domaćin bira jedno dijete, ostali smišljaju ljubazne izvedenice u njegovo ime. Tada dijete kaže koje ime mu je bilo najdraže čuti. Stoga smišljaju imena za svako dijete. Nadalje, voditeljica govori o tome da imena rastu s djecom. “Kad porasteš, i tvoje će ime rasti i puniti se, zvati ćeš se imenom i patronimom. Riječ "patronim" došlo od reči "otac", dato je po imenu oca. Djeca daju svoje ime i prezime.

"radi kao ja"

Target

"Razumi me"

Target: razvoj mašte, izražajni pokreti, grupna kohezija.

"Ja sam u budućnosti"

Target: razvoj grupne kohezije, mašte.

"Mi smo drugačiji"

Target: igra čini da osjećate svoju važnost, izaziva pozitivne emocije, povećava samopoštovanje.

Ko je od nas najviši?

Ko je od nas najniži?

Ko od nas ima najmračniji (svjetlo) kosa?

Ko ima luk itd.

Domaćin rezimira da smo svi različiti, ali svi smo jako dobri, zanimljivi i što je najvažnije - zajedno smo!

Razmotrite set N={1, 2, … , n) agenti. Ako postoji neodređeni parametar u situaciji (pretpostavićemo da je skup opštepoznat), onda struktura svijesti I i(kao sinonim koristićemo termine informaciona struktura i pogledajte hijerarhiju) i agent uključuje sljedeće elemente. Prvo, prezentacija i-ti agent o parametru – označimo ga . Drugo, reprezentacije i-ti agent o reprezentacijama drugih agenata o parametru – označimo ih . Treće, reprezentacije i agent o podnošenju j agent o podnošenju k- agent, označavamo ih sa . itd.

Dakle, struktura svijesti ja i ja-ti agent je dat skupom mogućih vrijednosti oblika , gdje je l prolazi kroz skup nenegativnih cijelih brojeva, , i .

Slično, struktura svijesti o I igri u cjelini - skup vrijednosti, gdje l prolazi kroz skup nenegativnih cijelih brojeva, , i . Ističemo da je struktura svijesti I"nedostupni" za posmatranje agenata, od kojih svaki poznaje samo neki svoj dio (naime - I i).

Dakle, struktura svijesti je beskonačna n- stablo (odnosno, tip strukture je konstantan i jeste n-stablo), čiji vrhovi odgovaraju specifičnoj svijesti o stvarnim i fantomskim agensima.

Refleksna igra G I igra opisana sljedećom torbom zove se:

gdje N- mnogo pravih agenata, X i i-ti agent, - njegova ciljna funkcija, , - skup mogućih vrijednosti neodređenog parametra, ja- struktura svijesti.

Dakle, refleksivna igra je generalizacija pojma igre u normalnom obliku datog torkom , u slučaju kada se svijest o agentima ogleda u hijerarhiji njihovih reprezentacija (informacijska struktura I). U okviru prihvaćene definicije, "klasična" igra u normalnom obliku je poseban slučaj refleksivne igre - igre sa opštim znanjem. U "graničnom" slučaju - kada je stanje prirode opšte poznato - koncept rješenja refleksivne igre predložen u ovom radu (informacijska ravnoteža - vidi dolje) prelazi na Nashovu ravnotežu.

Skup veza između elemenata svijesti agenata može se predstaviti kao stablo (vidi sliku 6.2). U isto vrijeme, struktura svijesti i-th agent je predstavljen podstablom koje izlazi iz vrha .

Da damo važnu napomenu: u ovom predavanju ćemo se ograničiti na razmatranje „tačkaste“ strukture svesti, čije se komponente sastoje samo od elemenata skupa. (Opštiji slučaj je, na primjer, intervalna ili probabilistička svijest.)

Strateška i informativna refleksija. Dakle, refleksivna igra je ona u kojoj znanje igrača nije opštepoznato. Sa stanovišta teorije igara i modela refleksivnog odlučivanja, preporučljivo je odvojiti stratešku i informatičku refleksiju.

Informacijska refleksija- proces i rezultat razmišljanja igrača o tome koje su vrijednosti neizvjesnih parametara, šta njegovi protivnici (drugi igrači) znaju i misle o tim vrijednostima. Istovremeno, sama komponenta "igre" je odsutna, jer igrač ne donosi nikakve odluke.

Drugim riječima, informacijska refleksija se odnosi na agentovu svijest o prirodnoj stvarnosti (kakva je igra) i refleksivnoj stvarnosti (kako drugi vide igru). Refleksija informacija logično prethodi refleksiji nešto drugačije vrste – strateškoj refleksiji.

Strateška refleksija- proces i rezultat igračevog razmišljanja o tome koje principe odlučivanja njegovi protivnici (drugi igrači) koriste u okviru svijesti koju im on pripisuje kao rezultat informativne refleksije. Dakle, refleksija informacija odvija se samo u uslovima nepotpune svesti, a njen rezultat se koristi u donošenju odluka (uključujući i stratešku refleksiju). Strateška refleksija se odvija i u slučaju potpune svijesti, predviđajući odluku igrača da odabere akciju (strategiju). Drugim riječima, informativne i strateške refleksije mogu se proučavati nezavisno, ali se oba odvijaju u uvjetima nepotpune svijesti.

je skup svih mogućih konačnih nizova indeksa iz N;

– unija sa praznim nizom;

je broj indeksa u nizu (za prazan niz se uzima jednak nuli), koji je gore nazvan dužinom indeksnog niza.

Ako - reprezentacija i-ti agent o neodređenom parametru i - reprezentacije i th agenta o sopstvenom predstavljanju, prirodno je pretpostaviti da je . Drugim riječima, i Agent je ispravno informiran o svojim idejama, a također vjeruje da jesu i drugi agenti, itd. Formalno, to znači da aksiom samoinformacije, za koje ćemo dalje pretpostaviti da su zadovoljni:

Ovaj aksiom znači, posebno, da zna za sve takve da , može se jedinstveno pronaći za sve takve da .

Zajedno sa strukturama svijesti I i, , strukture svijesti mogu se razmotriti I ij(struktura svijesti j-th agent u pogledu i-ti agent), Iijk itd. Identificirajući strukturu svijesti sa agentom koji je njome karakteriziran, možemo reći da, uz n pravi agenti ( i-agenti, gdje ) sa strukturama svijesti I i, učestvovati u igri fantomski agenti(-agenti, gdje , ) sa strukturama svijesti . Fantomski agenti, koji postoje u umovima stvarnih agenata, utiču na njihove akcije, o čemu će biti reči u nastavku.

Hajde da definišemo osnovni koncept za dalja razmatranja identiteta struktura svesti.

Strukture svijesti se nazivaju identičan ako su ispunjena dva uslova

1) za bilo koji;

2) posljednji indeksi u nizovima i poklapaju se.

Identitet struktura svijesti ćemo označiti na sljedeći način: .

Prvi od dva uslova u definiciji identiteta struktura je transparentan, dok je drugi zahtevao neko objašnjenje. Činjenica je da ćemo dalje raspravljati o djelovanju -agenta ovisno o njegovoj strukturi svijesti i ciljnoj funkciji fi, koji je upravo određen zadnjim indeksom niza . Stoga je zgodno pretpostaviti da identitet struktura svijesti znači, između ostalog, identitet ciljnih funkcija.

Nazovimo -agenta -subjektivno adekvatno informisani o reprezentacijama -agenta (ili, ukratko, o -agentu), ako

-Subjektivnu adekvatnu svijest -agenta o -agentu ćemo označiti na sljedeći način: .

Koncept identiteta struktura svijesti nam omogućava da odredimo njihovo važno svojstvo – složenost. Imajte na umu da, zajedno sa strukturom I postoji prebrojiv skup struktura, među kojima se, koristeći relaciju identiteta, mogu razlikovati klase parno neidentičnih struktura. Prirodno je prebrojati broj ovih klasa složenost strukture svijesti.

I Ima konačna složenost v=v(I), ako postoji konačan skup parno neidentičnih struktura tako da za bilo koju strukturu postoji struktura identična njoj iz ovog skupa. Ako takav konačni skup ne postoji, reći ćemo da je struktura I ima beskonačnu složenost: .

Nazvat će se struktura svijesti konačne složenosti krajnji(još jednom napominjemo da u ovom slučaju stablo strukture svijesti i dalje ostaje beskonačno). U suprotnom će biti pozvana struktura svijesti beskrajno.

Jasno je da je minimalna moguća složenost strukture svijesti potpuno jednaka broju stvarnih agenata koji učestvuju u igri (podsjetimo da se, prema definiciji identiteta struktura svijesti, razlikuju u parovima za stvarne agente).

Bilo koji skup (konačan ili prebrojiv) parno neidentičnih struktura tako da se svaka struktura identična jednoj od njih naziva osnovu strukture svijesti I.

Ako je struktura svijesti I ima konačnu složenost, tada je moguće odrediti maksimalnu dužinu indeksnog niza tako da se, znajući sve strukture, mogu pronaći sve ostale strukture. Ova dužina, u određenom smislu, karakteriše rang refleksije neophodan da se opiše struktura svesti.

Reći ćemo da je struktura svijesti I, , Ima konačna dubina, ako: . Ako su dva vrha povezana sa dva suprotno usmjerena luka, prikazat ćemo jedan rub sa dvije strelice.

Naglašavamo da graf refleksivne igre odgovara sistemu jednačina (6.6) (tj. definiciji informacione ravnoteže), dok njegovo rješenje možda i ne postoji.

Dakle, grof G I refleksivna igra G I(vidi gore definiciju refleksivne igre), čija informaciona struktura ima konačnu složenost, definirana je na sljedeći način:

1) vrhovi grafa G I odgovaraju stvarnim i fantomskim agentima koji učestvuju u refleksivnoj igri, odnosno parovima neidentičnim strukturama svesti;

2) graf lukovi G I odražavaju međusobnu svijest agenata: ako postoji put od jednog agenta (stvarnog ili fantomskog) do drugog agenta, onda je drugi adekvatno informiran o prvom.

Ako na vrhovima grafa G I predstavljaju predstave odgovarajućeg agenta o stanju prirode, zatim refleksivnu igru G I sa ograničenom strukturom svesti I može se dati kao tuple , gdje N- mnogo pravih agenata, X i- skup dozvoljenih radnji i-th agent, - njegova ciljna funkcija, , G I je graf refleksivne igre.

Imajte na umu da je u mnogim slučajevima zgodnije (i vizuelno) opisati refleksivnu igru u smislu grafa G I, umjesto stabla strukture informacija (pogledajte primjere grafova refleksivnih igara ispod).

Pregledi