Симулация на околната среда с електронна таблица
На юнаци, страхливци и други
Проблем: Социалните и икономическите взаимодействия се осъществяват в изключително сложни и едва прозрачни светове. Термини като лоялност, справедливост, смелост, малодушие, агресия, сътрудничество, егоизъм и любов към ближния играят голяма, но трудна за оценка роля.

Цел: Трябва да се изясни кои основни модели определят нашето поведение, каква е същността на споменатите (не) добродетели и каква полза те имат в определен контекст. Този урок предоставя основите на задълбоченото лечение в следващите уроци.
Метод: Взаимодействията се свеждат до основни модели, които могат да бъдат намерени в прости игри. Някои от тези прости игри се играят и анализират с елементарни средства.
Парадокс на теорията на игрите
Двама души и Въпрос: играйте по следните правила: и двете повдигат едновременно два или два пръста; ако общият брой вдигнати пръсти е четен, тогава плаща Въпрос: в , ако е странно, плаща в Въпрос:; Винаги плащате толкова, колкото вдигате пръсти. Матрицата на изплащанията за плащанията, които Въпрос: в трябва да направи, изглежда така:
Очевидно - при условие, че играта се повтаря непрекъснато - има смисъл да оставите другия играч на тъмно за това колко пръсти ще вдигнете. Това може да се постигне например чрез задържане на един и два пръста възможно най-произволно.
На пръв поглед изглежда, че играта е честна: ако възможните комбинации (1, 1), (1, 2), (2, 1), (2, 2) - номерата на престижната скала са в скоби Пръст от играча и играчи Въпрос: - се случват еднакво често, очакването за печалба на всеки от играчите е нула. И все пак играта не е честна, както ще бъде показано след малко. (Фактът, че тази привидно честна игра е несправедлива, се нарича парадокс на теорията на игрите.)
За да проследим несправедливостта, провеждаме малка симулация. Предполагаме, че всеки играч има по един смесена стратегия избирам. Смесената стратегия се определя от вероятността да бъде избран определен ход. Бъда q вероятността за Въпрос: държи един пръст (1 - q е вероятността той да държи два пръста нагоре). плейър избира пръст с вероятността стр.
В таблицата можете да видите избраните стратегии стр и q въведете. Печалбите, които съответният играч ще получи в дългосрочен план (очакваната стойност на печалбите) се появяват в полетата с резултати. Тъй като това е игра с нулева сума, единият губи това, което получава другият. В полетата за въвеждане можете да въведете числа като 0,75, но също и фракции като 3/4 (или общи формули на JavaScript). Тъй като това са вероятности, смисъл имат само стойности от 0 до 1.
Ако играчът Q избере стратегията q = q * = 7/12, играчът P може да прави каквото иска. В дългосрочен план той ще трябва да приеме средна загуба от 1/12 на игра.
С Принцип Minimax Оптималната стратегия може да бъде извлечена от теорията на игрите с нулева сума (von Neumann, 1944): За предпазливия играч най-добрата стратегия е тази, която свежда до минимум неговата максимална загуба (което се случва при оптимална защита) (Szйkely, 1990, стр. 54 и сл.). ) .
Играта с пръсти е a Игра с нулева сума: Това, което единият играч печели, другият губи и обратно. И както видяхме, това зависи от това дали сте линеен играч (P) или колонен играч (Q). Тук няма да се занимаваме с игри с нулева сума.
Играта ястреб-гълъб
Социалното поведение е по-съвместимо с симетрични игри Моделиране: Изплащането на играч в симетрични игри зависи само от неговата стратегия и тази на противника, а не от това дали е играч на редове или колони. Играта ястреб-гълъб е такава симетрична игра.
Да приемем, че имаме популация, която се състои изцяло от гълъби. Винаги, когато се бият, никой не се наранява. Сблъсъците се състоят от продължителни ритуални турнири, може би състезания с втренчен поглед, които спират само когато някой от съперниците отстъпи. След това победителят вкарва 50 точки за спечелване на спорния ресурс, но плаща -10 наказание за загуба на време в дълъг втренчен мач; така че като цяло той получава 40 точки. Загубилият също се наказва с -10 наказание за загуба на време. Средно всеки един гълъб може да очаква да спечели половината от битките и половината да загуби. Следователно средната ви премия за аргумент е средно от +40 и -10, т.е. +15. Следователно всеки един гълъб в популация от гълъби изглежда се справя доста добре. "Допълнителен анализ води до следната матрица на играта за всеки от играчите.