Як математична дисципліна, теорія ігор зародилась одночасно з теорією ймовірностей в 17 столітті, але протягом майже 300 років практично не розвивалась. Першою істотною роботою з теорії ігор слід вважати статтю Дж. фон Неймана «До теорії стратегічних ігор» (1928), а з виходом в світ монографії американських математиків Дж. фон Неймана та О. Моргенштерна «Теорія ігор і економічна поведінка» (1944), теорія ігор сформувалась як самостійна математична дисципліна. На відміну від інших галузей математики, які мають переважно фізичне, або фізико-технологічне походження, теорія ігор із самого початку свого розвитку була направлена на розв'язання задач, які виникають в економіці (а саме в конкурентній економіці)
Вы уже знаете о суперспособностях современного учителя?
Тратить минимум сил на подготовку и проведение уроков.
Быстро и объективно проверять знания учащихся.
Сделать изучение нового материала максимально понятным.
Избавить себя от подбора заданий и их проверки после уроков.
«…Гра — не філософія і не релігія, це особлива дисципліна, за своїм характером вона найближча до мистецтва..»
Г. Гессе «Гра в бісер»
Як математична дисципліна, теорія ігор зародилась одночасно з теорією ймовірностей в 17 столітті, але протягом майже 300 років практично не розвивалась. Першою істотною роботою з теорії ігор слід вважати статтю Дж. фон Неймана «До теорії стратегічних ігор» (1928), а з виходом в світ монографії американських математиків Дж. фон Неймана та О. Моргенштерна «Теорія ігор і економічна поведінка» (1944), теорія ігор сформувалась як самостійна математична дисципліна. На відміну від інших галузей математики, які мають переважно фізичне, або фізико-технологічне походження, теорія ігор із самого початку свого розвитку була направлена на розв'язання задач, які виникають в економіці (а саме в конкурентній економіці) [11].
В подальшому, ідеї, методи і результати теорії ігор почали застосовувати в інших галузях знань, які мають справу з конфліктами: в військовій справі, в питаннях моралі, при вивченні масової поведінки індивідів, які мають різні інтереси (наприклад, в питаннях міграції населення, або при розгляді біологічної боротьби за існування). Теоретико-ігрові методи прийняття оптимальних рішень в умовах невизначеності можуть мати широке застосування в медицині, в економічному і соціальному плануванні і прогнозуванні, в ряді питань науки та техніки. Іноді теорію ігор відносять до математичного апарату кібернетики, або теорії дослідження операцій [2].
Теорія ігор - це теорія математичних моделей прийняття оптимальних рішень в умовах конфлікту. Оскільки сторони, що беруть участь у більшості конфліктів, зацікавлені в тому, щоб приховати від супротивника власні наміри, прийняття рішень в умовах конфлікту, зазвичай, відбувається в умовах невизначеності. Сфера її застосування вже давно вийшла за рамки прикладних наук, і це не лише соціально-політичні науки: теорія ігор застосовується і в побуті, адже вона може стати у пригоді під час прийняття раціонального вибору [1].
Ігри класифікують залежно від обраного критерію: за кількістю гравців, за кількістю стратегій, за властивостями функцій виграшу та за можливостями попередніх переговорів між гравцями.
Залежно від кількості гравців розрізняють ігри з двома, трьома і більше учасниками.
За кількістю стратегій розрізняють:
- скінченні;
- нескінченні ігри.
У скінченних іграх кількість можливих стратегій є числом скінченним (підкидання монети – дві стратегії, підкидання кубика – шість стратегій). Стратегії у скінченних іграх називають чистими стратегіями. В нескінченних іграх кількість стратегій є нескінченною.
За властивостями функцій виграшу (платіжних функцій) теорію ігор поділяють на три види:
1. Гра з нульовою сумою, або антагоністична гра – гра, в якій виграш одного з гравців дорівнює програшу другого;
2. Ігри з постійною різницею – гра, коли гравці виграють і програють одночасно та їм вигідно діяти разом;
3. Гра з ненульовою сумою – це гра, в якій наявні конфлікт та узгоджена дія гравців.
За можливістю попередніх переговорів між гравцями розрізняють кооперативні та некооперативні ігри. Кооперативна гра – це гра, в якій до її початку учасники утворюють коаліції і приймають угоди про свої стратегії. Некооперативна гра – гра, в якій гравці не можуть координувати свої стратегії. Прикладом кооперативної гри може стати ситуація лобіювання у парламенті прийняття рішення зацікавлених у ньому учасників шляхом голосування [8].
«Усе наше життя - це гра…» - ця фраза вже давно відома кожному, і це не просте порівняння. Якщо його розглядати через призму теорії ігор, то так воно і є.
Теорія ігор дозволяє максимально точно розглянути системи суспільних відносин на простих прикладах. Кожні конкурентні чи солідарні відносини усередині суспільства є ускладненими і масштабними варіантами відомих математичних ігор.
Теорія ігор намагається математично зафіксувати поведінку в стратегічних ситуаціях, в яких успіх суб'єкта, що робить вибір залежить від вибору інших учасників.
Основним завданням застосування ігор у людській діяльності є навчання. Вважається, що перші серйозні ігри дорослих людей були військовими іграми, зокрема, військові маневри – це глобальні ігри за особливими правилами, а гра в шахи є предком сучасних імітаційних ігор. Сучасні ділові ігри беруть початок із 1930-х років, коли в колишньому СРСР запроваджувалася наукова організація праці для вирішення складних управлінських завдань. Наприкінці 50-х років ХХ ст. ділові ігри отримали нове народження у США у зв’язку з вирішенням, знову ж таки, військових проблем.
Значення багатьох ігор неочікувано набуває глобальних масштабів і не дозволяє ігнорувати їх соціально-психологічне значення. Наприклад, кубик Рубіка, на думку автора, дає серйозні уроки логіки, вчить людей бути більш обачними, кинувши своєрідний виклик європейській традиції двохвимірного мислення та спілкування, оскільки змусивши дивитися і думати тривимірно: ми повинні постійно враховувати те, що відбувається на зворотному боці.
Вважається, що поєднання навчання та гри може бути основою нової методології освіти, завдяки якій “людина перестає бути каторжником, прикованим до парти”, а Homo Ludens (людина граюча), що живе в кожному з нас, сприятиме відкриттю свого Я у змінюваному світі. [9]
Тому серед найбільш уживаних засобів інтерактивних технологій, які використовуються в освіті, є ігрові технології навчання. Розглядаючи застосування ігрових технологій у навчальному процесі, дослідники називають їх “іграми дорослих” та розглядають як інтерактивні методи навчання [2].
Теорія ігор - теорія індивідуальних раціональних рішень, що приймаються в умовах недостатньої інформації відносно результатів цих рішень. Теорія досліджує взаємодію індивідуальних рішень при деяких припущеннях, що стосуються прийняття рішень в умовах ризику, загальних умов довкілля, кооперативної або некооперативної поведінки інших індивідів. У той час, як традиційна мікроекономічна теорія пропонує теорію прийняття рішень в умовах визначеності, очевидно, що раціональному індивіду припадає приймати рішення в умовах невизначеності і взаємодії.
В підручниках зазвичай розглядається «дилема в’язня » й точка рівноваги по Нешу. Хотілося б більш детально зупинитися на «дилемі в’язня», тим більше, що в контексті появи синергетичної методології її розв´язання виглядає все більше ірраціональним та підпорядкованим не скільки економіко - соціологічній моделі, а моделі математичної теорії гри.
У теорії ігор дилема в'язня (ДВ) - гра з ненульовою сумою, в якій гравці прагнуть одержати вигоду, співпрацюючи один з одним або зраджуючи. Як у всій теорії ігор, передбачається, що гравець («в'язень») максимізує свій власний виграш, не піклуючись про вигоду інших [3].
У задачі дилеми ув’язнених існує два рівноважних розв’язання. Перше, якщо обидва не зізнаються та їх відпускають, називається Парето-ефективне рішення. Таке рішення максимізує корисність обох сторін. Друге, коли обидва зізнаються, називається рівновагою за Нешем. У цьому випадку жоден з гравців не може покращити свій виграш, змінюючи одноосібно власне рішення. Рівновага за Нешем — це ситуація, коли стратегія кожного з гравців є найкращою реакцією на дії іншого гравця.
Тобто для кожного з двох гравців в «дилемі в’язня» стратегія щиросердного зізнання строго домінує над стратегією мовчання. Поняття соціальної субоптимальності тісно пов´язане з дилемою ув´язнених, бо інтерактивна ситуація субоптимальна, якщо її єдиний рівноважний результат парето - субоптимальний, тобто такий, що має інший результат, який кращий для кожного учасника, але цей другий результат, на жаль, нерівноважний, і тому нестабільний, тобто практично недосяжний. «Дилема ув´язнених» - приклад соціальної субоптимальності. Дії людей визначає не сама ситуація, а її переформування в свідомості діяча. Це відноситься й до субоптимальних ситуацій взагалі, й до «дилеми ув´язнених зокрема».
Теорія ігор є одним з математичних інструментів. Оскільки дилема характеризує такі ситуації, коли двом гравцям потрібно співпрацювати, але при цьому існує дуже сильний стимул зрадити один одного, то її застосування набуває поширення у політиці, при дослідженні економіки та інших соціальних науках [4].
Якщо до умов гри «дилема в’язня» додати додаткову умову: відміну у банді злочинців неминучого покарання за співпрацю зі слідством, то як мають себе повести наші гравці? Все буде залежати від того, наскільки вони проінформовані про результати зборів у банді щодо покарання за співпрацю. Ускладнивши ситуацію тим, що дізнатися про це вони можуть або ж обидва, або жоден з них, А.Л.Блінов назвав цю гру «добрий вартовий», яка відрізняється від гри «дилема в’язня» + «покарання за співпрацю» тим, що невідома умова щодо покарання може бути знята. «Невідома умова» - це двочлен інформаційної множини, яка може бути прибрана тоді, коли стане відомо, що покарання за співпрацю зі слідством більше немає. Тобто маємо гру, яка починається з того, що двоє в’язнів мають одночасно зробити вибір між двома опціями: грати їм далі в гру «дилема в’язня» + «покарання за співпрацю» + «невідома умова» або ж в гру «дилема в’язня» + «покарання за співпрацю» без умови щодо зняття покарання . Якщо один з них відмовиться від інформації щодо умови про покарання, то вони обидва гратимуть в гру типу . Головне питання гри «добрий вартовий» полягає в тому, який має бути раціональний вибір кожного з в’язнів:
1) в тому, щоб дізнатися про результати зборів щодо покарання за зраду товариша;
2) в тому, щоб відмовитися від допомоги вартового? Для цього потрібно сформулювати питання про раціональність вибору відносно якої цілі буде йти мова; відносно епістемічної мети отримати якомога більше знання чи відносно всієї множини цілей гравця [7].
І тут ми можемо бачити, що кожен з двох в’язнів віддає знанню хоч і позитивну цінність, але значно меншу, ніж цінність свободи або життя. Тому раціональний вибір щодо епістемічної цілі отримати знання вказує на те, щоб прийняти пропозицію вартового й дізнатися про результати зборів банди, а раціональний вибір щодо цілі свободи - відмовитися. Вся причина в тому, що якщо обидва гравці не знають про результати зборів, то їх інтегрально - практична раціональність рекомендує їм мовчати й вийти з в´язниці через рік.
Таким чином, в інтерактивній ситуації може статися таке, що непоінформованість, якщо тільки вона поділяється всіма учасниками гри - виявляється не злом, а благом тоді, коли будуть прийняті до уваги всі цілі й цінності гравців. Тут ми і будемо мати конфлікт між поняттями конкретної епістемічної раціональності та інтегрально - практичної раціональності.
Доцільним є також показати, що в цій грі є рівно один Неш - рівноважний результат, який і представляє собою рішення гри. Цей результат є одночасно парето:
- оптимальним, адже мовчання обох призведе до року ув´язнення для кожного. Ця ситуація цікава тим, що вона спростовує нашу інтуїтивну думку, що завжди в будь-якій ситуації знання - це сила. В даній грі знання
- це слабкість, тому інструментально раціонально, але не раціонально з когнітивної точки зору, відмовитися від його отримання. Адже шанси гравців, що покарання за співпрацю зі слідством (отже, за зраду товариша) відмінено 50 із 100, і вони обидва будуть знати, що знаходяться в ситуації «дилеми ув´язнених». Тоді раціональність заставить їх зрадити один одного й просидіти за гратами 9 років. Чому так? Оскільки обидва ув´язнених однаково ідеалізовані та проінформовані щодо зняття покарання, то кожен з них буде розмірковувати приблизно так:
- якщо я співпрацюватиму зі слідством, а товариш мовчатиме, то я вийду зараз же (10: 0), де ситуація все ж таки краща, коли мовчатимемо обидва (1:1),
- якщо я співпрацюватиму, й товариш зробить те саме, то матиму 9 років (9:9), що краще, ніж коли змовчу, бо тоді товариш вийде на свободу, а я отримаю 10 років (0:10), бо 9
Звідси висновок, що мовчати невигідно, бо кожен гравець прагне максимізувати величину власної корисності (що є інструментально раціонально), а не стоїть на сторожі інтересів товариша. Між тим в початковому стані симетричної невизначенності (неповноти знання) раціональність диктує їм мовчати, бо шанси, що покарання не відмінене, достатньо великі. Але на початку гри двоє ув´язнених когнітивно раціональні настільки, наскільки це взагалі доступно людині, і якщо вони застосують всю свою блискучу раціональність до доступних їм обом фактів, то прийдуть висновку, що має місце шанс 1 до 100, що банда зберегла покарання, й 99 до 100, що воно відмінене. Тоді обидва зрадять, бо знатимуть, що знаходяться в ситуації «дилеми ув´язнених»[5].
Якщо брати до уваги всі можливі втілення гри «добрий вартовий», то формальні моделі такого роду здатні пояснити деякі види когнітивної ірраціональності в судженнях людей. І «дилема в’язня» пояснює деякі важливі види інтерактивних ситуацій, які трапляються в повсякденному житті.
Теорією ігор вже давно розроблена модель поведінки гравців в покер. Досить просто провести тут паралель, бо поінформованість в покері не має великого значення для гравців, де елементи блефу та взаємних погроз більш дієві, ніж отримання найбільшої комбінації карт. В теорії ігор для покеру використовується поняття так званого «прийому», тобто недостатньої інформованості гравців один про одного. В цьому випадку «прийом» полягає у відгадуванні намірів супротивника за умови приховування своїх намірів: «прийом» позитивний і «прийом» негативний. Тактика кожного гравця повинна бути дуже гнучкою, і один і той же «прийом» не повинен використовуватися багато разів, інакше вона сама стане «тактикою» і повернеться, як бумеранг до того, хто «в лоб» використовує її. Гравець повинен прагнути модифікувати свою гру згідно реакції свого супротивника, роблячи кожного разу найбільш вдалий для даної ситуації вибір: звідси відбувається ймовірність ймовірності.
Оскар Моргенштерн дав приклад вдалого вибору з невдалої самої по собі ситуації на основі одного з розповідей про Шерлока Холмса. Переслідуваний професором Моріарті, той сів в поїзд, що виходив з Лондона до Дувру через Кентербері. Але, сідаючи в поїзд, він помітив, що і Моріарті знаходиться в поїзді. Холмс знав, що, якщо він зійде одночасно з Моріарті, він напевно буде вбитий. Йому потрібно було дістатися до Дувра одному, щоб сісти на пароплав, що слідує через протоку. Така була його мета. Виникають наступні можливі варіанти:
а) Холмс виходить в Дуврі;
б) Холмс виходить в Кентербері;
в) Моріарті виходить в Кентербері;
г) Моріарті виходить в Дуврі.
Підсумком, з погляду Холмса, можуть бути:
1)повний успіх;
2) частковий успіх;
3) поразка.
Ці три результати, з погляду переваг Холмса, послідовно убувають як гідні вибору, останній - найгірший. Система переваг Моріарті протилежна системі Холмса. Відразу очевидна складність вибору через нестачу інформації. Рішення і для Холмса, і для Моріарті - результат випадкового вибору, що грає роль оборонної тактики. Добре підготовлений, кожен насторожено чекає щонайменшого упущення супротивника, щоб негайно перейти в наступ. Але, крім цієї можливої (випадкової) помилки, випадок веде гру. Виходить те, що встановив Дж. фон Нейман. Можна математично виразити гру перед її початком, ввівши імовірнісні переваги кожного з гравців.
Але можна і не володіти всіма даними ситуації. Такий випадок гри в карти, що ґрунтується на припущеннях і недостатній інформації. Таким чином, тут доводиться обирати серед множини ситуацій, чий результат відомий не повністю. В цьому випадку доводиться створювати гіпотези ймовірних результатів. Вибір в такій ситуації вводить нас, у свою чергу, в черговий потік ймовірностей. Хід такої гри: від ймовірності до ймовірності. Роблячи можливі припущення, складну ймовірність можна обчислювати з простішої ймовірності за формулою умовної ймовірності. Таким чином математично давно пояснено як мають себе вести кожен з ув´язнених в нашій дилемі ув´язнених , щоб досягти якнайкращого результату для себе. Якщо ж врахувати їх інструментальну та когнітивну раціональність, які б були доповнені моделлю ірраціональної дії, то, мабуть, ми отримали б ідеалізовану, але успішно працюючу модель раціональної поведінки в умовах конкуренції ринкових відносин. Доцільність використання старої моделі дилеми ув´язнених як інтерактивної ситуації та її доречність, як прикладу, в економічній теорії, на думку автора, читач визначить сам [10].
Також мною була в якості практичного прикладу ігор розглянута взаємодія «викладач - ПТНЗ». Вона полягає в тому, що:
1) викладач здійснює діяльність з виконання навчального процесу (підготовку до проведення аудиторних занять, учбово-методичних матеріалів, організацію самостійної роботи студентів, наукову діяльність тощо) і одержує за це оплату від ПТНЗ;
2) ПТНЗ одержує прибутки, продаючи працю викладача (тому що сам викладач продати «прямо» її не може).
Отже, ми продемонстрували хибність методу раціональної дії, адже в повсякденному житті досить рідко трапляються ситуації, коли такий метод є доцільним. На «допомогу» раціональності може прийти не радикально, але суттєво інша ірраціональність, як це було показано на прикладі «дилеми ув´язнених». Поінформованість, якій занадто, на думку автора, велику увагу приділяють економісти, не завжди виявляється благом, адже поняття дезінформації, яке заполонило наше теперішнє суспільство, ніхто не відміняв. На майбутнє автором буде детально розроблена «модель ірраціональної дії», в основі якої лежатимуть основні принципи математичної теорії ігор, але диференційовані синергетично параметром порядку й управляючим параметром, який так і не змогли ввести економісти, бо не володіли достатньою математичною теоретичною базою, і який не захотіли ввести математики, бо не побачили в цьому переконливих математичних відкриттів. Головною ж метою статті було зацікавити цією темою і тих, і інших [11].
ДЖЕРЕЛА ТА ЛІТЕРАТУРА
1. Блекуелл Л., Гіршік М.А. Теорія ігор і статистичних рішень. - М.: Іноземна література. 1958.
2. Венцель Е.С. Елементи теорії ігор. -М, 1961
3. Воробйов Н. Н. Енциклопедія кібернетики, , т. 1, ст. 333–334.
4. Нейман Дж., Моргенштерн Э. Теория игр и экономическое поведение. — М.: Наука, 1970. — 708 с.
5. Мак-Кинси Дж. Введение в теорию игр. — М.: ГИФМЛ, 1960. — 420 с.
6. Мулен Э. Теория игр с примерами из математической экономики. — М.: Мир, 1985. — 200 с.
7. Оуэн Г. Теория игр. — М.: Мир, 1971. — 232 с.
8. Шиян А.А. Теорія ігор: основи та застосування в економіці та менеджменті.Навчальний посібник. - Вінниця: ВНТУ, 2009,164 с.