Оренбурзький державний аграрний університет
Кафедра організації виробництва і моделювання економічних систем
реферативно-прикладне дослідження
на тему:
"Практичне застосування теорії ігор "
Оренбург - 2006р.
Зміст
Введення
I. Теоретичні основи методів програмування
1. Динамічне програмування
2. Теорія ігор
3. Мережеве планування і управління
4. Моделювання систем масового обслуговування
II. Практичне застосування теорії ігор в задачах моделювання економічних процесах
Висновок
Список літератури
Введення
Метою даного реферативного дослідження є розгляд рішення задач за допомогою методів: динамічного програмування, теорії ігор, сітьового планування і управління і моделювання систем масового обслуговування. Актуальність даної роботи полягає в тому, що за допомогою цих методів можна полегшити умови праці сучасній людині. У наведеній нижче роботі можна знайти способи вирішення завдань, які часто зустрічаються в нашому ужитку: наприклад, для менеджера підприємства, для бухгалтерів, для відділу споживання і т.д.
Особливе увагу в даній роботі приділено фактору сезонності в економічних процесах, приведення формул і прикладів розрахунків. Деякі моделі присвячені розгляду ряду прикладних задач маркетингу, менеджменту та інших областей управління в економіці: моделювання попиту і споживання, наукове управління запасами, аналітичне моделювання систем масового обслуговування, прийняття рішень на основі теорії ігор.
На моделях пов'язаних з теорією ігор я вирішила зупинитися більш докладно, так як там представлені, на мій погляд, більш актуальні завдання: як зробити так, щоб природа працювала на тебе, а не ти на неї, як отримати набольший вигоду або облік твоїх інтересів конкурентом, або постачальником, який товар краще виробляти і т.д.
I . Теоретичні основи методів програмування
1. Динамічне програмування
Динамічне програмування - один з розділів оптимального програмування, в якому процес прийняття рішення і керування може бути розбитий на окремі етапи (Кроки).
Економічний процес є керованим, якщо можна впливати на хід його розвитку. Під управлінням розуміється сукупність рішень, що приймаються на кожному етапі для рішень, прийнятих на кожному етапі для впливу на хід розвитку процесу. Наприклад, випуск продукції підприємством - управлінський процес. Сукупність рішень прийнятих на початку року (кварталу і т.д.) по забезпеченню підприємства сировиною, заміні обладнання, фінансування і т.д., є управлінням. Необхідно організувати випуск продукції так, щоб прийняті рішення на окремих етапах сприяли отриманню максимально можливого обсягу продукції або прибутку.
Динамічне програмування дозволяє звести одну складну задачу з багатьма змінними ко багатьом завданням з малим числом змінних. Це значно скорочує обсяг обчислень і прискорює процес прийняття управлінського рішення.
При вирішенні задачі цим методом процес вирішення розчленовується на етапи, які вирішуються послідовно у часі і призводять, у кінцевому рахунку, до шуканого рішенням. Типові особливості багатоетапних (багатокрокових) завдань, що вирішуються методом динамічного програмування, полягають у наступному:
Процес переходу виробничо-економічної системи з одного стану в інший повинен бути марковским (процесом з відсутністю післядії). Це означає, що якщо система знаходиться в деякому стані S n S n , то подальший розвиток процесу залежить тільки від даного стану і не залежить від того, яким шляхом система приведена в цей стан.
Процес триває певне число кроків N. На кожному кроці здійснюється вибір одного управління u n , під впливом, якого система переходить з одного стану S n в інше S n +1 : S < sup> n S n +1 . Оскільки процес марківський, то S n = u n (S n ) залежить тільки від поточного стану.
Кожен крок (вибір чергового рішення) пов'язаний з певним ефектом, який залежить від поточного зі стояння і прийнятого рішення: (S n , S n ).
Загальний ефект (дохід) за N кроків складається з доходів на окремих кроках, тобто критерій оптимальності дол дружин бути адитивним (або приводиться до нього).
Потрібно знайти таке рішення u n для кожного кроку (n = 1, 2, 3, ..., N), тобто послідовність (u 1 , ..., u N ), щоб отримати максимальний ефект (дохід) за N кроків.
В відміну від лінійного програмування, у якому симплексний метод є універсальним методом вирішення, в динамічному програмуванні такого універсального методу не існує. Одним з основних методів динамічного програмування є метод рекурентних співвідношень, який грунтується на використанні принципу оптимальності, розробленого американським математиком Р. Беллманом. Принцип полягає в тому, що, які б не були початковий стан на будь-якому кроці і керування, вибране на цьому кроці, подальші управління повинні вибиратися оптимальними щодо стану, до якого прийде система в кінці даного кроку. Використання даного принципу гарантує, що управління, вибране на будь-якому кроці; не локально краще, а краще з точки зору процесу в цілому.
В деяких завданнях, розв'язуваних методом динамічного програмування, процес управління розбивається на кроки. При розподілі на кілька років ресурсів діяльності підприємства кроком доцільно вважати часовий період; при розподілі коштів між підприємствами - номер чергового підприємства. В інших завданнях розбиття на кроки вводиться штучно. Наприклад, безперервний керований процес можна розглядати як дискретний, умовно розбивши, його на тимчасові відрізки (кроки). Виходячи з умов кожної конкретної задачі, довжину кроку вибирають таким чином, щоб на кожному кроці отримати просту задачу оптимізації та забезпечити необхідну точність обчислень.
Будь можлива допустима послідовність рішень (u 1 , ..., u N ) називається стратегією управління . Стратегія управління, доставляє максимум критерію оптимальності, називається оптимальної .
В основі загальної концепції методу ДП лежить принцип оптимальності Беллмана :
Оптимальна стратегія має таку властивість, що незалежно від того, яким чином система опинилася в розглянутому конкретному стані, подальші рішення повинні складати оптимальну стратегію, прив'язували до цього стану. Математично цей принцип записується у вигляді рекурентного співвідношення ДП (РДП):
,
де - всі допустимі управління за умови, що система знаходиться в стані S n ;
(S n , S n ) - ефект від прийняття рішення u n ;
- ефект за решту n кроків.
Завдяки принципом оптимальності вдається при подальших переходах випробовувати не всі можливі варіанти, лише оптимальні виходи. РДП дозволяють замінити трудомістке обчислення оптимуму по N перемінним у вихідній задачі рішенням N задач, в кожній з яких оптимум годиться лише по одній змінній.
Є дуже багато практично важливих завдань, які ставляться і вирішуються як завдання ДП (Завдання про заміну обладнання, про ранці, розподілу ресурсів і т.д.)
В Як приклад побудови РДП розглянемо використання принципу оптимальності для реалізації математичної моделі задачі оптимального розподілу деякого ресурсу в обсязі х:
де x j - кількість ресурсу, що використовується j-м способом;
- дохід від засто...