Розгляд питання управління марковськими полями на графах та стану їх околу і рішення в момент часу. Отримання умов існування нерандомізованих стаціонарних стратегій, а також тотожної рівності сталій ціни гри для обох гравців в стохастичній грі на графі.
При дослідженні складних технічних, фізичних і економічних проблем все більше застосування знаходить теорія управління марковськими процесами. В пропонованій дисертаційній роботі вводиться поняття марковського процесу на графі, яке відрізняється оригінальним підходом щодо впорядкування часового аргументу, а саме: кожний наступний стан деякої вершини графа залежить від стану її повного околу в попередній момент часу. Наприклад, якщо простір керувань деякої вершини складається лише з двох станів, то така система може бути описана моделлю Ізінга, достатньо вивченій в статистичній фізиці, а якщо трактувати вершини графа як фірми (або організації), ребра - як їх взаємодію, а множину рішень вершини як множину технологій, то дана задача управління марковським процесом перетворюється в задачу вибору технології деякою фірмою в кожен момент часу (наприклад, на рік) для того, щоб мінімізувати середні затрати в одиницю часу. Мета роботи полягає в розробці та обґрунтуванні моделей управління марковськими процесами на графі, знаходженні достатніх умов існування оптимальних нерандомізованих стаціонарних стратегій для випадків скінченності та нескінченності просторів станів системи та керуючих впливів, для моделі з переходом управління з однієї вершини до іншої, а також достатніх умов існування ціни гри та оптимальних стратегій для ігрової постановки. Уперше був запропонований системний підхід до управління марковськими процесами, який полягає в оригінальному означенні еволюції керованої системи, а саме: наступний стан елемента системи залежить не лише від свого попереднього стану і керування, а й від стану свого околу.У першому розділі досліджується питання про знаходження оптимальних стратегій управління марковськими процесами на графі для критерію мінімізації середніх затрат в одиницю часу за умови скінченності просторів станів кожної з вершин і керуючих впливів серед однорідних марковських нерандомізованих стратегій. Нехай - деякий локально-скінченний граф із множиною вершин і множиною ребер ; - ребро графа, що сполучає вершини та . Назвемо околом вершини множину вершин, що сполучені ребром з вершиною , тобто . Повним околом вершини будемо називати величину , що містить окіл вершини і саму вершину , тобто . Нехай . будемо позначати витрати-ї вершини, якщо і-ю вершиною приймається рішення .У дисертації одержано такі основні результати: Доведено, що оптимальні стратегії в задачі мінімізації функціоналу середніх затрат в одиницю часу для управління марковськими процесами на графі при скінченності просторів значень керуючих впливів і кожної з вершин графа можна вибрати в класі нерандомізованих однорідних марковських стратегій. Отримано достатні умови існування нерандомізованих стаціонарних стратегій і деякі можливості виконання цих достатніх умов в задачі максимізації функціоналу середніх доходів в одиницю часу для управління марковськими процесами на графі при нескінченності просторів значень керуючих впливів і кожної з вершин графа. Отримано достатні умови існування оптимальних нерандомізованих стратегій і тотожної рівності ціни гри сталій для обох гравців в стохастичній грі на графі. Поставлена задача управління марковським процесом на графі за умови, що керування в кожен момент часу може переходити від однієї вершини до іншої (сусідньої), для якої знайдено достатні умови існування нерандомізованих стаціонарних стратегій при критерії якості середніх доходів в одиницю часу. Основним математичним апаратом дослідження марковських процесів прийняття рішень на графі були рівняння Беллмана, теорема Банаха про нерухому точку.
План
ОСНОВНИЙ ЗМІСТ РОБОТИ
Вывод
У дисертації одержано такі основні результати: Доведено, що оптимальні стратегії в задачі мінімізації функціоналу середніх затрат в одиницю часу для управління марковськими процесами на графі при скінченності просторів значень керуючих впливів і кожної з вершин графа можна вибрати в класі нерандомізованих однорідних марковських стратегій.
Отримано достатні умови існування нерандомізованих стаціонарних стратегій і деякі можливості виконання цих достатніх умов в задачі максимізації функціоналу середніх доходів в одиницю часу для управління марковськими процесами на графі при нескінченності просторів значень керуючих впливів і кожної з вершин графа.
Отримано достатні умови існування оптимальних нерандомізованих стратегій і тотожної рівності ціни гри сталій для обох гравців в стохастичній грі на графі.
Поставлена задача управління марковським процесом на графі за умови, що керування в кожен момент часу може переходити від однієї вершини до іншої (сусідньої), для якої знайдено достатні умови існування нерандомізованих стаціонарних стратегій при критерії якості середніх доходів в одиницю часу.
Основним математичним апаратом дослідження марковських процесів прийняття рішень на графі були рівняння Беллмана, теорема Банаха про нерухому точку.
Основні положення дисертації опубліковані в таких працях: Кнопов П.С., Чорней Р.К. Задачи управления марковскими процессами с последействием // Кибернетика и системный анализ. - 1998. - № 3. - С. 61-70.
Чорней Р.К. Задачи управления марковскими процессами с последействием (компактное множество решений) // Кибернетика и системный анализ. - 1999. - № 2. - С. 147-154.
Чорней Р.К. О стохастических играх на графе // Кибернетика и системный анализ. - 1999. - № 5. - С. 138-144.
Knopov P., Chorney R. On some problems of Markov fields control on graphs // XX Int. Seminar on Stability Problems For stochastic Models, Lublin-Naleczov, 5-11 September, 1999. - Lublin: Wydawnictwo Uniwersytetu Marii Curie-Sklodowskiej, 1999. - P. 87.
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы