Створення інформаційної технології для одержання інтерпретованих прогнозних моделей на основі нечітких правил, отриманих за допомогою еволюційних методів. Описання комплексу апаратних засобів, мінімально необхідних для функціонування технології.
Аннотация к работе
В галузі розробки інформаційних технологій, що забезпечують підтримку прийняття рішень, актуальною є задача прогнозування процесу, що аналізується. Аналізу, моделюванню й прогнозуванню процесів різної природи, у тому числі й за допомогою методів штучного інтелекту (генетичних алгоритмів, нечіткої логіки, нейронних мереж) приділялася велика увага в роботах Д. Така задача, як виділення факторів, що впливають на поводження схожих часових рядів в умовах нечітко заданої інформації в них, визначення ступеня впливу цих факторів обмежує застосування статистичних методів у прогнозуванні й вимагає розробки методів, основаних на методах штучного інтелекту. Робота виконувалася відповідно до науково-дослідних робіт: Н-3-07 «Розробка наукових основ побудови компютерних систем технічної й медичної діагностики», Д-11-04 «Розробка й дослідження нейромережевих і еволюційних методів побудови систем прийняття рішень», № ДР 0104U002394, а також Д-11-07 «Розробка й дослідження еволюційних і нейромережевих моделей, методів і алгоритмів у системах діагностики й прогнозування», № ДР 0107U001482. Методами досліджень дисертаційної роботи є методи теорії ймовірностей і математичної статистики (із застосуванням у модифікації кроку настроювання імовірнісного вектора компактного генетичного алгоритму); відбору факторів впливу (під час визначення ефективності застосування для попередньої обробки даних); методи теорії еволюційних алгоритмів (під час створення й настроювання бази знань для прогнозування на основі набору продукцій; під час застосування для відбору факторів впливу); методи створення продукційних баз знань (настроюваних за допомогою еволюційних алгоритмів, із застосуванням у прогнозуванні); нейронних мереж (для одного з методів одержання прогнозу, з яким виконувалося порівняння); нечіткої логіки (для створення бази знань на основі нечіткого набору правил); програмування й оптимізації (для розробки програмного продукту).У першому розділі «Аналіз інтерпретованих методів прогнозування часових рядів, визначення етапів процесу видобування знань» наведено аналіз задачі прогнозування кількості підключень абонентів до АТС, досліджено програмні продукти, здатні вирішити цю задачу. Необхідно виконати побудову системи нечіткого висновку таким чином, щоб виконувалася мінімізація двох критеріїв: критерію точності системи (AC(FRSN)) і критерію інтерпретованості (IC(FRSN)): , (2) де FRSN - нечіткий висновок, визначений як результат прийняття рішення системою нечіткого висновку на основі бази нечітких правил і значення вхідних змінних; Математичне забезпечення інформаційної технології необхідно створювати на основі створення системи нечіткого висновку (fuzzy rule-based system, FRBS): , де LV - множина з n вхідних і однієї вихідної лінгвістичних змінних; R - множина із npr правил бази правил; T - t-норма для оцінки ступеня істинності підвисновку правил і для процедури активізації; I - стратегія імплікації; T - t-конорма для оцінки вихідної функції належності і визначення процедури акумуляції; DE - стратегія дефазифікації. Для створення бази знань, що містить набір нечітких правил, головною мірою інтерпретованості є компактність - мінімізація кількості правил і кількості підумов у них. Параметричний синтез складається з визначення лінгвістичної бази даних і створення бази правил, і виконується еволюційним алгоритмом.Розроблене математичне забезпечення інформаційної технології дозволило підвищити точність та інтерпретованість одержуваного прогнозу за рахунок створення бази знань на основі нечітких правил, що настроюють за допомогою еволюційного алгоритму. Дана база знань допомагає підвищити обґрунтованість прийняття рішень про подальший розвиток АТС у тому числі особам, які не володіють спеціальними математичними знаннями, що підтверджується актом про впровадження. У процесі проведення досліджень були отримані такі основні результати: Розроблено послідовність створення інформаційної технології для виділення знань (одержання бази знань на основі нечітких правил) у задачах прогнозування часових рядів, що регламентує процес її створення. Послідовність містить 7 основних етапів: попередня обробка даних, структурний та параметричний синтез системи нечіткого висновку, постпроцесинг створених правил (перші 4 етапи становлять математичне забезпечення розробленої технології), створення програмного забезпечення, розробка технічного й організаційного забезпечення і впровадження інформаційної технології. Модифікація основана на визначенні залежності величини зміни імовірнісного вектора від ступеня вірогідності порівняння міри оцінки підмножин атрибутів, і дозволила істотно скоротити час пошуку (на різних задачах до 90.6%).
План
ОСНОВНИЙ ЗМІСТ РОБОТИ
Вывод
У дисертаційній роботі вирішено актуальну наукову задачу створення інформаційної технології для прогнозування часових рядів на прикладі прогнозування кількості підключень до АТС, що використовується для визначення завантаженості обладнання звязку. Розроблене математичне забезпечення інформаційної технології дозволило підвищити точність та інтерпретованість одержуваного прогнозу за рахунок створення бази знань на основі нечітких правил, що настроюють за допомогою еволюційного алгоритму. Дана база знань допомагає підвищити обґрунтованість прийняття рішень про подальший розвиток АТС у тому числі особам, які не володіють спеціальними математичними знаннями, що підтверджується актом про впровадження.
У процесі проведення досліджень були отримані такі основні результати: Розроблено послідовність створення інформаційної технології для виділення знань (одержання бази знань на основі нечітких правил) у задачах прогнозування часових рядів, що регламентує процес її створення. Послідовність містить 7 основних етапів: попередня обробка даних, структурний та параметричний синтез системи нечіткого висновку, постпроцесинг створених правил (перші 4 етапи становлять математичне забезпечення розробленої технології), створення програмного забезпечення, розробка технічного й організаційного забезпечення і впровадження інформаційної технології. Для параметричної ідентифікації й постпроцесингу впроваджується еволюційний алгоритм створення й настроювання правил бази знань.
Для вирішення задачі відбору факторів використано компактний генетичний алгоритм, що відрізняється простотою реалізації при конгруентних із класичними ГА результатами. Для умови стохастичності оцінки набору факторів модифіковано крок зміни імовірнісного вектора КГА. Модифікація основана на визначенні залежності величини зміни імовірнісного вектора від ступеня вірогідності порівняння міри оцінки підмножин атрибутів, і дозволила істотно скоротити час пошуку (на різних задачах до 90.6%).
Набув подальшого розвитку метод побудови фітнес-функцій еволюційних алгоритмів. Як основну точністну складову фітнес-функції нечіткого еволюційного алгоритму вперше використано J-міру. Це дало можливість збільшити точність прогнозування для задач, що вимагають побудови правил вільної семантики, на 7.9-21.7%.
Набув подальшого розвитку метод побудови паралельних еволюційних алгоритмів. Побудовано розподілений еволюційний алгоритм для паралельного обчислення нечітких правил на основі моделі «робітник-хазяїн». На відміну від відомих методів, процес-сервер робить корекцію навчальної вибірки для процесів-клієнтів, що дає кращу настроєність створюваних правил на малоописані області простору пошуку. Експериментально отримано лінійне зростання швидкості створення бази знань при обмеженій кількості клієнтів (4-5).
Модифікація системи нечіткого висновку шляхом заміни алгоритму Мамдані на спрощений алгоритм нечіткого висновку дозволяє збільшити швидкість нечіткого висновку (у порівнянні з алгоритмом Мамдані на 41.8% для тестового набору). Це дозволило застосовувати довільну зі стандартних функцій належності, застосування яких раніше було обчислювально складнішим у звязку з неможливістю аналітичного й складністю чисельного інтегрування.
Вперше для нечітких продукційних систем використано еволюційну стратегію для оптимізації параметрів лінгвістичної бази даних. Оптимізація цих параметрів для настроювання методу побудови нечіткої бази знань на основі довільної функції належності дала можливість на порядок (у 12-16 разів) поліпшити точність прогнозування й досягти точності прогнозування, одержуваної за допомогою НМ, на довільно складних задачах.
Модифіковано фітнес-функцію на етапі постпроцесингу при використанні процедури спільної мультисимпліфікації й зважування. Модифікація дозволила одержувати більш короткі, більш інтерпретовані бази знань за рахунок погіршення точності. Для величини важливості короткості бази знань wl = 0.3 відбулося зростання СКВ від 2,8 до 4,1% при зростанні похибки прогнозування максимум на 0.37% і зменшенні кількості правил на 36.7% для задачі прогнозування кількості підключень до АТС.
За розробленими алгоритмами і спроектованою ієрархією обєктів створено програмне забезпечення інформаційної технології (інструментальні засоби) для автоматизованого одержання баз знань, що містять набори інтерпретованих нечітких правил. За допомогою таких баз знань можуть вирішуватися задачі одержання інтерпретованого прогнозу довільної задачі. Точність отриманого результату може варіюватися залежно від необхідного ступеня інтерпретованості результату. Реалізація програмного забезпечення зроблена з використанням мови Object Pascal.
Розроблено організаційне забезпечення технології: набір технологічних інструкцій, що регламентують виконання технологічних операцій та їх застосування в конкретних умовах. Розроблено технічне забезпечення технології - комплекс апаратних засобів, що дає можливість безперешкодної роботи технології.
Зроблено впровадження створеної системи для вирішення задачі прогнозування. Результати роботи використані для розвязання задачі прогнозування кількості підключень до АТС ВАТ «Промтелеком». Це необхідно для розрахунку окупності капіталовкладень в АТС. Отримана прогнозна модель інтерпретована, що дає можливість керівному персоналу, який не володіє спеціальними математичними знаннями, обґрунтовувати прийняття рішень при розширенні підприємства, що є необхідним при використанні позикових коштів.
Результати роботи використано у держбюджетних темах Н-3-07 (застосовані методи попередньої обробки даних, у тому числі для задач прогнозування); Д-11-04 (застосовано розроблені методи для створення еволюційного алгоритму видобування знань для задач класифікації); Д-11-07 (використано розроблені методи видобування знань у задачах прогнозування); а також у навчальному процесі кафедри «Автоматизовані системи управління» Донецького національного технічного університету.
Список литературы
Хмелевой С.В. Методы повышения и оценки качества обучающей выборки для задач нейросетевого прогнозирования временных рядов/ С.В. Хмелевой // Наукові праці ДОННТУ серія: обчислювальна техніка та автоматизація. Донецк: ДОННТУ. 2006. Вип. 106. С. 87-94.
Хмелевой С.В. Создание и применение базы знаний на основе аппроксимативных нечетких логических контроллеров для прогнозирования internet траффика / С.В. Хмелевой // Наукові праці ДОННТУ Серія: “Обчислювальна техніка та автоматизація”. Донецьк: ДОННТУ. 2007. Випуск 13 (121). С. 132-139.
Хмелевой С.В. Параллельная реализация эволюционного алгоритма для создания базы знаний на основе нечетких логических контроллеров / С.В. Хмелевой // Інформаційно-керуючі системи на залізничному транспорті. 2007. №4 (66). С. 120-123.
Скобцов Ю.А. Генетический подход к прогнозированию цен на подержанные автомобили / Ю.А. Скобцов, С.В. Хмелевой // Вестник Херсонского государственного технического университета. 2004. том 19. С. 212-224.
Скобцов Ю.А. Генетический поход к задачам прогнозирования / Ю.А. Скобцов, С.В. Хмелевой // Наукові праці ДОННТУ Серія: “Обчислювальна техніка та автоматизація”. Донецк: ДОННТУ. 2005. Випуск 90. С. 127-136.
Хмелевой С.В. Некоторые аспекты предварительной обработки данных в задачах нейросетевого прогнозирования и классификации/ Ю.А. Скобцов, С.В. Хмелевой, З.В. Панченко // Вестник Донецкого Национального Университета. Серия А: естественные науки. Донецк: ДОННУ. 2005. №2, Часть 2. С. 381-386.
Скобцов Ю.А. Модификация функции принадлежности аппроксимативных нечетких логических контроллеров, настраиваемых с помощью генетических алгоритмов / Ю.А. Скобцов, С.В. Хмелевой // Вестник Херсонского национального технического университета. 2007. №4 (27). С. 411-420.
Хмелевой С.В. Исследование функций принадлежности нечетких логических контроллеров применительно к задачам аппроксимации, прогнозирования и классификации / С.В. Хмелевой, Ю.А. Скобцов // Вісник Донецького Інституту автомобільного транспорту. Донецьк: ТОВ «Дончанка-інформ». 2007. №4. С. 11-19.
Хмелевой С.В. Инструментальные средства для создания базы знаний на основе нечетких продукций, настраиваемых с помощью генетических алгоритмов. / С.В. Хмелевой, Ю.А. Скобцов, А.М. Фонотов // Сучасні тенденції розвитку інформаційних технологій в науці, освіті та економіці: Матеріали ІІ Всеукраїнської науково-практичної конференції. 8-10 квітня 2008р. М. Луганськ. Луганськ: Альма-матер. 2008. С. 103-105.
Хмелевой С.В. Прогнозирование временных рядов с помощью набора нечетких правил, настраиваемых с помощью генетических алгоритмов / С.В. Хмелевой, А.М. Фонотов, А.А. Теличко // Проблемы информационных технологий. 2008. №2(004). С. 144-154.
Хмелевой С.В. Исследование зависимости эффективности работы нечетких контроллеров от распределения данных в выборке/ С.В. Хмелевой // Материалы 9 международной научно-практической конференции "Системный анализ и информационные технологии". К.: НТУУ "КПИ". 2007. С. 137.
Скобцов Ю.А. Извлечение правил с помощью генетических алгоритмов в задачах классификации / Ю.А. Скобцов, Ю.А. Хмелевой // Интеллектуальные системы принятия решений и прикладные аспекты информационных технологий: материалы научно-практической конференции. Херсон, изд-во Херсонского морского института. 2006. Том 4. С. 204-206.
Скобцов Ю.А. Применение эволюционной стратегии и мультисимплификации при генерации нечетких управляющих правил для прогнозирования internet траффика/ Ю.А. Скобцов, С.В. Хмелевой // Материалы восьмого международного научно-практического семинара «Практика и перспективы развития партнерства в сфере высшей школы». Донецк, ДОННТУ. 2007. Том 3. С. 302-313.
Хмелевой С.В. Модификация генетического алгоритма построения базы знаний на основе нечетких продукций. / С.В. Хмелевой, Ю.А. Скобцов // VIII международная конференция «Интеллектуальный анализ информации ИАИ-2008», Киев, 14-17 мая 2008г.: сб. тр./ ред. кол.: С.В. Сирота (гл. ред.) и др. К.: Просвита. 2008г. 608 с.: ил. С. 531-540.