Прогнозирование количества и классов солнечных вспышек на основе их предыстории по данным репозитория UCI с применением автоматизированного системно-когнитивного анализа и интеллектуальной системы "Эйдос" - Статья
Характеристика создания в среде системы "Эйдос" интеллектуального приложения, предназначенного для прогнозирования количества солнечных вспышек разных классов на основе предыстории их развития. Особенность использования базы данных репозитория UCI.
Аннотация к работе
ПРОГНОЗИРОВАНИЕ КОЛИЧЕСТВА И КЛАССОВ СОЛНЕЧНЫХ ВСПЫШЕК НА ОСНОВЕ ИХ ПРЕДЫСТОРИИ ПО ДАННЫМ РЕПОЗИТОРИЯ UCI С ПРИМЕНЕНИЕМ АСК-АНАЛИЗА И ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ «ЭЙДОС»Так как существует множество альтернатив систем искусственного интеллекта, то возникает необходимость оценки качества математических моделей этих систем. В работах [1, 2, 17] рассматривалось решение этой задачи для оценки качества модели, реализованной в универсальной автоматизированной системе «Эйдос», представляющей собой программный инструментарий автоматизированного системно-когнитивного анализа (АСК-анализ) [3, 4]. Удачным выбором является база данных тестовых задач для систем искусственного интеллекта репозитария «Репозиторий UCI (UCI Machine Learning Repository) - крупнейший репозиторий реальных и модельных задач машинного обучения.В данной работе использована база данных "Solar Flare Data Set ": из банка исходных данных по задачам искусственного интеллекта - репозитария UCI, который создан, развивается и поддерживается сотрудниками Школы информатики и компьютерных исследований Калифорнийского университета США.Для решения задачи используем стандартные возможности Microsoft Office Word и Excel, а также систему искусственного интеллекта "Эйдос-Х ".Измерительные шкалы - это инструмент создания формальных моделей реальных объектов, а так же и инструмент, который позволяет повысить степень формализации этих моделей до такого уровня, при котором возможна их реализация на компьютерах [9]. Чем выше степень формализации модели, тем точнее решаются различные задачи с использованием этих моделей, тем проще использовать модели для проектирования различных систем и их создания, а также тем более точные и развитые математические методы могут применяться в этих моделях. Однако если разные факторы измеряются в различных единицах измерения, то результат сравнения объектов будет зависеть от единиц измерения факторов, что недопустимо. В АСК-анализе все они рассматриваются с единой точки зрения: сколько информации содержится в их значениях о переходе объекта, на который они действуют, в определенное состояние, при этом направление влияния и сила значений факторов измеряется в одних общих для факторов единицах измерения (единицах количества информации).Преобразование исходных данных из промежуточных файлов MS Excel в базы данных системы "Эйдос". Из банка исходных данных по задачам искусственного интеллекта - репозитария UCI получаем исходную информацию по базе данных "Solar Flare Data Set ", которую оставим без изменений [5]. The second section (flare.data2) has had much more error correction applied to the it, and has consequently been treated as more reliable. Number of Instances: flare.data1: 323, flare.data2: 1066 Поскольку ввод исходных данных в систему «Эйдос» планируется осуществить с помощью ее универсального программного интерфейса импорта данных из внешних баз данных, который работает с файлами MS Excel, то преобразуем данные из html-файла в xls-файл, для чего выполним следующие операции.В результате выполнения режима 3.5 созданы все модели, со всеми частными критериями, перечисленные на рисунке 11, но ниже мы приведем лишь некоторые из них (таблицы 5, 6, 7). Рассмотрим решение задачи идентификации на примере модели INF1, в которой рассчитано количество информации по А.Харкевичу, которое мы получаем о принадлежности идентифицируемого объекта к каждому из классов, если знаем, что у этого объекта есть некоторый признак. INF1, частный критерий: количество знаний по А.Харкевичу, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу. Относительная частота того, что если у объекта j-го класса обнаружен признак, то это i-й признак Относительная частота того, что если предъявлен объект j-го класса, то у него будет обнаружен i-й признак.Для любой из моделей системой «Эйдос» рассчитывается ценность градации описательной шкалы, т.е. признака, для идентификации или прогнозирования. Для этого в системе «Эйдос» используется 2 аддитивных интегральных критерия: «Сумма знаний» и «Семантический резонанс знаний». Интегральный критерий «Семантический резонанс знаний» представляет собой суммарное количество знаний, содержащееся в системе факторов различной природы, характеризующих сам объект управления, управляющие факторы и окружающую среду, о переходе объекта в будущие целевые или нежелательные состояния. вектор состояния распознаваемого объекта, включающий все виды факторов, характеризующих сам объект, управляющие воздействия и окружающую среду (массив-локатор), т.е.: В текущей версии системы «Эйдос-Х » значения координат вектора состояния распознаваемого объекта принимались равными либо 0, если признака нет, или n, если он присутствует у объекта с интенсивностью n, т.е. представлен n раз (например, буква «о» в слове «молоко» представлена 3 раза, а буква «м» - один раз).
План
Содержание
1. Краткая теория
1.1 Проблематика
1.2 Исходные данные
1.3 Инструментарий
1.4 Метризация шкал
2. Синтез и верификация моделей
2.1 Описание решения
2.2 Преобразование исходных данных из HTML-формата в файл исходных данных MS Excel
2.3 Этапы АСК-анализа и преобразование исходных данных в информацию, а ее в знания в системе "Эйдос"
2.4 Скачивание и инсталляция системы «Эйдос»
2.5 Автоматизированная формализация предметной области путем импорта исходных данных из внешних баз данных в систему "Эйдос"
2.6 Синтез и верификация статистических и интеллектуальных моделей
2.7 Частные критерии и виды моделей системы «Эйдос»
2.8 Ценность описательных шкал и градаций для решения задач идентификации и прогнозирования
2.9 Интегральные критерии системы «Эйдос»
2.10 Результаты верификации моделей
3. Решение задач идентификации и прогнозирования в наиболее достоверной модели
4. Исследование моделируемой предметной области путем исследования ее модели