Разработка программного обеспечения для анализа полученных из хранилища данных. Система SAS Enterprise Miner и система Weka. Расчёт капитальных затрат на создание ПМК для анализа полученных из хранилища данных с использованием библиотеки XELOPES.
Аннотация к работе
В наше время всё большее количество компаний, стремясь к повышению эффективности и прибыльности бизнеса, пользуются цифровыми (автоматизированными) способами обработки данных и записи их в БД. Это несет в себе как огромные преимущества, так и рождает определенные проблемы, связанные с объемами полученных данных, а именно: при колоссальном увеличении объёма полученной информации усложняется её обработка и анализ, делать выводы по полученным данным становится всё сложнее, и вероятность того, что некоторые детали могут быть упущены, неумолимо растет. Данная проблема явилась причиной развития различных подходов и методов, позволяющих проводить автоматический анализ данных. Для решения данных вопросов существуют математические методы, которые и образуют направление Data Mining. Проблема существующих на данный момент программных решений заключается в том что они заточены под конкретное предприятие(на котором были внедрены) и используют лишь несколько методов анализа, необходимым на данном объекте. Результатом работы станет программный продукт - система анализа полученных из хранилищ данных. 1. Таблица 1.1 - Глоссарий предметной области № Термин Определение термина 1 Анализ данных Собирательное название, используемое для обозначения совокупности методов обнаружения в данных Y где Х и Y множества, причем . Поддержкой ассоциативного правила является поддержкой в D. (1.11) Правило называется достоверным, если его достоверность превосходит минимально заданную границу ?, теперь мы можем определить задачу поиска ассоциативных правил (Association Rule Mining): Задано множество элементов I, задана база данных D над I, заданы так же минимальные значения достоверности и поддержки ?,?, необходимо найти: (1.12) Как уже было сказано, одним из условий поставленной задачи является и то, что набор полученных ассоциативных правил должен удовлетворять некоторому заданному шаблону. Уникальность Xelopes заключается в его гибкой архитектуре, состоящей из трех главных частей: мощной и расширяемой библиотеки алгоритмов Data Mining, унифицированного, основанного на открытых стандартах, интерфейса прикладного программирования, а также, использующей стандарт PMML, подсистемы обмена Data Mining моделями. НПАОП 0.03-3.06-80 «Санитарно-гигиенические нормы допустимых уровней ионизации воздуха производственных и общественных помещений» регламентирует уровни ионизации воздуха помещений при работе на ПЭВМ.