Понятие баз данных. Технологии управления информацией. Основные компоненты хранилища данных и виды. Структура хранения данных, подходящая ГУМФ. Порядок обработки данных в ходе работы модуля "Загрузка данных". Функциональные модули хранилища данных.
Аннотация к работе
Тема: «Универсальное хранилище данных для ГУМФ»Если считать, что в распоряжении аналитика имеется только традиционная СУБД, то при выполнении возложенных на него обязанностей он столкнется с рядом проблем: Построение сводных отчетов над нормализованной структурой, как правило, неэффективно: связывание большого числа таблиц в одном запросе выполняется достаточно долго, если объем этих таблиц велик; развернуть данные по любому измерению. Ральф Кинболл (автор концепции хранилищ данных) описывал хранилища данных как «место, где люди могут получить доступ к своим данным». Типичное хранилище данных как правило отличается от реляционной базы данных: 1) Обычная база данных предназначена для того, чтобы помочь пользователям выполнять повседневную работу, тогда как хранилища данных предназначены для принятия решений; 2) Обычная база данных подвержена постоянным изменениям в процессе работы пользователей, а хранилища данных относительно стабильно; данные в нем обновляются согласно расписанию (например, ежечасно, ежедневно, ежемесячно), в идеале, процесс пополнения данными за определенный период времени без изменения прежней информации находящейся уже в хранилище. 3) Обычная база данных чаще всего является источником данных попадающих в хранилище, кроме того хранилище может пополняться за счет внешних источников (например, сжатия данных). Данные следует сохранять в таблицах, причем каждая таблица должна содержать информацию одного типа, тогда достаточно будет обновить конкретные данные только в одном месте, чтобы обновленная информация отображалась во всей базе данных.В деловой или личной сфере часто приходится работать с данными из разных источников, каждый из которых связан с определенным видом деятельности. Microsoft Access объединяет сведения из разных источников в одной реляционной базе данных. Создаваемые формы, запросы и отчеты позволяют быстро и эффективно обновлять данные, получать ответы на вопросы, осуществлять поиск нужных данных, анализировать данные, печатать отчеты, диаграммы и почтовые наклейки. При работе с данными из нескольких таблиц устанавливаются связи между таблицами. Запросы также позволяют обновить или удалить одновременно несколько записей, выполнить встроенные и специальные сообщения.Технологии OLAP плотно взаимодействуют с другими технологиями, такими как: хранилища данных (Data Warehouse) и методы интеллектуальной обработки (Data Mining). В хранилище данных (Data warehouses) содержатся оперативные данные, которые собираются, интегрируются из разных источников. При использовании хранилище данных позволяет значительно повысить скорость получения данных, возможность использования среза и сравнения данных, а так же иметь на выходе непротиворечивые, полные и достоверные данные. Решение "Система корпоративной и обязательной отчетности финансового института на основе единого хранилища данных" РДТЕХ представляет собой не просто хранилище данных, консолидирующее информацию из банковских систем-источников, это комплексное решение, состоящее из набора модулей, каждый из которых обладает определенной функциональностью (см. Таким образом, хранилище данных становится единственным источником для заведомо правильной чистой информации, структурированной в единую типовую банковскую модель, позволяющую использовать данные для всестороннего анализа и формирования аналитической, обязательной и специализированной отчетности банка.