Проблемы, связанные с продуктивным распределением и систематизированием больших потоков информации. Основные виды распределенных баз данных, анализ процессов их функционирования. Стратегии распределения данных. Распределение сетевого справочника данных.
Аннотация к работе
В настоящее время, имеются проблемы, которые связаны с продуктивным распределением и систематизированием больших потоков информации. Для устранения таких проблем требуется внедрение распределенных систем баз данных. Создание такой базы предоставляет множество преимуществ, таких как снижение времени отклика системы, повышение надежности хранения данных, уменьшение затрат на оборудование. Распределенные базы данных позволяют работать удаленным пользователям с огромным количеством информации в наиболее удобной для них форме. Ведущей причиной создания систем, которые используют базы данных, является готовность объединения всех обрабатываемых на предприятии данных в единое целое и обеспечения контролируемого к ним доступа.Распределенная база данных - это база данных, включающая в себя части из некоторого количества информационных баз данных, которые расположены на разных узлах сети компьютеров и при этом регулируемые разными системами управления баз данных [9]. База данных, которая расположена на одном из узлов, представляется неотделимым компонентом распределенной системы. Независимость узлов - каждый узел системы равноправен и независим от другого, а базы внутри этих узлов представляются равноправными производителями данных в единое для них пространство данных. База данных на любом из узлов сети является самодостаточной, так как включает в себя полный словарь данных и при этом она ограждена от неутвержденного доступа. распределенная база поток информация Пользователь, который обращается к базе данных, может и не знать действительного расположения данных в узлах данной системы.При использовании однородных систем управления базами данных не обнаруживается никаких проблем, связанных с моделью данных, языком запросов или какими-либо пользовательскими средствами. Но также следует определиться, нужно ли работать всем пользователям с сетевой системой управления базы данных или пользователям, запрашивающим данные, которые содержатся в локальном узле, нужно напрямую сотрудничать с локальной системой управления. Если база данных образовалась из нескольких независящих ранее друг от друга баз данных, тогда применяется неоднородная система управления базами данных. В данном случае для исполнителя очень важно добиться прозрачности доступа, но это не значит лишь осуществления доступа к удаленным системам управления базами данных и их базам данных. При использовании неоднородной системы управления базой данных так происходит только в том случае, если локальная система управления, тоже является "прозрачной" и пользователю не требуется быть в курсе того, какой локальной системой управления выполняется запрос.Все изменения базы данных постепенно собираются в специальном файле изменений, который именуется дифференциальным файлом. Для реализации операции выборки необходимо заблаговременно обратиться к дифференциальному файлу, который является наиболее результативным средством для доступа к самому последнему состоянию базы данных. В том случае, когда дифференциальный файл приобретает внушительные размеры, происходит преобразование, в ходе которого все изменения, хранимые в дифференциальном файле, регистрируются базой данных. Таким образом, возникает новое поколение базы данных, а в дифференциальный файл, который к этому моменты является пустым, вновь записываются различные изменения. В таком случае система обращается к записям с помощью уникального идентификатора, а каждая ссылка на данные осуществляется через индекс базы данных, который адресует все записи."Клиент-сервер" - это вид распределенной системы, имеющей сервер, который выполняет запросы клиента, при этом сервер и клиент взаимодействуют друг с другом, используя тот или иной протокол. Клиент представляет собой программу, использующую, а под сервером программа подразумевается программа, которая обслуживает запросы клиентов на получение определенных ресурсов. Для распределения обязанностей между сервером и клиентом при осуществлении запросов к базам данных имеется два подхода. Ели применять технологию файлового сервера, то когда клиент осуществляет запрос, сервер в ответ передает ему нужные для запроса файлы. В технологии "клиент-сервер" сервер выполняет сортировку данных для ответа на запрос, а до клиента уже доходит лишь только результат, то есть он получает только те данные, которые он запрашивал (рис 1).В ходе формирования базы данных определяются характерные черты реализуемой стратегий распределения данных. Централизация (существует единственная копия базы данных, которая размещается в одном узле), 2. Дублирование (существует некоторое количество копий базы данных, при этом во всех узлах имеется полная копия всех данных), 4. Стратегия дублирования рассчитывает существование во всех узлах целой копии базы данных и все эти копии должны обслуживаться слаженно для гарантии их полноты и целостности. Достоинства такой стратегии распределения состоят в увеличении объема базы данных; изза того, что многие запросы удовлетворяется локальными базами,
План
Содержание
Введение
1. Теоретическое описание баз данных
1.1 Определение и характеристики распределенных систем баз данных
1.2 Однородные и неоднородные базы данных
1.3 Дифференциальные файлы
2. Распределение баз данных
2.1 Архитектура распределенных СУБД
2.2 Стратегии распределения данных
2.3 Распределение сетевого справочника данных
2.4 Основы проектирования распределенной базы данных
Заключение
Список использованных источников
Введение
Актуальность исследования. В настоящее время, имеются проблемы, которые связаны с продуктивным распределением и систематизированием больших потоков информации. Для устранения таких проблем требуется внедрение распределенных систем баз данных. В частности распределенная обработка информации является самой результативной для оптимизации использования ресурсов и упрощения работы пользователя.
По большей части пользователь запрашивает только ту информацию, которая необходима ему на данный момент. Для этого наиболее эффективно перемещать определенную долю базы данных как можно ближе к пользователю. Таким образом, формируется регионально распределенная база данных. Создание такой базы предоставляет множество преимуществ, таких как снижение времени отклика системы, повышение надежности хранения данных, уменьшение затрат на оборудование.
Распределенные базы данных позволяют работать удаленным пользователям с огромным количеством информации в наиболее удобной для них форме. Ведущей причиной создания систем, которые используют базы данных, является готовность объединения всех обрабатываемых на предприятии данных в единое целое и обеспечения контролируемого к ним доступа. Формирование распределенных баз данных дает возможность разработать общедоступные данные, поддерживаемые любым из существующих подразделений предприятия, обеспечив их хранение именно в тех местах, где они требуются [8]. Данный прием повышает возможность одновременного потребления информации, при этом увеличивая продуктивность доступа к нужным данным и обеспечивая большие возможности по управлению сложных многоуровневых и многозвенных объектов и процессов.
Именно распределенная система баз данных осуществляет обеспечение средствами слияния локальных баз данных, находящихся в определенных узлах вычислительной сети, с тем, чтобы пользователь, который работает в каком-то узле сети, располагал доступом ко всем существующим базам данных как к единой базе данных.
Объектом исследования являются распределенные базы данных.
Предметом исследования является изучение видов распределенных баз данных, а также процессы их функционирования.
Цель работы состоит в исследовании и анализе распределенных баз данных, а также распределенных систем баз данных.
Основываясь на поставленной цели, можно выделить следующие задачи исследования: 1. определить понятия распределенных баз данных и системы управления базой данных;
2. проанализировать реализацию систем распределенных баз данных;
3. изучить основы проектирования распределенных баз данных.
Структура исследования. Данная работа состоит из введения, 2 глав, 7 параграфов, заключения и списка литературы. Основное содержание работы изложено на _____ страницах. Список литературы состоит из 22 источников.