Загальні відомості про архівацію даних. Огляд програмних продуктів: пакувальники та архіватори MS DОS, Wіndоws, Lіnux. Ідея словарних методів стиснення інформації (LZ77, Deflаte). Пошук платформонезалежного методу архівації даних, розробка програми.
Аннотация к работе
Розробка платформонезалежної програми архівації данихЗ розвитком науково-технічного прогресу персональні компютери стали збільшуватися та обєми інформації зберігається в них, що у свою чергу це привело до розвитку технологій по зберіганню інформації в стислому виді, тобто в архівах. Архіватори - це програми, що дозволяють створювати та обробляти архівні копії файлів. За допомогою спеціальних алгоритмів стиснення з файлів видаляється уся надмірна інформація, а при застосування зворотних алгоритмів розпаковування архівна копія відновлюється в первинному виді. Більшість програм здебільшого орієнтовані на роботу з архівами у форматі ARJ або ZIP, але, як правило, містять вбудовані засоби (чи допускають підключення зовнішніх модулів) для розпаковування та перегляду та архівів інших типів. Загалом, тести показують, що програми, орієнтовані на формат ARJ (їх, до речі, не так багато), в середньому працюють трохи швидше аналогічних ZIP-архиваторов та до того ж забезпечують більший коефіцієнт стиснення , проте архіватор, несумісний з форматом ZIP, навряд чи можна сьогодні вважати повноцінним інструментом.Архівація даних є процедурою стиснення інформації, що міститься в одному або декількох файлах. Можна автоматизувати багато дій - створення резервної копії диска, архівація починаючи з якоїсь дати, додавання до імені архіву поточної дати (arh970821.arj), архівація файлу з конкретного місця, декілька рівнів стиснення та так далі. Різні функції по обслуговуванню архівів .zip виконуються різними програмами: pkzip - приміщення файлів в архів pkunzip - витягання файлів з архіву zip2exe - створення архіву, що самораспаковивающегося pkzipfix - відновлення пошкодженого архіву. Вивчити довідку по роботі з архіватором pkzip за допомогою команд: pkzip /h pkunzip /h zip2exe /h Коли можливо, кожен файл заміщається файлом з розширенням ".gz ", при цьому зберігаються власник, режими, доступ та часи модифікації (Інші розширення "-gz" для VMS, "z" для MSDOS, OS/2, FAT та Atari).Безвідмовна робота, безліч функцій та підтримка величезної кількості форматів роблять її однієї з найулюбленіших у користувачів практично по всьому світу. Ця програма має унікальний алгоритм стиснення файлів, що забезпечує відмінний результат, коли необхідно заархівувати файли. Також програмі реалізована можливість створення архівів, що самораспаковивающихся, що мають розширення SFX. Такі файли просто потрібні для тих, хто не хоче встановлювати на свій компютер яку-небудь програму архівації, або для установки програми самої архівації. Викачати архіватор WINZIP безкоштовно, який дозволяє створювати архіви, що самораспаковивающиеся, архіви з паролями, архіви з коментарями.У Unix - подібних операційних системах, в т.ч. та в Linux, функції архівації з історичних причин реалізуються окремими програмами: для упаковки використовуються compress, gzip, bzip2, а для архівації - tar. Окрім tar, є ще програми сріо та dump/restore, але їх ми розглядати не будемо. Крім того, в будь-якому з *nix є програма ar, яка хоч та уміє робити архіви з довільних файлів, в першу чергу призначена для створення бібліотек обєктних файлів. Загальні властивості compress, gzip та bzip2 : По-перше, при упаковці та розпаковуванні ці програми "замінюють" початковий файл упакованим/розпакованим таким чином: вони читають вміст початкового файлу та пишуть результат у файл з таким же імям, але з додаванням/видаленням розширення (.Z/.gz/.bz2), а потім видаляють початковий файл. Наприклад, щоб створити архів /tmp/someconfs.tar, що містить файли /етс/fstab та /етс/passwd: tar cf /tmp/someconfs.tar /etc/fstab /etc/passwdТочний звязок між вірогідністю та кодами встановлений в теоремі Шенона про кодування джерела, яка свідчить, що елемент вірогідність появи якого дорівнює , найвигідніше представляти бітами. Якщо при кодуванні розмір кодів завжди в точності виходить рівним бітам, то в цьому випадку довжина закодованої послідовності буде мінімальною для усіх можливих способів кодування. Отже, якщо нам відомий розподіл вірогідності елементів, генерованих джерелом, то ми можемо представити дані найбільш компактним чином, при цьому середня довжина кодів може бути вичислена по формулі (2.1).
План
ЗМІСТ
Вступ
Розділ 1. Загальні відомості про архівацію даних. Огляд програмних продуктів
1.1 Загальні відомості
1.2 Архіватори MS DOS
1.3 Архівація даних в Windows
1.4 Пакувальники та архіватори в Linux
Розділ 2. Огляд методів стиснення інформації
2.1 Загальні відомості
2.2 Ідея словарних методів. Алгоритм LZ77
2.3 Формат Deflate
2.4 Алгоритм словарного стиснення для Deflate
2.5 Алгоритм Хаффмена
Розділ 3. Розробка платформонезалежної програми архівації даних