Сжатие информации в ПК
Государственный комитет России по
высшему образованию
Рязанская Государственная Радиотехническая
Академия
Кафедра ЭВМ
Контрольная работа
тема: Сжатие информации в ПК
Рязань, 2006 г.
1. Основные понятия и
методы сжатия данных
Во многих стадиях
информация, содержащаяся в файлах, избыточна. Для устранения избыточности
используются специальные методы сжатия данных, основанные на поиске в файле
избыточной информации и последующем ее кодировании с целью получения
минимального объема.
Сжатие информации – это процесс преобразования информации,
хранящейся в файле, к виду, при котором уменьшается избыточность в ее
представлении и соответственно требуется меньший объем памяти для хранения; процесс
сокращения количества битов, необходимых для хранения и передачи некоторого
объема информации. [3],[стр. 418]
Существует сжатие без
потерь, когда информация, восстановленная из сжатого сообщения, в
точности соответствует исходной (применяется при обработке текстов, записанных
на естественном или искусственном языках), и сжатие с потерями (необратимое),
когда восстановленная информация только частично соответствует исходной
(применяется при обработке изображений и звука, для цифровой записи аналоговых
сигналов).
Основные способы
сжатия: статистический
и словарный.
При первом каждому
символу присваивается код, основанный на вероятности его появления в тексте.
Высоко вероятные символы получают короткие коды и наоборот. Одним из самых
ранних и широко известных статистических методов является алгоритм Хаффмана,
при котором символы заменяются кодом, состоящим из целого количества битов.
Позднее он был вытеснен арифметическим кодированием, имеющим
схожую с кодом Хаффмана функцию и основанным на идее кодирования символов
дробным числом битов. Арифметическое сжатие может быть использовано в тех
случаях, когда степень сжатия важнее, чем временные затраты на сжатие
информации.
При словарном способе
группы последовательных символов или "фраз" заменяются кодом.
Замененная фраза может быть найдена в некотором словаре. В 1977 году Лемпель
и Зив предложили свою модификацию словарного метода,
отличающуюся от Хаффмановского и арифметического методов в которой сжатие
основано на свойстве "потока символов" иметь повторяющиеся участки. Поток
символов - это исходные данные для сжатия (например текстовый файл,
массив). Основная идея алгоритма Лемпеля и Зива состоит в том, что второе и
последующие вхождения некоторой строки символов в сообщении заменяются ссылкой
на ее первое появление в сообщении.
В последнее время было
показано, что любая практическая схема словарного сжатия может быть сведена к
соответствующей статистической схеме сжатия, и найден общий алгоритм преобразования
словарного метода в статистический. По этому при поиске лучшего сжатия
статистическое кодирование обещает быть наиболее плодотворным, хотя словарные методы
отличаются быстротой.
Одним из наиболее простых
и наглядных является метод сжатия последовательностей одинаковых символов,
не относящийся к названным основным методам.
Метод основан на
представлении последовательности одинаковых символов в виде двух величин K и S, где K -
количество повторяющихся символов, S - код этого символа. Основным недостатком данного метода является то,
что он обеспечивает сжатие лишь в случае, когда в исходном файле основную часть
составляют повторяющиеся символы. В противном случае сжатый файл может занимать
больше места, чем исходный неуплотненный файл. Наиболее эффективно метод сжатия
последовательностей одинаковых символов работает в случае двоичных файлов.
Синтетические алгоритмы.
Рассмотренные выше
алгоритмы в «чистом виде» на практике не применяются из-за того, что
эффективность каждого из них сильно зависит от начальных условий. В связи с
этим, современные средства архивации, используют более сложные алгоритмы,
основанные на комбинации нескольких теоретических методов. Общим принципом в
работе таких «синтетических» алгоритмов является предварительный просмотр и
анализ исходных данных для индивидуальной настройки алгоритма на особенности
обрабатываемого материала. [2],[стр.368]
2. Программы-архиваторы
На основе методов сжатия
данных созданы различные программы, называемые архиваторами или упаковщиками.
Существует много программ-архиваторов, имеющих различные показатели по степени
и времени сжатия. Среди самых известных и часто используемых программ
выделяются следующие: ARJ, PKZIP, RAR, НА и т. д. для DOS и WinARJ,
WinZip, WinRAR, Zip Magic для Windows. Обычно упаковщики осуществляют
сжатие сразу несколькими способами.
Как правило, программы для архивации файлов позволяют
помещать копии файлов на диске в сжатом виде в архивный файл, извлекать файлы
из архива, просматривать оглавление архива и др. В настоящее время архиваторы,
работающие под Windows, вытесняют
конкурентов в основном за счет использования 32-х битной шины данных, более
удобного и интеллектуального интерфейса, расширенных возможностей и более
совершенных алгоритмов сжатия. А также эти программы поддерживают не один, как
раньше, а сразу несколько различных форматов архивных файлов.
Программы-архиваторы позволяют создавать и такие архивы, для
извлечения из которых содержащихся в них файлов не требуются какие-либо
программы, так как сами архивные файлы
Могут содержать программу распаковки. Такие архивные файлы
называются самораспаковывающимися.
Самораспаковывающийся архивный файл – это загрузочный, исполняемый модуль,
который способен к самостоятельной разархивации находящихся в нем файлов без
использования программы-архиватора. [3],[стр. 419]
К базовым функциям, которые выполняют большинство
современных архиваторов, относятся:
- извлечение файлов из архивов;
- создание новых архивов;
- добавление файлов в имеющийся архив;
- создание самораспаковывающихся архивов;
- создание распределенных архивов на носителях малой емкости;
- тестирование целостности структуры архивов;
- полное или частичное восстановление поврежденных архивов;
- защита архивов от
просмотра или несанкционированной модификации. [2],[стр.369]
3. Программа-архиватор WinRAR
Достоинства и основные
возможности WinRAR
WinRAR - 32-битовая версия Windows архиватора RAR - мощное средство, которое позволяет создавать и
управлять архивными файлами.
Достоинства WinRAR:
- интеллектуальный
алгоритм сжатия (глубокий анализ данных, подлежащих сжатию, и др.);
- специальный алгоритм
сжатия для мультимедиа-файлов;
- не архивное управление RAR;
- плотная архивация, которая
может поднять коэффициент сжатия на 10 % -50 % по сравнению с общими методами,
особенно при упаковке большого количества небольших аналогичных файлов (при
этом файлы представляются как непрерывный поток данных).
Возможности WinRAR:
- создание архивов с
различной степенью уплотнения;
- просмотр как архивных,
так и обычных файлов;
- создание многотомных
архивов;
- создание
самораспаковывающихся архивов (в том числе и многотомных);
- восстановление
физически поврежденных архивов.
- возможность работы в двух
режимах: полноэкранного интерактивного интерфейса и интерфейса командной
строки;
- поддержка других типов
архивов, просмотра их содержимого, изменения и преобразования;
- защита архивов паролем.
[3],[стр. 427-428]
Кроме того, WinRAR обладает рядом других возможностей,
таких, например, как шифрование, архивные комментарии, регистрация ошибок и
т.п.
Работа с
программой-архиватором WinRAR
Запуск WinRAR
Для запуска программы WinRAR необходимо. выполнить одно из
следующих действий:
- открыть меню Пуск;
- выбрать Программы / WinRAR.
Архивация
файлов
Для создания архива необходимо сначала выбрать необходимые
файлы и/или директории из списка файлов в основном окне WinRAR, что можно сделать, используя
клавишу Пробел, Shift + клавиши позиционирования или щелкнув
левой кнопкой мыши. Затем, выбрав один или более файлов, нажать Alt-A. После этого появится диалоговое окно, в верхнем поле
Archive которого надо ввести имя и
расположение архивного файла или просто принять предложенное имя. В поле Compression можно выбрать степень уплотнения,
что будет влиять на скорость архивации и размер архивного файла. Следующая
строка Dictionary size дает возможность изменить размер
внутреннего словаря архиватора. Этот параметр также будет влиять на размер
конечного файла. С помощью диалогового поля Volume size можно разбить архивный файл на тома разного размера.
Диалоговый блок Archiving options также
предоставляет возможность изменять некоторые опции архивации, такие как:
- Solid archive / Плотный архив - при этом все файлы
в архиве будут представляться как непрерывный поток данных что позволит
увеличить степень сжатия, но замедлит обращение к файлам внутри архива;
- SFX archive / Самораспаковывающийся архив -
создается ЕХЕ модуль архива;
- Multimedia compression / Мультимедиа-уплотнение - в этом
режиме RAR выполняет интеллектуальный анализ
данных, направленный на улучшение архивации звука, видео и т. п.;
- Put recovery record / Добавление записи восстановления
данных - облегчение
восстановления данных при
их порче или потере;
- Pat authenticity verification / Добавлять проверку достоверности -WinRAR будет помещать в каждом новом и
скорректированном архиве информацию относительно создателя, последнего времени
коррекции и архивного имени;
- Delete files after archiving / Удалять файлы после их архивации -
после перемещения в архив файлы будут удалены.
Можно также добавлять файлы к уже существующему архиву. Для
этого надо выделить архив и нажать Enter (или дважды щелкнуть мышью), после чего Wm-RAR прочитает
архив и отобразит его содержание. Далее можно просто перетаскивать мышью
необходимые файлы из другого окна.
Просмотр
файлов
Для просмотра файла его
необходимо сначала выделить, а затем нажать на кнопку View.
Кнопка View осуществляет возможность
просматривать как архивированные, так и нормальные файлы. Для просмотра могут
использоваться как встроенные средства просмотра, так и другие программы. Если
используется встроенный просмотр, то можно рассматривать несколько файлов
одновременно. При использовании других средств просмотра одновременно можно
смотреть только один файл. Команды встроенных средств просмотра показаны в Таблице
1.
Таблица 1. Команды
встроенных средств просмотра файлов.
Меню/Пункт
|
Вызов
|
Функции
|
AH-F4
|
Выход из просмотра
|
Edit/Copy
|
Ctrl-C
|
Копировать выделенный текст в буфер
|
Edit/Select all
|
Ctrl-A
|
Выделить весь текст
|
Edit/Find
|
Ctrl-F
|
Поиск подстроки в тексте
|
Edit/Find next
|
F3
|
Поиск следующего появления стоки
|
View as Windows
|
Ctrl-W
|
Использовать шрифты Windows
|
View as DOS text
|
Ctrl-D
|
Использовать DOS OEM шрифт
|
Help/View help
|
Fl
|
Вызвать помощь
|
Удаление
файлов
Для удаления файлов из архива или директории необходимо
сначала выделить необходимые файлы, затем нажать кнопку Delete. Однако, если из архива удаляются
все файлы, то и пустой архив будет удален; удаление нельзя применять в
отдельных томах архива.
Извлечение файлов
Для извлечения файлов из
архива сначала нужно войти в архив, что можно сделать двойным щелчком мыши на
его имени в окне WinRAR. В
результате отображается содержание архива. Затем выбираются файлы/директории, которые
должны быть извлечены, и необходимо щелкнуть мышью кнопку Extract на верху окна WinRAR или нажать Alt-W. Если надо извлечь файлы в другую папку, а не в
текущую, необходимо щелкнуть мышью кнопку Extract to specified directory или нажать Alt-E , войти в папку, расположенную в диалоговом блоке, и
щелкнуть Ok.
В течение процесса
извлечения будет отображено окно статистики. При необходимости остановки
процесса извлечения можно нажать кнопку Cancel. По завершении извлечения окно
статистики исчезнет.
Другие
возможности
Кроме рассмотренных выше
кнопок работы с архивами, в верхнем меню оболочки WinRAR также находятся:
а) test archiving files /тестирование файлов архива -
выполняет ложное файловое извлечение для проверки правильности извлечения файлов;
б) add archive comment/добавить к архиву комментарий.
Максимальная длина комментария – 62000 байтов;
в) protect archive from damages/добавление записи восстановления
данных. К архиву может быть добавлена дополнительная, излишняя информация
восстановления. За счет небольшого увеличения в размере архивного файла она
поможет восстановить архивные файлы в случае потери данных;
г) lock archive/запирание архива. Эта команда
предохраняет дальнейшие архивные модификации WinRAR;
д) convert archive to SFX/преобразование архива в
самораспаковывающийся. Эта команда создает self-extract
архив (SFX), который самостоятельно извлекает
содержащиеся в нем файлы (без использования архиватора);
е) show archive information/показ информации об архиве.
Показывается информация об архиве и его содержимом.
Справка
Для получения справки о
работе программы-архиватора WinRAR
необходимо выполнить одно из действий:
- находясь в окне WinRAR, нажать клавишу F1;
- выбрать пункт меню Help/ Contents.
Сжатие файлов, используя метод сжатия последовательностей одинаковых
символов:
а) Исходный файл: “ X=5.2*******Y=5.********C=0.********D=4.” Сжатый файл: “1X1=151.127*1Y1=151.8*1C1=101.8*1D1=141.” No =
40 байт; N = 40 байт; Ксж = No/N = 1.
б) Число: 513 (513 = 10000000012) Исходный файл: Xo = 1000000001 Сжатый файл: X = 1181 No = 10 байт; N = 4 байт; Ксж = No/N = 2,5.
Регистрация:
-
Открыть окно Мой
компьютер;
-
Открыть диск D;
-
Открыть папку INFORM;
-Открыть папку GR440.
Задание 1:
А) В папке GR343 создать две папки с именами DIR1 и DIR2:
-В подменю Файл выбрать
команду Создать, а затем выбрать Папка;
-Ввести имя папки: «Dirl» и нажать клавишу Enter (появится папка с именем Dir1);
-В подменю Файл выбрать
команду Создать, а затем выбрать Папка;
-Ввести имя папки: «Dir2» и нажать клавишу Enter (появится папка с именем Dir2).
Б) В папке DIR1 с помощью редактора Блокнот создать
два текстовых файла: myfilel.txt и myfile2.txt объемом не менее 5 печатных строк:
-Перейти в папку Dir1, щелкнув по ней дважды левой
клавишей мыши (откроется окно папки Dir1);
-В подменю Файл выбрать команду
Создать , а затем выбрать тип создаваемого файла – текстовый документ;
-Ввести имя нового файла:
«myfile1» и нажать клавишу Enter (в паке Dir1появится текстовый документ с именем myfile1.txt);
-Открыть файл myfile1.txt, щелкнув по нему дважды левой клавишей мыши
(откроется окно текстового редактора);
-Ввести текст с
клавиатуры;
-В подменю Файл выбрать команду
Сохранить. (Набранный текст сохранен в файле myfile1.txt);
-В подменю Файл выбрать команду
Создать, а затем выбрать тип создаваемого файла – текстовый документ;
-Ввести имя нового файла:
«myfile2» и нажать клавишу Enter (в паке Dir1 появится текстовый документ с именем myfile2.txt);
-Открыть файл myfile2.txt, щелкнув по нему дважды левой клавишей мыши (откроется
окно текстового редактора);
-Ввести текст с
клавиатуры;
-В подменю Файл выбрать команду
Сохранить. (Набранный текст сохранен в файле myfile2.txt).
В) В папке DIR2 создать файл myfile3.txt, также объемом не менее 5 печатных
строк:
-Вернуться в папкуGR440, выбрав в подменю команду Закрыть
(папка Dir1 закроется, и мы окажемся в паке GR440);
-Перейти в папку Dir2, щелкнув по ней дважды левой
клавишей мыши (откроется окно папки Dir2);
-В подменю Файл выбрать команду
Создать , а затем выбрать тип создаваемого файла – текстовый документ;
-Ввести имя нового файла:
«myfile3» и нажать клавишу Enter (в паке Dir2 появится текстовый документ с именем myfile3.txt);
-Открыть файл myfile3.txt, щелкнув по нему дважды левой клавишей мыши
(откроется окно текстового редактора);
-Ввести текст с
клавиатуры;
Задание 2: Запустить программу-архиватор WinRAR.
- Открыть главное меню "Пуск" на панели задач
Windows;
- В разделе "Программы" открывшегося главного меню
выбрать пункт " WinRAR
".
Задание 3: С помощью архиватора WinRAR создать архив- arhivl .гаг, содержащий в себе файлы myfile1.txt и myfile3.txt, используя наилучший (best) метод уплотнения.
-Вернуться в папкуGR440;
-Перейти в папку Dir1, щелкнув по ней дважды левой
клавишей мыши (откроется окно папки Dir1);
-Щелчком левой клавиши
мыши выбрать файл myfile1.txt (файл выделится цветом);
-Вывести диалоговое окно
создания нового архива (Alt+A);
-В открывшемся диалоговом
окне ввести в соответствующее поле имя будущего архива: “arhiv1.rar”;
-В диалоговом окне
выбрать наилучшую (best) степень
сжатия;
-Подтвердить действия, нажав
Enter (архив с именем arhiv1.rar появится в паке Dir1);
-Открыть папку Dir2, щелкнув по ней дважды левой
клавишей мыши (откроется окно папки Dir2);
-Перетащить файл myfile3.txt на окно, открытого в WinRar, архива arhiv1;
-В открывшемся диалоговом
окне выбрать наилучшую (best)
степень сжатья;
-Подтвердить добавление
нового файла к архиву arhiv1.rar, нажав клавишу Enter (в архиве arhiv.rar
появится новый файл myfile3.txt).
Задание 4: Добавить в существующий файл arhivl .гаг файл myfile2.txt.
-Открыть папку Dir1, щелкнув по ней дважды левой
клавишей мыши (откроется окно папки Dir1);
-Перетащить файл myfile1.txt на окно, открытого в WinRar, архива arhiv1;
-В открывшемся диалоговом
окне выбрать наилучшую (best)
степень сжатья;
-Подтвердить добавление
нового файла к архиву arhiv1.rar, нажав клавишу Enter (в архиве arhiv.rar
появится новый файл myfile2.txt).
Задание5: Удалить из архива файл myfilel.txt.
-Щелчком левой клавиши мыши выделить в архиве файл myfile1.txt (файл выделится цветом);
-Нажать кнопку Delete;
-Подтвердить удаление,
нажав клавишу Enter (файл myfile1.txt
будет удален из архива arhiv1.rar).
Задание 6: Создать архив arhiv2.rar, содержащий в себе файлы myfile2.txt и myfile3.txt, используя нормальную степень сжатия (normal).
-Перейти в папку Dir1;
-Щелчком левой клавиши мыши выделить файл myfile2.txt (файл выделится цветом);
-Вывести диалоговое окно
создания нового архива (Alt+A);
-Ввести в соответствующее
поле имя будущего архива: “arhiv2.rar”;
-В диалоговом окне
выбрать нормальную (normal) степень
сжатия;
-Подтвердить действия,
нажав Enter (архив с именем arhiv2.rar появится в паке Dir1);
-Открыть папку Dir2;
-Перетащить файл myfile3.txt на окно, открытого в WinRar, архива arhiv2.rar;
-В открывшемся диалоговом
окне выбрать наилучшую (best)
степень сжатья;
-Подтвердить добавление
нового файла к архиву arhiv2.rar, нажав клавишу Enter (в архиве arhiv.rar
появится новый файл myfile3.txt).
Задание 7: Преобразовать файл myfile2.txt
архива arhivl.гаг в SFX архив.
-Открыть архив arhivl.гаг;
-Щелчком левой клавиши мыши выделить файл myfile2.txt (файл выделится цветом);
-Преобразовать архив в SFX (Alt+X);
-Подтвердить действия,
нажав Enter.
Задание 8:Создать архив arhiv3.rar из файлов myfile1.txt и myfile2.txt.
-Выбрать файлы myfile1.txt , myfile2.txt (это можно сделать выделяя их
поочередно с зажатой клавишей Ctrl);
-Вывести диалоговое окно
создания нового архива (Alt+A);
-Ввести в соответствующее
поле имя будущего архива: “arhiv3.rar”;
-Подтвердить действия,
нажав Enter (архив с именем arhiv3.rar появится в паке Dir1);
Задание 9: Преобразовать аrhivЗ.гаг в самораспаковывающийся
архив.
-Выбрать arhive3.rar (архив выделится цветом);
-Преобразовать архив в SFX (Alt+X);
-Подтвердить действия,
нажав Enter.
Задание10: Из файла arhiv2.rar файл myfile2.txt
распаковать в папку Dir2, а файл myfile3.txt удалить.
-Перейти в архив arhiv2.rar;
-Выбрать файл myfile2.txt (файл выделится цветом);
-Извлечь данные из архива
(Alt+E);
-Выбрать папку Dir2, в которую будут извлечены файлы;
-Подтвердить действия,
нажав Enter;
-Выбрать файл myfile3.txt (файл выделится цветом);
-Нажать кнопку Delete;
-Подтвердить удаление,
нажав клавишу Enter (файл myfile3.txt
будет удален из архива arhiv2.rar).
Список использованной литературы
сжатие архиватор winrar преобразование
1) Информатика, ч.I: Методические указания к
лабораторным работам / Сост. Н. И. Иопа – Рязань: РГРТА 2002.
2) Информатика. Базовый курс / С. В.
Симонович и др. СПб.: Питер 2001, стр.368-369.
3) Информатика: Учебник/ Под ред. проф.
Макаровой. 3-е изд. М.: Финансы и статистика, 2001, стр. 418-419, 427-428.
Размещено на