улог угол
Пермский авиационный техникум им. А.Д. Швецова
Основы теории информации
Одним из широко распространенных видов сервисных программ являются программы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации.

Сжатие информации - это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения.

Сжатие информации в файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Применяются различные алгоритмы подобного сжатия информации.

Алгоритм RLE. В основу алгоритмов RLE положен принцип выявления повторяющихся последовательностей данных и замены их простой структурой, в которой указаны тип данных и коэффициент повтора. Программные реализации алгоритмов RLE отличаются простотой, высокой скоростью работы, но в среднем обеспечивают недостаточное сжатие. Наилучшим объектом для данного алгоритма являются графические файлы, в которых есть большие одноцветные участки изображения, кодируемые длинными последовательностями одинаковых байтов. Для текстовых данных методы RLE, как правило, неэффективны.

Алгоритм KWE. В основу алгоритмов кодирования по ключевым словам заложено кодирование лексических единиц исходного документа группами байт фиксированной длины. Результат кодирования сводится в таблицу, которая прикладывается к результирующему коду и представляет собой словарь. Данный алгоритм наиболее эффективен для англоязычных текстов и файлов баз данных.

Алгоритм Хаффмана. В основе этого алгоритма лежит кодирование байтами, а не битовыми группами. Чем чаще встречается тот или иной символ, тем меньшим количеством битов он кодируется. Образующая в результате кодирования иерархическая структура прикладывается к сжатому документу качестве таблицы соответствия. В связи с тем, что к сжатому архиву необходимо прикладывать таблицу соответствия, на файлах малых размеров алгоритм Хаффмана малоэффективен.

Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл (архив).

Архивный файл - это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.д.

Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос с одного компьютера на другой, сокращает время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа, способствует защите от несанкционированного доступа.

Степень сжатия файлов характеризуется коэффициентом , определяемым как отношение объема сжатого файла к объему исходного файла , выраженное в процентах:

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 - 40 %, меньше сжимаются файлы исполняемых программ и загрузочных модулей - 60 - 90 %. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

Архивация (упаковка) - помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде.

Разархивация (распаковка) - процесс восстановления файлов из архива точно в таком же виде, какой они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память.

Программы, осуществляющие упаковку и распаковку файлов, называются программами - архиваторами. Большие по объему архивные файлы могут быть размещены на нескольких дисках (томах). Такие архивы называются многотомными.

Интерфейс WinRar

Практическое занятие — 9

Тест

угол
Hosted by uCoz