Перейти к содержимому

Какие типы файлов можно сжать без потерь

  • автор:

Сжатие без потерь: как это работает

Мы уже разобрались с тем, как оцифровывается звук. Одна из проблем — если качественно его оцифровывать, то нам нужно очень много данных, а это значит большие файлы, большой расход места на диске, дорогие флешки, много трафика в интернете. Хочется, чтобы файлики были поменьше.

Для этого используется сжатие — различные алгоритмы, которые творят с данными свою магию и на выходе получаются данные меньшего объёма.

Сжатие с потерями и без потерь

Есть два принципиальных вида сжатия — с потерями и без.

Сжатие с потерями означает, что в процессе мы лишились части информации. Алгоритмы сжатия с потерями стараются сделать так, чтобы мы потеряли только те данные, которые нам не слишком важны.

Представьте, что сжатие с потерями — это краткий пересказ произведения из школьной программы: школьнику не так важны описания природы и авторский стиль, ему главное сюжет. Краткий пересказ сохранил только важное, но передал это намного быстрее.

Сжатие без потерь — это когда мы уменьшаем размер файла, при этом не теряя в качестве. Для этого используются интересные математические приёмы и кодирование. Главная мысль — чтобы при раскодировании все данные остались на месте.

Алгоритмы сжатия без потерь

Есть два основных варианта: алгоритм Хаффмана или LZW. LZW используется повсеместно, но объяснить его довольно сложно, он неинтуитивный и требует целой лекции. Гораздо приятнее объяснить алгоритм Хаффмана.

Алгоритм Хаффмана берёт файл, разбивает его на фрагменты, с которыми ему удобно работать, а потом смотрит, насколько часто встречается каждый фрагмент. Самые частые слова этот алгоритм обозначает коротким кодом, а самые редкие — кодом подлиннее. Так как самые частые слова занимают теперь гораздо меньше места, то и готовый файл становится меньше.

Но есть и минус: иногда нужно хранить эту таблицу соответствий слов и кода прямо в этом же файле, а она может сама по себе получиться большой. Чаще всего алгоритм Хаффмана применяется для сжатия текстовых файлов и видео без потерь.

Вот пример: берём песню Beyonce — All The Single Ladies. Там есть два таких пассажа:

All the single ladies

All the single ladies

All the single ladies

Now put your hands up

If you like it then you shoulda put a ring on it

If you like it then you shoulda put a ring on it

Don’t be mad once you see that he want it

If you like it then you shoulda put a ring on it

Здесь 281 знак. Мы видим, что некоторые строчки повторяются. Закодируем их:

ТАБЛИЦА СЖАТИЯ

\a\ All the single ladies

\b\ Now put your hands up

\c\ If you like it then you shoulda put a ring on it

\d\ Don’t be mad once you see that he want it

ТЕКСТ ПЕСНИ

Вместе таблицей сжатия этот текст теперь занимает 187 знаков — мы сжали текст почти на треть благодаря тому, что он довольно монотонный.

Сжатие без потерь на примере аудио

В среднем минута несжатого аудио занимает 10 мегабайт. Это довольно много: если у вас, например, часовая запись концерта, то она будет занимать полгигабайта. С другой стороны, в этой записи захвачены все нюансы звука, есть много высоких частот и вообще красота.

Для таких ситуаций используют сжатие без потерь: оно уменьшает файл в 2–3 раза, не искажая звук. Алгоритмы, которые сжимают аудио, называются кодеками. FLAC и Apple Lossless — два популярных кодека для сжатия аудио без потерь.

Сравните сами размер и качество двухминутного аудио:

Оригинал — без сжатия, формат WAV, 23 мегабайта

Сжатие без потерь — формат FLAC с теми же параметрами, что и WAV, 10 мегабайт

Где ещё применяется сжатие без потерь

В архиваторах. Задача программ-архиваторов — упаковать выбранные файлы так, чтобы архив занимал как можно меньше места, при этом не повреждая то, что внутри. Например, текстовая версия «Войны и мира» может занимать 4 мегабайта, а заархивированная — 100 килобайт, в 40 раз меньше.

В программировании. Есть специальные упаковщики, которые берут готовую программу и оптимизируют код так, чтобы он занимал меньше места, но сохранил свою работоспособность. Например:

  • Удаляют комментарии
  • Сокращают до минимума названия переменных и функций
  • Удаляют символы, которые нужны были человеку для удобочитаемости

Что дальше

В следующей части разберём, как работает сжатие с потерями и почему благодаря этому у нас есть ТикТок и Ютуб.

Алгоритмы — основа разработки

Изучите алгоритмы, чтобы легко проходить ИТ-собеседования и делать более совершенный софт. Старт — бесплатно. После обучения — помощь с трудоустройством.

Алгоритмы — основа разработки Алгоритмы — основа разработки Алгоритмы — основа разработки Алгоритмы — основа разработки

Получите ИТ-профессию

В «Яндекс Практикуме» можно стать разработчиком, тестировщиком, аналитиком и менеджером цифровых продуктов. Первая часть обучения всегда бесплатная, чтобы попробовать и найти то, что вам по душе. Дальше — программы трудоустройства.

Сжатие без потерь

Сжатие данных без потерь (англ. Lossless data compression ) — метод сжатия данных: видео, аудио, графики, документов представленных в цифровом виде, при использовании которого закодированные данные могут быть восстановлены с точностью до бита. При этом оригинальные данные полностью восстанавливаются из сжатого состояния. Этот тип сжатия принципиально отличается от сжатия данных с потерями. Для каждого из типов цифровой информации, как правило, существуют свои оптимальные алгоритмы сжатия без потерь.

Сжатие данных без потерь используется во многих приложениях. Например, оно используется во всех файловых архиваторах. Оно также используется как компонент в сжатии с потерями.

Сжатие без потерь используется, когда важна идентичность сжатых данных оригиналу. Обычный пример — исполняемые файлы и исходный код. Некоторые графические файловые форматы, такие как PNG, используют только сжатие без потерь; тогда как другие (TIFF, MNG) или GIF могут использовать сжатие как с потерями, так и без.

Сжатие и комбинаторика

Легко доказывается теорема.

  1. Любой файл длиной не более N байт или оставляет той же длины, или уменьшает.
  2. Существует файл длиной не более N, который уменьшается хотя бы на один байт.

Доказательство. Не ограничивая общности, можно предположить, что уменьшился файл A длины ровно N. Обозначим алфавит как \Sigma. Рассмотрим множество \Sigma^0 \cup \Sigma^1 \cup \ldots \cup \Sigma^<N-1>\cup \< A \>» width=»» height=»» />. В этом множестве <img decoding= Информация Собственная · Взаимная · Энтропия · Условная энтропия · Сложность · Избыточность Единицы измерения Бит · Нат · Ниббл · Хартли · Формула Хартли

Энтропийное сжатие Алгоритм Хаффмана · Адаптивный алгоритм Хаффмана · Алгоритм Шеннона — Фано · Арифметическое кодирование (Интервальное) · Коды Голомба · Дельта · Универсальный код (Элиаса · Фибоначчи)
Словарные методы RLE · Deflate · LZ (LZ77/LZ78 · LZSS · LZW · LZWL · LZO · LZMA · LZX · LZRW · LZJB · LZT)
Прочее RLE · CTW · BWT · MTF · PPM · DMC
Теория Свёртка · PCM · Алиасинг · Дискретизация · Теорема Котельникова
Методы LPC (LAR · LSP) · WLPC · CELP · ACELP · A-закон · μ-закон · MDCT · Преобразование Фурье · Психоакустическая модель
Прочее Компрессор аудиосигнала · Сжатие речи · Полосное кодирование
Термины Цветовое пространство · Пиксель · Субдискретизация насыщенности · Артефакты сжатия
Методы RLE · DPCM · Фрактальный · Вейвлетный · EZW · SPIHT · LP · ДКП · ПКЛ
Прочее Битрейт · Test images · PSNR · Квантование
Термины Характеристики видео · Кадр · Типы кадров · Качество видео
Методы Компенсация движения · ДКП · Квантование · Вейвлетный
Прочее Видеокодек · Rate distortion theory (CBR · ABR · VBR)
  • Сжатие данных
  • Алгоритмы сжатия без потерь

Wikimedia Foundation . 2010 .

  • Кожелух, Леопольд
  • Кожин, Никита

Полезное

Смотреть что такое «Сжатие без потерь» в других словарях:

  • сжатие без потерь — Метод обратимого сжатия, при котором обеспечивается декомпрессия и точное восстановление исходного сигнала теоретически без снижения качества или потери какой либо части информации. В основе большинства современных методов сжатия информации без… … Справочник технического переводчика
  • Сжатие без потерь (математика) — Звук является простой волной, а цифровой сигнал является представлением этой волны. Это достигается запоминанием амплитуды аналогового сигнала множество раз в течение одной секунды. Например, в обыкновенном CD сигнал запоминается 44100 раз за… … Википедия
  • Сжатие звука без потерь — В Википедии … Википедия
  • Сжатие видео — (англ. Video compression) уменьшение количества данных, используемых для представления видеопотока. Сжатие видео позволяет эффективно уменьшать поток, необходимый для передачи видео по каналам радиовещания, уменьшать пространство,… … Википедия
  • Сжатие изображений — Сжатие изображений применение алгоритмов сжатия данных к изображениям, хранящимся в цифровом виде. В результате сжатия уменьшается размер изображения, из за чего уменьшается время передачи изображения по сети и экономится пространство для… … Википедия
  • Сжатие информации — Сжатие информации, компрессия, Шаблон:Англ. data compression алгоритмическое преобразование данных (кодирование), при котором за счет уменьшения их избыточности уменьшается их обьём. Содержание 1 Принципы сжатия информации … Википедия
  • адаптивное сжатие информации без потерь — — [Л.Г.Суменко. Англо русский словарь по информационным технологиям. М.: ГП ЦНИИС, 2003.] Тематики информационные технологии в целом EN adaptive lossless data compressionALDC … Справочник технического переводчика
  • Сжатие аудиоданных — В Википедии … Википедия
  • Сжатие данных — Возможно, эта статья содержит оригинальное исследование. Добавьте ссылки на источники, в противном случае она может быть выставлена на удаление. Дополнительные сведения могут быть на странице обсуждения. (26 мая 2012) … Википедия
  • Сжатие данных с потерями — У этого термина существуют и другие значения, см. Сжатие. Сжатие данных с потерями метод сжатия (компрессии) данных, при использовании которого распакованные данные отличаются от исходных, но степень отличия не является существенной с точки … Википедия
  • Обратная связь: Техподдержка, Реклама на сайте
  • �� Путешествия

Экспорт словарей на сайты, сделанные на PHP,
WordPress, MODx.

  • Пометить текст и поделитьсяИскать в этом же словареИскать синонимы
  • Искать во всех словарях
  • Искать в переводах
  • Искать в ИнтернетеИскать в этой же категории

Сжатие с потерями и сжатие без потерь — что лучше из двух

Сжатие данных — это процедура, при которой размер данных в вашем видео уменьшается без потери информации внутри вашего видео/файла. Сжимая данные вашего файла, размер вашего файла уменьшится и будет иметь небольшой размер. Многие люди используют сжатие данных, когда хотят сэкономить место на своих устройствах или имеют проблемы с загрузкой файлов большого размера на платформу. Существует два типа сжатия данных: сжатие с потерями и сжатие без потерь. Если вы хотите узнать больше об этих двух типах сжатия, читайте этот пост дальше. Ниже вы узнаете сравнение между с потерями против без потерь сжатия.

С потерями против без потерь

  • Часть 1: Что такое сжатие видео/файлов
  • Часть 2: Что такое сжатие с потерями
  • Часть 3: Что такое сжатие без потерь
  • Часть 4: Разница между сжатием с потерями и сжатием без потерь
  • Часть 5: Бонус: как сжимать видео
  • Часть 6: Часто задаваемые вопросы о сжатии с потерями и без потерь

Часть 1. Что такое сжатие видео/файлов

Видео состоит из разных данных для воспроизведения. Видео содержит визуальные данные, аудиоданные, формат аудиокодирования, набор изображений, битрейт, разрешение видео и многое другое. И все это хранится в вашем видео, составляя его размер файла. Существует список недостатков, которые могут повлиять на вас, если у вас есть видеофайл с огромным размером файла. Некоторые недостатки видео большого размера заключаются в том, что оно займет много места на вашем устройстве, вам будет сложно загружать видео на другие платформы (некоторые платформы имеют ограничения на размер файла), а также невозможно отправить видео большого размера по электронной почте.

Есть ли способ сделать большое видео меньше? Ответ на этот вопрос – да. Вы можете использовать процесс сжатия видео, который поможет вам уменьшить размер вашего видео. Сжатие видео — это процесс уменьшения общего количества битов, разрешения или размера вашего видео, чтобы уменьшить его размер. Кроме того, ваш видеофайл иногда теряет некоторые данные при сжатии файла. Тем не менее, как упоминалось выше, существует два типа сжатия: с потерями и без потерь. И в следующей части мы будем постоянно обсуждать сжатие с потерями и без потерь.

Часть 2. Что такое сжатие с потерями?

Сжатие с потерями , данные в вашем видеофайле удаляются и не могут быть восстановлены в исходное состояние после использования этого типа сжатия. Короче говоря, данные в вашем видео удаляются безвозвратно; сжатие с потерями также называется необратимым сжатием. Преимущество сжатия с потерями заключается в том, что потерянные данные незаметны при воспроизведении видео. Но чем больше ваш файл или видео сжато, тем больше будет деградация, в результате чего у вас будет видео низкого качества. И, как следует из названия, сжатие с потерями предполагает потерю информации. Поэтому, когда вы используете этот тип сжатия, ожидайте, что вы потеряете некоторые данные или качество вашего видео. Но преимущество использования метода сжатия с потерями для сжатия ваших файлов заключается в том, что он обеспечивает высокие значения сжатия, что приводит к меньшим размерам файлов. Однако несколько исходных пикселей, звуковых волн или видеокадров вашего видео будут удалены навсегда.

Вы также должны помнить, что чем больше сжатие, тем меньше размер вашего файла; таким образом, он может потерять отличное качество. Кроме того, когда вы используете сжатие с потерями для изображений, вы можете наблюдать потерю качества при их печати. А с точки зрения сжатия аудиофайлов MP3 с использованием методов сжатия с потерями вы услышите огромную разницу в качестве звука.

Вот пример изображения JPEG, сжатого с использованием метода сжатия с потерями.

Сжатие с потерями

Сжатие с потерями не является идеальным типом сжатия для бизнес-данных или текста, который требует идеального восстановления данных.

Часть 3. Что такое сжатие без потерь

Сжатие без потерь — это метод сжатия данных, который можно использовать для уменьшения размера видео. В отличие от сжатия с потерями, после распаковки файла вы можете восстановить или перестроить файл в исходное состояние. Например, его качество останется прежним, если вы сожмете изображение с помощью метода сжатия без потерь. Сжатие без потерь также называется обратимым сжатием, потому что вы можете сжать файл без потери качества и вернуть его в исходный формат. Самым значительным преимуществом использования сжатия данных без потерь является то, что качество вашего файла не будет испорчено.

Но как работает сжатие без потерь? Сжатие без потерь удаляет ненужные метаданные, что приводит к сохранению качества вашего файла. Однако недостатком этого типа сжатия является то, что для поддержания качества после сжатия требуется файл большого размера. Многие люди используют этот метод сжатия, потому что он более удобен при передаче файлов. Если вы хотите отправить видео с огромным размером файла по электронной почте, вы можете использовать сжатие без потерь, чтобы разрешить отправку видео большого размера.

Вот пример сжатого изображения JPEG с использованием сжатия без потерь.

Сжатие без потерь

Часть 4. Разница между сжатием с потерями и сжатием без потерь

Если вам нужна более простая презентация методов сжатия без потерь и сжатия с потерями, мы представим таблицу ниже для более подробного описания двух типов сжатия. Прочитав эту часть, вы узнаете, что более выгодно при сжатии видео, изображений, текста и многого другого.

Без потерь С потерями
Сжимает больше размера Он сжимает размер меньше Он сжимает больший размер файла
Применить на Видео, фотографии, аудио и текст Изображения, аудио и видео
Преимущества Он сохраняет качество вашего видео. Это значительно уменьшает размер файла
Поддерживается многими программами, платформами и плагинами.
Недостатки бонуса без депозита Он имеет меньшую емкость хранения данных Это приводит к потере качества
Вы не можете вернуть исходный размер файла
Степень сжатия Примерно от 1.5:1 до 3:1 Он имеет высокую степень сжатия до 50% от исходного размера файла данных.

Часть 5. Бонус: как сжимать видео

Вы столкнетесь с проблемами загрузки на некоторых платформах, если размер вашего видеофайла. Также практически невозможно отправить видео по электронной почте, если у вас есть видео большого размера. Кроме того, удобнее иметь видео с небольшим размером файла, потому что вы можете сэкономить место в памяти вашего устройства. Но где я могу сжать свои файлы? Вы можете использовать множество приложений для сжатия видео или изображений.

Если вы ищете лучший видеокомпрессор для сжатия ваших видео, мы предоставим его вам.

Tipard Video Converter Ultimate это первоклассное приложение для сжатия видео, доступное бесплатно. Вы можете сжать видео, изменив его размер, разрешение, формат и битрейт. Кроме того, он имеет простой в использовании интерфейс, что делает его удобным инструментом. Он также поддерживает все форматы видео, такие как AVI, MOV, MKV, MP4, VOB, FLV, SWF, WMV, M4V и более 500 форматов. Одним из преимуществ использования этого приложения для сжатия видео является то, что вы можете сжимать любые видео без потерь, а это означает, что при сжатии с помощью Tipard Video Converter Ultimate вам не нужно беспокоиться о качестве вашего видео.

Кроме того, он имеет процесс пакетного сжатия, при котором вы можете сжимать два или более файлов одновременно.

Еще одна замечательная особенность этого инструмента — множество расширенных функций редактирования, включая триммер видео, видео слияние, средство для удаления водяных знаков с видео, реверс видео и многое другое из панели инструментов. Его также можно загрузить на всех мультимедийных платформах, таких как Windows, Mac и Linux. Поэтому, если вы хотите использовать Tipard Video Converter Ultimate для уменьшения размера вашего видео, следуйте приведенным ниже инструкциям.

Шаги по сжатию видео с помощью Tipard Video Converter UItimate:

Шаг 1 Для начала скачайте Tipard Video Converter Ultimate нажав Скачать кнопку ниже для Windows или Mac. Установите приложение на свое устройство, а затем откройте его после установки.

Шаг 2 После открытия приложения перейдите в Ящик для инструментов панель и выберите Видео Компрессор функцию.

Сжать без потерь с потерями

Шаг 3 А затем, нажмите плюс (+) кнопку подписи, чтобы загрузить видео, которое вы хотите сжать. Вы также можете перетащить ваше видео из файлов на рабочем столе для загрузки.

Добавить видео Типард

Шаг 4 В следующем интерфейсе вы увидите, что можете изменить размер, формат и разрешение видео. Но в этом уроке мы изменим размер вашего видео, чтобы сжать его. Нажмите на стрелка вверх / вниз или переместите ползунок до предпочтительного процента, который вы хотите уменьшить.

Отрегулируйте размер

Шаг 5 После уменьшение размера вашего видео, Нажмите Сжимать кнопку в правом нижнем углу интерфейса, чтобы сохранить результат на вашем устройстве.

Кнопка сжатия Сохранить

Часть 6. Часто задаваемые вопросы о сжатии с потерями и без потерь

С потерями лучше, чем без потерь?

Лучше использовать процесс сжатия без потерь, потому что вы можете уменьшить размер видео, сохранив при этом качество. Но если вы предпочитаете процесс сжатия, который обеспечивает лучшее сжатие, используйте сжатие с потерями.

JPG без потерь или с потерями?

Изображения JPG используют формат сжатия с потерями. Тем не менее, вы все равно можете использовать процесс сжатия без потерь, если хотите уменьшить размер фотографии.

MP4 без потерь или с потерями?

MP4 — это формат файла с потерями, что означает, что вы потеряете немного данных и качества при сохранении аудио или видео в формате MP4.

Заключение

Сравнение с потерями против без потерь необходим, когда вы сжимаете файлы. Важно, чтобы вам нужен тип сжатия, который вы используете. Итак, если вы готовы сжимать видео, скачайте Tipard Video Converter Ultimate сейчас.

Размещено от Кенни Кевин в Редактировать видео
Сентябрь 26, 2022 14: 40

Вам могут понравиться эти статьи

КОММЕНТАРИЙ

Нажмите здесь, чтобы присоединиться к обсуждению и поделиться своими комментариями

Главная>Ресурс>Редактировать видео> С потерями против без потерь

Безопасно

Copyright © 2024 Типард Студия. Все права защищены.

Сжатие информации с потерями и без потерь

Еще вчера казалось, что диск размером в один гигабайт — это так много, что даже неясно, чем его заполнить, и уж конечно, каждый про себя думал: был бы у меня гигабайт памяти, я бы перестал «жадничать» и сжимать свою информацию какими-то архиваторами. Но, видимо, мир так устроен, что «свято место пусто не бывает», и как только у нас появляется лишний гигабайт — тут же находится чем его заполнить. Да и сами программы, как известно, становятся все более объемными. Так что, видимо, с терабайтами и экзабайтами будет то же самое.

Поэтому, как бы ни росли объемы памяти диска, упаковывать информацию, похоже, не перестанут. Наоборот, по мере того как «места в компьютере» становится все больше, число новых архиваторов увеличивается, при этом их разработчики не просто соревнуются в удобстве интерфейсов, а в первую очередь стремятся упаковать информацию все плотнее и плотнее.

Однако очевидно, что процесс этот не бесконечен. Где лежит этот предел, какие архиваторы доступны сегодня, по каким параметрам они конкурируют между собой, где найти свежий архиватор — вот далеко не полный перечень вопросов, которые освещаются в данной статье. Помимо рассмотрения теоретических вопросов мы сделали подборку архиваторов, которые можно загрузить с нашего диска, чтобы самим убедиться в эффективности той или иной программы и выбрать из них оптимальную — в зависимости от специфики решаемых вами задач.

Совсем немного теории для непрофессионалов

Позволю себе начать эту весьма серьезную тему со старой шутки. Беседуют два пенсионера:

— Вы не могли бы сказать мне номер вашего телефона? — говорит один.

— Вы знаете, — признается второй, — я, к сожалению, точно его не помню.

— Какая жалость, — сокрушается первый, — ну скажите хотя бы приблизительно…

Действительно, ответ поражает своей нелепостью. Совершенно очевидно, что в семизначном наборе цифр достаточно ошибиться в одном символе, чтобы остальная информация стала абсолютно бесполезной. Однако представим себе, что тот же самый телефон написан словами русского языка и, скажем, при передаче этого текста часть букв потеряна — что произойдет в подобном случае? Для наглядности рассмотрим себе конкретный пример: телефонный номер 233 34 44.

Соответственно запись «Двсти трцать три трицть четре сорк чтре», в которой имеется не один, а несколько пропущенных символов, по-прежнему легко читается. Это связано с тем, что наш язык имеет определенную избыточность, которая, с одной стороны, увеличивает длину записи, а с другой — повышает надежность ее передачи. Объясняется это тем, что вероятность появления каждого последующего символа в цифровой записи телефона одинакова, в то время как в тексте, записанном словами русского языка, это не так. Очевидно, например, что твердый знак в русском языке появляется значительно реже, чем, например, буква «а». Более того, некоторые сочетания букв более вероятны, чем другие, а такие, как два твердых знака подряд, невозможны в принципе, и так далее. Зная, какова вероятность появления какой-либо буквы в тексте, и сравнив ее с максимальной, можно установить, насколько экономичен данный способ кодирования (в нашем случае — русский язык).

Еще одно очевидное замечание можно сделать, вернувшись к примеру с телефоном. Для того чтобы запомнить номер, мы часто ищем закономерности в наборе цифр, что, в принципе, также является попыткой сжатия данных. Вполне логично запомнить вышеупомянутый телефон как «два, три тройки, три четверки».

Избыточность естественных языков

Теория информации гласит, что информации в сообщении тем больше, чем больше его энтропия. Для любой системы кодирования можно оценить ее максимальную информационную емкость (Hmax) и действительную энтропию (Н). Тогда случай Н

R = (Hmax — H)/ Hmax

Измерение избыточности естественных языков (тех, на которых мы говорим) дает потрясающие результаты: оказывается, избыточность этих языков составляет около 80%, а это свидетельствует о том, что практически 80% передаваемой с помощью языка информации является избыточной, то есть лишней. Любопытен и тот факт, что показатели избыточности разных языков очень близки. Данная цифра примерно определяет теоретические пределы сжатия текстовых файлов.

Кодирование информации

Факт избыточности свидетельствует о возможностях перехода на иную систему кодирования, которая уменьшила бы избыточность передаваемого сообщения. Говоря о переходе на коды, которые позволяют уменьшить размер сообщения, вводят понятие «коды сжатия». В принципе, кодирование информации может преследовать различные цели:

  • кодирование в целях сжатия сообщения (коды сжатия);
  • кодирование с целью увеличения помехоустойчивости (помехоустойчивые коды);
  • криптографическое кодирование (криптографические коды).

Сжатие с потерями

Говоря о кодах сжатия, различают понятия «сжатие без потерь» и «сжатие с потерями». Очевидно, что когда мы имеем дело с информацией типа «номер телефона», то сжатие такой записи за счет потери части символов не ведет ни к чему хорошему. Тем не менее можно представить целый ряд ситуаций, когда потеря части информации не приводит к потери полезности оставшейся. Сжатие с потерями применяется в основном для графики (JPEG), звука (MP3), видео (MPEG), то есть там, где в силу огромных размеров файлов степень сжатия очень важна, и можно пожертвовать деталями, не существенными для восприятия этой информации человеком. Особые возможности для сжатия информации имеются при компрессии видео. В ряде случаев большая часть изображения передается из кадра в кадр без изменений, что позволяет строить алгоритмы сжатия на основе выборочного отслеживания только части «картинки». В частном случае изображение говорящего человека, не меняющего своего положения, может обновляться только в области лица или даже только рта — то есть в той части, где происходят наиболее быстрые изменения от кадра к кадру.

В целом ряде случаев сжатие графики с потерями, обеспечивая очень высокие степени компрессии, практически незаметно для человека. Так, из трех фотографий, показанных ниже, первая представлена в TIFF-формате (формат без потерь), вторая сохранена в формате JPEG c минимальным параметром сжатия, а третья с максимальным. При этом можно видеть, что последнее изображение занимает почти на два порядка меньший объем, чем первая.Однако методы сжатия с потерями обладают и рядом недостатков.

Первый заключается в том, что компрессия с потерями применима не для всех случаев анализа графической информации. Например, если в результате сжатия изображения на лице изменится форма родинки (но лицо при этом останется полностью узнаваемо), то эта фотография окажется вполне приемлемой, чтобы послать ее по почте знакомым, однако если пересылается фотоснимок легких на медэкспертизу для анализа формы затемнения — это уже совсем другое дело. Кроме того, в случае машинных методов анализа графической информации результаты кодирования с потерей (незаметные для глаз) могут быть «заметны» для машинного анализатора.

Вторая причина заключается в том, что повторная компрессия и декомпрессия с потерями приводят к эффекту накопления погрешностей. Если говорить о степени применимости формата JPEG, то, очевидно, он полезен там, где важен большой коэффициент сжатия при сохранении исходной цветовой глубины. Именно это свойство обусловило широкое применение данного формата в представлении графической информации в Интернете, где скорость отображения файла (его размер) имеет первостепенное значение. Отрицательное свойство формата JPEG — ухудшение качества изображения, что делает практически невозможным его применение в полиграфии, где этот параметр является определяющим.

Теперь перейдем к разговору о сжатии информации без потерь и рассмотрим, какие алгоритмы и программы позволяют осуществлять эту операцию.

Сжатие без потерь

Сжатие, или кодирование, без потерь может применяться для сжатия любой информации, поскольку обеспечивает абсолютно точное восстановление данных после кодирования и декодирования. Сжатие без потерь основано на простом принципе преобразования данных из одной группы символов в другую, более компактную.

Наиболее известны два алгоритма сжатия без потерь: это кодирование Хаффмена (Huffman) и LZW-кодирование (по начальным буквам имен создателей Lempel, Ziv, Welch), которые представляют основные подходы при сжатии информации. Кодирование Хаффмена появилось в начале 50-х; принцип его заключается в уменьшении количества битов, используемых для представления часто встречающихся символов и соответственно в увеличении количества битов, используемых для редко встречающихся символов. Метод LZW кодирует строки символов, анализируя входной поток для построения расширенного алфавита, основанного на строках, которые он обрабатывает. Оба подхода обеспечивают уменьшение избыточной информации во входных данных.

Кодирование Хаффмена

Кодирование Хаффмена [1] — один из наиболее известных методов сжатия данных, который основан на предпосылке, что в избыточной информации некоторые символы используются чаще, чем другие. Как уже упоминалось выше, в русском языке некоторые буквы встречаются с большей вероятностью, чем другие, однако в ASCII-кодах мы используем для представления символов одинаковое количество битов. Логично предположить, что если мы будем использовать меньшее количество битов для часто встречающихся символов и большее для редко встречающихся, то мы сможем сократить избыточность сообщения. Кодирование Хаффмена как раз и основано на связи длины кода символа с вероятностью его появления в тексте.

Статическое кодирование

Статическое кодирование предполагает априорное знание таблицы вероятностей символов. К примеру, если вы сжимаете файл, состоящий из текста, написанного на русском языке, то такая информация может быть получена из предварительного статистического анализа русского языка.

Динамическое кодирование

В том случае, когда вероятности символов входных данных неизвестны, используется динамическое кодирование, при котором данные о вероятности появления тех или иных символов уточняются «на лету» во время чтения входных данных.

LZW-сжатие

Алгоритм LZW [2], предложенный сравнительно недавно (в 1984 году), запатентован и принадлежит фирме Sperry.

LZW-алгоритм основан на идее расширения алфавита, что позволяет использовать дополнительные символы для представления строк обычных символов. Используя, например, вместо 8-битовых ASCII-кодов 9-битовые, вы получаете дополнительные 256 символов. Работа компрессора сводится к построению таблицы, состоящей из строк и соответствующих им кодов. Алгоритм сжатия сводится к следующему: программа прочитывает очередной символ и добавляет его к строке. Если строка уже находится в таблице, чтение продолжается, если нет, данная строка добавляется к таблице строк. Чем больше будет повторяющихся строк, тем сильнее будут сжаты данные. Возвращаясь к примеру с телефоном, можно, проведя весьма упрощенную аналогию, сказать, что, сжимая запись 233 34 44 по LZW-методу, мы придем к введению новых строк — 333 и 444 и, выражая их дополнительными символами, сможем уменьшить длину записи.

Какой же выбрать архиватор?

Наверное, читателю будет интересно узнать, какой же архиватор лучше. Ответ на этот вопрос далеко не однозначен.

Если посмотреть на таблицу, в которой «соревнуются» архиваторы (а сделать это можно как на соответствующем сайте в Интернете [3], так и на нашем CD-ROM), то можно увидеть, что количество программ, принимающих участие в «соревнованиях», превышает сотню. Как же выбрать из этого многообразия необходимый архиватор?

Вполне возможно, что для многих пользователей не последним является вопрос способа распространения программы. Большинство архиваторов распространяются как ShareWare, и некоторые программы ограничивают количество функций для незарегистрированных версий. Есть программы, которые распространяются как FreeWare.

Если вас не волнуют меркантильные соображения, то прежде всего необходимо уяснить, что имеется целый ряд архиваторов, которые оптимизированы на решение конкретных задач. В связи с этим существуют различные виды специализированных тестов, например на сжатие только текстовых файлов или только графических. Так, в частности, Wave Zip в первую очередь умеет сжимать WAV-файлы, а мультимедийный архиватор ERI лучше всех упаковывает TIFF-файлы. Поэтому если вас интересует сжатие какого-то определенного типа файлов, то можно подыскать программу, которая изначально предназначена специально для этого.

Существует тип архиваторов (так называемые Exepackers), которые служат для сжатия исполняемых модулей COM, EXE или DLL. Файл упаковывается таким образом, что при запуске он сам себя распаковывает в памяти «на лету» и далее работает в обычном режиме.

Одними из лучших в данной категории можно назвать программы ASPACK и Petite. Более подробную информацию о программах данного класса, а также соответствующие рейтинги можно найти по адресу [4].

Если же вам нужен архиватор, так сказать, «на все случаи жизни», то оценить, насколько хороша конкретная программа, можно обратившись к тесту, в котором «соревнуются» программы, обрабатывающие различные типы файлов. Просмотреть список архиваторов, участвующих в данном тесте, можно на нашем CD-ROM.

При этом необходимо отметить, что в тестах анализируются лишь количественные параметры, такие как скорость сжатия, коэффициент сжатия и некоторые другие, однако существует еще целый ряд параметров, которые определяют удобство пользования архиваторами. Перечислим некоторые из них.

Поддержка различных форматов

Большинство программ поддерживают один или два формата. Однако некоторые, такие, например, как программа WinAce, поддерживают множество форматов, осуществляя компрессию в форматах ACE, ZIP, LHA, MS-CAB, JAVA JAR и декомпрессию в форматах ACE, ZIP, LHA, MS-CAB, RAR, ARC, ARJ, GZip, TAR, ZOO, JAR.

Умение создавать solid-архивы

Создание solid-архивов — это архивирование, при котором увеличение сжатия возрастает при наличии большого числа одновременно обрабатываемых коротких файлов. Часть архиваторов, например ACB, всегда создают solid-архивы, другие, такие как RAR или 777, предоставляют возможность их создания, а некоторые, например ARJ, этого делать вообще не умеют.

Возможность создавать многотомные архивы

Многотомные архивы необходимы, когда файлы переносятся с компьютера на компьютер с помощью дискет и архив не помещается на одной дискете.

Возможность работы в качестве менеджера архивов

Различные программы в большей или меньшей степени способны вести учет архивам на вашем диске. Некоторые архиваторы, например WinZip, позволяют быстро добраться до любого архивного файла (и до его содержимого), в каком бы месте диска он ни находился.

Возможность парольной защиты

В принципе, архивирование есть разновидность кодирования, и если раскодирование доступно по паролю, то это, естественно, может использоваться как средство ограничения доступа к конфиденциальной информации.

Удобство в работе

Не последним фактором является удобство в работе — наличие продуманного меню, поддержка мыши, оптимальный набор опций, наличие командной строки и т.д. При этом необходимо отметить, что для многих (особенно непрофессионалов) важен фактор привычки. Если вы привыкли работать с определенной программой и вам сообщают, что есть альтернативная программа, которая на каком-либо тесте выигрывает у вашей десять пунктов, — это вполне может означать, что программа-победитель сжимает файлы лишь на 2% лучше, а для вас это не принципиально. При этом вероятно, что эта программа менее удобна в работе и т.д. Однако если вам не хватает именно 2%, чтобы сжать распространяемую вами программу до размера дискеты, то подобный архиватор для вас — находка.

Я отнюдь не сторонник консервативной позиции «раз все работает, то главное — ничего не менять», я лишь подчеркиваю, что переход на новую программу должен быть обоснованным.

  • ПК и комплектующие
    • Настольные ПК и моноблоки
    • Портативные ПК
    • Серверы
    • Материнские платы
    • Корпуса
    • Блоки питания
    • Оперативная память
    • Процессоры
    • Графические адаптеры
    • Жесткие диски и SSD
    • Оптические приводы и носители
    • Звуковые карты
    • ТВ-тюнеры
    • Контроллеры
    • Системы охлаждения ПК
    • Моддинг
    • Аксессуары для ноутбуков
    • Принтеры, сканеры, МФУ
    • Мониторы и проекторы
    • Устройства ввода
    • Внешние накопители
    • Акустические системы, гарнитуры, наушники
    • ИБП
    • Веб-камеры
    • KVM-оборудование
    • Сетевые медиаплееры
    • HTPC и мини-компьютеры
    • ТВ и системы домашнего кинотеатра
    • Технология DLNA
    • Средства управления домашней техникой
    • Планшеты
    • Смартфоны
    • Портативные накопители
    • Электронные ридеры
    • Портативные медиаплееры
    • GPS-навигаторы и трекеры
    • Носимые гаджеты
    • Автомобильные информационно-развлекательные системы
    • Зарядные устройства
    • Аксессуары для мобильных устройств
    • Цифровые фотоаппараты и оптика
    • Видеокамеры
    • Фотоаксессуары
    • Обработка фотографий
    • Монтаж видео
    • Операционные системы
    • Средства разработки
    • Офисные программы
    • Средства тестирования, мониторинга и диагностики
    • Полезные утилиты
    • Графические редакторы
    • Средства 3D-моделирования
    • Веб-браузеры
    • Поисковые системы
    • Социальные сети
    • «Облачные» сервисы
    • Сервисы для обмена сообщениями и конференц-связи
    • Разработка веб-сайтов
    • Мобильный интернет
    • Полезные инструменты
    • Средства защиты от вредоносного ПО
    • Средства управления доступом
    • Защита данных
    • Проводные сети
    • Беспроводные сети
    • Сетевая инфраструктура
    • Сотовая связь
    • IP-телефония
    • NAS-накопители
    • Средства управления сетями
    • Средства удаленного доступа
    • Системная интеграция
    • Проекты в области образования
    • Электронный документооборот
    • «Облачные» сервисы для бизнеса
    • Технологии виртуализации
    1999 1 2 3 4 5 6 7 8 9 10 11 12
    2000 1 2 3 4 5 6 7 8 9 10 11 12
    2001 1 2 3 4 5 6 7 8 9 10 11 12
    2002 1 2 3 4 5 6 7 8 9 10 11 12
    2003 1 2 3 4 5 6 7 8 9 10 11 12
    2004 1 2 3 4 5 6 7 8 9 10 11 12
    2005 1 2 3 4 5 6 7 8 9 10 11 12
    2006 1 2 3 4 5 6 7 8 9 10 11 12
    2007 1 2 3 4 5 6 7 8 9 10 11 12
    2008 1 2 3 4 5 6 7 8 9 10 11 12
    2009 1 2 3 4 5 6 7 8 9 10 11 12
    2010 1 2 3 4 5 6 7 8 9 10 11 12
    2011 1 2 3 4 5 6 7 8 9 10 11 12
    2012 1 2 3 4 5 6 7 8 9 10 11 12
    2013 1 2 3 4 5 6 7 8 9 10 11 12

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *