Форматы графических файлов
![]()
Форматы растровой графики
Формат BMP
BMP — (Windows Bitmap) разрабатывался фирмой Microsoft как
совместимый со всеми приложениями Windows.
Это «чистый» растровый формат, где закодирован каждый пиксель,
поэтому из всех растровых форматов это самый «тяжелый» (т.е.
имеющий наибольший информационный объем).
Преимущества: высокое качество изображений
Недостатки: очень большой объем файла, что сильно затрудняет или
делает невозможным его хранение, передачу, особенно в Интернет
Эти два файла (слева и справа (просто белый
фон)) – BMP – рисунки, которые имеют
одинаковый
информационный
объем.
(объем файла не зависит от степени
наполнения рисунка объектами, так как у
обоих рисунков кодируется каждый пиксель).
4. Формат JPEG
Форматы растровой графики
Формат JPEG
JPEG — (Joint Photographic Experts Group) – сжатый особым образом
растровый файл (с потерей качества).
JPEG ищет плавные цветовые переходы, обрабатывая квадратные блоки
со стороной 8 пикселей. Вместо действительных значений JPEG хранит
скорость изменения от пиксела к пикселу. Лишнюю, с его точки
зрения, слабо воспринимаемой человеческим глазом цветовую
информацию он отбрасывает, усредняя некоторые значения. Чем выше
уровень сжатия, тем больше данных отбрасывается и тем ниже
качество. Формат аппаратно независим. В JPEG следует сохранять
только конечный вариант работы, потому что каждое пересохранение
приводит к все новым потерям (отбрасыванию) данных и превращения
исходного изображения в кашу.
Преимущества: высокое качество изображений при небольших размерах
файла (сжатие рисунков
в десятки и сотни раз). Самый
распространенный формат, применяется для хранения фотографий,
размещения полноцветных изображений в Интернет.
Недостатки: не поддерживает прозрачность изображений, возникновение
размытости изображения при сильной степени сжатия.
5. Формат GIF
Форматы растровой графики
Формат GIF
GIF — (Graphics Interchange Format) – создан специально для передачи
изображений в Интернет фирмой CompuServe.
GIF может хранит изображения в режиме индексированных цветов (до
256), т.е. переходя к формату GIF, мы уменьшаем число цветов и
размер файла (в тех случаях, когда простая картинка не требует
миллионов цветов). Сжатие файлов производится путем замены
последовательности одинаковых символов одним, умноженным на
число повторений (алгоритм LZW). Кроме того, файл GIF может
содержать не одну, а несколько растровых картинок, которые
интернетовские браузеры могут подгружать одну за другой с
указанной в файле частотой. Это называется GIF-анимация.
Преимущества: малый размер файла, поддержка прозрачности и
анимации рисунков, самый популярный формат в Интернет
(оформление Web – страниц, баннеры).
Недостатки: основное ограничение использования GIF в малом
количестве воспроизводимых цветов (до 256). Этого явно
недостаточно для полиграфии.
6.
Форматы растровой графики
Пример GIF – анимации:
Рисунок содержит 3 слоя (кадра), в
каждом из которых «горит» один из
цветов. GIF «умеет» поочередно
показывать кадры (слои), создавая
эффект переключения светофора.
Пример чересстрочной загрузки рисунка на Web — странице
GIF позволяет сохранять файлы с использованием
чересстрочной развертки. При использовании этого способа
браузер вначале показывает каждую 8-ую строчку, потом
каждую 4-ую, каждую 2-ую, и, наконец, загружается полное
изображение. При этом посетитель вашей странички сможет
понять, что же нарисовано на данной картинке, не дожидаясь
ее полной загрузки, что очень удобно.
7. Формат PSD
Форматы растровой графики
Формат PSD
Формат PSD является стандартным форматом пакета Adobe Photoshop и
отличается от большинства обычных растровых форматов
возможностью хранения слоев (layers). Формат поддерживает альфаканалы, слои, контуры, прозрачность, векторные надписи и т. п.
Прекрасно подойдет для переноса или хранения изображений,
содержащих специфические, свойственные только Adobe Photoshop,
элементы.
Главный недостаток – аппаратно зависим.
8. Формат TIFF
TIFF (Tagged Image File Format) – аппаратно независимый формат TIFF
на сегодняшний день является одним из самых распространенных и
надежных, его поддерживают практически все программы на РС и
Macintosh так или иначе связанные с графикой. TIFF является лучшим
выбором при импорте растровой графики в векторные программы и
издательские системы. Ему доступен весь диапазон цветовых моделей
от монохромной до RGB, CMYK и дополнительных цветов Pantone.
TIFF может сохранять векторы Photoshop’a, Alpha-каналы для
создания масок в видеоклипах Adobe Premiere и массу других
дополнительных данных. Наибольшие проблемы обычно вызывает
LZW-компрессия, иногда применяемая в TIFF’e. Ряд программ
(например, QuarkXPress 3.x и Adobe Streamline) не умеют читать такие
файлы, кроме того, они могут дольше выводиться на принтеры и
фотонаборные автоматы. Только если файл комрессуется в 3-4 раза,
получается выигрыш во времени вывода.
9. Подведем итоги…
Подведем итоги…
• формат BMP – очень качественная графика, но большой объем файла;
• формат JPEG – наиболее подходящий для хранения качественных
изображений и фотографий, приемлемое соотношение качества и
размера файла;
• формат JPEG обычно используется для рисунков высокого качества,
содержащих тысячи и миллионы цветов (до 16,7 миллионов
оттенков);
• Удобство использования рисунков JPEG заключается в том, что,
изменяя качество рисунка, можно управлять степенью сжатия файла;
• обозреватель способен загружать рисунки в формате JPEG только
линейно, от верхней строки к нижней;
• формат GIF наилучшим образом подходит для изображений, в
которых содержится малое количество разных цветов;
10. Подведем итоги…
Подведем итоги…
• рисунок в формате GIF с чередованием сначала загружается с низким
разрешением, а затем, по мере появления целого рисунка, его
качество постепенно улучшается. Таким образом, пользователь
сможет увидеть суть изображения перед тем, как изображение
появится целиком;
• один из цветов рисунков в формате GIF может быть сделан
прозрачным, чтобы видеть цвет фона текущего окна обозревателя;
• формат файлов TIFF используется в качестве универсального формата
для обмена цифровыми изображениями;
• формат PNG (Portable Network Graphics — переносимая сетевая
графика) является альтернативой формата GIF, но позволяет
сохранять в изображении миллионы цветов;
11. Оптимизация графики
Оптимизация графики
Смысл оптимизации графики – это уменьшение информационного
объема графического файла, особенно для размещения ее в сети
Интернет.
Вспомним, что объем файла зависит от размеров изображения в пикселях
и глубины цвета:
ОБЪЕМ ФАЙЛА (V) = A ×B × I
Поэтому уменьшить объем картинки (оптимизировать) можно
следующими способами:
уменьшение размеров изображения в пикселях (А ×В);
уменьшение глубины цвета I (использование меньшего
количества цветов);
сжатие файла (компрессия) специальными методами,
отбрасывание части цветовой информации, использование GIF
–форматов.
12. Форматы векторной графики
13. CDR
Cdr – расширение проектов CorelDRAW. Тип формата –
закрытый. Хранит векторные объекты, текст, эффекты. Может
состоять из нескольких страниц. Используется в полиграфии,
при
создании
рекламных
макетов,
визиток.
Достоинства: лучше сохраняет в себе параметры и
спецэффекты объектов. Удобен сам программный комплекс –
от сюда и популярность в общем-то нестабильного формата.
Недостатки:
• Изображения, созданные в новых версиях программного
комплекса, не открываются (или некорректно открываются) в
программах
предыдущих
версий.
• Практически несовместим с другими программными
комплексами. В случаи использования конвертеров, файл
«теряет» настройки элементов векторного изображения,
искажается.
Чтобы не было «сюрпризов», открывают и редактируют в
родной программе, без использования конвертера.
14. DXF
Векторный формат DXF поддерживают все программы
автоматизированного проектирования: начиная с пакета
AutoCAD компании Autodesk. Однако из-за его сложности
некоторые приложения «умеют» только читать DXF-файлы и не
способны сохранять данные в этом формате. В DXF
реализованы
многие
возможности,
отсутствующие
в
большинстве других форматов, например хранение трехмерных
объектов.
Необходимо
отметить
наличие
прекрасного
встроенного кодировщика текста.
15. WMF
WMF является аналогом формата PICT в среде Windows и
подходит для хранения векторных и растровых файлов и их
последующего вывода, как на экраны мониторов, так и на
печатающие устройства. Несмотря на то, что формат WMF
разработан для среды Windows, он поддерживается
графическими программами на многих других платформах и
часто используется для обмена данными с Windowsприложениями.
Формат WMF оказывается более удобным, чем, например, EPS,
когда необходимо вставить рисунки в документ, созданный в
текстовом редакторе или программе верстки, а затем вывести
его на экран монитора или распечатать на принтере, не
поддерживающем язык PostScript. К сожалению, формат не
обеспечивает высокое качество для сложных рисунков и имеет
16. PICT
Расширение PICT – это файл изображения в формате Macintosh
PICT, который обычно используется для фотографий. Один из
самых известных форматов PICT – это формат графических
файлов Mac, который используется для отображения на экране
в приложениях для верстки, как промежуточный формат для
передачи файлов между программами. Формат PICT
поддерживает и растровые, и векторные изображения,
использует сжатие RLE (Run-length encoding) и JPEG для
уменьшения размера файла.
Формат PICT поддерживает RGB файлы с одним альфа-каналом и
индексированные цвета, градации серого и растровые файлы
без альфа-каналов. Он не используется для печати
изображений поскольку формат не несет информацию,
необходимую для разделения.
17. Природные фракталы
Фрактал (лат. fractus — дробленый, сломанный, разбитый) —
сложная геометрическая фигура, обладающая свойством
самоподобия, то есть составленная из нескольких частей,
каждая из которых подобна всей фигуре целиком. Во фрактале
один и тот же фрагмент повторяется при каждом уменьшении
масштаба. В последние 20 лет фракталы стали очень
популярны. Природа зачастую создаёт удивительные и
прекрасные фракталы, с идеальной геометрией и такой
гармонией, что просто замираешь от восхищения. От гигантских
гор, до того, что мы кушаем за обедом, везде можно увидеть
идеальную гармонию фракталов. Многие объекты в природе
обладают фрактальными свойствами, например, побережья,
облака, кроны деревьев, морские ракушки, снежинки, молния,
кровеносная система и система альвеол человека или
животных и многое др. Фракталы, особенно на плоскости,
популярны благодаря сочетанию красоты с простотой
построения при помощи компьютера.
Тема 1. Свойства компьютерной графики. Преобразования графических файлов
Расчёт информационного объёма растрового графического изображения (количества информации, содержащейся в графическом изображении) основан на подсчёте количества пикселей в этом изображении и на определении глубины цвета (информационного веса одного пикселя).
Итак, для расчёта информационного объёма растрового графического изображения используется формула V=K*i, где V – это информационный объём растрового графического изображения, измеряющийся в байтах, килобайтах, мегабайтах; K – количество пикселей (точек) в изображении, определяющееся разрешающей способностью носителя информации (экрана монитора, сканера, принтера); i – глубина цвета, которая измеряется в битах на один пиксель.
Изображение с глубиной цвета 24 бит
Глубина цвета задаётся количеством битов, используемым для кодирования цвета точки.
Глубина цвета связана с количеством отображаемых цветов формулой N=2i,
где N – это количество цветов в палитре, i – глубина цвета в битах на один пиксель.
Изображение с глубиной 4 бит, с палитрой 16 цветов
Изображение в палитре «Оттенки серого» имеет глубину цвета 8 бит
Черно-белое (битовое) изображение
Пиксель, как и все данные в компьютере, несет в себе определенную информацию (в данном случае о цвете), выражаемую в битах.
Чем большим количеством бит описывается пиксель, тем больше информации он может в себе нести.
RGB – 3 * 8 бит (1 цвет) = 24 бит – глубина
CMYK – 4*8 бит = 32 бита
Черно-белое – 1 бит (0 – черный, 1- белый )
Оттенки серого – 8 бит
Это обозначается понятием «битовая глубина». Битовую глубину изображения часто называют цветовой разрешающей способностью
Задача 1. Какой объем информации занимает черно-белое изображение размером 600 х 800?
Решение: 600 х 800 = 480 000 точек 480 000 точек х 1 бит = 480 000 бит
480 000 бит / 8 бит / 1024 байт ≈ 58, 59 Кбайт
Ответ: 58, 59 Кбайт
Задача 2. Определить объем растрового изображения размером 600 х 800 при глубине цвета 24 бита.
Решение: 600 х 800 = 480 000 точек 480 000 точек х 24 бит = 11 520 000 бит
11 520 000 бит / 8 бит / 1024 байт = 1406,25 Кбайт / 1024 байт ≈ 1,37 Мбайт
Ответ: ≈ 1,37 Мбайт
1. Чему равен информационный объем компьютерного изображения размером 800х600 точек, в режиме «Оттенки серого»?
2. Чему равен информационный объем компьютерного изображения размером 100х100 точек, в режиме RGB?
3. Как изменится информационный объем компьютерного изображения, в режиме «Оттенки серого» после того как его преобразовали в цветное RGB?
4. Как изменится информационный объем компьютерного изображения объемом 100 байт, в режиме «Оттенки серого» после того как его преобразовали в цветное RGB?
5. Как изменится информационный объем компьютерного изображения объемом 100 байт, в режиме «Оттенки серого» после того как его размер увеличили вдвое?
6. Сколько высококачественных 24-битный снимков 5-ти мегапиксельной фотокамеры поместится на карте объемом 32 Мб?
7. Какой объем памяти потребуется для сканированного изображения размером 2х5 дюймов и разрешением 300 dpi в модели RGB?
8. Какой объем памяти потребуется для сканированного изображения размером 2х5 дюймов и разрешением 300 dpi в модели CMYK?
9. Какой объем памяти потребуется для сохранения видеофильма размером кадра 640х480 точек и длительностью 5 сек. (со стандартной частотой кадров)?
11. Сколько высококачественных 24-битных снимков 3-ти мегапиксельной фотокамеры поместится на карте объемом 32 Мб?
10. Компьютерное изображение объемом 100 Кб обрезали вдвое. Насколько изменился его объем?
12. Компьютерное изображение объемом 128 Кб обрезали вдвое. Насколько изменился его объем?
13. Компьютерное изображение в модели RGB объемом 128 Кб преобразовали в черно-белое битовое. Насколько изменился его объем?
14. Компьютерное изображение в модели RGB объемом 128 Кб преобразовали в оттенки серого. Насколько изменился его объем?
15. Компьютерное изображение в модели RGB объемом 128 Кб преобразовали в CMYK. Насколько изменился его объем?
Сейте разумное, доброе, вечное.
Тест по информатике Форматы графических файлов для 7 класса
Тест по информатике Форматы графических файлов для 7 класса с ответами. Тест включает 7 заданий с выбором ответа.
1. Что такое формат графического файла?
1) хранение описания геометрических фигур , составляющих изображение
2) совокупность точек, образующих строки и столбцы, формирующие изображение
3) способ представления графических данных на внешнем носителе
2. Какие бывают графические форматы?
1) растровые и векторные
2) фрактальные и пиксельные
3) векторные и фрактальные
3. В каком формате на хранение информации о цвете каждого пикселя отводится 24 бита?
1) JPEG
2) BMP
3) EPS
4. Сколько разных цветов можно использовать в формате GIF?
1) 324
2) 256
3) 144
5. Какой формат разработан специально для эффективного хранения изображений фотографического качества?
1) BMP
2) WMF
3) JPEG
6. Какой формат может хранить информацию о растровой и векторной графике?
1) EPS
2) WMF
3) GIF
7. Как называется уменьшение информационного объема графического файла?
1) минимизация
2) сжатие
3) упрощение
Ответы на тест по информатике Форматы графических файлов для 7 класса
1-3
2-1
3-2
4-2
5-3
6-1
7-2
Как называется уменьшение информационного объема графического файла
Документные сканеры для обработки большого объема документов, работы в составе систем электронных архивов.
Сетевые сканеры позволяют сканировать документы по сети, отправлять их в сетевые папки, на FTP, по E-mail.
Планшетные сканеры ориентированы на работу со сшитыми документами, книгами, фото, графикой на профессиональном уровне.
Книжные сканеры безконтактное сканирование гарантирует бережное обращение с документами.
Паспортные сканеры специальное решение для сканирования паспортов и удостоверений личности.
Портативные сканеры для работы в «полевых» условиях, когда важны компактность и автономность.
Опции к сканерам дополнительное оборудование, расширяющее функционал АПД-сканеров.
Расходные материалы ролики, модули подачи и отделения, нуждающиеся в регулярной замене.
Серверы USB-устройств дают возможность исполь-зовать сканеры и принтеры как сетевые устройства.
Программные продукты для повышения качества изображения и продуктив-ности сканирования.
Поддержка Linux и MAC загрузка драйверов для сканеров Avision для LINUX и MAC OS.
Архив Модели сканеров, снятые с производства.
(495) 785-5554
Знаете ли вы что:
В отличие от двух-стороннего принтера, который поворачивает лист для печати на второй стороне, документ сканер сканирует лист в двухстороннем режиме за один проход.
Теория сканеров » Графические форматы файлов

Графические форматы различаются по виду хранимых данных (растровая, векторная и смешанная формы), по допустимому объему данных, параметрам изображения, хранению палитры, методике сжатия данных (для EGA без сжатия требуется 256К) — DCLZ (Data Comdivssion Lempel-Ziv), LZW (Lempel-Ziv & Welch), по способам организации файла (текстовый, двоичный), структуре файла (с последовательной или ссылочной (индексно-последовательной) структурой) и т.д.
Растровый файл состоит из точек, число которых определяется разрешением, измеряемым обычно в точках на дюйм (dpi) или на сантиметр (dpc). Очень важным фактором, влияющим, с одной стороны, на качество вывода изображения, а с другой — на размер файла, является глубина цвета, т.е. число разрядов, отводимых для хранения информации о трех составляющих (если это цветная картинка) или одной составляющей (для полутонового не цветного изображения). Например, при использовании модели RGB глубина 24 разряда на точку означает, что на каждый цвет (красный, синий, зеленый) отводится по 8 разрядов и поэтому в таком файле может храниться информация о 2^24 = 16,777,216 цветах (Обычно в этом случае говорят о 16 млн. цветов). Очевидно, что даже файлы с низким разрешением содержат в себе тысячи или десятки тысяч точек. Так, растровая картинка размером 1024х768 точек и с 256 цветами занимает 768 Кбайт. Для уменьшения объемов файлов разработаны специальные алгоритмы сжатия графической информации. Именно они и являются основной причиной существования графических форматов.
Векторный способ записи графических данных применяется в системах автоматического проектирования (CAD) и в графических пакетах. В этом случае изображение состоит из простейших элементов (линия, ломаная, кривая Безье, эллипс, прямоугольник и т.д.), для каждого из которых определен ряд атрибутов (например, для замкнутого многоугольника — координаты угловых точек, толщина и цвет контурной линии, тип и цвета заливки и т.д.). Записывается также место объектов на странице и расположение их друг относительно друга (какой из них «лежит» выше, а какой ниже). Векторный формат является доказательством идеи древнегреческих математиков о том, что любую существующую в природе форму можно описать, используя геометрические примитивы и компас.
У каждого метода есть свои преимущества. Растровый позволяет передавать тонкие, едва уловимые детали образов, векторный же лучше всего применять, если оригинал имеет отчетливые геометрические очертания. Векторные файла меньше по объему, зато растровые быстрее вырисовываются на экране дисплея, так как для вывода векторного изображения процессору необходимо произвести множество математических операций. С другой стороны, векторные файлы гораздо проще редактировать.
Существует множество программ-трансляторов, переводящих данные из векторного формата в растровый. Как правило, такая задача решается довольно просто, чего нельзя сказать об обратной операции — преобразовании растрового файла в векторный и даже о переводе одного векторного файла в другой. Векторные алгоритмы записи используют уникальные для каждой фирмы-поставщика математические модели, описывающие элементы изображения.
Ниже описан ряд наиболее распространенных графических форматов.
PCX — Простейший растровый формат. Первоначально этот формат использовался в программе PaintBrush фирмы Zsoft, однако в последствии получил широкое распространение среди пакетов редактирования растровых изображений, хотя до сих пор не признан в качестве официального стандарта. К сожалению, в процессе своей эволюции PCX претерпел настолько значительные изменения, что современная версия формата, поддерживающая 24-разрядный цветовой режим, не может использоваться старыми программами. С самого «рождения» формат PCX был ориентирован на существующие видеоадаптеры (сначала EGA, потом VGA) и поэтому является аппаратно-зависимым. В PCX используется схема сжатия данных RLE, позволяющая уменьшать размер файла, например, на 40- 70%, если используется 16 и менее цветов, и на 10- 30% для 256-цветных изображений.
BMP — (Windows Bitmap) разрабатывался фирмой Microsoft как совместимый со всеми приложениями Windows. Для приложений в операционной системе OS/2 имеется собственная версия BMP. В формате BMP можно сохранять черно-белые, серые полутоновые, индексные цветные и цветные изображения системы RGB (но не двухцветные или цветные изображения системы CMYK). Недостаток этих графических форматов: большой объем. Следствие — малая пригодность для Internet-публикаций.
GIF — поддерживает до 256 цветов, позволяет задавать один из цветов как прозрачный, дает возможность сохранения с чередованием строк (при просмотре сначала выводится каждая 8-я, затем каждая 4-я и т.д. Это позволяет судить об изображении до его полной загрузки). Способен содержать несколько кадров в одном файле с последующей последовательной демонстрацией (т.н. «анимированный GIF»). Уменьшение размера файла достигается удалением из описания палитры неиспользуемых цветов и построчного сжатия данных (записывается количество точек повторяющегося по горизонтали цвета, а не каждая точка с указанием ее цвета). Такой алгоритм дает лучшие результаты для изображений с протяженными по горизонтали однотонными объектами. Для сжатия файла используется высокоэффективный алгоритм Лемпела — Зива — Велча (LZW)
TIFF (target image file format) — был разработан специально для использования в приложениях, связанных с компоновкой страницы и направлен на преодоление трудностей, которые возникают при переносе графических файлов с IBM-совместимых компьютеров на Macintosh и обратно. Он поддерживается всеми основными графическими пакетами и пакетами редактирования изображений и читается на многих платформах. Использует сжатие изображения (LZW). Формат TIFF очень удобен, но за это приходится расплачиваться огромными размерами получаемых файлов (например, файл формата А4 в цветовой модели CMYK с разрешением 300 dpi, обычно применяемым для высококачественной печати, имеет размер около 40 Мбайт). Кроме того, существует несколько «диалектов» формата, которые не каждая программа, поддерживающая TIFF, легко «понимает».
JPEG — миллионы цветов и оттенков, палитра не настраиваемая, предназначен для представления сложных фотоизображений. Разновидность progressive JPEG позволяет сохранять изображения с выводом за указанное количество шагов (от 3 до 5 в Photoshop’e) — сначала с маленьким разрешением (плохим качеством), на следующих этапах первичное изображение перерисовывается все более качественной картинкой. Анимация или прозрачный цвет форматом не поддерживаются. Уменьшение размера файла достигается сложным математическим алгоритмом удаления информации — чем заказываемое качество ниже, тем коэффициент сжатия больше, файл меньше. Главное, подобрать максимальное сжатие при минимальной потере качества. Последний идентифицирует и отбрасывает данные, которые человеческий глаз не в состоянии увидеть (незначительные изменения в цвете не различаются человеком, тогда как улавливается даже малейшая разница в интенсивности, поэтому JPEG меньше подходит для обработки черно-белых полутоновых изображений), что приводит к существенному уменьшению размера файла. Таким образом, в отличие от метода сжатия LZW или RLE в результате применения технологии JPEG данные теряются навсегда. Так, файл, однажды записанный в формате JPEG, а затем переведенный, скажем, в TIFF, уже не будет тем же, что и оригинал. Наиболее подходящий формат для размещения в Интернете полноцветных изображений. Вероятно, до появления мощных алгоритмов сжатия изображения без потери качества останется ведущим форматом для представления фотографий в Web.
PNG — пока малораспространен из-за слабой рекламы, создавался специально для Интернета как замена первых двух форматов и благодаря патентной политике Compuserve постепенно вытесняет GIF (см. выше). Позволяет выбирать палитру сохранения — серые полутона, 256 цветов, true color («истинные цвета»). В зависимости от свойств изображения действительно иногда предпочтительнее GIF’a или JPG’a. Позволяет использовать «прозрачный» цвет, но, в отличие от GIF’a таких цветов может быть до 256. В отличие от GIF сжатие без потери качества производится и по горизонтали и по вертикали (алгоритм собственный, параметры тоже не настраиваемые). Не умеет создавать анимированные ролики (разрабатывается формат MNG).
PDF (Portable Document Format) — это пример смешанного формата, предназначенного для хранения текста и графики одновременно. В формате PDF сохраняются данные текстовым редактором Adobe Acrobat. Для сжатия графики применяется метод LZW.
PSD — формат графического редактора Adobe Photoshop. Обладает очень большими возможностями. Хранит данные о различных палитрах цветов, о прозрачности, имеет возможность хранения послойных изображений. При этом отличается большим размером.
В настоящее время разрабатываются перспективные графические форматы и некоторые из них уже понимаются броузерами, но еще не поддерживаются большинством графических редакторов (*.art фирмы Johnson-Grace). Другие же требуют наличия у броузеров плагинов для своего просмотра (*.fif, обеспечивает сильное сжатие и позволяет растягивать изображения на весь экран при любом разрешении без заметной потери качества).
Как сейчас решается вопрос с переводом информации из бумажного вида в электронный? Понятно, что первым делом книга, журнал, газета, не суть важно что – сканируется. Что можно сделать потом? Очевидно, дальше имеет смысл распознать отсканированный текст. Конечно, это самое грамотное решение, позволяющее использовать все преимущества цифрового представления информации. Основная проблема в этом случае заключается в том, что невозможно поставить распознавание на поток. Распознавание большого количества материалов – крайне трудоемкий процесс.
Поэтому для перевода в цифру большого количества материалов, как правило, их просто сохраняют в виде картинки. Но и тут есть целый ряд трудностей. Дело в том, что сейчас распространены только два компрессирующих формата представления цифровых изображений – GIF и JPEG, говорить о некомпрессирующих форматах, по большому счету, бессмысленно. Ведь основная задача представления информации в цифре – это возможность передавать ее через Сеть, а если одна журнальная страница будет весить тридцать мегабайт, например, в TIFF, то кому она вообще будет нужна?
При этом у двух существующих компрессирующих форматов существуют серьезные недостатки. GIF, к примеру, не может содержать больше 256 цветов. Для текста, конечно, этого более чем достаточно, но что делать, если на странице напечатаны красивые цветные фотографии? Для представления фотографий обычно используют формат JPEG, и свои задачи, в подавляющем большинстве случаев, он реализует «на ура». Но в то же время, сохранять в JPEG текст или, скажем, чертежи (lineart) – полнейший абсурд: JPEG «размоет» и испортит их. Разделять же представляемую информацию на разные форматы не менее трудоемко, чем распознавать тексты, но при этом еще и страшно неудобно в дальнейшем использовании.
Очевидно, что идеальным выходом из сложившейся ситуации стало бы либо появление крайне умных систем распознавания, не делающих ошибок, либо создание нового графического формата, умеющего компрессировать и объединяющего все преимущества существующих форматов – качественное представление текста, как в GIF, и качественное представление фотоизображений, как в JPEG.
Оказывается, такой формат уже придуман. При чем придуман по умному, хотя и не без недочетов. Называется он DjVu («дежа вю»). Работает примерно следующим образом. Сначала выделяет на странице весь текст и lineart, после чего отдельно отображает картинки. При чем и то и другое – качественно. Да и объем файла, представляющего обычную страницу A4 с текстом и фотографиями в разрешении 300 DPI получается примерно 45-50 килобайт, что, по последним исследованиям, равно усредненному весу web-странички.
Для того чтобы иметь возможность просматривать подобные картинки, необходимо установить специальный plug-in, который весит немногим меньше девятисот килобайт. При этом сделан он очень интересно. Дело в том, что, в отличие от обычных программ-просмотрщиков, DjVu не расшифровывает сжатый файл полностью, а только ту его часть, которую в данный момент демонстрирует. Это позволяет просматривать файлы огромного размера и разрешения даже на очень слабых компьютерах. Да и демонстрировать эти картинки он может постепенно – по мере скачивания. Скажем, после того как вы зашли на дежавюшную страничку, в течении пары секунд вы можете полностью увидеть макет страницы. Еще через пару секунд сможете прочитать текст, а подождав еще буквально чуть-чуть – видите картинки. Конечно, web-сёрфер и так имеет то же самое – сначала текст, потом постепенно картинки. Но не забывайте – то, что вы видите с помощью DjVu – это полностью графика, а не комбинация распознанного текста и картинок.
DjVu – новейшая технология сжатия файлов изображений от компании LizardTech, возможности которой на порядки выше возможностей существующих технологий.
Компания LizardTech приобрела эту разработку у AT&T Labs и затем доработала ее до состояния, пригодного к продаже, в виде компьютерной программы для корпораций и частных лиц.
Рассмотрим сначала назначение и основные достоинства DjVu.
DjVu – технология, преобразующая отсканированные документы (книги, каталоги и т. д.) в файлы малых размеров, сохраняющие высокое качество исходного изображения, которые могут передаваться и размещаться в Интернет и Интранет-сетях.
Следует отметить, что технология DjVu прежде всего ориентирована на различные документы, содержащие смешанную информацию – в основном текстовую и графические изображения. Для представления и преобразования сложных графических изображений, таких как, например, фотографии, существует другая технология от LizardTech – MrSID.
Новая технология DjVu сжимает файлы изображений до рекордно малых размеров без потери четкости и разрешения изображения. Так, если отсканировать цветные документы с разрешением 300 dpi, содержащие текст и картинки, то в формате DjVu они будут иметь размеры в 10-20 раз меньшие, чем в формате GIF или JPEG, при прочих равных условиях и одинаковых параметрах.
Что же касается сравнения PDF-файлов и DjVu-файлов, то файлы в формате DjVu могут иметь размеры в 50-100 раз меньшие, чем в формате PDF. Например, цветная страница документа в формате PDF, имеющая размер 12 Mb, в виде файла DjVu имеет размер всего 80 Kb.
Кроме того, данная технология позволяет сжимать файлы в 150 раз быстрее, чем это делается с использованием форматов PDF, и в 20 раз быстрее, чем при использовании форматов JPEG или GIF.
Как же достигаются такие высокие скорости кодирования и малые размеры сжатых файлов? Все дело в особенностях обработки исходного отсканированного изображения, осуществляемой с помощью данной технологии.
DjVu выделяет из исходного отсканированного изображения два слоя: слой, содержащий высококонтрастные изображения – текст, а также штриховые рисунки (контуры), и слой, содержащий графические изображения, фотографии, цветной фон. Далее каждый слой кодируется соответствующим методом, обеспечивающим максимальные скорость и степень сжатия для данного слоя и максимальное качество.
При сжатии файла с использованием DjVu имеют место некоторые потери информации. Основной информационный слой исходного отсканированного изображения кодируется без потерь, в то время как для кодирования слоя, соответствующего фону, используется сжатие с потерями. Однако при просмотре DjVu-документов эти потери не будут заметными.
Следует отметить, что методы сжатия информации, используемые в JPEG и GIF, допускают значительно большие потери, чем DjVu.
Компанией LizardTech разработан целый ряд программных продуктов с технологией DjVu – от DjVu Solo для индивидуального использования до DjVu Enterprise для офисных систем.
Работа в программе DjVu Solo в упрощенном виде сводится к двум этапам: 1) сканирование изображения; 2) преобразование в формат DjVu и некоторые простейшие преобразования полученного файла. После опубликования DjVu-файла в сети Интернет возможен его просмотр с помощью DjVu Web Browser Plug-in.
Программные продукты DjVu позволяют производить различные операции над отсканированными документами. Так, программы DjVu Solo и DjVu Editor (для Linux) позволяют редактировать полученные файлы. (Скоро также появится редактор DjVu Editor для Windows.) Другой программный продукт – DjVu Enterprise – предусматривает операцию поворота изображения (rotation) на определенный угол.
DjVu Web Browser Plug-in позволяет встраивать файлы DjVu в HTML-страницы. Кроме того, с помощью программ DjVu Solo и DjVu Editor возможно добавление гиперссылок в файлы DjVu.
С помощью специальной утилиты PDF/PS to DjVu Conversion utility можно осуществлять преобразование PDF- и Postscript-файлов в формат DjVu.
Однако не все операции редактирования и обработки изображения доступны в существующих программных продуктах DjVu на данный момент. Так, например, пока что отсутствует операция выделения фрагмента исходного изображения (crop). Осуществление этой операции возможно в других программах перед преобразованием изображения в формат DjVu.
Совсем недавно была выпущена новая версия DjVu Solo – DjVu Solo 3.1, содержащая программу распознавания образов (OCR), которая позволяет искать в отсканированном и сжатом документе с иллюстрациями ключевые слова. Стоимость данной программы составляет примерно 0.