Перейти к содержимому

Как называется перевод электронного текста в бумажный

  • автор:

Как называется перевод электронного текста в бумажный

В зависимости от предполагаемых сценариев работы с электронными образами, оцифровка документов может быть сопряжена с распознаванием текста (для организации полнотекстового поиска по документам) и извлечением определенного набора структурированных данных (для их последующей аналитической обработки, построения сводных отчетов и т.п.).

Решение «Поточное сканирование»

Компания ЭОС разработала решение «Поточное сканирование», которое позволяет эффективно организовать перевод бумажных документов в электронный вид. Высокая скорость достигается в результате автоматизации процесса сканирования и применения технологии параллельных вычислений при распознавании текста.

Применение «Поточного сканирования» позволяет загружать в сканер одновременно пачку документов и запускать сканирование одной кнопкой. При этом каждый документ автоматически идентифицируется в системе и прикрепляется к соответствующей регистрационной карточке.

Возможности и преимущества:
  • распознавание текста (OCR);
  • сканирование одной кнопкой;
  • высокая скорость;
  • интеграция с любыми системами;
  • простая система лицензирования;
  • возможность ручного контроля;
  • работа с поточными сканерами;
  • работа со штрих-кодами;
  • API-интерфейс и подробная документация.

Интеграция с системами ДЕЛО, eDocLib и EOS for SharePoint, а также с любыми СЭД сторонних производителей. Для распознавания текста и извлечения структурированных данных в решениях ЭОС применяются технологии, реализованные в продуктах ABBYY FIneReader и ABBYY FlexiCapture.

В процессе поэтапного перехода от бумажного документооборота к электронному зачастую возникает необходимость переводить в электронный вид значительные объемы бумажной документации. Сделать этот процесс максимально эффективным поможет модуль «Поточное сканирование».

Для массового сканирования и регистрации бумажных документов на каждом из них (на первом или на отдельном чистом листе) печатается назначаемый системой уникальный штрих-код. Он содержит уникальный идентификационный номер документа и правила его обработки.

В процессе сканирования и распознавания система анализирует штрих-код и обрабатывает отсканированные документы в соответствии с указанной в нем информацией. Полученные в заданном формате результаты сканирования автоматически прикрепляются к соответствующим регистрационным карточкам.

Для автоматического заполнения полей регистрационных карточек информацией, содержащейся в бумажном документе, могут быть использованы программные продукты компании ABBYY, например ABBYY FlexiCapture.

ABBYY FlexiCapture позволяет выделять необходимые значимые поля из неструктурированного текста. Например, из бумажных договоров с помощью этой технологии можно автоматически выделять наименования контрагентов, сумму сделки и т.п.

  • Настольные ПК
  • Ноутбуки
  • Серверы и СХД
  • Принтеры/Сканеры/МФУ
  • Антивирусная защита
  • Программное обеспечение
  • Прочее

Перевод цифрового документа в бумажный и его удостоверение

Перевод цифрового документа в бумажный и его удостоверение

Совсем недавно в наших новостях мы упоминали о новации в деятельности нотариусов. Перевод бумажных документов в электронный вид позволяет подавать документы на регистрацию в электронном виде. Гражданам при этом нужна ЭЦП. Это стало возможно благодаря поправкам в Основы законодательства РФ о нотариате.

Практика по переводу бумаги «в цифру» пока только нарабатывается, но уже видны её полезные перспективы. Например, перевести в электронный вид кадастровый документ или доверенность – подписанные квалифицированной ЭЦП, эти документы имеют полноправную юридическую силу. Ведь суть нотариального действия – не только «перевод» документа на бумагу, но и удостоверение его полноправности.

А теперь рассмотрим вопрос – а возможна ли обратная операция? Как перевести электронный документ на бумагу с сохранением всех его качеств, установленных законом?

Для чего может пригодиться перевод «цифры» на бумагу

Электронные технологии развиваются быстро. И данное нотариальное действие благодаря этим технологиям можно – и нужно – использовать, если у Вас имеется электронный документ, которому нужно придать традиционную бумажную форму. Прежде всего, конечно, приходят на ум сделки с контрагентами. Обмениваться электронными документами по сделке значительно удобнее. Но представим и ситуацию, когда гражданин присылает нотариусу документ – например, отказ от доли или наследства. Пока такой документ технически не приравнивается к «настоящему», полноправному. Нотариусу для таких документов нужен официальный электронный ящик, так что этот вопрос сейчас прорабатывается. И в данном случае гражданину придётся переводить свой документ на бумагу.

К этому же способу можно прибегнуть, если Вы получили документ в электронном виде от госорганов и собираетесь представить его в банк, для подачи иска в суд и в другие организации. В итоге перевод цифры на бумагу имеет много вариантов применения.

Как удостоверить документ

На первый взгляд всё просто, но работа с электронным документом – это далеко не простая распечатка. Мы уже обращали внимание, что нотариус должен удостоверить электронный документ, который Вы перевели на бумагу. На настоящий момент Вам придётся некоторое время провести в поисках нотариуса. Далеко не все сейчас соглашаются перевести электронный документ на бумагу, мотивируя это техническими сложностями или отсутствием практики.

Наконец, Вы отыскали подходящего нотариуса. Он должен проставить на свободном месте документа удостоверительную надпись. Если свободного места нет, можно поставить её на обратной стороне документа. Удостоверение проходит в строгом соответствии с принятыми формами. Есть специальный приказ Минюста от 10.04.2002 №99, который утвердил формы реестров для нотариальных действий. Согласно этому Приказу, нотариус должен будет указать на документе следующие данные – населённый пункт (город, посёлок с указанием района или края, области или республики), и дату прописью.

Далее нотариус делает следующую надпись: «Я, (фамилия, имя, отчество), нотариус (наименование государственной нотариальной конторы или нотариального округа) подтверждаю, что содержание изготовленного мной на бумажном носителе документа тождественно содержанию представленного мне электронного документа». В этой надписи также должно содержаться упоминание о проверке ЭЦП и о том, что документ на бумажном носителе равнозначен представленному электронному документу: «Квалифицированная электронная подпись лица, подписавшего представленный мне электронный документ, проверена, ее принадлежность заявителю подтверждена. Настоящий документ на бумажном носителе равнозначен представленному мне электронному документу и имеет ту же юридическую силу». Далее следуют привычные реквизиты нотариуса – номер регистрации в реестре, сколько взыскано госпошлины, подпись и печать.

После всего этого полученный Вами документ будет иметь ту же юридическую силу, что и изначальный электронный документ.

Перевод бумажной документации в электронный вид

Перевод бумажных архивов в электронную форму интенсивно осуществляется на предприятиях во всем мире. Не осталось в стороне и Комсомольское-на-Амуре авиационное производственное объединение (КнААПО). Четыре года назад для централизованной обработки документов был создан участок перевода информации в электронную форму (участок сканирования). Работая в тесной связи с подразделениями объединения (отделы главного конструктора, главного технолога, главного метролога, планово-экономический отдел, сектор стандартизации, цеха основного и вспомогательного производства, бухгалтерия, отдел кадров и многие другие), он перевел в электронный вид более 200 тыс. листов бумажных документов формата А4.

Технология перевода документов в электронную форму

ЛВС — локальные вычислительные сети, КВС — корпоративные вычислительные сети. Технология перевода документов в электронную форму

Подразделения, воспользовавшиеся нашими услугами, освобождаются от рутинного труда, связанного с большими затратами времени и требующего освоения программных продуктов, которые могут им в дальнейшем и не понадобиться. Процесс перевода документации в электронный вид регламентируется временным положением, действующим на предприятии.

Все необходимые сведения заносятся в карту заказа, которую с помощью инженера по АСУП участка сканирования заказчик заполняет при сдаче документов на обработку. В карте заказа указываются параметры форматирования, имена файлов и каталогов, особенности обработки и адреса хранения готовой электронной формы.

Сегодня мы предлагаем заказчикам следующие виды электронных документов:

• качественные копии бумажной технической документации, доступные для редактирования в графических редакторах (*.tif, *.jpg и др.);

• чертежи в формате AutoCAD (*.dwg);

• эскизы векторного качества для приложений Windows и баз данных в виде метафайлов Windows (*.wmf);

• книги Microsoft Excel (*.xls);

• документы, подготовленные для печати на типографском оборудовании в формате Adobe Acrobat (*.pdf) и т.д.

Кроме того, мы размещаем информацию в базах данных корпоративной сети предприятия. Таким образом, заказчики, сдав в обработку бумажные документы (зачастую ветхие и плохого качества), получают их электронные аналоги, доступные целой группе пользователей.

Стимулом к созданию участка стала потребность сопровождать изделия на экспорт документами в электронном виде. Первыми заказами, выполненными участком сканирования, были технологические карты и руководства по эксплуатации изделий, послужившие основой для создания интерактивных электронных технических руководств.

На создание первых книг общим объемом 10 тыс. листов формата А4 конструкторам и технологам понадобилось бы (по их собственным подсчетам) около полутора лет, но благодаря новой технологии эта работа была выполнена за три месяца.

Окно базы данных Scandoc, форма Книги, вкладка Регистрация

Окно базы данных Scandoc, форма Книги, вкладка Регистрация

Сегодня производительность участка составляет около 6 тыс. листов формата А4 в месяц. Количество обработанной документации зависит от качества оригинала и выбранной технологии. Разработаны технологические процессы разной сложности: например, перевод в электронный вид Документ Microsoft Word простых текстов без рамок форм имеет сложность 1, а перевод чертежей в электронный вид Рисунок AutoCAD — сложность 4. Благодаря систематическому обучению персонала поддерживается высокая квалификация специалистов, что позволяет создавать качественные электронные версии различных документов.

Поступающие на обработку документы регистрируются в специальной базе данных Scandoc. В ней содержатся сведения о заказчиках и исполнителях работы, технологическом задании, сроках выполнения, адресах размещения электронных версий документов в корпоративной сети и т.д.

Технические средства

Первые работы по переводу в электронный вид были выполнены нами на сканерах Vidar TruScan Select с помощью программы TruInfo. Эти сканеры и сегодня продолжают исправно работать, позволяя выполнять сканирование на отдельных листах в черно-белом изображении шириной от 150 до 965 мм и длиной до 10 м. Возможность подбора различных настроек монохромного сканирования в программе TruInfo, удобный интерфейс с укрупненным просмотром сканируемого изображения, небольшой размер конечного файла в формате tif CCIT Group4 — основные преимущества программы TruInfo. В то же время были и определенные трудности. Например, нарушение выравнивания камер сканирования требовало полной переустановки программы TruInfo с получением от фирмы-поставщика нового кода авторизации. Неудовлетворительный результат на этих сканерах дает и сканирование в режиме Grayscale.

Для сканирования книг, технических журналов и сшитых документов, формат которых не превышает А3, мы с успехом используем цветные планшетные сканеры Paragon 1200 A3 SP PRO.

Чтобы сканировать цветные документы большого формата, иногда очень плохого качества, мы приобрели широкоформатный цветной сканер Contex с программным обеспечением RasterID, которое предлагает различные варианты настроек, благодаря чему можно повысить качество сканирования. Положительные отзывы получила автоматизация процессов обработки. Кроме того, программа поддерживает технологию ActiveX, что еще больше расширяет наши возможности.

Наш опыт

Для большинства документов хорошее качество изображений при небольших размерах файлов обеспечивает сканирование с разрешением 300 dpi. Сканирование калек, мятых и разорванных чертежей удобно проводить при помощи специальных прозрачных пакетов, приобретенных нами у компании Consistent Software.

Быстро и качественно сканируются документы, обладающие высоким контрастом, сочностью цвета, однородностью и постоянной плотностью. В этом случае оцифрованное изображение занимает незначительный объем дисковой памяти и практически не требует дальнейшей обработки. К сожалению, процент таких документов невысок (около 30%).

Участок сканирования КнААПО

Участок сканирования КнААПО

Для других документов получение качественного растра требует времени. При обработке такого документа используются разработанные компанией Consistent Software программные продукты серии Raster Arts. С программами RasterDesk Pro и Spotlight Pro мы работаем начиная с третьей версии и считаем их наиболее эффективными для улучшения качества монохромных растровых изображений. В четвертой версии появилась возможность выбора растровых объектов, что позволяет редактировать растр, применяя привычные методы работы с вектором. Длительное время мы, руководствуясь пожеланиями заказчиков, обрабатывали чертежи, сохраняя их либо в растровом, либо в векторном виде, однако сегодня считаем, что пора переходить к гибридным чертежам, так как работа с ними наиболее целесообразна для быстрого создания электронных архивов. Действительно, вряд ли имеет смысл перерисовывать в AutoCAD качественные растровые фрагменты!

В программе Spotlight есть и весьма полезный режим пакетной обработки, позволяющий обрабатывать пакет растровых файлов без участия оператора. Правда, этот прием можно применять только для изображений одинакового качества.

Для чертежей плохого качества быстрее получить векторную копию растрового оригинала средствами CAD-программ, чем проводить очистку сильно загрязненного растра. Программы Raster Arts позволяют автоматически векторизовать растровые объекты, однако мы эту возможность используем редко, так как выполняем работу для разных подразделений предприятия. Настройка параметров векторизации на разные виды часто меняющихся чертежей требует существенных временных затрат. Конечно, при больших объемах однотипных чертежей более целесообразно подобрать параметры векторизации, сохранить их в виде шаблонов и автоматизировать процесс перевода документации в электронный вид, но это требует участия специалистов подразделений, которые пока делают лишь первые шаги в освоении программ серии Raster Arts.

Обычно мы используем метод сколки: вставляем растр в рисунок AutoCAD в виде ссылки в масштабе 1:1, а затем средствами инструментов панели рисования получаем векторную копию растрового оригинала. Для работы с цветными документами (мы сканируем в цвете документы очень плохого качества) RasterDesk 5 и Spotlight 5 также предлагают набор инструментов, но их применение требует больших ресурсов памяти, которые есть не на всех рабочих местах, поэтому обработка таких документов замедляется. Цветные документы в Spotlight можно преобразовать в монохромные при помощи программы Color Image Processor и далее воспользоваться инструментами, улучшающими битональные изображения.

Качественные тексты хорошо распознаются большинством OCR-программ и требуют минимальной обработки.

Для текстовой документации плохого качества, которую и прочитать-то трудно, сканирование и распознавание применять нецелесообразно. Предпочтительнее ручной набор информации (время на сканирование, распознавание и редактирование может оказаться больше, чем на ручной набор).

Информацию в электронном виде мы формируем так, чтобы при просмотре на экране компьютера ее расположение было удобным для пользователя. Листы с книжным расположением информации должны иметь книжную ориентацию, а с альбомным расположением — альбомную. При выводе на печать соответствие бумажному оригиналу сохраняется путем настройки параметров принтера.

Слои рисунка AutoCAD

Слои рисунка AutoCAD

При наличии в бумажном оригинале технической документации символов, написанных или нарисованных от руки, мы определяем для них вариант замены из таблицы символов или используем качественно нарисованное электронное изображение данного символа. Для рисования желательно выбирать векторный редактор и отслеживать, чтобы в электронной версии один и тот же символ не обозначался разными знаками. Для этого необходимо создать единую библиотеку символов предприятия. В бумажной документации 70-80-х годов символы чаще всего вписывались от руки, в результате чего один и тот же символ мог иметь разное написание. В Windows одни и те же символы в разных шрифтах также различаются. При выборе того или иного варианта, наряду с внешним видом, нужно учитывать наличие соответствующего шрифта на компьютерах предприятия и в выбранной программе. Например, не все знаки, написанные в Microsoft Word (*.doc), будут отображаться в рисунке AutoCAD (*.dwg) или в таблицах баз данных. Отсюда возникает проблема: установку программного обеспечения и настройку компьютеров предприятия необходимо проводить так, чтобы одни и те же документы смотрелись на всех машинах одинаково и желательно в соответствии со стандартами на электронные документы.

Инженеры Марина Авдеева и Анатолий Чиркин

Инженеры Марина Авдеева и Анатолий Чиркин

Для CAD-программ необходимо использование (создание) типов линий по ГОСТ, единство текстовых и размерных стилей, систем слоев, выработка единых принципов формирования и сохранения чертежей (особенно при применении гибридных технологий). Мы, например, для удобства работы в AutoCAD выбрали светло-серый цвет экрана.

Основной шрифт, принятый для использования на предприятии, — GOSTW. Но многие подразделения начали использовать AutoCAD раньше, чем были предприняты попытки стандартизации данного процесса. Как следствие, появился большой объем электронных чертежей с разнообразными настройками, удобными для конкретных пользователей. В результате сегодня существует большое количество текстовых и размерных стилей, типов линий и т.д.

Ряд проблем возникает при переводе в электронный вид текстовых документов, оформленных по ГОСТ. Текстовую часть документа нередко требуется поместить в рамки форм. Однако создать универсальные рамки, которые полностью печатаются на любом принтере и при этом удовлетворяют требованиям стандартов, — трудная задача.

Эту проблему можно решать по-разному. Создано много вариантов рамок в Word, Excel, в растровых и векторных редакторах. Но обидно тратить на это время, да еще и подгонять результат под параметры принтера. Кроме того, нужно ли сохранять рамки для электронного вида? Можно, конечно, установить на все компьютеры специализированное программное обеспечение для работы с отсканированными формами, но насколько это целесообразно?

Благодаря тесному сотрудничеству с компанией Consistent Software мы всегда в курсе ее новых разработок. (К сожалению, не со всеми интересующими нас фирмами удалось достичь столь тесного контакта.) Из перспективных разработок Consistent Software нас заинтересовала программа PlanTracer. Она предоставляет просто фантастические возможности для создания трехмерных чертежей из растровых рисунков. Хотелось бы попробовать ее на планировках наших зданий. Быть может, недалек и переход к моделям?

Надеемся, что с помощью таких партнеров, как Consistent Software, мы сможем более профессионально решать проблемы, возникающие в процессе работы.

Распознавание сканированного текста

Наверное, каждый из нас сталкивался с задачей, когда нужно перевести бумажный документ в электронный вид. Особенно это часто нужно делать тем кто учиться, работает с документацией, переводит тексты при помощи электронных словарей и т.д.

Рекламное агентство АС-Лаки принт предлагет услугу распознования текста с различных носителей бумажной информации таких как книги, журналы, методички и т.д. Сохранение сканированной, распознанной и обработанной информации возможно в виде документов форматов Word или adobe reader. При необходимости работы проводятся с последующей версткой в книгу, брощюру и распечаткой.

Cканирование и распознавание текста — довольно трудоемко, так, как большинство операций придется делать вручную. Мы попытаемся разобраться по шагам, что, как и почему. Не все сразу понимают одну вещь. После сканирования (пригона всех листов на сканере) у вас будут картинки формата BMP, JPG, PNG, GIF (могут быть и другие форматы). Так вот с этой картинки нужно получить текст — это процедура называется распознаванием.

Сканированные документы обрабатываются специальной программой для распознования текста. Хотелось бы думать что текст выйдет идеальным буква к букву, но это ошибочное мнение. Программа распознавания текста делает свое дело и из символов на картинке складывает буквы и далее слова, но если текст на оригинале не ровный или смазаный, или присутствуют картинки и графики, то в большинстве случаев получается «каля-баля», в которой пытается разобраться менеджер, выполняющир работу. Сравнивая каждую букву, каждый символ, проводится кропотливая работа, которая занимает огромное колличество времени и требует четкого внимания.

И только после всего вышеперечисленного, Вы становитесь обладателем копии электронного/распечатанного экземпляра обработанного издание докумета или издания.

Цена на услуги распознование текста

  • Распознование текста А4+перевод в формат word — 15 руб/лист
  • Редактирование текста формата А4 — 50 руб/лист
  • Сканирование не сшитых оригиналов формата А4 при тираже от 50 экз. — 5 руб/лист

Цены указаны за работы с напечатанным текстом. Стоимость работ с рукописным текстом оговаривается индивидуально. Редактированный лист сохраняются в формате word и pdf.

По времени исполнения заказа сканирования+распознования текста уточняйте у менеджеров АС-Лаки Принт т.к время на прямую будет зависеть от загруженности работников.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *