Яндекс.Метрика
logo image
Фотоуслуги г.Мценск т. 8(915)504-84-55

Сканирование (оцифровка) документов

Сканирование (оцифровка) документов

Цветное или черно-белое  сканирование документов, книг, дипломов, грамот, нестандартных или ветхих документов до формата А3.

   Несмотря на кажущуюся простоту, создание цифровых копий документов – это комплексный и технически сложный процесс, который зависит от типа документного комплекса вашей организации, его характерных особенностей. Цели и задачи, которые ставит перед собой ваша организация, лягут в основу принципов отбора документов для оцифровки. Это может быть создание рабочего фонда документов для их интенсивного использования, фонда хранения, создание поисковой системы или создание полнофункционального электронного архива.
Создание электронного архива – это работа, которая включает индивидуальный подход к документальным материалам заказчика, постановку задачи, выбор средств для ее реализации и определенную последовательность специальных процедур. Работы ведутся в несколько этапов: некоторые из них обязательны применительно к любым целям оцифровки, другие же опциональны и используются лишь при ограниченном круге задач.
10967232-opticbook-3600-with-books-by-plustek

Параметры сканирования и сохранения результатов. Сколько dpi?

       При сканировании документов важно правильно выбрать технические параметры для того, чтобы получить наиболее качественный результат. Руководствуясь рекомендациями Государственного архива РФ, наша компания при сканировании документов использует разрешение 300 dpi (точек на дюйм). Такое разрешение позволяет получить копию высокого качества, при последующей печати которой будет полностью сохранена вся информация подлинника. В отдельных случаях при сканировании документов сложной структуры и для их последующего распознавания оправдано сканирование с более высоким разрешением.  1027068504

  Формат — tiff, jpeg или PDF?

    Для получения цифровых копий, полностью сохраняющих информацию, качество и внешние особенности подлинника в международной практике обычно применяется формат tif (англ. Tagged Image File Format) — формат хранения растровых графических изображений). Документы, сохраненные в файлах такого формата, используют как для постоянного обращения, так и для долговременного архивного хранения. Однако у них есть один недостаток – они довольно объемны и при оцифровке больших массивов требуют значительного пространства на хранящим их носителе. По этой же причине такие файлы не очень удобны при передаче данных с использованием сетей.
Если вы предполагаете постоянное обращение к цифровым копиям, включающее многопользовательский режим, частую пересылку и печать документов, то возможно для вашей организации предпочтительнее хранить массив в файлах формата pdf (англ. Portable Document Format — переносимый формат документов). Особой популярностью сегодня пользуются так называемые двухслойные документы pdf, в которых на одной странице находятся одновременно и отсканированный вариант страницы, и распознанный, что позволяет даже использовать контекстный поиск по отсканированным изображениям. Зачастую наши клиенты предпочитают иметь свои документы в обоих вариантах. Tif – для хранения документов и печати тех из них, что требуют высокого качества копии; и pdf – для интенсивного офисного использования. Также широко используется хранение в формате .jpeg
SCAN

Сканирование с распознаванием текста

    Что нужно сделать для того, чтобы можно было редактировать сканированный текст в популярных текстовых редакторах?  Произвести простое сканирование – задача не сложная. Достаточно нажать кнопку на сканере, выбрать качество сканирования и сохранить получившийся файл в каком-либо графическом формате *.tiff, *.jpeg, *.bmp и т.д.
В таком формате редактирование текста не представляется возможным, т.к. получившийся файл является простой картинкой, ничем не отличающейся от рядовой фотографии. Сканер просто-напросто «не понимает» что буквы текста являются именно буквами. Для него это всего лишь пятна или точки черного цвета.
Именно для того, чтобы «объяснить» компьютеру, что отсканированный файл является текстом и были созданы программы для распознавания текстов. Причем они позволяют распознавать текст введенный не только с помощью сканера, но и даже если этот текст был сфотографирован простым фотоаппаратом.
К современным программам для распознавания текстов предъявляется довольно широкий спектр задач. Сегодня эти программы умеют:
— Распознавать текст, набранный самыми различными шрифтами и даже рукописный текст;
— Распознавать текст, в котором содержатся слова на нескольких языках;
— Корректно распознавать таблицы и картинки;
— Распознавать некачественный текст (например, многократно — ксерокопированные тексты);
И самое главное – перевод сканированного текста в текстовые редакторы.
http://fotomtsensk.ru/
Вернуться на главную

%d такие блоггеры, как: