Расширение сканированных документов. Сканирование документов в формат PDF

12.04.2019

После завершения поиска документа, можно открыть документ в Word для его изменения. Как это сделать зависит от версии Office, в которой установлены.

Сканирование документа в формате PDF и изменить в Word

Совет: Преобразование лучше всего работает с документами, содержащими преимущественно текст.

    Сканирование документа в соответствии с инструкциями для сканера и сохраните его на своем компьютере как PDF-файл.

    В Word, выберите файл > Открыть .

    Перейдите к нужному PDF-файл на своем компьютере и нажмите кнопку Открыть .

    Появится сообщение о том, что Word будет преобразовать PDF-файла в редактируемый документ Word. Нажмите кнопку ОК .

См. также

Параметр со сканера или камеры для сканирование изображений и документов недоступен в Word 2010. Вместо этого можно использовать сканер для сканирования документа, и сохраните файл на своем компьютере.

Программа Microsoft Office Document Imaging была удалена из Office 2010, однако вы можете установить ее на своем компьютере, используя один из вариантов, описанных в статье Установка приложения MODI для использования совместно с Microsoft Office 2010 .

Прежде чем продолжать

    Найти и открыть изображений документов Microsoft Office для Обработки изображений документа Microsoft Office в меню Пуск Windows.

    В меню Файл выберите команду Открыть .

    Найдите отсканированный документ и нажмите кнопку Открыть .

    После запуска Microsoft Office Document Imaging нажмите клавиши CTRL+A, чтобы выделить весь документ, а затем нажмите клавиши CTRL+C.

    Запустите Microsoft Word.

    На вкладке Файл нажмите кнопку Создать .

    Дважды щелкните элемент Новый документ .

    Нажмите клавиши CTRL+V, чтобы вставить содержимое отсканированного документа в новый файл.

Параметр со сканера или камеры для сканирование изображений и документов недоступен в Microsoft Office Word 2007. Вместо этого можно использовать сканер для сканирования документа, и сохраните файл на своем компьютере.

Шаг 1: Установка Microsoft Office документа обработки изображений

    Завершите работу всех программ.

    Совет: Перед завершением работы всех программ советуем распечатать этот раздел.

    Откройте панель управления: Щелкните правой кнопкой мыши кнопку Пуск и затем выберите пункт Панель управления или введите Панель управления в поле поиска в Windows.

    На панели управления щелкните Программы , а затем - Программы и компоненты .

    Щелкните правой кнопкой мыши название выпуска Microsoft Office установлен, или щелкните правой кнопкой мыши Microsoft Office Word 2007 (в зависимости от того как часть Office или отдельной программы установлен Word) и нажмите кнопку Изменить .

    Выберите Добавить или удалить компоненты , а затем нажмите кнопку Продолжить .

    В разделе Параметры установки щелкните знак "плюс" (+) рядом с компонентом Средства Office .

    Щелкните стрелку рядом с компонентом Microsoft Office Document Imaging , выберите параметр Запускать все с моего компьютера , а затем нажмите кнопку Продолжить .

Шаг 2: Создание документа, который можно редактировать

Отсканируйте документ, следуя инструкциям для сканера.

Прежде чем продолжать , преобразуйте полученный файл в формат TIFF. Для этого можно использовать Paint или другую подобную программу.

Теперь у вас есть документ, который можно редактировать. Не забудьте сохранить новый файл, чтобы не потерять изменения.

При работе с электронными официальными бумагами между партнерами можно установить свои требования к правилам оформления документов, в том числе к сканам бумажных оригиналов. А вот при взаимодействии с официальными органами власти придется соблюдать требования чиновников. Надо отметить, что на законодательном уровне пока нет единых требований к сканированным бумагам, поэтому такие правила устанавливаются в каждом конкретном ведомстве самостоятельно.

Так, например, для подачи сканов в Арбитражный суд нужно учитывать, что документы, подаваемые через сайт, должны быть переведены в электронный вид в формат PDF. Цвет скан-копии должен быть черно-белый или серый. Если подписи в бумажном документе выполнены синей ручкой, важно, чтобы при сканировании такого документа было выбрано черно-белое решение. Кроме того, разрешение скана должно быть не менее 200 точек на дюйм (DPI). Очень важным является размер одного файла – он не должен превышать 10 Мб. Само собой, скан должен хорошо читаться, т. е. все надписи, печати, подписи должны быть различимы. При этом в каждом направленном вложении должно быть не более одного документа, такой файл должен иметь название, отражающее суть вложенного документа, и содержать количество страниц в нем. Например, название может быть таким: «Договор 15 от 12.12.2016 года 7л.pdf».

Требования к файлу

Единый портал государственных услуг, который на сегодняшний день позволяет компаниям решить многие свои вопросы не выходя из офиса, принимает сканированные документы, которые соответствуют определенным требованиям. Так, оцифровка бумаги должна включать в себя формирование электронных копий документов в формате TIFF, PDF. Кроме того, страницы, содержащие черно-белые и серые иллюстрации, сканируются в режиме 8-bit Grayscale (256 градаций серого) с разрешением 150 DPI или 300 DPI. Учтите, что страницы, содержащие цветные иллюстрации, сканируются в формате RGB (цветной режим) с разрешением 150 DPI или 300 DPI. Настройки яркости и контрастности производятся для достижения наилучшего результата в части четкости и цветности изображения и для оптимальной эффективности распознавания типографского текста. К тому же сканы должны открываться на просмотр стандартными средствами, предназначенными для работы с ними в среде операционной системы MS Windows 2000/XP/Vista/7/8 без предварительного вывода на экран каких-либо предупреждений или сообщений об ошибках. Не допускается в файлах устанавливать опцию запрета печати содержимого, также нельзя делать в них защиту паролем на открытие.

Обратите внимание

В письме ФНС от 9 февраля 2016 года № ЕД-4-2/1984@ указано, что на сегодняшний день возможность отправки документов в xml-формате установлена только для некоторых видов бумаг. В том числе для счетов-фактур; журнала учета полученных и выставленных счетов-фактур; книги покупок и книги продаж и дополнительных листов к ним, если они есть.

Учтите, в качестве основных форматов представления цифровых образов отсканированных документов должны использоваться TIFF и PDF. Использование других форматов не рекомендуется. Документы, состоящие из нескольких страниц, должны сканироваться в многостраничном режиме. То есть после оцифровки должен получиться один файл, содержащий образы всех страниц документа. В случае если документ состоит из одной бумажной страницы, допускается использовать формат JPEG. Формат PDF применяется для полного представления документа в электронном виде.

Мнение налоговиков

Особое мнение по вопросу цифровых документов имеется и у налоговых органов. Разрешено предоставить сканы от организации в порядке, определенном статьей 93 Налогового кодекса, в электронной форме (сканирование с сохранением реквизитов) по установленным форматам при условии заверения усиленной квалифицированной проверяемого лица или его представителя (абз. 4 п. 2 ст. 93 НК РФ). В письме ФНС от 9 февраля 2016 года № ЕД-4-2/1984@ указано, что на сегодняшний день возможность отправки документов в xml-формате установлена только для некоторых видов бумаг. Во-первых, это счет-фактура, в том числе корректировочный; журнал учета полученных и выставленных счетов-фактур; книга покупок и книга продаж и дополнительные листы к ним, если они есть. Во-вторых, это товарная накладная () и акт приемки-сдачи работ (услуг) (форматы рекомендованы приказом ФНС от 21 марта 2012 г. № ММВ-7-6/172@). В-третьих, документы о передаче товаров при торговых операциях, формат которых утвержден приказом ФНС от 30 ноября 2015 года № ММВ-7-10/551@. И в-четвертых, это бумаги о передаче результатов работ или оказании услуг, их формат утвержден приказом ФНС от 30 ноября 2015 года № ММВ-7-10/552@.

Формат описи

Приказом ФНС от 29 июня 2012 года № ММВ-7-6/465@ «Об утверждении формата описи документов, направляемых в налоговый орган в электронном виде по телекоммуникационным каналам связи» разработан формат описи. Речь идет о списке документов, направляемых инспекторам в электронном виде по ТКС, который включает и форматы, указанные в описи, и документы, представленные в виде скан-образов. Возможность их представления в виде сканированных копий установлена для следующих документов: договор, в том числе дополнения и изменения; спецификация, калькуляция, расчет цены и стоимости; акт приемки-сдачи работ и услуг; счет-фактура, в том числе корректировочный; товарно-транспортная накладная; товарная накладная ТОРГ-12; грузовая таможенная/транзитная декларация, в том числе добавочные листы к ним. На данный момент указанный перечень документов является исчерпывающим.

Проект приказа

Если документы составлены по форматам, установленным ФНС, они могут быть направлены в инспекцию в электронном виде с использованием любого программного обеспечения, в том числе с использованием системы электронного документооборота «Контур-Архив». ФНС уже разработала требования к формату материалов, составленных на бумажном носителе, и представляемых сканов. Эти требования касаются представления документов инспекторам по запросу согласно пункту 2 статьи 93 НК РФ. В настоящее время подготовлен проект приказа Службы, которым планируется утвердить требования к формату сканов.

Планируется установить следующие требования: документ, оформ-ленный на бумаге и истребованный ревизорами, преобразуется в электронный образ путем сканирования с сохранением реквизитов документа. Сам скан формируется в виде файлов изображений в формате TIFF, JPG, PDF, PNG. При этом сканирование должно производиться с разрешением не менее 150 и не более 300 DPI (точек на дюйм) с использованием 256 градаций серого цвета.

Обратите внимание

5 Мб и не более должен быть суммарный размер всех передаваемых файлов в рамках одного заявления.

Сканирование должно обеспечивать возможность свободного чтения текста, всех реквизитов, дат, виз, резолюций, иных надписей, печатей, штампов и отметок. А электронный образ надо направлять в инспекцию с использованием технологического XML-файла, формат которого устанавливается ФНС.

Направляемые ревизорам документы должны быть заверены усиленной квалифицированной электронной подписью проверяемого лица или его представителя. Имя представляемого файла электронного образа должно будет иметь следующий вид: KD_O_P_N1_GGGGMMDD_N2, где:

  • KD – префикс, принимающий четырехзначное значение, равное 1101 (истребованные документы);
  • О – идентификатор отправителя, имеет вид: девятнадцатиразрядный код (ИНН и КПП организации) – для организаций, двенадцатиразрядный код (ИНН физлица, при отсутствии ИНН – последовательность из двена-дцати нулей) – для физлиц;
  • P – идентификатор конечного получателя, четырехразрядный код налогового органа в соответствии с СОНО;
  • GGGGMMDD – дата формирования файла;
  • N1, N2 – идентификационные номера файла (GUID).

Сканирование документов и создание электронного архива могут занять у Вас длительное время, но, поверьте, это того стоит! Ведь грамотное сканирование позволяет пользоваться документами в электронном виде, а для бумажных носителей предусмотреть внеофисное хранение документов. Представьте, сколько офисного пространства Вы могли бы сэкономить!

Сканирование документов и создание электронного архива подразумевает три шага:

Шаг 1. Подготовка.

одного размера и в хорошем состоянии можно воспользоваться автоматическим устройством подачи документов. Кроме того, использование этого устройства при двусторонней печати поможет Вам существенно сэкономить время при сканировании документов.

Обязательно удалите все скобы и скрепки, разгладьте все загибы и складки на документах, чтобы избежать замятия бумаги в процессе сканирования.

Сканирование документов нестандартного размера нужно сканировать вручную.

Шаг 2. Выбор формата файлов.

Приступая ко второму шагу в процессе сканирования документов и создания электронного архива, задумайтесь, хотите ли Вы в будущем иметь возможность редактировать файлы в электронном архиве. Если Вы не собираетесь изменять отсканированные документы, сохраняйте их в формате PDF (Portable Document Format). В свою очередь, оптическое распознавание символов (OCR) позволяет сохранять документы в редактируемых форматах. При сканировании документов с OCR с расширением.RTF или.DOC, или с другим расширением, соответствующем приложению, которое Вы будете использовать для редактирования документа.

Итак, при сканировании и сохранении документов выберите один из следующих форматов:

  • Portable Document Format (PDF) – формат сохраненных файлов, позволяющий просматривать документы электронного архива на различных компьютерных платформах вне зависимости от шрифтов и программного обеспечения, использованных для создания оригинала.
  • Tagged Image Файл Format (TIFF) – формат высокого качества поддерживается в большинстве операционных систем, идеально подходит для сканирования и архивирования документов или чертежей, которые в дальнейшем можно будет изменять с помощью программ-редакторов изображения, таких как Adobe Photoshop.
  • Документы Microsoft Word (. DOC) или Microsoft Rich Text Format (. RTF) – цифровые текстовые форматы поддерживаются во всех операционных системах и позволяют также не допустить изменения документов.

Заключительный этап

Шаг 3. Хранение.

Закончив сканирование документов, Вы переходите к завершающему этапу создания электронного архива – передаче файлов на свой компьютер или другие устройства хранения информации. Для удобства можно воспользоваться специальными утилитами для создания электронного архива, или записать несколько DVD или CD дисков с отсканированными документами. Помните про резервные копии файлов электронного архива – они пригодятся в случае поломки компьютера.

BMP (от англ. Bitmap Picture) - формат хранения растровых изображений, разработанный компанией Microsoft. Файлы формата BMP могут иметь расширения.bmp, .dib и.rle.

С форматом BMP работает огромное количество программ, так как его поддержка интегрирована в операционные системы Windows и OS/2. Кроме того, данные этого формата включаются в двоичные файлы ресурсов RES и в PE-файлы. В данном формате можно хранить только однослойные растры. На каждый пиксель в разных файлах может приходиться разное количество бит (глубина цвета). Microsoft предлагает битности 1, 2, 4, 8, 16, 24, 32, 48 и 64. В битностях 8 и ниже он указывается индексом из таблицы цветов (палитры), а при больших непосредственным значением. Цвет же в любом случае можно задать только в цветовой модели RGB (как при непосредственном указании в пикселе, так и в таблице цветов), но в битностях 16 и 32 можно получить Grayscale с глубиной до 16 и 32 бит соответственно. Частичная прозрачность реализована альфа-каналом различных битностей, но при этом прозрачность без градаций можно косвенно получить RLE-кодированием.

В большинстве случаев пиксели хранятся в виде относительно простого двумерного массива. Для битностей 4 и 8 доступно RLE-кодирование, которое может уменьшить их размер. Формат BMP также поддерживает встраивание данных в форматах JPEG и PNG. Но последнее скорее больше предназначено не для компактного хранения, а для обхода ограничений архитектуры GDI, которая не предусматривает прямую работу с изображениями отличных от BMP форматов.

GIF (англ. Graphics Interchange Format - «формат для обмена изображениями») - популярный формат графических изображений. Способен хранить сжатые данные без потери качества в формате не более 256 цветов. Не зависящий от аппаратного обеспечения формат GIF был разработан в 1987 году (GIF87a) фирмой CompuServe для передачи растровых изображений по сетям. В 1989-м формат был модифицирован (GIF89a), были добавлены поддержка прозрачности и анимации. GIF использует LZW-компрессию, что позволяет сжимать файлы, в которых много однородных заливок (логотипы, надписи, схемы).



JPEG (произносится «джейпег » , англ. Joint Photographic Experts Group , по названию организации-разработчика) - один из популярных графических форматов, применяемый для хранения фотоизображенийи подобных им изображений. Файлы, содержащие данные JPEG, обычно имеют расширения (суффиксы) .jpg ,.jfif , .jpe или .jpeg . Однако из них .jpg является самым популярным на всех платформах. MIME-типом является image/jpeg.

PNG (англ. portable network graphics , сокращение произносится по-английски /pɪŋ/ ) - растровый формат хранения графической информации, использующий сжатие без потерь по алгоритму Deflate.TIFF (англ. Tagged Image File Format ) - формат хранения растровых графических изображений. TIFF стал популярным форматом для хранения изображений с большой глубиной цвета. Он используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. TIFF был выбран в качестве основного графического формата операционной системы NeXTSTEP и из неё поддержка этого формата перешла в Mac OS X. Формат был разработан Aldus Corporation в сотрудничестве с Microsoft для использования с PostScript. Компания-владелец спецификаций - Aldus Corporation - впоследствии объединилась с Adobe Systems, владеющей в настоящее время авторским правом на эти спецификации .

Изначально формат поддерживал сжатие без потерь, впоследствии формат был дополнен для поддержки сжатия с потерями в формате JPEG .

DjVu (от фр. déjà vu - «уже виденное») - технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов - книг, журналов, рукописей и прочее, где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценноераспознавание. Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов, где важное значение имеет не только содержание, но и цвет и фактура бумаги; дефекты пергамента: трещинки, следы от складывания; исправления, кляксы, отпечатки пальцев; следы, оставленные другими предметами и т. д.

Изначально технология была разработана Яном Лекуном, Леоном Боту и Патриком Хеффнером в AT&T Labs с 1996 по 2001 годы. DjVu стал основой для нескольких библиотек научных книг. Он довольно популярен, и в нём делается большое количество разных документов.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения загрузки файла. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлятьполнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области - ссылки, что позволяет реализовать удобную навигацию в DjVu-книгах.

  1. Что такое TWAIN?

TWAIN - стандартный протокол и интерфейс (API), определяющий взаимодействие между программами и устройствами захвата изображения, такими как сканеры и цифровые камеры.

Поскольку TWAIN не является протоколом аппаратного уровня, производитель устройств для получения изображений может предоставлять TWAIN-совместимый драйвер. Таким образом, становится возможным захват изображений не только со сканеров, но и некоторых веб-камер, не только при помощи Video for Windows, DirectShow или WIA, но и через TWAIN. Благодаря открытости стандарта становится возможным использование оборудования с программным обеспечением сторонних поставщиков, например камер для микроскопических систем Leica Microsystems (англ.).

В процессе работы используется несколько абстракций: англ. Data source manager, управляющий всеми доступными в системе TWAIN-совместимыми устройствами и англ. Data source object для каждого отдельного устройства, отвечающий за передачу и настройки захвата получаемого кадра.

Взаимодействие клиентского приложения и устройства можно представить следующим образом:

Диалог выбора устройства захвата (Data source manager)

Открытие источника данных (Data source) и настройка параметров захвата, с установкой разрешения изображения, разрядности и пр.

Клиентское приложение опрашивает устройство. Доступны два механизма: опроса и callback. В последнем случае устройство само сообщает о готовности изображения для передачи.

Собственно передача данных от DS. Существует несколько механизмов передачи:

Native - в Windows это Device independent bitmap в памяти

Memory - блоки пикселей в буферах памяти

File - DS записывает изображение непосредственно в файл (не обязательно поддерживается)

Закрытие источника данных

Если в распоряжении есть такая полезная техника, как сканер, то необходимо подобрать к ней хорошее программное обеспечение. Ведь без него не получится раскрыть все возможности устройства. А сканирование документов должно быть комфортным и качественным.

Диски не вечны

Обычно при покупке нового сканера пользователю достается диск с драйвером и программой. Но такие диски имеют свойство куда-то пропадать со временем. Тут-то и могут прийти мысли об использовании какой-либо альтернативной документов в PDF и других форматах. Ведь некоторые утилиты способны на большее в сравнении с оригинальным ПО к устройству.

Программа VueScan

Сканер является таким устройством, которое служит десять и более лет. Если им пользоваться не очень активно, он продолжает работать даже тогда, когда произошла смена нескольких компьютеров. Но производителей такая ситуация не устраивает. В этом можно убедиться, если попробовать подключить очень старый сканер к ПК с установленной новейшей операционной системой. Драйверы для него уже не выпускают, так как прекращена поддержка. И как же осуществлять сканирование документов? Ведь производители намекают на то, что нужно приобретать новое устройство. Тут приходит на помощь VueScan, которая играет роль универсального драйвера для устаревших моделей.

Использование данной в PDF, TXT, JPEG позволяет успешно работать и сохранять результаты либо отправлять их на печать. Пригодится она и владельцам новых моделей, так как имеет большое число настроек. Работает программа в двух режимах. Первый называется «Мастер» и организован в виде помощника. Здесь пользователю предлагается сканирование документов в Word или PDF либо отправка на печать. Интересная особенность данного режима в том, что пользователь не сталкивается с такими понятиями, как разрешение. Нужно только указать желаемое действие. Следующий этап - показ того, как будет выглядеть документ после сканирования. Его можно обрезать или повернуть.

Режим для профи

Если пользователь привык все держать под контролем, то ему необходим второй режим - «Детально». Программа за долгий срок существования приобрела огромное число возможностей. И этот режим - одна из них. Тут можно избавляться от зернистости, увеличивать резкость и восстанавливать оттенки.

Многочисленные настройки позволяют управлять балансом цветов, устанавливать автокадрирование и многое другое. Те опции, которые были подобраны, можно сохранить и использовать при сканировании документов всякий раз. Это очень удобно, если подготавливаются документы одного типа.

Прочие возможности

Кроме того, в программу встроена система распознавания текста, благодаря которой документы можно распознать, а на их основе создать текстовые файлы, в которых будет возможность включить функцию поиска по тексту. Конечно, не все документы корректно распознаются, но это не главная функция программы, а приятное дополнение. Профессиональное издание утилиты отличается от стандартного поддержкой цветовых пространств и ICC. А еще в ней есть калибровка цветов и возможность сканирования в формат RAW.

Программа для работы со сканером по сети

Как правило, сканеров меньше, чем рабочих компьютеров. И это приводит к некоторым неудобствам. К примеру, имеется пара настольных ПК и пара ноутбуков. Нужно решить, к какому устройству удобнее подключать сканер. Если в офисе к компьютеру подключен аппарат, человек, который за ним работает, может сойти с ума от наплыва желающих сделать сканирование документа. На использование компьютера выстраивается очередь.

Эту проблему способна решить программа BlindScanner. Ее использование позволяет получить доступ к сканеру с любого ПК в сети. Для этого на компьютер со сканером устанавливается серверная часть программы, а на остальные - клиентская. Вторая имеет дружелюбный интерфейс, и с ее помощью можно взять под контроль процесс сканирования. В первую очередь надо выбрать из списка устройств сканер, а затем определить место для сохранения документа и формат. Среди поддерживаемых - PDF, PNG, TIFF и другие распространенные типы файлов. Перед тем как сканировать, можно задавать разрешение и цветовой режим. Если сканирование предполагает множество документов, то можно задействовать специальную группу настроек. Их также можно сохранять для дальнейшего использования. Нужно отметить, что для связи с сервером программой используется порт 8900. Для корректной работы надо проследить, чтобы брандмауэр его не блокировал.

Программа для быстрой отправки сканов на печать

Не все утилиты, которые поставляются вместе с оборудованием, могут быстро отправлять документы на печать. Но функция эта является очень востребованной, ведь сканер и принтер, которые подключены к компьютеру, вполне заменяют ксерокс. Программа PhotoCopier Pro дает возможность отправлять сканы на принтер после того, как было произведено сканирование документов. Canon, HP и другие модели без проблем с ней работают.

Утилита очень легка в использовании. Все ее настройки помещаются в маленьком окне. Но есть возможность для более тонкой наладки. По умолчанию можно просмотреть документ, отцентрировать или обрезать его, снизить или повысить яркость, изменить масштаб. Здесь же указывается необходимое число копий, включается опция двухстороннего сканирования, и отключается автоподатчик бумаги. Для каждого цветового режима сканирования можно задавать разрешение и определять, необходимо ли в процессе включать функцию для создания негативов.

Все вышеперечисленные программы значительно облегчат сканирование документа. На компьютер их установить рекомендуется всем, кто занимается работой с документами.