Наиболее распространенные системы оптического распознавания символов, например, ABBYY FineReader иCuneiForm от Cognitive, используют как растровый, так и структурный методы распознавания. Кроме того, эти системы являются «самообучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов) и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.
Существует также системы On-line распознавания текста:Online OCR иABBYY FineReader Online
(http://www.onlineocr.ru , http://finereader.abbyyonline.com)
При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются различного вида бланки с полями. Рукописные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.
Сложность состоит в том, что необходимо распознавать символы, написанные от руки, а они довольно сильно различаются у разных людей. Кроме того, система должна определить, к какому полю относится распознаваемый текст.
Системы распознавания рукописного текста. С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.
Это приложения, которые производят сканирование и распознавание текста, от англ. Optical Character Recognition - Оптическое распознавание символов
Это программы для перевода
изображений документов в редактируемый текст, который можно затем обрабатывать в текстовых и табличных редакторах. По сравнению с ручной перепечаткой текста, такие программы дают существенный выигрыш вскорости работы, к тому же делают меньше ошибок.Еще одно достоинство - возможность сохранить
иллюстрации, а они иногда не менее
Это бесплатная программа сканирования и распознавания текста российского разработчика Cognitive Technologies.
OCR CuneiForm обеспечивает быстрое, удобное и качественное распознавание текста с сохранением исходного вида документа. Поддерживается распознавание с более 20 языков, среди них русский, украинский, английский, немецкий, французский, испанский, итальянский, португальский,
шведский, финский, сербский,Скачать бесплатно программу хорватский, польский, а также сканирования и распознавания распознавание смешанноготекста русско-английского текста.OCR Cuneiform 12 (freeware) с
http://depositfiles.com/files/sj9pt7q6x
Популярная программа распознавания текста российской компании ABBYY
Программа производит распознавание текста с более 180 языков , для38 из них предусмотрена встроенная проверка орфографии. Начиная с версииProfessional , распознаются иврит, японский, тайский, китайский языки. Finereader открывает файлы графических форматов (TIFF, JPG, PFD, PNG и др.) в том числеDjVu – компактный формат для хранения отсканированных документов, книг.
Стоимость программы 3990 рублей
Популярная программа распознавания текста российской компании ABBYY
Программа отличается высокой скоростью и точностью распознавания. Распознаются более 120 языков с различными алфавитами:латинский,
греческий алфавиты, кириллица, китайский, японский и корейский
языки. Как и FineReader, OmniPage уверенно распознает документы, полученные с помощью цифровых камер с помощью технологии коррекции изображения "3D Correction".
Стоимость программы 6090 рублей (150 евро)
Программа сканирования и распознавания текста
компании I.R.I.S.
Поддерживается распознавание текста с более 120 языков распознавания, включая русский, а также ближневосточные языки -
арабский, иврит, фарси (в версии Middle-East) и
японский, китайский, корейский (в версии Asian). Есть версия Readiris для
Macintosh.
Вместе с поддержкой распознавания популярных форматов картинок, распознаются файлы PDF и
DjVu.
Программа распознавания текста компании Microsoft
Программа Document Imaging способна работать только с двумя языками: английским и языком локализации самого MS Office. Для поддержки других языков необходимо дополнительно устанавливать пакетMultilingual User Interface (MUI).OCR
настроек в программе практически нет, программа в автоматическом режиме поддерживает распознавание типа и размера шрифтов, картинок и простых таблиц.
Стоимость программы входит в стоимость пакета MS Office.
Название программы : OCR CuneiForm
Версия : 12
Размер : 33,4 Мб
Язык : несколько языков в т.ч. русский
Тип программы : распознавание текста
Лицензия : свободная с открытым кодом
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.
OCR CuneiForm это:
В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.
Что такое CuneiForm? CuneiForm - это система оптического распознавания крупнейшего российского разработчика программного обеспечения Cognitive Technologies, которая обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов, получаемых, например, со сканера или факса, в редактируемый текст для последующей работы с ним в текстовых редакторах.
Для кого предназначена OCR CuneiForm? Система распознавания текстов CuneiForm предназначена для всех, кому приходится вводить в компьютер факсы, книги, газеты, машинописные страницы, тексты договоров и т.д. Для работы с системой достаточно положить страницу с текстом в сканер, нажать кнопку, и через несколько секунд Вы получите готовый результат в многофункциональном текстовом редакторе.
Какие шрифты распознает OCR CuneiForm, требуется ли обучение? CuneiForm - шрифтонезависимая (OmniFont) система. Алгоритмы, заложенные в CuneiForm, исходят из правил написания букв, из их топологии, и не требуют задания каких-либо эталонов, или обучения.
В системе используется технология интеллектуального самообучения на базе адаптивного распознавания символов.
Распознаются любые печатные шрифты - книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п.
Не распознается рукописный текст и декоративные шрифты (готический, стилизованный под рукописный).
В CuneiForm существуют специальные настройки для распознавания текстов с матричного принтера и факсов 200x100 dpi.
Чем OCR CuneiForm отличается от других подобных программ?
Поддерживает ли OCR CuneiForm работу с таблицами? Да. Программа автоматически находит в тексте таблицы различной структуры, в том числе без линий разграфки. Встроенный редактор поддерживает редактирование таблиц (можно уменьшать/увеличивать, удалять/создавать колонки и т.д.)
Как OCR CuneiForm отнесется к картинкам в тексте? Как пожелаете. Может просто проигнорировать их присутствие, а может сохранить в выходном документе в черно-белом, сером или цветном виде, в зависимости от вашего желания.
Информация взята с официального сайта программы
Дата добавления обзора: 05.07.2009 г.
Информация об OCR CuneiForm:
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.
OCR CuneiForm это:
Основные возможности OCR CuneiForm
1. ИНТЕРФЕЙС
Интерфейс программы содержит выпадающие контекстные меню, панели быстрого доступа, контекстную помощь.
2. СКАНИРОВАНИЕ
3. ФРАГМЕНТАЦИЯ
4. РАСПОЗНАВАНИЕ
5. ЯЗЫКОВАЯ ПОДДЕРЖКА
Система распознает русский, английский, смешанный русско-английский, украинский, немецкий, французский, испанский, португальский, итальянский, голландский, датский, шведский, финский, сербский, хорватский, польский, казахский, узбекский и другие языки.
6. СЛОВАРНЫЙ КОНТРОЛЬ
7. РЕАЛИЗАЦИЯ ПРИНЦИПА "What You Scan Is What You Get" ("Что Вы сканируете, то и получаете").
CuneiForm позволяет получить полную копию вводимого документа, включая:
8. РАБОТА С ТАБЛИЦАМИ
9. РЕДАКТИРОВАНИЕ
В программу встроен многофункциональный редактор, не уступающий по своим возможностям популярным текстовым процессорам.
10. ИНТЕГРАЦИЯ С ДРУГИМИ ПРИЛОЖЕНИЯМИ
Опции командной строки и поддержка Drag&Drop для вызова из внешних приложений, сканирования, распознавания и сохранения результатов в автоматическом режиме.
Скачать программу OCR CuneiForm (.zip-файл, 33,3 Мб.) Обратите внимание на вес файла!!!