YAGF — программа, предоставляющая графический интерфейс пользователя для систем оптического распознавания символов CuneiForm и Tesseract. YAGF является свободно распространяемой программой для операционной системы Linux.
Возможности программы:
- Графические форматы ввода данных: PNG, JPEG, BMP, TIFF, GIF, Portable anymap (PNM, PGM, PBM, PPM) и другие. Импорт PDF-файлов с использованием программ Ghostscript или PDFtoPPM (входит в состав Poppler).
- Форматы вывода данных
- Текст: текстовый файл, HTML.
- Изображения: PNG, JPEG.
- Поворот страниц.
- Автоматическое и ручное выделение блоков текста на странице.
- Проверка орфографии при помощи программы Aspell.
- Получение изображений со сканера посредством программы XSane.
- Распознавание нескольких изображений по порядку за один проход (пакетное распознавание).
По материалам http://ru.wikipedia.org/wiki/YAGF
Программа YAGF доступна в официальном репозитории Ubuntu, поэтому ее можно установить через центр приложений Ubuntu или воспользоваться терминалом: