YAGF — ПРОГРАММА ДЛЯ РАСПОЗНАВАНИЯ ТЕКСТА

YAGF — программа, предоставляющая графический интерфейс пользователя для систем оптического распознавания символов CuneiForm и Tesseract. YAGF является свободно распространяемой программой для операционной системы Linux.
Возможности программы:
  • Графические форматы ввода данных: PNG, JPEG, BMP, TIFF, GIF, Portable anymap (PNM, PGM, PBM, PPM) и другие. Импорт PDF-файлов с использованием программ Ghostscript или PDFtoPPM (входит в состав Poppler).
  • Форматы вывода данных
    • Текст: текстовый файл, HTML.
    • Изображения: PNG, JPEG.
    • Поворот страниц.
  • Автоматическое и ручное выделение блоков текста на странице.
  • Проверка орфографии при помощи программы Aspell.
  • Получение изображений со сканера посредством программы XSane.
  • Распознавание нескольких изображений по порядку за один проход (пакетное распознавание).
По материалам http://ru.wikipedia.org/wiki/YAGF
Программа YAGF доступна в официальном репозитории Ubuntu, поэтому ее можно установить через центр приложений Ubuntu или воспользоваться терминалом:
sudo apt-get install yagf tesseract-ocr-rus
33548813

Добавить комментарий