UImageOCR: библиотека оптического распознавания символов для Python
Библиотека UImageOCR для Python 3.8+ (только для Windows) является надстройкой над библиотеками UImageC и UImageCV. Она позволяет преобразовать текст на изображении в редактируемый машиночитаемый текст, т. е. является библиотекой оптического распознавания символов (OCR — Optical Character Recognition).
UImageOCR: библиотека оптического распознавания символов для Python
Класс UStack: стек
Класс UQueue: очередь
Класс UBlock: прямоугольный блок
Создание иерархии блоков
Обводка границ блоков на изображении
Добавление объектов строк
Класс URow: строка внутри блока
Добавление объектов слов
Гистограммы для строки
Класс UWord: слово внутри строки
Добавление объектов букв
Список с токенами
Класс ULetter: буква внутри слова
Класс UToken: токен с результатом распознавания слова
Класс UPage: сегментация страницы с изображением текста
Разделение страницы с изображением текста на прямоугольные блоки
Разделение блока с изображением текста на строки
Вычисление гистограмм для всех строк и выполнение их анализа
Создание черно-белого изображения из текстовых строк
Разделение строк с изображением текста на слова
Представление нескольких столбцов как одного столбца