Главная » OCR

UNumbers36: OCR dataset с черно-белыми цифрами

Набор данных с черно-белыми изображениями цифр UNumbers36 v1.0.0, включает нормализованные шаблоны цифр (всего 164 578 цифр), приведенные к ограничивающей области размерами 36 на 36 px при соблюдении пропорций. Если высота символа больше или равна ширине, то значение 36 px получает высота, а ширина изменяется пропорционально. В противном случае ширина получает значение 36 px, а высота изменяется пропорционально. Благодаря этому можно подать на вход нейросети вектор длиной 36 на 36, итого 1296 значений 0 или 1.

Следует учитывать, что символы не только приведены к одному размеру, но и были прореж ... Читать дальше »

Категория: OCR | Просмотров: 6 | Добавил: unicross | Дата: 19.11.2025 | Комментарии (0)

OCR dataset USymbols36 с черно-белыми изображениями символов

Набор данных с черно-белыми изображениями символов USymbols36, включает нормализованные шаблоны символов (всего 1 169 673 символов), приведенные к ограничивающей области размерами 36 на 36 px при соблюдении пропорций. Если высота символа больше или равна ширине, то значение 36 px получает высота, а ширина изменяется пропорционально. В противном случае ширина получает значение 36 px, а высота изменяется пропорционально. Благодаря этому можно подать на вход нейросети вектор длиной 36 на 36, итого 1296 значений 0 или 1.

Следует учитывать, что символы не только приведены к одному размеру, но и были прорежены. Символы, которые на 90% похожи на символ в базе данных, не добавлялись. Благодаря этому размер базы удалось уменьшить примерно в 2 раза. Таким образом база охват ... Читать дальше »

Категория: OCR | Просмотров: 10 | Добавил: unicross | Дата: 19.11.2025 | Комментарии (0)

База черно-белых символов для распознавания

База данных с изображениями черно-белых символов из 250-ти шрифтов. Символы распределены по файлам с названиями высота-ширина.txt. Файлы в свою очередь распределены по папкам, имеющими названия в виде высоты символа. Всего 50 папок (высота символа от 1 до 50 px) и 3182 файла. Размер базы данных 843 МБ (в архиве 78 МБ). Базу можно использовать для машинного обучения, а также непосредственно для распознавания символов.

База содержит символы следующих классов:

Категория: OCR | Просмотров: 6 | Добавил: unicross | Дата: 19.11.2025 | Комментарии (0)

Наборы данных с изображениями шрифтов (для машинного обучения, распознавания символов)

Наборы данных с изображениями 250 шрифтов предназначены для машинного обучения в целях дальнейшего оптического распознавания символов (OCR, optical character recognition). Набор содержит несколько изображений в формате PNG с оттисками символов шрифта на белом фоне. Каждый символ находится в ячейке размерами 100x100 пикселей (где-то посередине ячейки). Местоположение каждого символа в наборе задается индексами, относительно левого верхнего угла изображения. Благодаря этому можно программно считать оттиск символа из изображения.

Каждый шрифт располагается в отдельной папке.

Внутри папки со шрифтом находятся вложенные папки с названиями стилей шрифта, например, normal, bold, ... Читать дальше »

Категория: OCR | Просмотров: 5 | Добавил: unicross | Дата: 19.11.2025 | Комментарии (0)

Категории раздела
Списки слов [10]
Списки слов и словари
OCR [4]
Оптическое распознавание символов
UImage [18]
Графическая библиотека для Python
Программы [4]
Полезные программы
Прочее [3]
Другие темы
Календарь
«  Декабрь 2025  »
Пн Вт Ср Чт Пт Сб Вс
1234567
891011121314
15161718192021
22232425262728
293031
Архив записей