Главная » 2025 » Ноябрь » 19

UNumbers36: OCR dataset с черно-белыми цифрами

Набор данных с черно-белыми изображениями цифр UNumbers36 v1.0.0, включает нормализованные шаблоны цифр (всего 164 578 цифр), приведенные к ограничивающей области размерами 36 на 36 px при соблюдении пропорций. Если высота символа больше или равна ширине, то значение 36 px получает высота, а ширина изменяется пропорционально. В противном случае ширина получает значение 36 px, а высота изменяется пропорционально. Благодаря этому можно подать на вход нейросети вектор длиной 36 на 36, итого 1296 значений 0 или 1.

Следует учитывать, что символы не только приведены к одному размеру, но и были прореж ... Читать дальше »

Категория: OCR | Просмотров: 7 | Добавил: unicross | Дата: 19.11.2025 | Комментарии (0)

OCR dataset USymbols36 с черно-белыми изображениями символов

Набор данных с черно-белыми изображениями символов USymbols36, включает нормализованные шаблоны символов (всего 1 169 673 символов), приведенные к ограничивающей области размерами 36 на 36 px при соблюдении пропорций. Если высота символа больше или равна ширине, то значение 36 px получает высота, а ширина изменяется пропорционально. В противном случае ширина получает значение 36 px, а высота изменяется пропорционально. Благодаря этому можно подать на вход нейросети вектор длиной 36 на 36, итого 1296 значений 0 или 1.

Следует учитывать, что символы не только приведены к одному размеру, но и были прорежены. Символы, которые на 90% похожи на символ в базе данных, не добавлялись. Благодаря этому размер базы удалось уменьшить примерно в 2 раза. Таким образом база охват ... Читать дальше »

Категория: OCR | Просмотров: 10 | Добавил: unicross | Дата: 19.11.2025 | Комментарии (0)

База черно-белых символов для распознавания

База данных с изображениями черно-белых символов из 250-ти шрифтов. Символы распределены по файлам с названиями высота-ширина.txt. Файлы в свою очередь распределены по папкам, имеющими названия в виде высоты символа. Всего 50 папок (высота символа от 1 до 50 px) и 3182 файла. Размер базы данных 843 МБ (в архиве 78 МБ). Базу можно использовать для машинного обучения, а также непосредственно для распознавания символов.

База содержит символы следующих классов:

Категория: OCR | Просмотров: 6 | Добавил: unicross | Дата: 19.11.2025 | Комментарии (0)

Наборы данных с изображениями шрифтов (для машинного обучения, распознавания символов)

Наборы данных с изображениями 250 шрифтов предназначены для машинного обучения в целях дальнейшего оптического распознавания символов (OCR, optical character recognition). Набор содержит несколько изображений в формате PNG с оттисками символов шрифта на белом фоне. Каждый символ находится в ячейке размерами 100x100 пикселей (где-то посередине ячейки). Местоположение каждого символа в наборе задается индексами, относительно левого верхнего угла изображения. Благодаря этому можно программно считать оттиск символа из изображения.

Каждый шрифт располагается в отдельной папке.

Внутри папки со шрифтом находятся вложенные папки с названиями стилей шрифта, например, normal, bold, ... Читать дальше »

Категория: OCR | Просмотров: 5 | Добавил: unicross | Дата: 19.11.2025 | Комментарии (0)

Тренажер для изучения английских слов (версия для браузера)

Программа Program5 для Web-браузера реализует тренажер для запоминания, изучения или повторения английских слов. Изучая английские слова вместе с Program5 можно в кратчайшие сроки увеличить свой словарный запас до 9 тысяч английских слов. В состав программы входят словари, распределенные по тематикам или по частотности использования слов на практике.

Тренажер состоит из набора HTML-страниц, которые можно открыть с помощью вашего любимого браузера. Если этот набор загрузить в какую-либо папку на вашем сайте, то тренажер станет доступен вам через Интернет в любой точке планеты и вы сможете изучать английские слова в вашем любимом смартфоне по пути на работу или в отпуск.
... Читать дальше »
Категория: Программы | Просмотров: 4 | Добавил: unicross | Дата: 19.11.2025 | Комментарии (0)

Преобразование ODT в HTML 5 со стилями

Программа предназначена для конвертации (преобразования) информации из файла формата ODT (OpenDocument OpenOffice Writer 4.1) в формат валидного HTML 5 со стилями. Код программ на разных языках программирования подсвечивается. Для стилизации используется библиотека Bootstrap 4.5 и собственные стили, которые вы можете изменить на своё усмотрение

Помимо преобразования форматов программа позволяет разбить документ на фрагменты и вставить в шаблоны HTML-страниц. После преобразования можно сразу загрузить страницы на сервер без необходимости дополнительной обработки. Таким образом, программа является генератором HTML-страниц для сайта.
Категория: Программы | Просмотров: 5 | Добавил: unicross | Дата: 19.11.2025 | Комментарии (0)

Категории раздела
Списки слов [10]
Списки слов и словари
OCR [4]
Оптическое распознавание символов
UImage [18]
Графическая библиотека для Python
Программы [4]
Полезные программы
Прочее [3]
Другие темы
Календарь
«  Ноябрь 2025  »
Пн Вт Ср Чт Пт Сб Вс
     12
3456789
10111213141516
17181920212223
24252627282930
Архив записей