Страница: 1 | 2 |
Вопрос: Алгоритм распознания текста
Добавлено: 24.10.05 01:42
Автор вопроса: vito | Web-сайт:
Никто не знает хоть какой-нибудь алоритм распознания текста? Или символа?
Ответы
Всего ответов: 18
Номер ответа: 1
Автор ответа:
Sur
ICQ: 1249088
Вопросов: 10
Ответов: 304
Web-сайт:
Профиль | | #1
Добавлено: 24.10.05 16:06
так например:
http://www.programmersheaven.com/zone1/cat1264/18107.htm
Номер ответа: 2
Автор ответа:
vito
Разработчик Offline Client
Вопросов: 23
Ответов: 879
Web-сайт:
Профиль | | #2
Добавлено: 24.10.05 17:05
Спасибо. Сейчас будем посмотреть.
Номер ответа: 3
Автор ответа:
vito
Разработчик Offline Client
Вопросов: 23
Ответов: 879
Web-сайт:
Профиль | | #3
Добавлено: 24.10.05 17:55
Как и ожидалось. Имеем базу символов, ищем соответствия, фильтруя шум.
Млин придется все - таки работать
Номер ответа: 4
Автор ответа:
AndreyMp
ICQ: 237822510
Вопросов: 28
Ответов: 1182
Профиль | | #4
Добавлено: 24.10.05 18:01
Кто то на сорцах писал подобное. Не помню кто, примерно год назад это было. У меня прога без исходников скачана 05.10.2004.
Номер ответа: 5
Автор ответа:
AgentFire
ICQ: 192496851
Вопросов: 75
Ответов: 3178
Профиль | | #5
Добавлено: 24.10.05 18:32
А ты другое ожидал, А что именно?
Номер ответа: 6
Автор ответа:
vito
Разработчик Offline Client
Вопросов: 23
Ответов: 879
Web-сайт:
Профиль | | #6
Добавлено: 24.10.05 19:04
Ну а вдруг?)
Кстати, как винда распознает символы??????
Тот же Word например?
Номер ответа: 7
Автор ответа:
HACKER
Разработчик Offline Client
Вопросов: 236
Ответов: 8362
Профиль | | #7
Добавлено: 24.10.05 20:10
vito, а зачем? Всёравно конкуренцию FineReader'у не составиш, а такие программу, которые пишут Васи-одиночки (не тебе в обиду, просто FineReader'a чел 100 пишут одновременно, а одному и браться нет смысла), так вот подобная прога Васи Пупкина на фоне FineReader'a - даже не маленькая пони, её жалко как птичку...
Номер ответа: 8
Автор ответа:
vito
Разработчик Offline Client
Вопросов: 23
Ответов: 879
Web-сайт:
Профиль | | #8
Добавлено: 24.10.05 21:02
HACKER
Тут несколько другая задача. Нужно реализовать этот блок, в общей программе. Да и не для себя пишу, заказик такой.
Номер ответа: 9
Автор ответа:
HACKER
Разработчик Offline Client
Вопросов: 236
Ответов: 8362
Профиль | | #9
Добавлено: 24.10.05 22:36
а, ну заказик да...
Ну и хоть чё-то в тему вопроса Распознать можно в лоб, терпение и труд всё перетрут Берём каждый символ и записуем его пиксельные координаты каждой точки - это будет оригинал, потом при распознавании "выдираем" 1 символ, разбиваем его по пикселям и сравниваем с оригиналом. Ну короче думаю намёк понял, сравнивать каждую точку. Конечно наверника это самый плохой способ, другого ничего пока немогу придумать.
Номер ответа: 10
Автор ответа:
GSerg
Вопросов: 0
Ответов: 1876
Профиль | | #10
Добавлено: 24.10.05 22:50
Word не распознаёт символы вообще.
Угу.
Нейронная сеть.
Пример на VB есть... Правда, линк, откуда он скачан, уже не работает.
Номер ответа: 11
Автор ответа:
vito
Разработчик Offline Client
Вопросов: 23
Ответов: 879
Web-сайт:
Профиль | | #11
Добавлено: 24.10.05 23:38
Да сеть уже создана и обкатывается. Результаты классные!
На данном этапе она умеет распознавать очень зашумленные изображения. Но работаю с самопальным шаблоном. Мне было интересно использовать в готовые шрифты винды для настройки.
Word не распознаёт символы вообще.
Поподробнее можно?
Номер ответа: 12
Автор ответа:
vito
Разработчик Offline Client
Вопросов: 23
Ответов: 879
Web-сайт:
Профиль | | #12
Добавлено: 24.10.05 23:55
Сейчас разбираюсь с API GetGlyphOutline(она возвращает битмар или контур шрифта).
Вот мне и стало интересно как винда эту функцию использует.
Номер ответа: 13
Автор ответа:
GSerg
Вопросов: 0
Ответов: 1876
Профиль | | #13
Добавлено: 25.10.05 00:32
Поподробнее можно?
А куда подробнее. Картинку ему дай - она картинкой и будет.
Номер ответа: 14
Автор ответа:
Sharp
Лидер форума
ICQ: 216865379
Вопросов: 106
Ответов: 9979
Web-сайт:
Профиль | | #14
Добавлено: 29.10.05 02:31
Можно векторизовать изображение символа а'ля Flash, а затем считать сдвиги узлов для приведения в имеющийся набор символов. А FineReader'у сильно не достает 3 хороших и нужных вещей, вместо которых ABBYY, к сожалению, совершенствует защиту, и добавляет разные мелкие примочки и мало кому нужные языки. Это:
1) Распознавание криволинейного текста (при сканировании книг не всегда возможно получить идеально ровные строчки)
2) Несовершенный алгоритм определения картинок-текста (достаточно было бы добавить уменьшающуюся вероятность усложнения контура границы раздела, ведь совсем немного материалов с очень сложным взаимодействием графики и текста)
3) Абсолютное непонимание математических формул, хотя их распознавание не особо сложная задача.
Номер ответа: 15
Автор ответа:
HACKER
Разработчик Offline Client
Вопросов: 236
Ответов: 8362
Профиль | | #15
Добавлено: 31.10.05 23:51
ставь новее FR.
Да и в прочем, куда там команде разработчиков ABBYY до Sharp'a