[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Распознание текста
T1grOK
Кто сталкивался с задачей распознания текста на картинке? Чем лучше всего это делать?
Пошарил по интернету нашел, якобы неплохое решение, путем вызова внешней программы(СuneIForm). На деле еще не проверил насколько это качественно работает.
Что скажете по поводу СuneIForm? Или может какой другой вариант?

_____________
Mysql, Postgresql, Redis, Memcached, Unit Testing, CI, Kohana, Yii, Phalcon, Zend Framework, Joomla, Open Cart, Ymaps, VK Api
jetistyum
captchabot и подобные сервисы
T1grOK
Нет не подходит. Оно ведь платное.
Мне нужно распознать самый обычный текст, то есть белый фон, черный текст, один и тот же шрифт. Ничем не извращенный как в каптчах.

_____________
Mysql, Postgresql, Redis, Memcached, Unit Testing, CI, Kohana, Yii, Phalcon, Zend Framework, Joomla, Open Cart, Ymaps, VK Api
vital
Цитата (T1grOK @ 12.11.2012 - 13:11)
Нет не подходит. Оно ведь платное.
Мне нужно распознать самый обычный текст, то есть белый фон, черный текст, один и тот же шрифт. Ничем не извращенный как в каптчах.

Дык. Тогда не сложно совсем разобрать текст и руками.
На хабре были статьи про такие случаи. Вам не повезло с гуглом)

_____________
"Нужно быть готовым прислушиваться к тем, кто может тебя чему-нибудь научить. Иначе ты никогда не вырастешь."

Откровенно я никому ниразу не нагрубил. А дать подзатыльник зарвавшемуся юнцу, так это и ему на пользу, и мне в удовольствие. © AllesKlar
sharki
как вариант подрочить гугл на способ разбора вручную, или попробовать сделать что-то на подобии http://habrahabr.ru/post/130601/ , но сперва картинки запилить в пдфки. Под линукс куча прог для таких вещей, я когда баловался нодом, решил сконвертить пдф в txt нашел уйма прог, за пол часа всё получилось =)

А если ты решил на чистом пыхе все сделать, сочувствую)
Hello
T1grOK
http://en.wikipedia.org/wiki/Comparison_of...nition_software
выбирай
Tesseract довольно простой

_____________
VPS от 5$, первые 2 месяца - бесплатно.
T1grOK
Попробовал я СuneIForm....Что сказать....Г...
Идеальный шрифт, большая картинка...и все равно ошибки...
А если шрифт хоть чуть чуть под наклоном...то вообще ниче не распознает...

_____________
Mysql, Postgresql, Redis, Memcached, Unit Testing, CI, Kohana, Yii, Phalcon, Zend Framework, Joomla, Open Cart, Ymaps, VK Api
T1grOK
Цитата (vital @ 12.11.2012 - 11:18)
Дык. Тогда не сложно совсем разобрать текст и руками.
На хабре были статьи про такие случаи. Вам не повезло с гуглом)

Самоубийством заниматься я еще не хочу biggrin.gif

_____________
Mysql, Postgresql, Redis, Memcached, Unit Testing, CI, Kohana, Yii, Phalcon, Zend Framework, Joomla, Open Cart, Ymaps, VK Api
T1grOK
С оф сайта CuneiForm

При распознавании с помощью CuneiForm сохраняется структура документа и его форматирование.
Программа распознает таблицы любой структуры и сложности, в том числе и без отображения линий табличной сетки.
Распознаются любые печатные шрифты: книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п.

Это явно на прикол похоже. Это программа для Нераспознания текста biggrin.gif

_____________
Mysql, Postgresql, Redis, Memcached, Unit Testing, CI, Kohana, Yii, Phalcon, Zend Framework, Joomla, Open Cart, Ymaps, VK Api
T1grOK
Такс. В который час гугления нашел, что FineReader 8 имеет инструмент для вызова через консоль...
Не там то было...все время просит активацию....кучу патчей перепробовал, бесполезно! Обычный запуск - пожалуйста, консоль - посылает!
Через N часов гугления нашел, нормальный кейген. Ура, заработало!
Теперь проблема с выгрузкой - есть возможность выгрузить в буфер обмена в ворд эксель....и то они запускаются после распознания... mad.gif

_____________
Mysql, Postgresql, Redis, Memcached, Unit Testing, CI, Kohana, Yii, Phalcon, Zend Framework, Joomla, Open Cart, Ymaps, VK Api
T1grOK
Продолжаем! smile.gif С помощью FineOCR распознаю картинку, результат помещаю в буфер обмена. С помощью GetClip извлекаю данные из буфера обмена smile.gif

P.S. Если кому интересно могу создать отдельную тему с полным описанием "Опыт дурака или как правильно настроить FineOCR" smile.gif

_____________
Mysql, Postgresql, Redis, Memcached, Unit Testing, CI, Kohana, Yii, Phalcon, Zend Framework, Joomla, Open Cart, Ymaps, VK Api
vital
http://en.wikipedia.org/wiki/Ocrad

_____________
"Нужно быть готовым прислушиваться к тем, кто может тебя чему-нибудь научить. Иначе ты никогда не вырастешь."

Откровенно я никому ниразу не нагрубил. А дать подзатыльник зарвавшемуся юнцу, так это и ему на пользу, и мне в удовольствие. © AllesKlar
соучастник
T1grOK
создай, чем больше инфы будет по вопросу тем лучше
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.