Какой есть свободный или бесплатный аналог распознавания русских иероглифов с картинок (вроде Abby Finereader)? В смысле, наиболее точный и продвинутый. Платформы - win/lin

Аноним 17/06/15 Срд 19:24:31 #1 №1267048

Аноним 17/06/15 Срд 22:38:59 #2 №1267223

bump

Аноним 17/06/15 Срд 22:42:55 #3 №1267228

>>1267048
Пользуюсь пираткой этой хуйни, зависимость есть.

Аноним 17/06/15 Срд 22:47:30 #4 №1267234

>>1267048
http://alternativeto.net/software/abbyy-finereader/

Аноним 17/06/15 Срд 22:55:19 #5 №1267250

>>1267048
tesseract

/thread

Аноним 17/06/15 Срд 23:00:28 #6 №1267260

>>1267234
там одна хуйня

Аноним 17/06/15 Срд 23:07:13 #7 №1267272

>>1267260
Ну значит аналогов нет. /thread

Аноним 20/06/15 Суб 03:10:55 #8 №1269544

>>1267048
Ещё недавно пилили OpenOCR на основе исходного кода CuneiForm, но походу это всё уже загнулось. Протухший CuneiForm 12 можно бесплатно скачать на офсайте.
По большому счёту ни одной действительно годной альтернативы божественному во всех отношениях FineReader'у нет. Юзай пиратку, это несложно.
Со сканерами/МФУ иногда поставляют Readiris http://www.irislink.com/c2-3089-225/Readiris-15---OCR-Software--No-Retyping--No-Paper--Just-Smart-Documents.aspx в качестве довеска, но после FR абсолютно любая десктопная OCR кажется говном.

Аноним 20/06/15 Суб 11:56:21 #9 №1269746

>>1269544
А под линукс вообще нихуя нет? Ну, бля, отечественные прогерам похуй, видимо. Англюсик как нехуй сканируется/распознается.

Аноним 20/06/15 Суб 12:22:05 #10 №1269778

>>1269746
Есть движок FR. Обёртку пили сам, ведь ты линуксойд.

Аноним 20/06/15 Суб 12:27:13 #11 №1269781

>>1267048
С русским нормальных аналогов нет. Воруй.

Аноним 20/06/15 Суб 12:31:09 #12 №1269785

Когда что то давно не разрабатывается, это не равно плохой. Математика одна.
Cunei не меняет свой движок, например. Они пилят костыли для е-док оборота.

И совет - чекни гугл и мс облачные сервисы для распознования. Если не на постоянной основе надо распознавать - самое то.

Аноним 20/06/15 Суб 12:48:00 #13 №1269805

>>1269746
Чем тебя тессаракт не устраивает, он в тестах по качеству распознавания обходжит файнридер.

Аноним 20/06/15 Суб 21:54:52 #14 №1270555

>>1269805
Скачал - он даже не запускается. У него, вроде, даже нет графической оболочки.
Поясни как пользоваться-то?

Кстати, посоветуйте годную пиратку файнридера.

Аноним 20/06/15 Суб 22:11:19 #15 №1270587

>>1270555
https://ru.wikipedia.org/wiki/Tesseract

Аноним 20/06/15 Суб 22:14:26 #16 №1270593

>>1270555
Нахуй тебе гуевая морда? Есть гуевые морды, продаются отдельно, но куда проще написать скрипт, который автоматом будет сканировать пачку картинок и проверять по словарю, а потом склеивать в нужный формат, если надо.

man tesseract.

Аноним 20/06/15 Суб 22:16:09 #17 №1270596

>>1270593
Я в программировании мало разбираюсь.

>>1270587
Я скачал, а там какие-то неисполняемые файлы.

Аноним 20/06/15 Суб 22:29:37 #18 №1270610

>>1270596
apt install tesseract.

Аноним 20/06/15 Суб 22:30:22 #19 №1270611

>>1270610
У меня винда.

Аноним 20/06/15 Суб 22:33:05 #20 №1270615

>>1270555
>посоветуйте годную пиратку файнридера
http://nnm-club.me/forum/tracker.php?f=562&nm=finereader

Аноним 20/06/15 Суб 22:35:51 #21 №1270618

>>1270611
>Платформы - win/lin
>у меня винда

Логично.

Аноним 20/06/15 Суб 22:36:57 #22 №1270621

14348290174660.png

>>1270618
Установил, как запустить-то?

Аноним 20/06/15 Суб 22:38:50 #23 №1270622

>>1270621
В консольке запускай. Документацию почитай.
Не еби голову ни себе, ни людям. Своруй файнридер и переводи текстики, если нет желания читать документацию.

Аноним 20/06/15 Суб 22:40:41 #24 №1270623

>>1270622
Поясни, как в винде юзать командную строку?
Нашёл в документации это:
>tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfiles...]
Хоть попробую.

Аноним 20/06/15 Суб 22:43:03 #25 №1270627

>>1270623
win+r>cmd>enter

Аноним 20/06/15 Суб 22:46:38 #26 №1270632

14348295986240.png

>>1270627
Я тут попытался, но не вышло, что не так?

Аноним 20/06/15 Суб 22:48:34 #27 №1270634

>>1270632
>что не так?
Ты не читаешь первую же строку вывода, в которой указан способ использования.

Аноним 20/06/15 Суб 22:50:32 #28 №1270635

14348298326570.png

>>1270634
Ох нихуя себе, я даже на секунду почувствовал себя охуенным программистом, который может накодить мир.
Сейчас попробую рабочий жпег, если не получится, то нахуй.

Аноним 20/06/15 Суб 22:51:10 #29 №1270636

>>1270611
https://sourceforge.net/projects/gimagereader/files/3.1.1/
Качай бинарники для windows.

Аноним 20/06/15 Суб 22:52:19 #30 №1270638

>>1270635
Бля, он пдфы не жрёт.

Аноним 20/06/15 Суб 22:57:56 #31 №1270648

>>1270638
Ты можешь скачать гуевую обертку к tesseract, они пдф жрут, в википедии есть примеры, а лично я использую imagemagick обычно для конвертации и кропа пдф автоматом. В сперме консоль ой как сосет, и работать в ней ты заебешься, я бы не стал. Спермоконсоль хуже ада, такое говно как и сама сперма, впрочем. Ставь гуй.

Аноним 20/06/15 Суб 22:58:29 #32 №1270649

>>1270648
Что за гуй?

Аноним 20/06/15 Суб 22:59:07 #33 №1270650

>>1270649
http://sourceforge.net/projects/gimagereader/

Аноним 20/06/15 Суб 23:00:36 #34 №1270653

>>1270650
>>1270648
>imagemagick
Т.е. это юзать для пдф, а для жпега - тесеракт?

Аноним 20/06/15 Суб 23:09:00 #35 №1270667

14348309403090.png

>>1270648
Что-то у меня и имейджмагик не работает...

Аноним 20/06/15 Суб 23:18:18 #36 №1270677

>>1270667
Можешь скинуть pdf_ку?

Аноним 21/06/15 Вск 00:00:29 #37 №1270709

>>1270667
>IMDisplay
А зачем тебе эта утилита? Тебе нужен convert из набора imagemagick.

Аноним 21/06/15 Вск 00:09:39 #38 №1270714

Из всех гуев к тессеракту, что я перепробовал, самый годный оказался вьетнамский (да, пусть вас это не смущает) VietOCR - http://vietocr.sourceforge.net/ (вариант на дотнете, а не на жабе, но можно и на жабе, если извращенец)
Качаешь его, качаешь русский тессеракт, качаешь русский ханспелл (если спеллчекинг нужен), качаешь гостскрипт (если поддержка пдф нужна) и заебись
Есть русская локализация, мжно портабельным сделать

Аноним 21/06/15 Вск 09:41:28 #39 №1270855

>>1270677
http://rghost.net/6fvys6RNY
Вот.

Аноним 21/06/15 Вск 12:26:56 #40 №1270948

>>1270714
чет дохуя телодвижений. Оно точно заработает после всех шаманств?

Аноним 21/06/15 Вск 12:45:31 #41 №1270966

>>1270948
Это опенсорс, детка. Тем более, на винде. Это еще не шаманства, видел бы ты заведение ворда в вайне на линуксах.

Аноним 21/06/15 Вск 12:51:10 #42 №1270972

>>1270966
>ворда
Там же есть свои опеноффисы, зачем?

Аноним 21/06/15 Вск 12:52:29 #43 №1270973

Проигрываю с вас - весь тред одна ебля вместо того, что бы скачать файнридер с торрентов.

Аноним 21/06/15 Вск 13:32:19 #44 №1271001

>>1270972
Так полной совместимости не завезли.
>>1270973
Эта ебля кому-то в кайф просто. Мне вот в кайф.

[bump] Аноним 21/06/15 Вск 13:41:16 #45 №1271017

>>1271001
Да лано, не свисти. Только если с таблицами проблемы. А так даже колонтитулы в докикс не пидорасит.

Аноним 21/06/15 Вск 14:42:49 #46 №1271060

>>1270855
Tesseract+OCRFeeder
test1 распознавание русский
test2 распознавание английский
test3 распознавание no language
http://rghost.ru/6drXr8kpd
Итог двухязычный документ распознает плохо, но можно распознать по отдельности и отредактировать.

Аноним 21/06/15 Вск 14:53:32 #47 №1271067

Просунул писюн в тред и оросил шпермонеосилятора

Аноним 21/06/15 Вск 15:06:21 #48 №1271079

>>1271067
>писюн

Аноним 21/06/15 Вск 15:26:09 #49 №1271090

>>1271079
https://www.youtube.com/watch?v=vaFmretTrpM

Аноним 21/06/15 Вск 15:39:40 #50 №1271095

>>1271090
Прошло уж столько лет, а я вспоминаю, внезапный тот писюн! Ты зачем показывал мне, свой писюн в ночной тишине? Ты зачем показал мне его? Ты зачем показал мне, свой писюн?

Аноним 21/06/15 Вск 16:45:52 #51 №1271146

>>1271017
>Только если с таблицами проблемы
Да для меня это достаточная причина спиздись офис и за вечер неспешно раскатать его в вайне. А ну если еще какой нежданчик? Оно мне надо?

Аноним 21/06/15 Вск 16:51:45 #52 №1271158

>>1270973
Не всем совесть позволяет пиздить софт с торрентов (не все ж пидорахи).

Аноним 21/06/15 Вск 17:13:17 #53 №1271174

14348959973410.png

>>1267048
блять, даже в IrfanView есть плагин для OCR
хуевый, правда, но есть же
а ты , оп-хуй, уже четыре дня тут мозги ебешь, хотя сто раз мог попробовать разные варианты

Аноним 21/06/15 Вск 17:54:49 #54 №1271201

14348984894070.png

>>1271060
>Итог двухязычный документ распознает плохо

Для того, чтоб распознать двухязычный текст, нужно давать ему два языка в настройках:

tesseract -l rus+eng исходник.png результат

собсна вот:

http://rghost.ru/6zXkWFst2

Аноним 21/06/15 Вск 17:55:48 #55 №1271203

>>1271201
Дальше прогоняешь через любой словарик и готово.

Аноним 22/06/15 Пнд 13:59:25 #56 №1271894

>>1271174
> KaKo~ ecTm cBo6o""HbIu
О, да, охуенный плагин охуенного OCR. Всем рекомендую.

Аноним 24/06/15 Срд 00:45:45 #57 №1273165

>>1271894
Так если основным языком английский поставил, не удивительно.

Аноним 24/06/15 Срд 15:18:40 #58 №1273541

>>1270632
Ошибка в твоём генном коде, обмудок.