Прошлые домены не функционирует! Используйте адрес ARHIVACH.VC.
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Какой есть свободный или бесплатный аналог распознавания русских иероглифов с картинок (вроде Abby Finereader)? В смысле, наиболее точный и продвинутый. Платформы - win/lin
>>1267048 Ещё недавно пилили OpenOCR на основе исходного кода CuneiForm, но походу это всё уже загнулось. Протухший CuneiForm 12 можно бесплатно скачать на офсайте. По большому счёту ни одной действительно годной альтернативы божественному во всех отношениях FineReader'у нет. Юзай пиратку, это несложно. Со сканерами/МФУ иногда поставляют Readiris http://www.irislink.com/c2-3089-225/Readiris-15---OCR-Software--No-Retyping--No-Paper--Just-Smart-Documents.aspx в качестве довеска, но после FR абсолютно любая десктопная OCR кажется говном.
Когда что то давно не разрабатывается, это не равно плохой. Математика одна. Cunei не меняет свой движок, например. Они пилят костыли для е-док оборота.
И совет - чекни гугл и мс облачные сервисы для распознования. Если не на постоянной основе надо распознавать - самое то.
>>1270555 Нахуй тебе гуевая морда? Есть гуевые морды, продаются отдельно, но куда проще написать скрипт, который автоматом будет сканировать пачку картинок и проверять по словарю, а потом склеивать в нужный формат, если надо.
>>1270621 В консольке запускай. Документацию почитай. Не еби голову ни себе, ни людям. Своруй файнридер и переводи текстики, если нет желания читать документацию.
>>1270622 Поясни, как в винде юзать командную строку? Нашёл в документации это: >tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfiles...] Хоть попробую.
>>1270634 Ох нихуя себе, я даже на секунду почувствовал себя охуенным программистом, который может накодить мир. Сейчас попробую рабочий жпег, если не получится, то нахуй.
>>1270638 Ты можешь скачать гуевую обертку к tesseract, они пдф жрут, в википедии есть примеры, а лично я использую imagemagick обычно для конвертации и кропа пдф автоматом. В сперме консоль ой как сосет, и работать в ней ты заебешься, я бы не стал. Спермоконсоль хуже ада, такое говно как и сама сперма, впрочем. Ставь гуй.
Из всех гуев к тессеракту, что я перепробовал, самый годный оказался вьетнамский (да, пусть вас это не смущает) VietOCR - http://vietocr.sourceforge.net/ (вариант на дотнете, а не на жабе, но можно и на жабе, если извращенец) Качаешь его, качаешь русский тессеракт, качаешь русский ханспелл (если спеллчекинг нужен), качаешь гостскрипт (если поддержка пдф нужна) и заебись Есть русская локализация, мжно портабельным сделать
>>1270855 Tesseract+OCRFeeder test1 распознавание русский test2 распознавание английский test3 распознавание no language http://rghost.ru/6drXr8kpd Итог двухязычный документ распознает плохо, но можно распознать по отдельности и отредактировать.
>>1271090 Прошло уж столько лет, а я вспоминаю, внезапный тот писюн! Ты зачем показывал мне, свой писюн в ночной тишине? Ты зачем показал мне его? Ты зачем показал мне, свой писюн?
>>1271017 >Только если с таблицами проблемы Да для меня это достаточная причина спиздись офис и за вечер неспешно раскатать его в вайне. А ну если еще какой нежданчик? Оно мне надо?
>>1267048 блять, даже в IrfanView есть плагин для OCR хуевый, правда, но есть же а ты , оп-хуй, уже четыре дня тут мозги ебешь, хотя сто раз мог попробовать разные варианты