Сохранен 20
https://2ch.hk/s/res/1304478.html
Прошлые домены не функционирует! Используйте адрес ARHIVACH.VC.
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Деархивация автоматом

 Аноним 25/07/15 Суб 14:15:37 #1 №1304478 
14378229370600.jpg
Привет, /s/. По работе огромное количество документов передают в архивах. Порой бывает такая ебанистика, что отсканированные страницы пихают в doc. И тут я подумал, а ведь можно напердолить костыль, который будет при попадании архива в определённую папку выуживать из него .pdf, .jpg .png .gif .tiff, а остальное посылать. Как такое реализовать?
Аноним 25/07/15 Суб 19:12:38 #2 №1304770 
Бамп.
Аноним 25/07/15 Суб 20:39:20 #3 №1304841 
Ну что же вы, софтаны?
Аноним 25/07/15 Суб 22:21:48 #4 №1304972 
>>1304841
Нихуя не понятно, что ты хочешь, вот все и молчат.
Аноним 25/07/15 Суб 23:09:17 #5 №1305037 
>>1304841
Ну начнем с того, что *.doc это не архив. А продолжим тем, что скорее всего для такой странной задачи тебе придётся писать программулину самому либо заказывать
Аноним 25/07/15 Суб 23:58:11 #6 №1305059 
>>1305037
Начнем с того, что это зип архив.
Аноним 26/07/15 Вск 00:01:35 #7 №1305061 
>>1305059
docx - архив, а doc - бинарный документ.
Аноним 26/07/15 Вск 00:20:45 #8 №1305075 
>>1305037
вообще можно же UNP http://linuxpoison.blogspot.ru/2010/01/unp-universal-file-unpacking-utility.html на крон поставить тащемто
Аноним 26/07/15 Вск 01:52:25 #9 №1305119 
ОП снова здесь.
>>1304972
Попробую проще по пунктам:
1) Проверяю много документов по работе. Не менее 200 в сутки, конвейерно.
2) Документы приходят в архиве by default. В архиве может быть всё что угодно - от кучи jpg до doc. Архив может быть из кучи папок или внутри может быть ещё архив внутри
3) Архив качается в C:\Temp
4) Как только он туда попадает - скрипт разбирает его до jpg, pdf, или что там лежит, извлекая картинки из архивов или doc/docx
?????
PROFIT!!!1
>>1305037
А как в нём картинки тогда запакованы?
>>1305075
Это придётся с портами ебаться?
Аноним 26/07/15 Вск 02:49:58 #10 №1305130 
>>1305119
>Это придётся с портами ебаться?
C портами ебаться это во FreeBSD тред пиздуй, под виндой можешь вот это http://legroom.net/software/uniextract в планирощик задач засунуть на регулярный запуск
Аноним 26/07/15 Вск 02:58:04 #11 №1305132 
>>1305130
О, спасибо. А как сделать чтобы оно автоматом работало?
Аноним 26/07/15 Вск 03:06:15 #12 №1305134 
14378691755440.png
>>1305132
В планировщике задач же говорю, запускается через taskschd.msc или командой schtasks
Аноним 29/07/15 Срд 16:37:22 #13 №1312317 
>>1305134
Окей, поставил эту вещь. Но чтобы пихнуть его в планировщик - нужны имена файлов для анпака, а имена там практически случайные. Плюс, не нашёл команды извлечь определённый тип файлов.
Аноним 29/07/15 Срд 16:48:32 #14 №1312398 
>>1312317
VBS'ки-VBS'очки.
мимо
Аноним 29/07/15 Срд 17:21:26 #15 №1312609 
>>1312398
Лол, я совсем нуфаг. Есть ли способы проще?
Аноним 29/07/15 Срд 17:33:02 #16 №1312695 
>>1312609
Чего-то я сомневаюсь, уж больно задача специфичная. Если совсем ньюфаг, можешь любой другой язык программирования взять. Тебе же без разницы, в чем разбираться начинать. Просто плюшка VBS в том, что скрипт будет работать на любой винде. На этом достоинства VBS заканчиваются.
>скрипт разбирает его до jpg, pdf, или что там лежит, извлекая картинки из архивов или doc/docx
Вот это надо как-то еще по пунктам разложить.
1) получение всех имен файлов.
2) попытка распаковки всех файлов.
3) получение нового списка имен.
4) удаление из этого списка всего, что в твоей маске нужных расширений (jpg, pdf, еще ебани популярных)
5) удаление всех файлов по списку с записью в лог.
Я бы может быть даже и занялся, но не выспался нихуя и винды нет под рукой.
Аноним 29/07/15 Срд 18:32:43 #17 №1313067 
>>1305119
- docx переименовываются в zip, разархивуются и все картинки оказываются по пути ./word/media
- doc придется чем-то открыть и сохранить как html
- отфильтровать результаты по вкусу
В osx такая хрень реализуется штатными automator и pages. Как оно в форточках не в курсе.
Аноним 30/07/15 Чтв 00:15:35 #18 №1314943 
>>1304478 (OP)
Освой командую строку и консольные версии архиваторов.
В нужной папке запускаешь
> rar e .rar .pdf .jpg .png .gif .tiff
или
> unzip .zip .pdf .jpg .png .gif .tiff
или можно использовать 7-Zip, поскольку он поддерживает сразу множество форматов
> 7z e -r .zip .pdf .jpg .png .gif .tiff
Получишь распакованные в текущую директорию только указанные файлы.
Аноним 30/07/15 Чтв 00:16:02 #19 №1314946 
>>1314943
Ебанный парсер съел все звёздочки в масках.
Аноним 03/08/15 Пнд 02:33:46 #20 №1329736 
ОП тут, бампает на всякий случай, работа пока не даёт опробовать всё указанное в треде
comments powered by Disqus