Предыстория: Задумал скачать несколько пабликов из вк. Использовал для этого vkmate. НО! Качает он голые .html файлы только с текстом - картинки и прочее подгружаются только при подключении к интернету. Решение нашлось быстро - открыть файл в лисе, подождать пока прогрузится и запустить плагин singlefile. Хотелось бы автоматизировать процесс, а то уже заебался вручную делать. Решил на AutoHotKey скрипт наговнокодить и голову сломал, сутки уже бьюсь, хз как продолжить: Run C:\Users\Cat\Desktop\Test\File.html Sleep 5000 SendPlay !{Tab} Sleep 100 SendPlay ^+u Sleep 20000 SendPlay ^w
Надо чтобы после того как закрыл файл открыл следующий в папке и так до тех пор пока файлы не закончатся.
>>221199632 если у тебя не получилось, это не значит что программа не подходит. для решения твоей проблемы, была придумана программа wget, твой случай не уникален.
>>221201236 >httrack когда рулят вебдваноль и фреймворки, эта шняга не канает. Безусловно, нужно пробовать, но httrack спотыкается на скриптовых селекторах например, и ещё бесит коррекция в именах файлов даже тогда и там, где нет такой необходимости.
>>221197903 (OP) Еблан тупорылый, иди на фриланс биржу, тебе рублей за 300 напишут парсер. Можешь куда-нибудь в пр сходить и там вкатывальщика те же деньги найти.
Все те кто советуют wgey и подобные, к вам вопрос: с какими параметрами его запускать если стена в ВК постраничная и каждая страница содержит ссылки на пару предыдущих (уже скачанных) страниц?
>>221202373 Нахуя ты бампаешь дальше, дебил? Тебе же сказали скинуть свою хуйню... >>221202428 Нахуя погружать её всю и сохранять через это говно, нахуя вообще браузер для всего этого? Ладно, иди нахуй, короче, придёшь, когда тебе надо будет, а не мне.
>>221202562 Слыш. Ты вот эту хуйню > Перечитай шапку внимательнее. пиши уебанам которые советуют вгеты, а не мне. Вгет тебе ссылки с уже скачанных страниц не спарсит
>>221202562 Если страницы уже скачаны и все что надо, это локально подгрузить все файлы, то можно скриптом все скачать в папку к каждой html и изменить в них пути с интернетовских на локальные
>>221203150 Ну в общем, для начала каждый файл надо обособить, то есть в папку поместить. Дальше пройтись по нему регуляркой, которая будет ссылки на изображения искать, ну или не регуляркой, вообще не ненавижу их. Потом изображения схоронить, скорее всего ссылки будут на оригиналы на серверах, поэтому авторизироваться втентактах не надо. Ну и после того как изображение скачал, изменить ссылку на оригинал на сервере, на относительный путь к файлу, чтобы если вдруг перенесешь их куда-то, все работало как и прежде.
>>221197903 (OP) Что-то всё уровня поехавшего пятиклассника дотера SingleFile - это случайно не икстэншн, который всю страницу в один html сохраняет вместо папка + htm? Если так, то что-то ты вообще далеко не продвинулся XDXDDX
Я для себя написал скрипт, который через api скачивает все данные со стены и заносит в бд джанги. Таким образом я получаю полную комию стены вк с лайками, комментами, просмотрами и т.д.
>>221197903 (OP) Вообще ты какими-то костылями делаешь это. Но если надо именно выгрузить всё из html, то на любом ЯП берешь любой парсер XML, циклично парсишь все ссылки и качаешь, раскидывая по папкам как тебе надо.
Предыстория:
Задумал скачать несколько пабликов из вк. Использовал для этого vkmate. НО! Качает он голые .html файлы только с текстом - картинки и прочее подгружаются только при подключении к интернету. Решение нашлось быстро - открыть файл в лисе, подождать пока прогрузится и запустить плагин singlefile. Хотелось бы автоматизировать процесс, а то уже заебался вручную делать. Решил на AutoHotKey скрипт наговнокодить и голову сломал, сутки уже бьюсь, хз как продолжить:
Run C:\Users\Cat\Desktop\Test\File.html
Sleep 5000
SendPlay !{Tab}
Sleep 100
SendPlay ^+u
Sleep 20000
SendPlay ^w
Надо чтобы после того как закрыл файл открыл следующий в папке и так до тех пор пока файлы не закончатся.