Сохранен 100
https://2ch.hk/b/res/210399376.html
Прошлые домены не функционирует! Используйте адрес ARHIVACH.VC.
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Копьютерщики, хацкеры, погромисты, нужна ваша

 Аноним 30/12/19 Пнд 07:59:58 #1 №210399376 
Снимок.JPG
Копьютерщики, хацкеры, погромисты, нужна ваша помощь!
Есть текст, содержащий в себе 100500 ссылок на фоточки, их надо скачать.
Делать это вручную - пиздец, надо это дело автоматизировать.
Задача №1 - вычленить из текста именно ссылки, потому что помимо ссылок есть куча мусора.
Ссылки, к счастью, в адекватном формате - начинаются с http и заканчиваются .jpg, что по идее облегчает задачу.
Задача №2 - запихнуть эти ссылки в какую-нибудь качалку файлов.
Вопрос - куда? Download Master и ему подобные говноедские программы принимают только по одной ссылке.
Еще там вроде бы можно загрузить xml файл с ссылками, но я не знаю как именно этот файл должен быть устроен.
Просто список ссылок или с какими правильным оформлением - хз.
Предполагаю, что поможет мне в этом обычный Word. Через поиск я выделю все ссылки, используя какой-то паттерн.
Ссылки скопирую, получится список. Вопрос - а хули дальше то?
Как вы решаете подобные задачи?
Аноним 30/12/19 Пнд 08:02:33 #2 №210399437 
>>210399376 (OP)
Полчаса, и я тебе сваяю это говно. Нужен только файл.
Деньги или шмот в доте.
иммортал сет на некра
Аноним 30/12/19 Пнд 08:03:31 #3 №210399467 
1 https://stackoverflow.com/questions/22997773/get-list-of-links-from-large-text-file
2 wget -i list.txt
И то и другое есть под Винду
Аноним 30/12/19 Пнд 08:03:51 #4 №210399483 
1oGaYyDJNEZ6UL5nN-43YMg[1].png
>>210399376 (OP)
Аноним 30/12/19 Пнд 08:04:11 #5 №210399495 
>>210399437
> полчаса
Сук заорал. Нихуя не программист и не линуксоид и то такую хуиту делал минут за 10.
Аноним 30/12/19 Пнд 08:05:08 #6 №210399513 
Безымянный.jpg
Да, вот еще момент.
У того же Download Master есть функция закачать все ссылки со страницы.
Почему я не пользуюсь этой функцией - потому что все ссылки под спойлерами.
То есть на каждый нужно кликать вручную, в автоматическом режиме это не работает.
Но в исходном коде все ссылки видны. Теперь их просто надо как-то вычленить и добавить в закачку.
Аноним 30/12/19 Пнд 08:06:47 #7 №210399552 
>>210399513
Оппик - это то, что качать надо будет? Вероятно можно соснуть, кажется у фастпика какая-то защита от хотлинкинга и макакинга была
>>210399467-кун
Аноним 30/12/19 Пнд 08:06:50 #8 №210399554 
>>210399437
Не, я хочу сам запилить, чтобы знать на будущее.
Поясни в какую сторону двигаться, я тебе ссылку на ЦП дам.
Аноним 30/12/19 Пнд 08:08:20 #9 №210399591 
>>210399467
Спасибо, но там все по-англицки, как-то туго до меня все доходит.

Абу благословил этот пост.
Аноним 30/12/19 Пнд 08:08:49 #10 №210399601 
>>210399591
Если никто не подскажет - через полчаса дойду до пеки и распишу
Аноним 30/12/19 Пнд 08:13:54 #11 №210399738 
>>210399552
>кажется у фастпика какая-то защита от хотлинкинга и макакинга
Не, сейчас проверил в Download Master - картинка напрямую скачивается, с этим без проблем.
Проблема исключительно в автоматизации, как закачать все пикчи разом, а не в вручную.
Просто там в одной раздаче по 300 файлов, а мне их штук 50 надо внимательно изучить.
То есть это тысячи файлов в конечном итоге, что однозначно требует автоматизации.
Аноним 30/12/19 Пнд 08:17:18 #12 №210399837 
>>210399738
Скинь кусок из оппика в виде текста
Аноним 30/12/19 Пнд 08:18:22 #13 №210399873 
>>210399837
Аноним 30/12/19 Пнд 08:18:50 #14 №210399882 
>>210399873
Упс. Двач все схавал. Щас стороннюю ссылку запилю.
Аноним 30/12/19 Пнд 08:20:43 #15 №210399949 
>>210399376 (OP)
wget
/thred
sage[mailto:sage] Аноним 30/12/19 Пнд 08:21:27 #16 №210399971 
Могу меньше чем за 5 минут выковырять эти ссылки. Ещё за 5 дать скрипт на скачивание, либо сам засунь список в download master. Сколько платишь?
Аноним 30/12/19 Пнд 08:23:05 #17 №210400029 
>>210399971
Ссылки на цп подойдут?
Аноним 30/12/19 Пнд 08:23:35 #18 №210400041 
>>210399949
Подробнее?
>>210399971
Мамке твоей за щеку оплачу.
sage[mailto:sage] Аноним 30/12/19 Пнд 08:23:57 #19 №210400055 
>>210400029
Нет.
Аноним 30/12/19 Пнд 08:26:13 #20 №210400100 
>>210399376 (OP)
wget
Аноним 30/12/19 Пнд 08:26:42 #21 №210400112 
>>210399591
>Спасибо, но там все по-англицки
Гуголтранслейт
Аноним 30/12/19 Пнд 08:27:34 #22 №210400145 
На питоне написал бы скрипт на beautiful soup, да и дело с концом
Аноним 30/12/19 Пнд 08:27:43 #23 №210400150 
>>210399837
https://privatebin.net/?398c30a8d568411f#9tCxfAVocneNngm4B11ESQqFCTJcXxbdAYgFmNFx8DMY
Аноним 30/12/19 Пнд 08:27:57 #24 №210400157 
>>210399591
Начни с учебника по ангельскому.
Аноним 30/12/19 Пнд 08:30:22 #25 №210400240 
>>210400150
Ох лол. На странице с пастой нажал закачать все ссылки и процесс пошел!
хоть и через жопу, но результат достигнут. Правда, не все ссылки работают, некоторые битые почему-то.
Аноним 30/12/19 Пнд 08:30:53 #26 №210400261 
d73c3a70cfc194f9115facb6c85e062c.jpg
4495d5bbc9d220687db9e786376c67f7.jpg
>>210400150
проиграл
Аноним 30/12/19 Пнд 08:32:38 #27 №210400318 
>>210399495
Я джавагосподин, мне сначала надо фабрики развернуть
Аноним 30/12/19 Пнд 08:34:01 #28 №210400367 
>>210400261
Блядь
Аноним 30/12/19 Пнд 08:35:02 #29 №210400393 
>>210400318
>фабрики развернуть
... землю отдать крестьянам, власть советам
Аноним 30/12/19 Пнд 08:36:16 #30 №210400431 
https://privatebin.net/?d29b7b8645f8f2df#9vSptCaQ6njAUXQ2Qi471LYxqHUSS6a6eZVgSp3FgypV вот по инструкции сделал >>210399467
Аноним 30/12/19 Пнд 08:39:45 #31 №210400533 
>>210400431
Качай вгет под винду
Аноним 30/12/19 Пнд 08:42:00 #32 №210400598 
>>210400431
Сложная регекспа, мне http://.*\.jpg хватило %)
Аноним 30/12/19 Пнд 08:42:02 #33 №210400599 
>>210400533
Не, делал через нотпад++ нахуй какие-то костыли.
Аноним 30/12/19 Пнд 08:42:26 #34 №210400613 
>>210400431
test
Аноним 30/12/19 Пнд 08:44:31 #35 №210400682 
>>210400599
Ну а качать как? Или твой довенлоад мастер справится?
Аноним 30/12/19 Пнд 08:49:48 #36 №210400864 
>>210400682
>Ну а качать как?
Старательно.
sage[mailto:sage] Аноним 30/12/19 Пнд 08:51:40 #37 №210400925 
>>210400598
Влад?
Аноним 30/12/19 Пнд 08:52:18 #38 №210400946 
>>210400925
Ноуп.
Аноним 30/12/19 Пнд 08:52:37 #39 №210400962 
>>210400682
Попробуй расширение для браузера, https://addons.mozilla.org/ru/firefox/addon/free-download-manager-addon/ для хрома сам ищи или как выше советовали
sage[mailto:sage] Аноним 30/12/19 Пнд 08:54:59 #40 №210401057 
>>210400946
Врёш
Аноним 30/12/19 Пнд 08:55:02 #41 №210401062 
>>210399437
Сколько бы ты взял за создание такой проги?

учу джяву, писал подобную прогу
Аноним 30/12/19 Пнд 08:55:32 #42 №210401079 
>>210401057
Нет, я по паспорту проверил.
Аноним 30/12/19 Пнд 08:56:38 #43 №210401114 
>>210399495
Оно и видно, что ты не программист. Никогда не показывай заказчику, что задача лёгкая. Иначе он не захочет тебе платить.
"Это ж было легко! Если было легко - то и платить незачем!"
Аноним 30/12/19 Пнд 08:56:39 #44 №210401116 
>>210400393
жопу первому встречному.
sage[mailto:sage] Аноним 30/12/19 Пнд 08:57:44 #45 №210401148 
>>210401079
А я по имени ВКонтакте...
Аноним 30/12/19 Пнд 08:58:09 #46 №210401161 
>>210401148
Тогда я, вообще, тян.
Аноним 30/12/19 Пнд 08:58:49 #47 №210401181 
>>210401116
Каждому встречному*
sage[mailto:sage] Аноним 30/12/19 Пнд 08:58:55 #48 №210401185 
>>210401161
Мож спишемся? Мне некому кидать смешные и атмосферные картинки
Аноним 30/12/19 Пнд 08:59:20 #49 №210401195 
>>210401185
Да я уже прогу написал
Аноним 30/12/19 Пнд 09:00:00 #50 №210401212 
>>210401114
Щасб в бэ пытаться искать заказчиков на программы.
sage[mailto:sage] Аноним 30/12/19 Пнд 09:01:17 #51 №210401241 
>>210401195
Какую прогу
Аноним 30/12/19 Пнд 09:01:32 #52 №210401249 
>>210400431
По какой инструкции?
Аноним 30/12/19 Пнд 09:01:56 #53 №210401262 
>>210401241
Которая пол меняет м-ж
Аноним 30/12/19 Пнд 09:02:01 #54 №210401264 
>>210399495
Ща бы скоростью решения всякой хуйни меняться.
Аноним 30/12/19 Пнд 09:02:07 #55 №210401268 
>>210401241
По скачиванию картинок, ОП-овскую. Шутки ещё объяснять
sage[mailto:sage] Аноним 30/12/19 Пнд 09:02:23 #56 №210401281 
>>210401262
Круто ну я вообще о другом спрашивал..
Аноним 30/12/19 Пнд 09:02:33 #57 №210401285 
>>210401212
А чо б нет?
Аноним 30/12/19 Пнд 09:02:48 #58 №210401296 
>>210401264
Что не так? Го фибоначчами меряться!
Аноним 30/12/19 Пнд 09:03:08 #59 №210401308 
>>210401285
Денег у них нет.
sage[mailto:sage] Аноним 30/12/19 Пнд 09:03:08 #60 №210401309 
>>210401268
А в чём шутка то
Аноним 30/12/19 Пнд 09:03:36 #61 №210401326 
>>210401309
В том, что у меня уже есть картиночки, ну
sage[mailto:sage] Аноним 30/12/19 Пнд 09:04:23 #62 №210401353 
>>210401326
Ясно. Пока
Аноним 30/12/19 Пнд 09:04:49 #63 №210401373 
>>210401249
>>210400599
Аноним 30/12/19 Пнд 09:06:35 #64 №210401448 
>>210401062
Я бы такое делал бесплатно либо не делал вообще. Всякую мелочёвку брать - себя не уважать. Надо, чтобы работы было минимум на пару недель.
Мимо другой анон
Аноним 30/12/19 Пнд 09:08:13 #65 №210401515 
>>210399376 (OP)
>Download Master и ему подобные говноедские программы принимают только по одной ссылке.
Он может кушать текстовые файлы со списком ссылок, ты плохо ищешь.
Аноним 30/12/19 Пнд 09:15:20 #66 №210401778 
>>210401062
2 имморталки на некра, яж написал
Аноним 30/12/19 Пнд 09:15:37 #67 №210401791 
hqdefault.jpg
>>210401296
Аноним 30/12/19 Пнд 09:16:23 #68 №210401825 
>>210401778
Дота говно, кста.
Аноним 30/12/19 Пнд 09:16:42 #69 №210401840 
>>210401062
Бтв, если серьёзно - надо торговаться и договариваться.
Можно за хуйню мешок денег взять, а можно ИИ разработать в устьзалупинском нии
Аноним OP 30/12/19 Пнд 09:26:23 #70 №210402171 
Безымянный.jpg
Так, что-то я застрял на этой хуйне.
Научился искать в документе ссылки как таковые. Ок.
А как мне теперь сохранить только их и обрезать все лишнее?
По идее должна где-то быть функция инверсия выделения или что-то подобное.
Аноним 30/12/19 Пнд 09:26:45 #71 №210402189 
>>210401840
Разрабатывал ИИ в Устьзалупинском НИИ
Лучше раздрочить анал и принять туда хуи.
Пам, пам, пампарам, пам-пам-пам-пам,
Пампарам
Аноним 30/12/19 Пнд 09:30:56 #72 №210402332 
>>210402171
>>210400431
Аноним OP 30/12/19 Пнд 09:31:35 #73 №210402353 
Безымянный.jpg
>>210402171
Так, теперь научился вырезать все строки, не содержащие нужного мне текста.
Теперь осталось вырезать все, кроме ссылки как таковой.
Аноним 30/12/19 Пнд 09:32:34 #74 №210402382 
>>210402171
https://pastebin.com/KUcnwyLm
На, заебал уже
Аноним OP 30/12/19 Пнд 09:35:32 #75 №210402523 
>>210402382
У меня пастбин почему-то не открывается, забанен он в моих краях, что ли.
У меня не получается вот эта хуйня:
>Delete all unmarked step 3) find everything before http:// and delete it. Step 4) Find everything after .html and delete it. –
Аноним 30/12/19 Пнд 09:36:06 #76 №210402553 
>>210402382
Найс xss атака на анона
Аноним 30/12/19 Пнд 09:36:28 #77 №210402572 
>>210402382
https://privatebin.net/?92db165fd011b93c#Fq6S8T8Dm8WNhqAipnJj1qHp1Ush1F45C1JuA6jy3iHV
Аноним 30/12/19 Пнд 09:36:45 #78 №210402578 
>>210402353
у тебя у всех ссылок одинаковая длинна. сделай просто слайс и не еби мозги
Аноним 30/12/19 Пнд 09:36:48 #79 №210402583 
>>210402553
Ух бля, ссылки на пастебин
Аноним 30/12/19 Пнд 09:39:55 #80 №210402720 
>>210402523
>>210402572
Обосрался.
sage[mailto:sage] Аноним 30/12/19 Пнд 09:40:02 #81 №210402727 
Дэбил уже почти полтора часа с этим морочится, кек
Аноним 30/12/19 Пнд 09:41:09 #82 №210402775 
>>210399376 (OP)
Смотри в сторону bs4 и requests питонячего. Сделаешь за пару минут.

import requests
from bs4 import BeautifulSoup
from os.path import basename

r = requests.get("xxx")
soup = BeautifulSoup(r.content)

for link in links:
if "http" in link.get('src'):
lnk = link.get('src')
with open(basename(lnk), "wb") as f:
f.write(requests.get(lnk).content)
Аноним 30/12/19 Пнд 09:41:17 #83 №210402779 
>>210402727
Файлы качать из интернета, это тебе не против ветра ссать!
Аноним 30/12/19 Пнд 09:42:00 #84 №210402816 
>>210402775
Для этого надо питон скачать. Ты переоцениваешь /b/
sage[mailto:sage] Аноним 30/12/19 Пнд 09:42:40 #85 №210402843 
>>210402775
> Смотри в сторону bs4 и requests питонячего. Сделаешь за пару минут.
Советчик из тебя НУ ТАКОЕ
Аноним 30/12/19 Пнд 09:45:20 #86 №210402948 
>>210399376 (OP)
как программист дам тебе дельный совет, бесплатно:
забей хуй на это гавно
Аноним 30/12/19 Пнд 09:45:23 #87 №210402950 
>>210402843
Хороший совет, всёко лучше всяких мастеров загрузки
мимо
Аноним OP 30/12/19 Пнд 09:46:14 #88 №210402986 
Безымянный.jpg
>>210402578
>сделай просто слайс
Я как раз пытаюсь понять как это сделать.
Аноним 30/12/19 Пнд 09:47:59 #89 №210403051 
>>210402986
Я тебе уже html с js кинул, хули ты мозги ебёшь??!
Аноним 30/12/19 Пнд 09:48:12 #90 №210403060 
>>210402986
на каком языке?
Аноним 30/12/19 Пнд 09:50:02 #91 №210403138 
let govno = document.getElementsByClassName('postImg')
for (let el of govno) {console.log(el.getAttribute('title'))}
Аноним 30/12/19 Пнд 09:53:56 #92 №210403263 
axaxax 300k/наносекундные

с элементарной задачей не могут справиться

отзываем русских программистов
Аноним 30/12/19 Пнд 09:54:45 #93 №210403292 
>>210403263
жирно
Аноним 30/12/19 Пнд 10:00:26 #94 №210403526 
>>210399376 (OP)
1) Копируешь в саблайм текст, работаешь над регулярками
2) Ищешь утилиту которая выполняет эту задачу, наверняка какой-нибудь wget это может
Аноним 30/12/19 Пнд 10:06:00 #95 №210403778 
>>210402816
lil peep install
Аноним 30/12/19 Пнд 10:07:05 #96 №210403810 
>>210403778
>lil peep install
Команда 'lil' не найдена, возможно вы имели в виду:
Команда 'lilo' из пакета 'lilo'
Команда 'lli' из пакета 'llvm-runtime'
Команда 'pil' из пакета 'picolisp'
Команда 'cil' из пакета 'cil'
Команда 'uil' из пакета 'uil'
Команда 'lie' из пакета 'lie'
Команда 'lid' из пакета 'id-utils'
Аноним 30/12/19 Пнд 10:16:45 #97 №210404224 
>>210403810
Я имел
Аноним 30/12/19 Пнд 10:19:18 #98 №210404329 
>>210403810
Бля, вспомнил как писал функции на постресе. Это говно указывает, что ошибка находится где-то в окрестности, например, ")", но не указывает какой именно скобки (есть номер линии, но номер этой линии как правило за пределами описания функции находится), и не указывает, в чём заключатся ошибка. Ну, если эта ошибка на уровне лексера, а не компайл-тайма.
Аноним 30/12/19 Пнд 10:21:35 #99 №210404417 
>>210399376 (OP)
>вычленить из текста
grep, regular expression
>Задача №2
wget
Аноним OP 30/12/19 Пнд 10:40:24 #100 №210405207 
Снимок.JPG
>>210403051
Благодарю! Ты сэкономил кучу времени мне и другим посетителям сайта порнолаб.
comments powered by Disqus