Сохранен 23
https://2ch.hk/b/res/302809451.html
Прошлые домены не функционирует! Используйте адрес ARHIVACH.VC.
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Есть тут парсеры? Как достать email с сайта вакансий или фриланса? Ну вот есть анкета (резюме) челов

 Аноним 06/04/24 Суб 22:55:18 #1 №302809451 
image.png
Есть тут парсеры? Как достать email с сайта вакансий или фриланса? Ну вот есть анкета (резюме) человека, как спарсить его email???
Аноним 06/04/24 Суб 23:05:23 #2 №302809855 
>>302809451 (OP)
ну собстна берешь и парсишь, нихуя сложного. а вообще лучше в чатгпт вопрос пиши а не в двач
Аноним 06/04/24 Суб 23:08:43 #3 №302809977 
>>302809451 (OP)
Правой кнопкой нажимаешь посмотреть код элемента и ищешь где там значение поля email находится.
И отталкиваясь от этого пишешь логику парсера. Скорее всего придется использовать библиотеку selenium.
Мимо недавно спарсил 6к слов со своего аккаунта на lingualeo.
Аноним 06/04/24 Суб 23:09:46 #4 №302810016 
Можно спарсить зеннопостером скорее всего если он у тебя есть, по другому я не знаю как, могу попробовать для тебя
Аноним 06/04/24 Суб 23:10:19 #5 №302810036 
>>302809977
Парсить через selenium это для лохов которые не могут научиться напрямую запросы к сайтам делать, тогда можно чаще всего юзать апи браузера напрямую, в другом случае так же просто парсить html
>но Cloudflare страшно больно!
Легко обойти во многих случаях, и для апи чаще всего не включают защиту
Аноним 06/04/24 Суб 23:10:54 #6 №302810063 
Блять, апи сайта, не браузера*
Аноним 06/04/24 Суб 23:11:11 #7 №302810077 
>>302809977
>посмотреть код элемента и ищешь где там значение поля email
А не всегда вроде, иногда такая информация скрыта, как и exif фото в соцсетях
sage[mailto:sage] Аноним 06/04/24 Суб 23:12:40 #8 №302810133 
>>302809451 (OP)
Спарсил тебе за щеку, собака инцельская
Аноним 06/04/24 Суб 23:30:11 #9 №302810819 
>>302810036
Я новичок в этом деле. Не особо шарю. Просто бывали случаи, когда не получалось получить код страницы без селениума. Это вроде с динамическими сайтами такое. Еще часто нужно прикручивать приблуды, чтобы сервер не палил что ты программой делаешь запросы.
>>302810077
Наверное бывает и такое. Я пока не сталкивался.
Аноним 06/04/24 Суб 23:33:13 #10 №302810943 
>>302810063
Не всегда у сайтов есть апи. Я вот парсил свои 6к слов со словаря lingualeo. Мне пришлось прям по хардкору через пагинацию прокручивать вниз селениумом до самого конца страницы. Ппц как начинало тормозить из за подгрузки. Часа 3 в общем парсинг занял по времени.
Аноним 06/04/24 Суб 23:38:32 #11 №302811174 
Почему вообще можно спарсить емейл который по идее СКРЫТ? Почему эти сайты такие дырявые?
Аноним 06/04/24 Суб 23:39:34 #12 №302811223 
>>302811174
Какие программисты, такие и сайты
Аноним 06/04/24 Суб 23:40:46 #13 №302811272 
>>302811174
если что-то можно сделать руками, все это можно воссоздать скриптом
Аноним 06/04/24 Суб 23:42:36 #14 №302811351 
>>302811272
Ну вот как например можно достать емейл с хабр карьера?
Аноним 06/04/24 Суб 23:48:00 #15 №302811591 
>>302811351
Если емейлы скрыты для обычных пользователей, то никак. Если они видны обычным пользователям и их можно посмотреть вручную, то и спарсить их соотвественно можно. Ну и очевидно иногда есть баги в коде, когда какую либо скрытую информацию можно достать.
Аноним 06/04/24 Суб 23:52:37 #16 №302811763 
>>302811591
>иногда есть баги в коде, когда какую либо скрытую информацию можно достать
А есть какие-нибудь известные примеры подобного?
Аноним 06/04/24 Суб 23:56:09 #17 №302811926 
>>302809977
>о спарсил 6к слов со своего аккаунта на lingualeo.
а упражнения по грамматике пробовал спарсить?
Аноним 06/04/24 Суб 23:57:36 #18 №302811996 
>>302809451 (OP)
Ыэ слышь я карочи синьор пиздабол у меня в заложниках твоя собака ану взял меня на работу быстренько кае сигму чэда, омежка
Аноним 07/04/24 Вск 00:08:13 #19 №302812431 
>>302811926
нахуй надо, я же не лингвист
>>302811763
Да любой криво написанный код, который ведет к уязвимостям. Как пример погугли sql инъекция
Аноним 07/04/24 Вск 00:11:11 #20 №302812530 
>>302811763
Когда сниффал сайты знакомств под спам, бывало, что в коде страницы фигурировали номера телефонов и почты дрочеров, которых вообще не видно и не должно быть видно на странице обычным пользователям.

Разработчики разъебаи или новички иногда криво пишут код. Пример - амазон года 3 назад раздавал домены вновь зарегистрировавшимся, нужно было подтвердить номер, а подходили только США, Германия и прочие бохатые страны, иначе висел фрейм на всю страницу с требованием привязать телефон, который не давал нажать "далее". Я поленился логиниться в смс-активатор и на авось решил сбрить эту "защиту" тупо юблоком, запретив запрос. Оказалось, возможность продолжить процедуру получения домена была закрыта всего-лишь визуально на фронтенде.
Удовлетворился и вышел, но можно было бы автоматизировать и нарегистрировать себе сколько угодно их.
Слышал, что такие баги можно репортить кабану владельцу ресурса за денежку

Если интересна тема, есть чаты в телеграме по bas, selenium+requests и просто общей автоматизации веба
Аноним 07/04/24 Вск 00:17:47 #21 №302812745 
>>302812431
>нахуй надо, я же не лингвист
зачем тебе слова тогда?
Аноним 07/04/24 Вск 01:53:09 #22 №302815846 
>>302812745
Ну я на английском если смотрю что-нибудь или читаю, то незнакомые слова выписываю и учу потом.
А свои же слова спарсил, тк пытаюсь написать себе словарь на customtkinter в качестве практики. Хочу туда испортировать все свои слова.
sage[mailto:sage] Аноним 07/04/24 Вск 02:00:39 #23 №302816024 
>>302809451 (OP)
Нахуя тебе это надо? Скамер?
comments powered by Disqus

Отзывы и предложения