Достаём документы из вконтактика предыдущий тред тонет здесь https://2ch.hk/b/res/97006543.html В предыдущем треде было предложено сделать скрипт для скачивания документов с вконтактика только от определённого пользователя для этого необходимо генерировать ссылки например таким образом
http://vk.com/doc289853309_000000000 до http://vk.com/doc289853309_999999999 и далее сделать проверку каждой странице на параметр <title></title> (пик 1, 2.)если есть какой то файл по ссылке и если нет и сделай выводы что не обязательно всё скачивать, а сделать проверку титле и если там Ошибка | ВКонтакте то качать не нужно, далее нужен мудрый анон который смог бы реализовать генератор ссылок и проверку каждой ссылки на параметр <title>, далее если есть ссылка на файл ищем прямую ссылку для скачивания (пик 3) и качаем его к себе на пеку.
Нужны аноны кодеры для реализации данного проэкта, сам я диванный теоретик и не могу в код, но то что смог я описал выше.
Примеры поисковых запросов с классификацией по фотоаппаратам: "dcp#####.jpg" - Kodak, range of 0 to 4000 "dsc#####.jpg" - Nikon, range of 0 to 4000 "dscn####.jpg" - Nikon, range of 0 to 4000 "mvc-###.jpg" - Sony Mavica "mvc#####.jpg" - Sony Mavica "P101####.jpg" - Olympus, Using default camera date of 101 "PMDD####.jpg" - Olympus, M is in hex from 1 to c, DD is 01-31 "IMG_###.jpg" - Some other camera "IMAG####.jpg" - RCA and Samsung "1##-####.jpg" - Canon 1TH-TH## "1##-####_IMG.jpg" - Alternate Canon name. "IMG_####.jpg" - Canon "_MG_####.jpg" - Canon raw conversion. "dscf####.jpg" - Fuji Finepix "pdrm####.jpg" - Toshiba PDR "IM######.jpg" - HP Photosmart "EX######.jpg" - HP Photosmart timelapse? "DC####S.jpg" - Kodak DC-40,50,120 S is (L)arge, (M)eduim, (S)mall. "pict####.jpg" - Minolta Dimage. "P#######.JPG" - Kodak DC290. "MMDD####.JPG" - Casio QV3000 and QV4000. "YYMDD###.JPG" - Casio QV7000 - M is hex. "IMGP####.JPG" - Pentax Optio S. "PANA####.JPG" - Panasonic video camera stills. "IMG_YYYYMMDD_HHMMSS.JPG" - HTC Desire Z (AKA Tmobile G2). "Image(##).JPG" - Nokia 3650 camera phone. "DSCI####.JPG" - Polaroid PDC2070. Вводить без кавычек.
>>97026834 Кодинг фигня, нужен сервер для координации. И перебор такого числа страниц займёт чуть более чем дохуя времени. Идея была парсить страницы поиска по всем запросам и схоронять их ответы в БД. Когда их наберётся много, можно было бы организовать поиск. Всё это было разжёвано в прошлом треде. В общем хуйня перекат, делай заново.
>>97026834 Блядь, анон. Ну нахуя выебываться? Просто включаешь загрузку картинок и wget качает все в отдельную папочку. Если нет, то пиши быдлокодеру из прошлого треда
>>97027107 А где уязвимость? Нету уязвимости. Перебор 999999999 вариантов? Охуеть дыра, так можно любой шифр взломать. Поиск? Да люди сами оставили файлы для открытого поиска.
Это ж миллиард урлов. Даже если каждый проверять за десятую доли секунды, то перебор всех вариантов займет 3 года(для каждого конкретного пользователя)
>>97027379 Не понимаю смысла. Вбиваешь все как положено туда и у тебя в папке картинки. Разве не этого ты хочешь? Само собой если не будет файла, то и картинки не будет. То есть ты не потеряешь время. Сделай как я говорю, увидишь все
>>97027460 а ты представь что там дохуя важный документ а не писечка твоей ЕОТ, тогда ты будешь ждать сколько тебе потребуется, хоть сутки хоть двое или прикупишь сервер для таких целей, вообщем идею я подал и дальше мне похуй, буду рад если мудрый анон который может в код напишет скрипт и выложит в тред
Зачем делать скрипт который по три года будет перебирать доки в поисках годноты, которой там НЕТ. Еще ведь кто-то должен просматривать все эти скачанные файлы
>>97027495 Ты сначала запусти хотя бы 10. Тебя вконтакт просто забанит и всё, хоть 1000 процессов запускай. И не забыай, что это только для одного пользователя и в идеальных условиях минимального пинга.
>>97027495 >ну а если запустить 100 процессов параллельно то 10 дней То более трех месяцев. Да и канал у тебя не резиновый, а хттп протокол довольно прожорлив в плане одних только хидеров
>>97028139 мое до сих пор не забанили, а я много всякой хуиты им творю
например в марте я собрал приглашатор - заебывал всех инвайтамив чатики в вк. По 200 чатиков в минуту новых. Потом правда ограничение ввели на 20 приглашений одного тела в день
>>97027966 Спасибо, натолкнуло. Можно радикально снизить нагрузку- вместо того, чтобы парсить страницу, можно просто подсмотреть код ответа. Если картинка есть, то будет редирект (301), если её нету, то вконтач отдаёт код 200 (сука, не следующая стандартам). Аноны, дальше сами.
>>97028135 С моим личным айди прокатывает(но я вам его не покажу). Видимо есть какие-то ограничения по безопасности. Оно не палит документы кого попало.
>>97028071 Уебите его. У меня уже нет сил. Нужны права. Анону выдало ошибко поэтому, а не от некорректного ид. Юзер должен сам зайти в приложение и только тогда мы получим доступ к документам. Но вот только кому нахуй это надо? Собираем леньги и пишем быдлокодеру.
>>97028325 >Собираем леньги и пишем быдлокодеру. На что собираем? На перебиратор миллиарда урлов или на приложение вконтача, которое еще надо будет установить жертве?
>>97028450 3 запроса в секунду. Уже что-то. Я хотел как-то спарсить телефоны всех юзеров. По моим скромным подсчетам при наличии 25 страничек в вк и непрерывной работе спарсить данные удалось бы за пол года
бля, аноны напишите хотя бы генератор страниц для документов пользователя и проверку параметра <title></title> а дальше будем всем двачем качать важные документы со страницы Патриарха Кирилла
>>97028883 так вот я про то и говорю, одному долго будет, а всем двачем мы сможем многое, главное найти щас кодера, которому как нехуй написать этот код, далее запилим сайтик на котором скрипт будет уже перебирать по средствам компьютера пользователя а не сервера, нужно будет просто ввести id и ждать или задать диапазон страниц для поиска
>>97028883 Ну с учетом вконтактовского ограничения на три запроса в секунду, то документы одного конкретного пользователя будет ковырять не 10 лет, а 5 месяцев. Всё, вдуров пал.
>>97029282 Он вроде сайты умеет делать. Он же и предлагал. Только парсить по поиску. В принципе идея годная. Можно принцип сделать, вбиваешь ид и с тебя снимают баллы. Другие аноны парсят. Им баллы даются. То есть реализовать это как майнинг
Пиздос вы отбросы. Один с vkapi мозг ебет, уебан, другой миллиард урлов собирается перебирать по 3 запроса вручную. Никто, блять, читать не хочет, уебки. http://habrahabr.ru/post/257951/
Кодер в треде. Могу запилить сайт на укозе для парсинга страниц. Кто за ставьте Двач. Из интерфейса будет только ввод айди пользователя и выпадающее окно с текстовым списком найденых урл. Пилить?
>>97029398 >Уязвимость на данный момент исправлена. Администрация ВКонтакте выплатила вознаграждение в 10к голосов. И нахуй этот тред? мимо скролил нулевую
Не надо _постоянно_ парсить все страницы, достаточно распарсить всю базу (или ее значимую часть) один раз и сохранить ссылки на валидные документы в БД и потом просто каждую ночь парсить новые документы.
>>97029671 Уязвимость по фоткам, не по документам. Документы не планируют НИКОГДА закрывать. Так что идея быдлокодера с сайтом и скриптом для парсинга поиска отличная
>>97029724 Батя твой ущерб, я писал многопоточный парсер для харкача когда была уязвимость с фотками icq\mail.сру. В оп посте нихуя не описано, в первом абзаце ссылки на хабропомойку сказано что уязвимость закрыто, дальше читать не стал.
>>97030062 >>97029724 Он писал на рубине. Просто ускорил работу скрипта, не более того. Если написать то же самое на плюсах, то можно добиться еще большей скорости. Кроме того херня в библиотеках занимает много времени. А так же парсинг через нокогири
>>97030062 Нахуй пройди, документы ненужны, фотки закрыли, интерес упал до нуля и я еще на работе. если убедите что там есть годнота, то может напишу на пистончике
>>97030098 Окей, пиши не плюсах, знаток. Nokogiri использовался только, чтобы получить access_token. Ибо через vk api его можно получить, если твое приложение прошло проверку.
>>97030098 Ты просто дебил, во первых пиши хоть на асемблере, скорость не повысится, тут все упирается в скорость интернета, скорость обработка запросов сервером, плюс ограничение на количество запросов секунду, а во вторых скрипт был на пистоне.
>>97030299 тут http://habrahabr.ru/post/257951/ пишут что интервал за определенное время загрузки одинаков. Кароч можно загрузитьдокумент и посмотреть какойе число и в перебор добавить +- 10000 штук, а не все 1*10^9 комбинаций.
>>97030415 Да вы заебали. Анон написал, что там был найдет способ быстрее перебирать. Я сказал, что этот способ изменил скорость работы скрипта. Того же самого можно быстрее добится на плюсах или как сам сказал на ассемблере
>>97030718 пиздец, этот анон не понимает. дайте ему по ебалу кто-нибудь в чем быстрее на плюсах? посылать запрос? или пару раз спарсить страничку авторизации? может сохранение фото? выиграв на этих вещах ты потеряешь скорость разработки. а выигрыш не стоит и гроша
Так и не понял. Это же не из личных сообщений фотки/видео, а если дебил сначала решил добавить как документ и не указал, как "личное", я правильно понимаю?
>>97031557 Кто блядь отправляет писечки в ДОКУМЕНТАХ? >>97031577 Это не баг, а говно (про документы), еще мусолили во время фоток с icq, хуйня не нужная. парсер с icq
>>97031730 сука, пиздец, ты не понимаешь? там описано то, как можно увеличить количество запросов с 3 до 25 в секунду. + использовать не 1 приложение, а дохуя. Узнал об этих способах только благодаря этой статье. не хочу унижать анонов, но думаю, что они просто написали бы скрипт типа такого >>97030299 НО НА ПЛЮСАХ!!11
>>97031886 Перебирать 10 в 9 степени вариантов для ОДНОГО ПОЛЬЗОВАТЕЛЯ? больше шансов что, к тебе сама придет лоля и ты ее выебишь, чем найти цп таким способом.
>>97031989 Это ты сука не понимаешь. Ты первый раз статью прочитал, а я парсеры делал когда ты пешком под стол ходил. За кого ты меня нахуй держишь? Думаешь если сказал на плюсах быстрее, то значит я смогу перебрать все доки одного пользователя за пару часов? В свое время писал парсер сайтов и подсчитывал сколько уходит на каждый способ парсинга. На десяти страницах это нихуя не дает. Когда же ты парсишь тысячи, тогда то скрипт и нужно улучшать. А уж лучше переходить на плюсы. Не спорь и съеби нахуй
>>97031577 Мне кажется тебе интернета на сегодня уже достаточно.>>97031989 > сука, пиздец, ты не понимаешь? > там описано то, как можно увеличить количество запросов с 3 до 25 в секунду. > + использовать не 1 приложение, а дохуя. > Узнал об этих способах только благодаря этой статье. Так пусть получают акксесс токен и юзают метод отсюда >>97028100
>>97030299 Имя "Invoke-WebRequest" не распознано как имя командлета, функции, файла скрипта или выполняемой программы. Проверьте п равильность написания имени, а также наличие и правильность пути, после чего повторите попытку. строка:4 знак:32 + $result = Invoke-WebRequest <<<< $url + CategoryInfo : ObjectNotFound: (Invoke-WebRequest:String) [], CommandNotFoundException + FullyQualifiedErrorId : CommandNotFoundException
Нельзя вызвать метод для выражения со значением NULL. строка:5 знак:55 + $title = $($result.ParsedHtml.getElementsByTagName <<<< ("title")) + CategoryInfo : InvalidOperation: (getElementsByTagName:String) [], RuntimeException + FullyQualifiedErrorId : InvokeMethodOnNull
>>97032369 ты меня веселишь, анон. сходи еще напиши пару парсеров. я писал несколько парсеров под вк, а не один раз статью прочитал, и здесь описан хороший способ для реализации парсера вк. пиши синтетику, я вечерком тоже накатаю на руби. сколько лет, кстати?
>>97032894 В прошлом треде анон предложил базу доков сделать. Чтобы можно было смотреть любого пользователя сразу. Тут же хуйню загоняют про перебор. То есть тебе несколько лет придется ждать доки пользователя таким вот перебором. Я не понимаю чем они думают. Жопой. Сделали бы базу, как предложено было раньше. Все бы были счастливы
нахуя это говно если приватные доки не посмотришь в 96% случаев найдете тока смищные гифки с реакшн фейсами которые пациенты юзают в переписках и комментах
Ребята нет времени читать тред ответьте мне скорее кто шарит. Выше скидывали ссылку на вк апи для получения инфы о доках, я на скорую руку схерачил скрипт но мне закралось подозрение что этот метод может возвращать только инфу о ТВОИХ доках, потому как для моей странички работает а для других возвращает еррор 15. Я правильно понял или я криворук?
>>97034642 Так и знал, блеать. Как я вообще мог подумать что апи позволит порсто смотреть чужие доки. Чувствую себя тупым что-то. Окай, как нам тогда сделать чтобы кто-то согласился установить наше приложение, лол?
В треде есть кто-нибудь кто серьезно шарит или только аутисты-самоделки вроде меня? Есть ли смысл сделать на сишке многопоточный переборщик? Или проще как-то заставить школьников добавить приложение?
>>97035545 Да я всю статью прочитал. Там в месте про динамику генерации ид фотографий по годам неплохо расписано. Если предположить что такая же тема работает с документами - можно сократить перебор.
Ну это, у меня в среднем curl тратит четверть секунды на один post к докам (замерил gnuшным time'ом, лол). Если делать много-много скидок то минимум выйдет миллион запросов в неделю. Плюс время на проверку того что вернулось и запоминание ссылок еще... бля. Кароче до миллиарда не дотягивает че-то, думаю как-то прилично сделать чтобы перебиралось мне точно не под силу. Воть.
Местные гении, лучше напишите игрушку для ВК с расширенными функциями, или сайтик типа ПОСМОТРИ ГОСТЕЙ с авторизацией через ВК. Быдло редко читает права, запрашиваемые приложением - пихаете туда просмотр фотографий, оффлайновый доступ, и вы в шоколаде.
>>97040047 Я тут хотел написать о том как тяжело когда еот не хочет принимать(и устанавливать) от тебя ничего т.к. ты погромист, но у меня её нет, так что похуй.
Да и вообще, что может быть в этих ебаных документах интересного? Часто вы что ли какие-то архивы секретные в них заливаете? Скорее всего - нет. Зачем их пробивать - непонятно.
>>97040467 >ДЛЯ ДОМАШНЕГО Можно поставить на арендованном серваке крутиться. А для себя действительно проще приложенькой.
>Здорово же, свободный человек. Когда она была - я каждый день стремился становиться лучше, трудности преодолевал с мыслью о ней. А сейчас нет еот - нет стимула, качусь по наклонной.
Пиздец нахуй. Я просто поражаюсь с вас. Видимо адекваты тут только ночью бывают. И были они в прошлом треде. Начался день и набежала школота. Использовать апи вк не для анонима. Нахуй заманивать людей в приложение? Сделайте базу как писали в первых постах. Каждый из анонов парсит доки из строки поиска. Потом уже будем делать поиск по ид и прочим параметрам. Нихуя не нужно делать. Нужно анонимам установить скрипт и скинуться на сайт
>>97042287 Подписываюсь. API для нубяр. Парень предложил отличную идею. Сделать ботнет из анонимов и пройтись по всем фоткам впараши в доках. Круто и вполне реально.
>>97042441 Идея действительно не плоха, я бы даже, возможно, принял в ней участие. Но анон уже не тот, слабо представляю как поднять на такое дело народ. Да и слабо представляю себе реализацию этого: >парсит доки из строки поиска
>>97042674 Полистай выше. Зайди в старый тред. Там чувак все расписывал. Аноны даже картинку нарисовали. Типа гайда. В этом треде вроде мыло кодера этого было.
>>97045723 Да заебали вы с этой хуйней. Сказано же для тупых. Пользователь должен дать доступ приложению. Сделать эту хуйню за пару часов можно. Как юзеров заставлять давать права приложению? Проще создать базу как писали выше. Пишешь номер вконтача и тебе все файлы. То что нужно.
>>97047109 По мне так годнота с базой. Я подписался на мыло к быдлокодеру. Он сайт думает замутить. А мы как хомячки будем колесо крутить. Соберем базу и все будем пользоваться. Такой себе закрытый клуб онанистов
>>97026834 Допустим можем проверять по 100 url в секунду, что слишком много, в реальности будет меньше, то потребуется: 1 000 000 000 / 100 / (60 60 24) = 115,(740) дней.
Чтобы проверить 1% нужно 1,15(740) дней.
Оп, нахуй и впизду, лучше придумать какой-нибудь развод: бот для весёлой фермы, введи пароль бла-бла-бла, ой ошибка не могу подключится.
>>97045259 Забей на это. Не там спрашиваешь. Недопаскаль, пэхапэ, сишарп. Не с теми анонами ты говоришь. Тебе на сайт более высокого уровня бы. Там бы тебе помогли. Идея годная. Наверное самая лучшая из всех что тут были. Просто в отличии от остального бреда на сайт надо слаживаться. Проще тратить время в пустую на чтение вкдоков и наеб узверей причем бесплатно. Перекат неправильно сделали. Тот способ не указали. Набежала школота. Результат очевиден. Тред скатился в говно. В прошлом под быдлокодером подписалось около 6 человек (и я в их числе). Будем думать что с деньгами, где их взять. А на школоту эту забей. Может на следующем перекате норм аноны будут.
Нужно сгенерировать массив ссылок на документы, попутно проверяя ссылки на наличие img = src тега, а в теге искать определенные символы, а именно /uidпользователя/ https://cs7050.vk.me/c610930/u9518730/docs/5c6d95c41183/img.jpg? /u9518730/ например. Чтобы не записывать пустые в массив.
Конечно проще сделать доступ к укл доков через вк апи, но там нужны разрешения со стороны пользователя и не все клюнут.
>>97051796 Напиши другому кодеру на мыло выше. С этими не говори. Они слишком высокого мнения о себе и слишком мало из себя представляют. Почитай их посты и согласишься со мной
>>97045259 Картинка хороша, но мне действительно не понять момент между "анон запускает скрипт" и "урлы текут на сайт". Анон будет просто открывать страницу со своими документами что-ли? Или может быть будет вбивать в поиск рандомный запрос? Старый тред мертв, ссыль на архивач я не увидел.
>>97045658 >подпишусь под парнем выше. Анон уже не тот Спасибо.
>>97052161 Вот сейчас немного обидно было (хотя практически всё оправданно). Не очень ясно для чего нужны деньги на ранней стадии, так сказать?
>>97050368 Выше была статья на хабр, исходя из которой, вероятно, можно сократить перебор в десятки раз. Тоже столкнулся с проблемой двойного умножения
Тот самый быдлокодер-анон, который весь тред раздумывает над написанием
>>97052630 Нет. Просто ты генерируешь url адрес с ID. Типа как номера постов на дваче №97052722 i++ 97052723 проверка на img if есть img{ } elif { если в img url src = /uidпользователя/ есть совпадение с введеным ранее id пользователя } Показываем или записываем в базу ид пользователя + изображения.
Итак, господа аутисты. Сделал на питоне набросок. Во-первых, docs.getById позволяет дергать до 100 доков в 1 запросе, таким образом это уменьшает количество запросов. Для того что бы сделать быструю обработку, достаточно многопоточно запустить с разных аккаунтов скрипт, при этом используя app_id топовых приложений, у которых количество запросов в минуту в разы больше чем для обычных. Я на vk api пишу каждый день что либо, ибо всё что приносит мне бабло - связано с VK Api. Если кому-то не лениво, допишите скрипт который я набросал. Если лениво, то я по свободе доделаю Задавайте свои ответы.
>>97053146 >"анон запускает скрипт" и "урлы текут на сайт" УРЛы должны как-то попасть на сайт, причем только те, в которых что-то есть? Вот анон и запускает скрипт.
>>97053256 Вся загквоздка в том, что ты не знаешь URL адреса и ID доков.
Вот как ты узнаешь мои адреса доков? Апи работает только через разрешение доступа приложению к своим докам. Для этого жертве нужно дать ссылку и чтобы она разрешила приложению доступ к докам. Тогда все легко.
>>97033442 >>97053380 По дефолту доки не приватные. И суть в том, что шлюхи думают, что раз они закинули интимные фотки, то к ним имеют доступ лишь те, кому они дадут ссыль на них.
>>97053030 Можно было бы шантажом выбить деньги. Уже предлогалось ведь. Ищем голые фотки как в треде написано, требуем деньги или покажем всем. Часть себе в карман, а часть на нашу затею. >>97053146 Походу рандомный запрос. Спроси у того парня по мылу. Он хотел вроде как по теме сделать. Каждый анон вбивает свой запрос в поиск, скрипт распарсивает урлы картинок и отправляет их на сайт. Потом когда их дохуя будет, то можно будет искать по ид. В поиске ведь существующие будут. Не нужно ничего будет перебирать. Много лолей, много цп, много чернухи. Все как любит анон. >>97053523 Это не перебор. Просто многие пройдутся по докумнтам. Вбивают в поиск свою фразу и все что находится идет на сайт
>>97055154 Если ты за базу данных, то это поеботина. Мы делаем все через вк апи. Работать все будет как часы. Все будут довольны. Программа будет выдавать все документы пользователя
>>97055431 2 и 3 анон это один и тот же человек, я. Спасибо что пояснил, а то действительно думал про паралельность на уровне анонов. А деньги... деньги это всегда неплохо, когда за них сгуха не светит.
Сейчас шантаж вк это туфта. Никто уже не ведется. Тяны просто удаляют страницы независимо от того рассылаешь ты фотки ее друзьям или нет. Ну а пацаны шлют нахуй. Алсо раз такое дело то уже было бы быстрее создать акк лоли тян, около 14 лвл и разводить дрочеров, так быстрее фоток собрали бы чем со своим парсером доков.
>>97055154 using System; using vk_api; using math; namespace HelloWorld { class Hello { static void Main() { Console.WriteLine("Вас взломали вконтакте!");
// Keep the console window open in debug mode. Console.WriteLine("Press any key to exit."); Console.ReadKey(); } } }
Вот, я сделал. Написал на коленке. Не знаю будет работать или нет. Взлабывает пользователей вк. С помощью vk_api
>>97056508 Ты даун? Какой нахуй юкоз? Там нет базы данных. Там нельзя сделать поиск по ид. Там нельзя фотки сделать. Вообще только дауны юкозом пользуются
>>97056794 Я ставил двиг там, больше нихуя не умею. Но даже моих знаний хватило чтобы понять как он лагает. К тому же там вроде бы свободную регу закрыли. Но база данных там и вправду есть. Называется phpmyadmin
>>97057034 Забей на эту хуйню. Тут одни ламеры, говорю же. Ничего не знают и не понимают. В прошлом треде был анон, но всплыл. Почту только от себя оставил
>>97053256 Снимаю перед тобой шляпу, ты лучше меня по крайней мере тем, что что-то написал. Это действительно ускорит перебор в ~100раз. В случае использования своего приложения будет: через execute, в теории можно впихнуть еще х25, что уже выходит увеличение скорости перебора в 2.5к раз. С учетом 5 обращений в секунду (для своего приложения), в идеальном случае, получаем увеличение скорости перебора порядка 12.5к раз.
В случае топового приложения можно обратиться только 35 раз в секунду, но если пустить это через execute, увеличение еще в 25 раз (25 обращений к апи): увеличение скорости около 87.5к раз.
>>97057194 Вроде по общению встречаются адекватные люди, так что на счет одних ламеров не согласен. А прошлый тред был в прошлом треде. В этом треде мы обсуждаем что есть, а есть уже рабочий скрипт.
>>97058038 > В случае использования своего приложения будет: через execute, в теории можно впихнуть еще х25 Не влезет, там есть лимит на количество символов в запросе. Может, можно что-нибудь попробовать, но лучше не надо. Лучше затариться аккаунтами вк и написать простенький сервер авторизации (у меня есть своё скромное добро и 70к страниц, с которых теоретически за минуту можно перебрать лям документов при налиции бесконечно широкого канала, бесконечно мощной видеокарты, неисчерпаемых вычислительных ресурсов и памяти, так что дело не сложное, но я в это говно лезть не буду).
#Мыло для авторизации vk_user_email = "" #Пароль для авторизации vk_user_password = "" #id жертвы victim_id = # Например 41402093 doc_id = 405962300 # Номер документа, с которого начинать поиск
#Authn section $agent = Mechanize.new Mechanize.html_parser = Nokogiri::XML login_form = $agent.get('https://vk.com').form login_form.email = vk_user_email login_form.pass = vk_user_password login_form.submit # def check(victim_id,doc_id) url = "https://m.vk.com/doc#{victim_id}_#{doc_id}" page =$agent.get(url) str = "Файл был удалён" p url if !page.body.force_encoding("UTF-8").include?(str.to_s.force_encoding("UTF-8")) end
while doc_id < 999999999 do check(victim_id,doc_id) sleep 1 doc_id += 1 end
>>97060007 В случае использования своего приложения можно свой код в сохраненную функцию вынести и вызывать её прямо с сервера. А вот в случае стороннего приложения - там действительно может не влезть (хотя откуда мне знать, сколько там может влезть). >70к страниц неплохой багаж, но откуда?
>>97060152 Kek, ты это хотя бы проверял? VK давно уже не позволяет с глагне авторизоваться по логину-паролю.
>>97060349 > можно свой код в сохраненную функцию вынести А как ты номера будешь менять в запросе, а? Ты не представляешь, кого научить пытаешься, лол.
> но откуда По-разному. 20к мои, еще 50к арендую постоянно.
>>97060344 Потому, что для теста на левый ак залил файлик для проверки, что пользователь, не находящийся в друзьях может его открыть. 405962308 находится в диапазоне от 405962300 до 99999999 Файлик по https://vk.com/doc42402093_405962308
>>97060537 >А как ты номера будешь менять в запросе Вероятно передавая параметром текущий номер, а внутри функции 25 раз его инкрементируя.
>Ты не представляешь, кого научить пытаешься Конечно не представляю, это же анонимная борда. Да и не научить пытаюсь, но веду дискуссию о вероятной оптимизации.
>>97061419 Изначальная затея была именно нахождение всех документов по ид (ну и, вероятно, в обратную сторону это тоже работает). А про еот-шантаж это я уже так, приукрасил. Так-то тут все адекватные. На сколько вообще анон может быть адекватным сидя здесь...
http://rghost.ru/private/8xHL4v799/8b28a634d04f90ee546e8b9a5528b4c0 Придется логиниться, ищет только не скрытые документы. Нахуя сделал? А просто. Используется IE на компе. Весь кеш тута: C:\Users\%юзернаем%\AppData\Local\Microsoft\Windows\INetCache ЕЩЕ РАЗ! ФОТО ПИЗДЫ ТРУСОВ АНУСА ЧЕЙ-ЛИБО ЕОТ ШАНСЫ НАЙТИ ОЧЕНЬ МАЛЫ. ИБО ПОИСК ИДЕТ ПО ОТКРЫТЫМ ДОКУМЕНТАМ.
По выборке айди документов: Как вы могли заменить, ссылка на фотографию photo52708106_359542386 состоит из двух частей: (id пользователя)_(какое-то непонятное число). Как же формируется вторая часть?
Увы, но, потратив два часа на эксперименты, я так этого и не понял. В 2012 году на HighLoad++ Олег Илларионов сказал несколько слов про то, как они хранят фотографии, про горизонтальный шардинг и случайный выбор сервера для загрузки, но эта информация мне ничего не дала, так как между id сервера и id фотки никакой связи не видно. Понятно, что есть некий глобальный счетчик, но там есть ещё какая-то логика… Потому что если второе число формировалось бы с помощью обычного автоинкремента, то значения айдишок фоток давно бы уже достигли огромных значений (у фб, например, на данный момент это ~700 трлн.), но у «Вконтакте» это значение всего лишь ~400 млн (хотя, судя по статистике, ежедневно пользователи загружают более 30 млн фотографий). Т.е. ясно, что цифра эта не уникальна, но при этом и не рандомная. Я написал скриптик, который прошелся по фотографиям «старых» пользователей и по полученным данным составил график того, на сколько менялась эта цифра с каждым годом. Видно, что значения скачут в зависимости от каких-то факторов (количества серверов или новой логики?). Но суть в том, что они достаточно малы (особенно за последние 2-3 года) и очень легко вычислить диапазон id для желаемого периода времени. То есть чтобы узнать прямые ссылки на фотки юзера, допустим, за прошлый год, нужно попробовать добавить в закладки всего лишь 30 млн (от _320000000 до _350000000) различных вариаций ссылок! Ниже я описал технику перебора, которая позволила мне проделать это за считанные минуты.
>>97065703 Благодарю за информацию. Жаль, зря спал. >>97065994 Вы, программисты, почему не заюзали мою идею с проверкой кода ответа? Это будет на порядок быстрее, чем поиск строки в тексте.
>>97069141 Те, которые пересылали. >>97070411 Публичных, конечно. С приватными можно было сразу к админам вконтакта обращаться, чтобы денежку получить.
В прошлом треде было предложение создать базу данных всех документов вконтакта. Автор написал мыло и слился. Я ему тогда еще написал. Совсем недавно он мне все объяснил и написал более понятно и доходчиво. На картинке я нарисовал как это понял. Если окажется что я не прав, то не бросайтесь в меня тряпками. Я далек от программирования и просил разжевывать этого анона который называет себя быдлокодером как можно доходчивей. Прошлый тред закончился на идее перебирать документы отдельного пользователя через wget (она тупо качает все докумнты от docXXXXX_00000 до docXXXXX_00000). Потом аноны решили написать скрипт который проверял бы существует ли документ и если да, то он качал бы его. Потом один хитрый анон предложил обманывать людей и вытягивать документы людей приложением вконтакта. Но мало кто на это поведется. Другой анон предложил перебор фоток через баги вконтакта. А на этом месте я уже запутался.
Ебантяи, не скачивайте всю страницу целиком. Нахуя проверять title, хуй проссышь. Смотрите хедеры. Если пришёл хедер Set-Cookie: remixlhk=бла бла бла то у нас ошибка доступа. Если такой куки нет, значит всё заебись.
предыдущий тред тонет здесь
https://2ch.hk/b/res/97006543.html
В предыдущем треде было предложено сделать скрипт для скачивания документов с вконтактика только от определённого пользователя
для этого необходимо генерировать ссылки например таким образом
http://vk.com/doc289853309_000000000
до
http://vk.com/doc289853309_999999999
и далее сделать проверку каждой странице на параметр <title></title> (пик 1, 2.)если есть какой то файл по ссылке и если нет и сделай выводы что не обязательно всё скачивать, а сделать проверку титле и если там Ошибка | ВКонтакте то качать не нужно, далее нужен мудрый анон который смог бы реализовать генератор ссылок и проверку каждой ссылки на параметр <title>, далее если есть ссылка на файл ищем прямую ссылку для скачивания (пик 3) и качаем его к себе на пеку.
Нужны аноны кодеры для реализации данного проэкта, сам я диванный теоретик и не могу в код, но то что смог я описал выше.