В ближайшие дни Архивач временно работает без основного хранилища ранее сохранённых картинок/видео пока мы проводим работы по техническому обслуживанию. Сохранение всего вновь поступающего контента продолжается. Но затем всё обязательно вернётся в полном объёме!
Пытаюсь парсить инфу с быдлятни.
Вот что получается:
Текст при указании селектора CSS "wall_post_text" парсится нормально, а с картинками при выборе селектора "page_post_sized_thumbs" с атрибутом "style" летит вся хрень которая в этом атрибуте есть "width: 510px; height: 510px;background-image: url(https://sun1-4.userapi.com/c7005/v7005763/17753d/WPoLrSnY1B4.jpg);""
Как же из атребута STYLE вытащить чисто ссылку? Это делаюется с помощью регулярных выражений или как-то по другому?
Вот содержимое поста:
текст:
--------------------------------------------------------------------------------------------------------
<div class="wall_post_text">Покой — это когда тебя не тревожат лишние мысли. Когда ты не беспокоишься, что завтра может произойти то, чего тебе не хочется. Когда тебе не нужно идти туда, куда ты не хочешь. Когда то, что ты делаешь, — это и есть радость. Это когда ты перестаешь анализировать окружающий мир и понимаешь — он просто есть. И ты — просто часть него. И на этом все вопросы замолкают. И вот если этот покой внутри найден, то можно и другим дарить это спокойное, умиротворённое, радостное состояние своей души.</div>
--------------------------------------------------------------------------------------------------------
картинка:
<div class="page_post_sized_thumbs clear_fix" style="width: 510px; height: 510px;"><a onclick="return showPhoto('-45378430_456252701', 'wall-45378430_15256', {"temp":{"base":"https://sun1-4.userapi.com/","x_":["c7005/v7005763/17753d/WPoLrSnY1B4",604,604],"y_":["https://sun1-21.userapi.com/c7005/v7005763/17753e/lK6k3tjyHfg",640,640]},queue:1}, event)" style="width: 510px; height: 510px;background-image: url(https://sun1-4.userapi.com/c7005/v7005763/17753d/WPoLrSnY1B4.jpg);" class="page_post_thumb_wrap image_cover page_post_thumb_last_column page_post_thumb_last_row"></a></div>