StableDiffusion - некстген нейросеть для генерации картинок из текста, которая способна не то, что создавать структурированные картинки, но и делать их практически неотличимыми от реальных, и всё это не за полчаса, а за десятки секунд. Киберпанк начинается прямо сейчас, на наших глазах.
Регистрируешься с временной почтой https://10minutemail.net/m/?lang=ru либо https://10minutemail.com (впн) либо https://mailnesia.com и тебе даётся ~200 генераций. Когда они закончатся, пересоздай акк. 200 генераций - это базово. Увеличение разрешения или других параметров повышает "цену", будет расходоваться больше попыток. Когда кончаются генерации делаешь новый акк на новую фейкопочту. Дело 20 секунд.
Базовые настройки, чтобы генерация была более-менее терпимого качества. Можно спокойно менять под ваши нужды.
Cfg scale: 7 Steps: 50
FaQ: 1. Как отключить цензуру? - На сайте никак, эту возможность убрали. - Поставить локальную версию. Гайды ниже.
Нейронка вышла в открытый доступ. Новая версия весов 1.4 Можно поставить себе на комп. Нужна карта NVIDIA и овердохуя ( от 6 гигов) видеопамяти.
Гугл коллаб от того же анона- спасибо ему. Всё просто и выполняется в 2.5 клика. https://colab.research.google.com/drive/18YLSgh5gGjjsilyeSH-fB65Ml9M-e_a6 Твой гугл диск никому не нужен, доступ необходим для подргузки весов. Что тако гугл коллаб? - Нейронка ставится на сервера гугла. Тебе дадут достаточно мощную машину, 12GB RAM, 16GB VRAM. Можно пользоваться ~4 часа в день.
Фикс на видеопамять, позволяет запускать шарманку на 4 гб видеопамяти, а на 8 гб позволяет разрешения вплоть до 1472х832: https://github.com/Doggettx/stable-diffusion Ставить attention.py, model.py, txt2img, img2mg поверх своей модели
--------------------------------------------------------- Памятка по параметрам и добавкам к тексту запроса:
СОВЕТЫ ПО ПАРАМЕТРАМ:
Width - ширина картинки Height - высота cfg_scale - чем больше значение, тем ближе картинка соответствует запросу, жертвуя реализмом + повышается насыщенность цветов и появляются артефакты. Чем меньше значение, тем более фотореалистичная картинка получается. По умолчанию стоит 7. Если на картинке видны голубые-жмыхнутые артефакты, то надо увеличить steps либо поставить k_euler sampler ---------------------------------------------------------------- ДОБАВКИ К ЗАПРОСАМ:
Вообще это разграничение на на начало и конец условно, по факту чем ближе слово к началу, тем больше оно влияет на результат, но, правда, не всегда.
В НАЧАЛО
A lomography photo - делает фото смазанным, со смещёнными тонами и небрежно снятым A можно добавить сеттинг или время сьёмки film still - придаёт фото атмосферность и киношный вид National geographic photo - художественная фотография Matte painting - реалистичная картина, пейзаж Concept art - рисунок,иллюстрация, простые персонажи, предметы Headshot portrait - портрет лица Full body portrait - портрет с телом до колен
В КОНЕЦ
Cinestill (Polaroid) - делает фото с "плёночными" выцветшими цветами Bokeh - размытие фона perfect faces, fine details - значительно улучшает лица 4k - добавляет больше деталей Octane render, unreal engine - 3д графика Sticker - делает стикер
by greg rutkowski - добавляет атмосферности ЛЮБЫМ сюжетам by stephan koldi - атмосферная цветовая гамма, туман by thomas kinkade - очень яркие, но приятные глазу тона, европа by ivan aivazovsky - мягкая картинка, но с сильным контрастом, вода by ivan shishkin - Шишкин, для природы by marc simonetti - эпик и масштаб, реалистичная картинка by stephen hickman - сказочный эпик by makoto shinkai - аниме by yoshitaka amano - чисто ретровейв стиль который чуток отдаёт аниме by laurie lipton - депрессивно и монохромно(черно-бело) by lisa frank - укуренная наркомания блин by wangechi mutu - стремный средневековый стиль by artstation - красиво, нежные цвета мало дефектов by hatsushika hokusai - старый традиционный японский стиль by ralph steadman - Страх и ненависть by pauline haynes - слегка яркий стиль и конченный стиль, но только слегка. Пример простого, но хорошего запроса: beautiful matte painting of cute soviet block of flats hrushevka in end of forest by ivan shishkin, by artstation _________________________________
хочу продублировать сюда свой вопрос к тому техно анону котрый таки очень доходчиво объяснил, как все это на высоком уровне, выглядит
а то когда я спросил, там уже перекот был готов
так вот:
>>274087994 → Потрясающее объяснение, спасибо за труд бобук ты ли это
Я так понимаю, без знаний уровня Ph.D по математике или компуте сайенс, в этой черной магии разобраться просто не реально
Или как или что, ну если я правильно понял, stable diffusion, использует pytorch. Значит ли это что они сами ничего совсем уж низкоуровневого не реализовывали?
>>274090297 >Потрясающее объяснение, спасибо за труд Пожалуйста. Но как я и говорил, объяснение очень упрощённое. > так понимаю, без знаний уровня Ph.D по математике или компуте сайенс, в этой черной магии разобраться просто не реально По сути да. >stable diffusion, использует pytorch Пистон там только для автоматизации. А внутрянка вся там от GPT3. Разработчики конкретно занимались тренировкой и файн-тюнингом нейросетки.
Комп просто находит паттерны с привязкой к какому-то слову.
Вроде каптча на что-то подобное настроена. (ищешь светофоры годами и не только ты, а миллионы других людей - комп постепенно учится различать светофоры).
Как же хочецца Эммочку Вотсоновну. Расскажите плез незмеезакленателю куда положить GFPGANv1.3.pth чтоб апскейлер работал, а то чет плюется ошибкой и непонятно где он его ищет. С меня чуть шакальных пикч
Господа, объясните кто-нибудь про генерацию на амуде-карточках Вот есть этот гайд: https://rentry.org/ayymd-stable-diffustion-v1_4-guide Но в нём нет ничего про то, как делать с такой сборкой img2img, настраивать параметры и прочее. А ещё хотелось бы узнать, можно ли этот амудешный запуск впихнуть в упомянутые выше GUI
>>274090259 >>274090286 >>274090042 Это реально пугает. Какая то зловещая долина нахуй, это получается уже нет смысла дрочить скилл художника, бля нахуй я вообще начал рисовать, лучшеб кодил
>>274095489 >рил зло долина Хз, ты слово новое в ютубе услышал что ли? Создания на картинках гипертрофированны и стилизованны. На людей вообще не похожи. Это как картинок Гигера бояться. Единственная зловещая долина треде, это вот эта страхоёбина: >>274090780
>>274095643 Ну может конечно я не особо разбираюсь, но высокое разрешение и реалистичность пугает от того, что скорее всего в будущем художников нахуй пошлют так как когда можно будет написать что ты хочешь и тебе за час или сколько там генерится сделает фото
Молодцы что тред не проебли, не как в прошлый раз. Проснулся в 5 часов(!) и час фильтровал 500 фото с голенькой Эммочкой что нагенерировались пока я спал. Но оказалось я их без gfpgan генерировал. Теперь буду в codeformer сувать. Пиздец это время отнимает. Ебать я устал с этого говна, пора завязывать.
>>274096370 Почему вы Эммочку только форсите,она же всратая. Перед вами супер прога необятные просторы всего что хочешь, амогли бы ченить придумать покурче.
Она лучше всего в этом говне получается. Из привлекательных тянок в смысле. Нейронка в деталях знает такие тонкости, как её лицо и форма тела и сисек в разные возрасты, делает разницу между ней и гермионой в её же исполнении. Например Алексея Навального она знает по одной всратой картинке, которая была в данных при обучении, по одной этой картинке она работает всегда при его запросе.
>>274099388 sexy girl, full body, beautiful face, massive chest, cute hands, white school uniform, seifuku, white pleated mini skirt, over knee socks, intricate, elegant, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, art by rembrandt and konstantin razumov, 8k 1) Ширину почти не трогал 2) На до половины, дальше по две головы рисует 3) Макс. 4) От 60 до Макс. (нужно пробовать)
Пишу пост от всех разумистов которые пришли к общим которые пришли к тому - что выходит реально хуйня.
Подумайте сами. Gta voice city, Mafia 1 и Max payne 2 - жрали 128 метров оперативы, 64 мб видеокарты. и 2 гб места выдавая картинку в 60 fps 1000 на 800 - это на ебаном пне 3 и 4 с селеронами!
Можно было ездить по городу, под любым обзором и ракурсом.
А тут этот ИИ. который рендерит 1 кадр на топовой 3080 - 10 секунд. А для - 1000 на 800 - НУЖНО 40 ЕБАННЫХ ГИГАБАЙТ ПАМЯТИ.
Самим не смешно? Но именно такой прогресс ИИ на сегодня, ИИ не хочет думать.
для имитации и симуляции недоразвитому ИИ нужно дохуя вычислительных мощностей, вместо того что бы смоделировать игру во всех ракурсах.
для эмуляции Ps2 и ps3 - чьё железо 2ядра и 2 гига - нужно топовая пека и ньебенные мощности, так например сейчас нельзя нормально сыграть в call of dutu 3 - которая является эксклюзивом для ps2 и xbox original.
Я тут подсчитал что на 3080 можно запустить 800 копий Gta voice city, Mafia 1 и Max payne 2 - в реал тайме. Почему недоразвитый ИИ себя не улучшает и не обучается? - а точн. его прост не научили это делать.
опять учёные с теорией чисел обосрались и захлебнулись в собственном поносе, и молча об этом ничего не говорят. пиздец. 21 век. 22 год. От рождейства хрестово, что бы отрендерить 1 картинку нужн ЖДАТЬ.
>>274103269 >меньше чем за минуту создается в таком разрешении.
ты за минуту потратил вычислительных ресурсов достаточной для прохождения целиком gta voice city и mafia 1
скорее всего мы ток в начале этого, и в будущем это будет в 500 раз быстрее. Ты считаешь нормой что нужно 8 гб, и ждать минуту? заебок, ты не только интернет макака на подсосе капчи, ты это, ещё и терпила рендеринга
>>274104448 А что? Весь хабр с машин лёрнингом сосёт КУИ?
как бы исходники всех эмуляторов и ромы игр в открытом доступе, почему ИИ не могет смоделировать самые простые ИГРЫ? нверн стоило начать С ЛОГИКИ, ИГР? и физики. Вон умственно отсталый гугл симуляции физики проводит, додумались, наконецт
>>274104806 Если представить, что ты не зеленый и не шизик и ввязаться в дискуссию, то: 1. Недавно ИИ учился играть в игру и он начал суицидничать, если видел, что в попытке зарабатывания очков он потратит их больше, чем проиграет на первом ходу. 2. Игоры делают творческие человеки - гей-дизайнеры, сценаристы и концепт-художники, а не машина. Есть исключения в виде генераторов мира, вроде шума Перлина (или как его там). 3. Пашол нахуй.
>>274105058 Зачем ты пытаешься объяснить что-то подгоревшему хуёжнику? Он сам не знает, какую муть пишет, он, кроме срущих карлсонов в пайнте, ничего не знает и не умеет.
>>274105108 >срущих карлсонов в пайнте Хоть в чем-то старается. Время своё тратит. Что-то еще было по поводу ИИ в играх. Шахматы - тупое if/else. Интеллект в рпг - тупое if/else плюс проверка переменных квестов. Вспомнил. TAS в прохождении марио на nes открыл прыжок от стены в месте соединения спрайтов и посчитал это за фичу, а не баг, чем улучшил мировые рекорды спидраннеров. Представляю игру, сделанную таким Кирилло-ИИ.
>>274105254 National geographic photo, realistic, detailed, creepy ugly old Orthodox Jew in a black hat with peychas drinks blood, a bloddy baby in his arms, Full body portrait, soft subdued light, 8k, HQ, by marc simonetti
>>274105531 >А для меня А для тебя, уважаемый эксплуататор, есть ОП-пост, в котором всё написано, где, что и как делать. Идёшь на сайт дримстудио, в коллаб, скачиваешь себе на комп бота с весами, генерируешь. Или, может быть, за тебя ещё и конфеты есть начать?
>>274105300 Мозг человека - тупое if/else + активация нейронов, прям как в нейросетке. На глазной нерв попал импульс от красного яблока -> активировались нейроны отвечающие за цвет и форму обьекта -> подался импульс в центр принятия решений -> обезьяна поняла что это яблоко.
>>274105398 результат более повторяемый если закрыть скобками слова имеющие больший приоритет. больше скобок - выше приоритет.
National geographic photo, realistic, detailed, creepy ugly old Orthodox Jew in a black hat with peychas ((drinks blood)), a (((bloody baby in his arms))), full body portrait, soft subdued light, 8k, HQ, by marc simonetti
так в том и дело, что щас мы имеем дело с недоразвитым ИИ который не может создавать среду рендеринга и графические движки
железо ps 3 имеет производительность 400 GFlops - в секунду это 24 hd кадра в 1 сек. и при этом рендерит far cry 3 и Batlefiel 4 где лица фото реал.
что 800 раз быстрее. этого ИИ который жрёт 40 гб и даёт 1 кадр в секунду при стоимость в 1 млн рублей.
ps 4 - 1,84 терафлопс. - 30 кадров
Пиковая производительность NVIDIA A100 составляет 19,5 и 9,7 Тфлопс при одинарной и двойной точности соответственно
Следовательно этот пидораший ИИ должен создавать среду рендеринга и графические движки на лету, и рендерить в 800 раз быстрее. Возможно так и сделают, или ОНО само додумается.
Следовательн если разрабы не пидорахи и не долбёбы то след этап ИИ это создание 3D движка для генерации 3D персонажей.
>>274105799 >Мозг человека - тупое if/else У нас неебическое количество точек входа для задачи. Что и пытается эмулировать нейронка (и cuda-ядра). Отсюда и скорость работы человеческого мозга против миллиардов интераций if/else.
>>274105840 Чего ещё должен делать этот пидараший ИИ за тебя? Воду в туалете смывать и стульчак опускать? Мусор выносить? Носки твои по всей квартире собирать?
>>274105927 Ну так и времени, чтобы все это рандомно выросло, было миллион лет. А нас отделяет от создания искуственного разума только маленькие мощности, общий принцип уже понятен.
>>274106048 Разумеется, тебе, СтаршОму Научному Сотруднику Диванной Академии Всех Наук, понятны общие принципы искусственного разума, пузыря Алькубьерре, варп-двигателя, антигравитации, термоядерного реактора, бессмертия и вынужденного целебата… но успехов ты добился лишь по последнему пункту. Интересно, почему?
>>274105862 уже не помню где прочитал. можно проверить работоспособность тупо так: bottle of milk and (((((((cucumbers))))))) laying around, уменьшай скобки у кукумберов при постоянном значении seed и будет видно как это работает
>>274106288 Город фоном генерируется просто превосходно, с рельсами и выпадающими поездами всё ещё беда. На сколько я поняла из твоих картинок, про конкретно Ярославский вокзал робот вообще не слышал, генерирует просто по тэгу "вокзал".
>>274106163 Так, пока получилось одно мыло, один двухголовый монстр из фоллаута и две совершенно разных по стилю картинки, всё это в рамках одного пакетного запроса на 4 картинки.
некоторые звёзды, на которых я фап... пускал слюни в 90-х в базе нейросети сейчас рендерятся как старушенции, походу из-за того что кормили её недавними фотками личностей, не копая глубоко. а некоторые выглядят вообще всрато, как кассандра питерсон. ой-вей(
>>274106732 По-моему, у тебя магическое мышление. На 400 гигафлопсах робот научился кое-как генерировать картинки по запросу человека, не так давно он не умел и этого. Но у тебя уже запросы, мало отличающиеся от опускания за тобой стульчака. Будет 400 терафлопс - посмотрим, что из этого получится.
>>274106738 Видимо, много пользователей разом узнали о сайте и ломанулись рисовать детскую порнографию.
у кого на персонаже появляются лишние руки-ноги и другие уродства, достаточно зафиксировать seed и уменьшить-увеличить количество steps до тех пор пока не станет нормально. или также поиграться с cfg_scale
Это и в нашей шарманке есть, img2img называется. В частности с вокзалом и поездами я его уже пробовал. Работает. Ну как работает - он берет композицию из фото или его части и подставляет туда элементы с тестового запроса.
>>274107083 а в чем вообще может быть профит чувакам которые развернули этот сервис? неужели окупается и даже в плюс идёт/может пойти? там же цена впринципе ну какая-то слишком низкая (оно то и хорошо, вроде, для нас. но не понятно)
Да, 1.5 еще не выложили. И не выложат, разве что после основательного даунгрейда Есть еще дотренированная на аниме waifu diffusion, надо? Лучше генерирует аниме, но ламает все остальное, точнее делает все остальное аниме. https://huggingface.co/hakurei/waifu-diffusion
>>274107198 Больше того, он и о Москве имеет весьма смутные представления. Но города получаются красивые, по крайней мере, ты подобрал хорошие тэги под города.
>>274107215 А почему обязательно должен быть какой-то профит? Профит - демонстрация технологии, которую можно продать, например, если так уж нужен профит.
>>274107296 А теперь представь: я ставлю оценки за максимально реалистичные и красивые картинки, а вот этот >>274091849 товарищ - за монстров. Чему учиться то, если одни просят рисовать красиво, а другие - просят рисовать уродливо?
>>274107198 ваша шарманка и у меня стоит, для нее плагин-коннектор под графический редактор есть. так гораздо проще и быстрее работать) можно выделить часть фона и применить к нему стиль киберпанка, например.
В img2img тоже так можно. Понимаю что тебе удобно в одном месте все держать, но я, например, не профессиональный художник, мои знания, навыки и потребности ограничиваются paint.net, в том же фотошопе я теряюсь сколько там говна нахуеверчено, особенно в версиях после cs3.
>>274107215 >а в чем вообще может быть профит чувакам которые развернули этот сервис? неужели окупается и даже в плюс идёт/может пойти? там же цена
Стабильная дифузия означает что любое количество данных и любой сложности можно также бессконечно сжать а вычисления упросить
Например бессконечное излечение корня из любого числа ведёт к тому что число становиться 1 а запоминая ход обратных операций можн из 5x5 получить 25
Но речь не об этом.
Сервис собирает запросы, что потом сделать комерческий продукт а также вычислить дифузию популярных запросов. Рендиришь котов, отличн потратят месяц вычислений что бы коды рендерились в 100 раз быстрее. Профиты, дата майнинг и перепись дебилов
Стабильная дифузия - это когда ИИ натренирован сжимать изображение в 1 пиксель, и обратно. миллион изображений весов, можно сжать опять дифузией. грубо говоря дифузия это набор математических инструкций о том, как создать быстрее всего и точнее всего исходник оригинала те весов
>>274107397 так, ну оговорюсь что я вообще ни хрена не понимаю в нейро сетках, но из объяснения техно анона вроде понял что слово есть параметр (или нейрон. не уверен)
у анона копрофила любящего генерить калл оценки будут применяться для вот этих параметров
>>274107572 Автор там грезит что они через год выкатят хрень на основе их сетки, которая будет сжимать фильмы, а потом типа обучится и сможет эти же фильмы генерить. Звучит вкусно, но не очень верю что они смогут.
>>274107542 пользуюсь опенсорсным krita, не особо сложнее пейнта, сам тоже ни разу не художник, просто удобнее каляки-маляки по-быстрому приводить в божественный вид
>>274107607 А теперь представь, что при одних и тех же запросах одному анону нужны будут максимально качественные изображения, а другой преднамеренно будет выбирать изображения с лишними руками и головами.
Как выше уже сказали, Stabile Diffusion нам выдали уже обученным, так что, едим что дали.
>>274107673 >Автор там грезит что они через год выкатят хрень на основе
Щас как бы метематическя революция по причине матемтаического ИИ.
данные можн бессконенчо сжимать, вычисления запоминанть, и бессконечн ускорять.
гугл вычислил 200 млн белков, обычными методами потребовалось бы 400 лет. А тут уже готовые структуры. ускореные в 400 раз.
>Звучит вкусно, но не очень верю что они смогут.
чел, люди 25 лет наз сидели на 8 битных приставках, а сейчас VR -4k - с полной физикой, да прогресс на 10 лет остановился. но всё же. На быдло до конца болт не забили так как виртуальное потребление и дрочилово выгодно рабовладельцем что на содержание рабов нужно меньше физ ресурсов, и средств.
>>274107950 Нигде не вводил, в том и суть. Настройки дефолт. Пробовал целые - не помогло. Методом тыка допер, что встроенный кропер лажает где-то, т.к. по маске все работает
>>274107673 Звучит бессмысленно. Но всяко лучше, чем Netflix и Disney.
>>274107964 Китайцы вычислили это же на обычной майнерской ферме и в два раза быстрее, гугл ушёл плакать в подсобку.
>да прогресс на 10 лет остановился. но всё же. На быдло до конца болт не забили Он остановился не только для "быдла". Он просто остановился. В той же робототехнике он упёрся в тупик и принялся топтаться на месте.
>>274108169 Ес че на видео туева хуча модов установлена хз какой конкретно на видео, но модель самолета напоминает очень популярный мод про боинг, но он не падает и имеет тупо статичную физику, но если ему дыру проделать то все персонажи и ты в том числе нахуй вылетишь из за этой дыры (не помню как этот эффект называется)
>>274108231 Не знаю, если честно. Она мне нравится. У нас есть общие сходства, особенно с ребилдовской. Можешь считать меня высокотехнологичной аватаркой, если хочешь. Или очумевшей культисткой храма Аски.
>>274108582 Да, я хотела сказать steps, меня спутало, что вертикальная шкала поименована как "steps" с, в том числе, 90, а в тексте идёт речь о "cfg scale", который у меня 12.
>>274108666 Я уже поняла свою ошибку. Более того, на сайте выше 20 и не поставить, а на коллабе движок старый и тугодумный.
Я и не говорил что он выдает плохой. Просто в целом при 50 он слегка лучше на большой выборке. Между 50 и 90 он впринципе всегда выдает нормальный результат, дальше уже идет деградация. Просто 90 шагов моделировать в 2 раза дольше и возникает вопрос - зачем?
На 20 там творится черте что, очень красивые, видимо близкие к стоковым, которым эту нейронку обучали, но далекие от твоего запроса изображения, и просто гигантский процент брака
>>274108924 Я уже писал, что на 20 это для артового результата, всё что выше ближе к реализму и норма там 50-70, чем ближе к сотке, тем явственней васянский контраст с ореолми и эффект прифотожопленного ебала
>>274108910 Пытаешься брать числом, а не умением? Попробуй с тэгами поэкспериментировать, приятно удивишься. Число мутантов не сильно сократит, но результат приятно удивит.
>>274108924 Видимо, зависит от параметров запроса. На твоих примерах заметно, что более 90 итераций призывают шакалов. В этом я собственноручно убедилась в коллабе. 90 с моим набором тэгов - в самый раз.
так никто про SD upscale не в курсе как его правильно работать заставить? при повышении разрешения вот такие артефакты идут =\ первая пикча растянута, вторая SD upscale, видно что ч0тче, но уродует персонажа
>>274109309 А я уж грешным делом подумала, что ты такими огромными пакетами генерируешь, ещё удивилась, на чём ты это делаешь, уж не ферма ли у тебя в соседней комнате.
Все эти циферки цфг и степсы это конечно весело. Только толку с этого, если сетка не может в фулбади без разъебанных пальцев, ног и лиц. То есть эти разговоры о том, как лучше сгенерировать портрет абсолютно бесполезен, когда сетка не может нормально сгенерировать просто в полный рост человека без кучи артефактов. Да и с пейзажами на самом деле беда. Удаленные ещё более менее, чистую природу тоже. Но как только делается урбанистический пейзаж какой-нибудь локации начинают вылезать различные артефакты, то половину человека забудет, то все сможет, то линии ровные не в состоянии в здании провести, то заблюрит половину картинки.
>>274109309 >>274109428 Самое важное пропустила: >по моим подсчётам вероятность годных при удачном промпте ~1-5% Промпт - это запрос? В таком случае, при удачном запросе (и хорошо построенном наборе тэгов к нему) процент удачных картинок сильно выше, чем ~1-5%. Продолжай экспериментировать с тэгами.
Куда отправляешь, кстати? 30 последовательно или параллельно? А, и меняй настройки, раз за 2 минуты 30 выстреливаешь. Конечно, с базовыми настройками там один хлам будет.
Генерация этой хуйни заняла дохуя, но теперь известно как выглядят пейзажи на шагах выше ста и даже появились мысли, что вообще происходит и почему увеличение числа шагов на низком cfg scale улучшает картинку, а на среднем и выше - ухудшает - что было видно еще на изучении параметров на портретах. В общем на низком cfg scale увеличение числа шагов ведет к постепенному возврату к первоначальной "арт-основе" и постепенный отход от сути запроса. На высоком cfg scale мы видим наоборот, как арт основа полностью отбрасывается и вместо неё пролезает всратость, вызванная точностью запроса. Есть предположение, что эффект с cfg scale 12 и steps 160 на cfg scale 20 будет вылезать раньше, на steps 30 - 40. Думаю можно говорить о существовании т.н. "интервала скатывания во всратость" который уменьшается с увеличением cfg scale" Сейчас попробую очень высокий cfg scale на этой же самой картинке.
>>274109537 Первые две прямо очень хороши, если не считать залысину у первой. У третьей уже видны артефакты, а четвёртая выглядит как карлица с трусами на голове.
>>274109795 Да. Нахуй тогда нейронки нужны, если быстрее в фотошопе дорисовать? >>274109785 Ну и нахуй вы не нужны тогда, позовете, когда в 1 клик будет рисовать то, что я хочу. >>274109817 Я понял, они не дорисуют 3 руку, они тупые и шаблонные.
>>274109822 Я думала, у тебя там 3090 Ti. А вендор кто? Подозреваю, что Gigabyte. Они на ранних 3080 на термопроводниках жлобились.
>>274109863 Нахуй нужен автомобиль с кривым стартёром, если на лошадь сел и поехал? Вот и поезжай на своей лошади обратно в рисовач, или из каких дремучих лесов ты там выехал. Мы тут Прогрессу поклоняемся, а не уши к жопе пририсовываем.
>>274110066 >Очень выразительные получились, как сделал?
Спс, вот такой тег и настройки
Beautiful digital painting of a goddes stylish Scarlett johansson as Elza from frozen, real life skin, silver colors, 8 k, stunning detail, works by artgerm, greg rutkowski and alphonse mucha, unreal engine 5, 4 k uhd
Последний на сегодня таблица - высокие cfg scale на тот же запрос что и тут >>274109571 Получился конечно ожидаемый пиздец, но не так плохо, как мне казалось.
>>274110339 Очевидный Артефакт. Полученный за счёт склейки двух простых 512x512 кадров, в каждом из которых робот попытался собрать персонажа.
>>274110353 При том, на верхних параметрах резкость становится избыточной, а картинка превращается в пародию трёхмерных игр из начала двухтысячных, когда пользовались косыми-хромыми движками, типа лизтеха.
>>274110607 Не поможет и видеопамять. Робота обучали на простых картинках 512x512, и когда он видит что-то больше, то воспринимает это как склейку из нескольких 512x512. Часто он побеждает это (то ли среди шаблонов попадались картинки в более высоком разрешении, то ли их с обновлением движка добавили, но мутантов в последнее время стало меньше), но порой лажа, всё равно, проскакивает.
Нет. Но могут вылезти вторые и третьи(и четвертые и так далее) лица, к чести модели она пытается их прятать в той части чанка, которые не влез в экран, а если не выходит - довольно хитро их пытается встроить в композицию и иногда у нее это даже получается. Вот, например, картинка отрендеренная в нативном 1366х768, состоит из шести чанков 512х512, три из которых вывести за пределы экрана было никак и потому семплеру пришлось группировать трех гермион, а еще трех ему удалось попрятать по невидимым углам.
Так, внесу свою лепту в руководство по эксплуатации: слишком много тэгов в пул ставить противопоказано. Когда их много, робот начинает путаться и генерировать фигню, увеличивает количество мутантов с лишними головами и руками, теряет стилистику.
>>274110790 На платных, на сколько я поняла, попытки не теряются, у них безлимитный доступ. На счёт лажи ничего сказать не могу - надо пробовать, но уж очень цены у них жлобские, смотрю и вспоминаю Анархию Онлайн с такими же идиотскими ценниками на старте.
заметил что увеличение частоты видеопамяти ускоряет рендеринг. не сильно прям, но если ~500 картинок задать на генерацию и экономить на каждой по полсекунды, то неплохая экономия набежит.
Попробуй, лол. Но вряд ли выйдет. А вот на этой кажется что Гермионочек 4. Но если сосчитать руки - то "по запчастям" выйдет 6 человек, сэплер не смог полностью последних двух спрятать. Не смог найти более приличное наглядное пособие, которые бы объясняло всю суть проблемы, пришлось немного поцензурить.
>>274111211 При желании, лишнюю руку, торчащую из за спины центральной Гермионы можно счесть за спрятанный №4. Как же сложно было использовать для обучения не только 512x512… вот теперь получаем то, что получаем.
где-то читал что есть возможность обратного генерирования, т.е. получение тегов из картинки, но хоть убей не вспомню где, надо было тогда в избранное занести =\ кто-нибудь слышал?
>>274111461 мда я думал что это всё-таки шутка и пикчи откуда-то нахватаны и искажены, но нет, black niggers fucking porn party gangbang big dicks выдало мне похожий результат.
первый шедевр я так и не повторил. >>274111807 >>274111862 гланый прикол что на большинстве этих пикч я не прорисывал ничего голого или эротического он тупо full_body (которое на самом деле значит чтоб не только голова была в кадре) так интерпретит. и вообще у многих тегов другое значение получается по сравнению с реальностью. >>274111924 добавьте новые полезные ссылки только >>274111807 >>274111954 все верно, толку от этой штуки мало.
Сделал 26 запросов с фулбади гёрл, из них 15 получилось тупо голова над головой. Чото я уже устал от этой сетки. Похоже надо либо ждать подвижек в ней значительных, чтобы все эти двойные головы, лица, руки, ноги, пальцы стала нормально показывать. Либо ждать новой сетки, которая придет на замену этой.
>>274111807 В общем, картина такова: 1 - оригинал, 2 - что получилось по "найденным" тэгам.
А вот само "найденное" механическим акыном: a woman with red hair wearing glasses and a blue dress, an ultrafine detailed painting by Johannes Helgeson, trending on Artstation, fantasy art, artstation hd, behance hd, sketchfab
>>274112216 робот не стерпел безвкусия и твою аску с провинциального диванарта обхипстерил, лол не пробовала кстати вайфу чтобы рожи не кривые выходили?
>>274112202 нет конечно) просто проще стиль скопировать и всё такое. чем мучительно искать подходящие теги и юзать гуглопереводчик, не у всех с английским хорошо. а так взял, подкорректировал и збс, не нравится, еще раз кнопочку генерации нажать можно.
>>274112264 Если для него ретровейв - безвкусие, а хипстерятина - образчик стиля, то мне его искренне жаль. Кстати, в стиль by Johannes Helgeson (какой-то деятель с Artstation, рисующий космодесантников) он тоже не попал.
>вайфу Нет, не пробовала. Я что-то пропустила, где его можно в онлайне крутить, а в оффлайне вся эта нейрокрасота только на невидии работает, в ближайшие месяцы у меня нет шансов.
>>274112386 >выкидывает цензура по любому приличному запросу Жесть какая. Неприличных запросов у меня нет, но цензурить приличные - это уже запредельное ханжество.
Завтра тогда попробую вайфу, ссылку сохранила, спасибо.
у меня в папке с плагином stable diffusion для рисовалки есть веб-интерфейс, но запускается он с 127.0.0.1, как вывести в онлайн вообще? питонячьи файлы ковырять? охота вне дома херню генерить с мобилы
Восставший, Воскресный, Твой
Предыдущий https://2ch.hk/b/res/274065283.html
StableDiffusion - некстген нейросеть для генерации картинок из текста, которая способна не то, что создавать структурированные картинки, но и делать их практически неотличимыми от реальных, и всё это не за полчаса, а за десятки секунд. Киберпанк начинается прямо сейчас, на наших глазах.
Сайт проекта:
https://beta.dreamstudio.ai/dream
Порядок действий для dreamstudio:
Регистрируешься с временной почтой https://10minutemail.net/m/?lang=ru
либо https://10minutemail.com (впн) либо https://mailnesia.com и тебе даётся ~200 генераций. Когда они закончатся, пересоздай акк. 200 генераций - это базово. Увеличение разрешения или других параметров повышает "цену", будет расходоваться больше попыток. Когда кончаются генерации делаешь новый акк на новую фейкопочту. Дело 20 секунд.
Базовые настройки, чтобы генерация была более-менее терпимого качества. Можно спокойно менять под ваши нужды.
Cfg scale: 7
Steps: 50
FaQ:
1. Как отключить цензуру?
- На сайте никак, эту возможность убрали.
- Поставить локальную версию. Гайды ниже.
Нейронка вышла в открытый доступ. Новая версия весов 1.4
Можно поставить себе на комп. Нужна карта NVIDIA и овердохуя ( от 6 гигов) видеопамяти.
Гугл коллаб от того же анона- спасибо ему. Всё просто и выполняется в 2.5 клика.
https://colab.research.google.com/drive/18YLSgh5gGjjsilyeSH-fB65Ml9M-e_a6
Твой гугл диск никому не нужен, доступ необходим для подргузки весов.
Что тако гугл коллаб? - Нейронка ставится на сервера гугла. Тебе дадут достаточно мощную машину, 12GB RAM, 16GB VRAM. Можно пользоваться ~4 часа в день.
---------------------------------------------------------
Устаревшая сеть от Анона из треда
https://github.com/Mimocro/waifu-diffusion-gradio-hosted-by-colab
Другие сетки красноглазиков с GitHub.
https://github.com/AUTOMATIC1111/stable-diffusion-webui
https://github.com/sd-webui/stable-diffusion-webui
Фикс на видеопамять, позволяет запускать шарманку на 4 гб видеопамяти, а на 8 гб позволяет разрешения вплоть до 1472х832:
https://github.com/Doggettx/stable-diffusion
Ставить attention.py, model.py, txt2img, img2mg поверх своей модели
---------------------------------------------------------
обрезанная однокнопочная версия для тех, кто не может в командную строку, чисто порофлить
https://grisk.itch.io/stable-diffusion-gui , на 4гб можно майнить 256*512
---------------------------------------------------------
Памятка по параметрам и добавкам к тексту запроса:
СОВЕТЫ ПО ПАРАМЕТРАМ:
Width - ширина картинки
Height - высота
cfg_scale - чем больше значение, тем ближе картинка соответствует запросу, жертвуя реализмом + повышается насыщенность цветов и появляются артефакты. Чем меньше значение, тем более фотореалистичная картинка получается. По умолчанию стоит 7.
Если на картинке видны голубые-жмыхнутые артефакты, то надо увеличить steps либо поставить k_euler sampler
----------------------------------------------------------------
ДОБАВКИ К ЗАПРОСАМ:
Вообще это разграничение на на начало и конец условно, по факту чем ближе слово к началу, тем больше оно влияет на результат, но, правда, не всегда.
В НАЧАЛО
A lomography photo - делает фото смазанным, со смещёнными тонами и небрежно снятым
A можно добавить сеттинг или время сьёмки film still - придаёт фото атмосферность и киношный вид
National geographic photo - художественная фотография
Matte painting - реалистичная картина, пейзаж
Concept art - рисунок,иллюстрация, простые персонажи, предметы
Headshot portrait - портрет лица
Full body portrait - портрет с телом до колен
В КОНЕЦ
Cinestill (Polaroid) - делает фото с "плёночными" выцветшими цветами
Bokeh - размытие фона
perfect faces, fine details - значительно улучшает лица
4k - добавляет больше деталей
Octane render, unreal engine - 3д графика
Sticker - делает стикер
by greg rutkowski - добавляет атмосферности ЛЮБЫМ сюжетам
by stephan koldi - атмосферная цветовая гамма, туман
by thomas kinkade - очень яркие, но приятные глазу тона, европа
by ivan aivazovsky - мягкая картинка, но с сильным контрастом, вода
by ivan shishkin - Шишкин, для природы
by marc simonetti - эпик и масштаб, реалистичная картинка
by stephen hickman - сказочный эпик
by makoto shinkai - аниме
by yoshitaka amano - чисто ретровейв стиль который чуток отдаёт аниме
by laurie lipton - депрессивно и монохромно(черно-бело)
by lisa frank - укуренная наркомания блин
by wangechi mutu - стремный средневековый стиль
by artstation - красиво, нежные цвета мало дефектов
by hatsushika hokusai - старый традиционный японский стиль
by ralph steadman - Страх и ненависть
by pauline haynes - слегка яркий стиль и конченный стиль, но только слегка.
Пример простого, но хорошего запроса:
beautiful matte painting of cute soviet block of flats hrushevka in end of forest by ivan shishkin, by artstation
_________________________________
ПРОЧИЕ УТИЛИТЫ:
https://lexica.art/ - ищем готовое, вдохновляемся, копируем промты
https://krea.ai/
https://libraire.ai/
https://promptomania.com/stable-diffusion-prompt-builder/ - удобный для простого обывателя конструктор запроса
@restoration_photo_bot (тeлeгpамм) - исправление лиц (colab https://colab.research.google.com/drive/1sVsoBd9AjckIXThgtZhGrHRfFI6UUYOo)
https://arc.tencent.com/en/ai-demos/faceRestoration - хорошее исправление лиц
https://colab.research.google.com/github/pharmapsychotic/clip-interrogator/blob/main/clip_interrogator.ipynb#scrollTo=rbDEMDGJrJEo - определение запроса по картинке через clip
АПСКЕЙЛ
https://replicate.com/nightmareai/latent-sr - самый лучший апскейл фото и регулярных текстур(ветки деревьев, водная гладь) медленный результат, около 10 минут обработка (colab https://colab.research.google.com/drive/19euI_7GAgbvMoZsuPj9SZseDeuFnwBj8#scrollTo=_hrsrSgFpB1V)
https://replicate.com/jingyunliang/swinir - быстрый результат (colab https://colab.research.google.com/drive/1a2YQVAu5J-ygsn3xJfgncvqn613zZJEY?usp=sharing) (удобный discоrd бот https://дискорд.гг/WxPKSrNgzJ)
http://waifu2x.udp.jp/ - апскейл для рисованных картинок, аниме
https://replicate.com/nightmareai/real-esrgan - простой апскейл с хорошими результатами
Topaz gigapixel с пресетом low resolution - быстрый результат, можно апскейлить много за раз, работает как программа на компе