StableDiffusion Восстановленный, твой Предыдущий - сдох до переката. Помянем.
StableDiffusion - некстген нейросеть для генерации картинок из текста, которая способна не то, что создавать структурированные картинки, но и делать их практически неотличимыми от реальных, и всё это не за полчаса, а за десятки секунд. Киберпанк начинается прямо сейчас, на наших глазах.
Регистрируешься с временной почтой https://10minutemail.net/m/?lang=ru либо https://10minutemail.com (впн) либо https://mailnesia.com и тебе даётся ~200 генераций. Когда они закончатся, пересоздай акк. 200 генераций - это базово. Увеличение разрешения или других параметров повышает "цену", будет расходоваться больше попыток. Когда кончаются генерации делаешь новый акк на новую фейкопочту. Дело 20 секунд.
Базовые настройки, чтобы генерация была более-менее терпимого качества. Можно спокойно менять под ваши нужды.
Cfg scale: 7 Steps: 50
FaQ: 1. Как отключить цензуру? - На сайте никак, эту возможность убрали. - Поставить локальную версию. Гайды ниже.
Нейронка вышла в открытый доступ. Новая версия весов 1.4 Можно поставить себе на комп. Нужна карта NVIDIA и овердохуя ( от 6 гигов) видеопамяти.
Гугл коллаб от того же анона- спасибо ему. Всё просто и выполняется в 2.5 клика. https://colab.research.google.com/drive/18YLSgh5gGjjsilyeSH-fB65Ml9M-e_a6 Твой гугл диск никому не нужен, доступ необходим для подргузки весов. Что тако гугл коллаб? - Нейронка ставится на сервера гугла. Тебе дадут достаточно мощную машину, 12GB RAM, 16GB VRAM. Можно пользоваться ~4 часа в день.
Фикс на видеопамять, позволяет запускать шарманку на 4 гб видеопамяти, а на 8 гб позволяет разрешения вплоть до 1472х832: https://github.com/Doggettx/stable-diffusion Ставить attention.py, model.py, txt2img, img2mg поверх своей модели
--------------------------------------------------------- Памятка по параметрам и добавкам к тексту запроса:
СОВЕТЫ ПО ПАРАМЕТРАМ:
Width - ширина картинки Height - высота cfg_scale - чем больше значение, тем ближе картинка соответствует запросу, жертвуя реализмом + повышается насыщенность цветов и появляются артефакты. Чем меньше значение, тем более фотореалистичная картинка получается. По умолчанию стоит 7. Если на картинке видны голубые-жмыхнутые артефакты, то надо увеличить steps либо поставить k_euler sampler ---------------------------------------------------------------- ДОБАВКИ К ЗАПРОСАМ:
Вообще это разграничение на на начало и конец условно, по факту чем ближе слово к началу, тем больше оно влияет на результат, но, правда, не всегда.
В НАЧАЛО
A lomography photo - делает фото смазанным, со смещёнными тонами и небрежно снятым A можно добавить сеттинг или время сьёмки film still - придаёт фото атмосферность и киношный вид National geographic photo - художественная фотография Matte painting - реалистичная картина, пейзаж Concept art - рисунок,иллюстрация, простые персонажи, предметы Headshot portrait - портрет лица Full body portrait - портрет с телом до колен
В КОНЕЦ
Cinestill (Polaroid) - делает фото с "плёночными" выцветшими цветами Bokeh - размытие фона perfect faces, fine details - значительно улучшает лица 4k - добавляет больше деталей Octane render, unreal engine - 3д графика Sticker - делает стикер
by greg rutkowski - добавляет атмосферности ЛЮБЫМ сюжетам by stephan koldi - атмосферная цветовая гамма, туман by thomas kinkade - очень яркие, но приятные глазу тона, европа by ivan aivazovsky - мягкая картинка, но с сильным контрастом, вода by ivan shishkin - Шишкин, для природы by marc simonetti - эпик и масштаб, реалистичная картинка by stephen hickman - сказочный эпик by makoto shinkai - аниме by yoshitaka amano - чисто ретровейв стиль который чуток отдаёт аниме by laurie lipton - депрессивно и монохромно(черно-бело) by lisa frank - укуренная наркомания блин by wangechi mutu - стремный средневековый стиль by artstation - красиво, нежные цвета мало дефектов by hatsushika hokusai - старый традиционный японский стиль by ralph steadman - Страх и ненависть by pauline haynes - слегка яркий стиль и конченный стиль, но только слегка. Пример простого, но хорошего запроса: beautiful matte painting of cute soviet block of flats hrushevka in end of forest by ivan shishkin, by artstation _________________________________
seductive 10 year old emma watson as 10 year old hermione granger in star wars holds a blue lightsaber in her hand, space sci-fi, ultra detailed, perfect face, artstation, matte painting, by Akihito Yoshida and wlop, 8k
>>274065803 Я из /pa, задавал недавно вопрос про локальную версию. Анон, спасибо за помощь, будь другом, кинь еще ссылку на локалку, в упор линк не вижу
>Фикс на видеопамять, позволяет запускать шарманку на 4 гб видеопамяти, а на 8 гб позволяет разрешения вплоть до 1472х832: https://github.com/Doggettx/stable-diffusion >Ставить attention.py, model.py, txt2img, img2mg поверх своей модели
>>274067431 О, благодарю! Версии отличаются в плане результата генерации или производительностью лишь?
Без фикса видеопамяти нужно больше просто, от скольки Гб без фикса пашет нормально?
И еще вопрос, в промте можно прописать, с какой стороны и как светит источник света, как в 3д редакторе например: типа закатное солнце справа и на 30 градусов к горизонту угол падения света или солнце в полдень строго сверху, либо фонарь слева сверху. Или же четко свет задать нельзя, это на откуп рандому отдается, лишь общую атмосферу можно тесктом задать?
>>274067618 >Версии отличаются в плане результата генерации или производительностью лишь?
Генерация одинакова, за нее отличают семплеры и модель, которые везде одинаковы. Отличаются в плане свистелок-перделок накрученных и опций. В sd webui можно массово ебашить апскейл до 4к и неплохой набор настроек, зато в automatic1111 охуенный исправлятор лиц, лучше обоссаного gfpgan, и создатель таблиц с разными настройками аля пикрелейтед, но каждую картинку будешь вручную апскейлить.
>Без фикса видеопамяти нужно больше просто, от скольки Гб без фикса пашет нормально?
Без фикса 8 гб позволяет генерировать 512х512, 12 гб позволяет 892х892. 24 позволяет плюс минус генерировать около-хд, но вроде как нет. Не рекомендую в общем.
>И еще вопрос, в промте можно прописать, с какой стороны и как светит источник света, как в 3д редакторе например: типа закатное солнце справа и на 30 градусов к горизонту угол падения света или солнце в полдень строго сверху, либо фонарь слева сверху.
Прописать можно все что угодно, не факт что поймет, но в случае со светом скорее всего да.
>>274067536 >фикс походу уже не нужен А, значит можно теперь из коробки сразу в около ашди делать, на 12 Гб например? Либо если не прокатит, апскейлом просто доводить до нужного размера-качества с помощью утилиты от Топаза?
>Ставить attention.py, model.py, txt2img, img2mg поверх своей модели Это все поверх sd webui навалить, или там уже тоже встроено теперь?
Seductive naked 10 year old Emma Watson as 10 year old hermione granger looks at camera with a lewd smile, perfect face, Full body portrait, by Akihito Yoshida
Я по фану, но в треде были люди которые хвалились что зарабатывают. Хз, мне кажется цена обычных художников скоро упадет, зато их роль возьмут нейрохудожники, вроде меня, которые не умеют рисовать сами по себе, но умеют управлять и программировать нейросетями и править ихние художества.
Да, я знаю, уже сидел в бане. Не буду дальше развивать эту тему. Но новые ньюфаги должны понять, зачем это всё вообще, зачем эти треды. Картинки там, эмочка, это все здорово, конечно. Но...
Но ведь Гермиона это лучшее, что случалось с этим тредом. Я бы посрал чем-нибудь другим, будь оно такое же красивое. Можешь посрать сам чем-нибудь, что нравится тебе.
Его довольно тяжело заставить рисовать низ, как правило это портит картинку, нужна реально большая выборка 300+ чтобы отобрать хотя бы десяток-другой пристойных брухлей. У меня есть такой выборка, но только с мелкой Гермионкой, со взрослой только сисечки.
>>274069884 Очень сильно портит впечатление от ролика то, что кукла прибита к полу, как Кобзон, и лишь иногда периодически совершает дёрганные движения, похожие на неловкие попытки улететь, тогда как песня подразумевает некие активные действия от исполнителя. По крайней мере, точно не подразумевает вялого коновульсирования на одном месте.
>>274070094 очень интересно. донки хот это моби дик который? или который в вовчанском на леопардов охотился? а самое интересное что я почти не понимаю что вы пишете. и такое только в этом треде. разгадка где-то рядом...
Стандартная модель - это stable diffusion 1.4. Кто-то дообучил её на аниме с данбуры, используя тамошние теги, называется waifu diffision. Она все превращает в аниме, делая невозможным обычное использование, но генерировать аниме в ней самый раз, куда лучше, чем в обычной модели, особенно если ты знаешь как работают теги в бурах. https://huggingface.co/hakurei/waifu-diffusion Надо просто скачать и заменить model.pkt на pkt с этой модели.
Апскейлит по хитрому алгоритму. На третьей вкладке можно дорабатывать изображение один из 4 апскейлеров на выбор. Я тупо по дефолту ESRGAN врубил в txt2img и не ебусь никакой доработкой.
>>274070378 >Апскейлит по хитрому алгоритму. Ага, спасибо, может позже его поставлю. Саму сборку с некоторым трудом удалось запустить, что-то в path пришлось прописывать, ещё какой-то гемор...
>>274070482 Не жесть, а "высококачественная" броневая сталь с добавкой нацистского дерьма разной степени свежести.
>С чего бы это? Подозреваю, что тонкая духовная организация анимешников не перенесла суровой атмосферы треда. Нургл с Тзинчем в очередной раз оказались сильнее някающих долбоёбов.
Тред, в котором водятся девочки, разбирающиеся в бронетехнике лучше, чем в вовчанском и аниме.
>>274070023 >Распечатывать продукцию нейросети и вешать на стену Нет. При всём удовольствии от взаимодействия с нейросетью. Вешать это на стену я не хочу, а то, что показано на фотографии - не хочу даже сохранять.
>>274070663 >про нацистов анима Кто бы сомневался, что японцы, как были глубоко убеждёнными нацистами, так ими, видимо, и останутся до скончания времён. Хорошо, что весь их нацизм свёлся к аниме и робкому мышиному писку про Курилы.
>>274070781 Там сейчас весь госаппарат - чмо, полностью подконтрольное США. Абэ, кстати, был одним из немногих премьеров, кто хотя бы частично пытался думать самостоятельно, без оглядки на звёздно-полосатое чудище.
>>274070879 Так и есть)) там все чмошники. я определяю по голосу, а ты ну так примерно чувствуешь, да? лан пойду слушать разные приятные голоса. блин забыл, их же не выпустили ни одного с 2017
>>274070927 Угу, а ещё продукт генной инженерии и биоробот Если мы про ребилд евангелиона заговорим
>>274070928 Там не нужно определять по голосу. Там достаточно знать историю Японии после 1945 года, хотя бы немножко. Оккупация, война в Корее и военная база на Окинаве, попытка превратить в индустриальную колонию, облом из-за запредельной стоимости труда (в это время очень кстати Хрущёв посрался с Мао, и амеры принялись доиндустриализировать Китай), превращение в экономический хаб, параллельно со всем этим непрекращающееся развитие военной базы на Окинаве, уже против Китая и СССР/Российской Федерации, да и вообще, чтобы за азиатско-тихоокеанским регионом следить. В девяностые экономика Японии ушла в затяжную рецессию и выбраться из неё не может до сих пор, но лютое американское оверфинансирование, породившее феномен "японского экономического чуда" в семидесятые-восьмидесятые, и поразительное азиатское трудолюбие не дают стране скатиться в треш, угар и содомию до сих пор. Хоть предпосылки уже проглядывают.
>>274071163 Войны нельзя избежать деньгами. Но на войне можно поднять деньги, если ты - спонсор этой войны, а на самой войне появляешься лишь эпизодически, в роли Такседо Маска из Сейлор Мун (ни хуя не делаешь, но зато как эффектно ты это делаешь!)
>пендосские рассуждения Японская новейшая история. Именно так и выглядит.
>лучше бы не писала мне этой хуйни А в твоём мире Япония сама всего достигла и Санта Клаус, такой настоящий, приносит детям подарки на Рождество? В таком случае, извини, что убила твоего Санту ещё раз.
>>274071341 >Ничего пока что Пока что на будущее у них перспективы смутные, туманные. Своё население стареет; молодёжь вестернизировалась и не желает работать по 14 часов в день, как их родители и деды, вообще работать не желает; у руля ожившие гранулы наполнителя для кошачьих туалетов, без собственных идей и инициатив, не способные ни на что, кроме мышиного писка из под тапка хозяина; богатый хозяин за океаном в предынфарктном состоянии, весь красный, но продолжает орать и размахивать покрытыми старческими пятнами кулаками, скоро ему точно будет не до забытой ками-саном острвоной страны.
>вот рашка это да, медицина, еда, двач. мне кажется неплохо. Понимаю твою иронию, но у России с перспективами куда как лучше, чем у Японии. Хоть молодёжь мы тоже проебали, а значит, руины, доставшиеся после лихих девяностых, восстанавливать придётся нашему поколению (тем, кому сейчас 30+), ударными темпами… но, вот беда, в нашем поколении я тоже сильно сомневаюсь. Америкашки нам в головы накакать успели славно.
Ладно, что-то на ночь глядя развезло меня на политику. Пойду спать лучше.
>>274070828 hyper realistic, surreal, portrait of greta thunberg sit in the toilet making silly absurd faces, painted by Norman ROCKWELL, greg rutkowski, wlop, loish
>>274071767 Ну IXIXXIONXPN сразу мимо, видно, что либераха и продаст страну PIUM PIPIS конечно базовый, сразу видно, что мобилизацию объявит, но я за PHUIHA, во взгляде видны сталь и хладнокровие PUNA какой-то ни туда ни сюда, сразу видно, что это спойлер
Вот такие косяки в всей этой шарманке, которые непонятно как фиксить. 1. Картинка не всегда пытается генерироваться в заданном нами разрешении, а видимо берет какую-то картинку из пула как исходник, а потом обрезает или двоится под разрешение - пример такого хуевого и странного поведения(получается нам напиздели что ли что её обучали только на квадратных 512х512?) на пикрелейтедах. Обнаружил, что основы для full body portrait часто вытянуты по вертикали, а вот landscape - наоборот по горизонтали. 2. При разрешении выше чем 640х640 объекты начинают двоится и вместо одного путина или эммы получаются два. Или три, если разрешение выше 1024.
>>274072222 >При разрешении выше чем 640х640 объекты начинают двоится и вместо одного путина или эммы получаются два. Или три А если явно указывать, что на картинке должен быть только один Путин.
Думаю что это не сработает. Понимаешь все завязано на картинки-основы, большая часть из которых - это 512х512, которые он хитро соединяет между собой, но рисует на каждой(!) основной запрос, т.е. 1 путина. Т.е. на большой 1024х1024 картинке таких основ будет 4 и, соответственно, будет 4 Путина. И вот смотри сюда на 4 пик >>274072127 Единственный выход из этой ловушки если тебе не хочется видет двух путиных ли двух эммочек - рисовать в меньшем разрешении и потом скейлить. Либо надеятся на те самые нестандартные основы, которые я описал в первом пункте, разрешение которых выше 512х512 - но тогда придется создавать много картинок и отбраковывать большинство из них, отбирая только те, которые смогли - посмотри на мои пикрелейтеды, у них одинаковые исходные разрешения, на двух прокнула большая основа, и Эммочка там одна, на двух - нет.
>>274072438 >Единственный выход Если использовать img2img можно разметить силуэт, хотя бы два овала под голову и туловище - тогда не должно быть лишних персонажей.
>>274065283 (OP) >Твой гугл диск никому не нужен, доступ необходим для подргузки весов. ПРАВДА ? А КАКОГО ХУЯ ОНО У МЕНЯ НЕ РАБОТАЕТ ВИСИТ НА ПОСЛЕДНЕМ ШАГЕ И ПИЗДА, ПО ССЫЛКЕ БЕЛАЯ СТРАНИЦА ? НЕ НУЖЕН ПАРОЛЬ ОТ ГУГЛА АККА КОМУ ТЫ ПИЗДИШЬ СУКА ? ОН У МЕНЯ ПУСТОЙ МНЕ ПОХУЙ, НО АНОН У КООРОГО СТАРЫЙ АКК ТЫ ПОПАЛ ))))))))))))))))))))))
>>274072672 рамзанка дыров by иероним Босх? >>274070519 дегенераты потому что ыыыыыыы не генерирует мне вайфу нормально ыыыыы я прооебайл свои нейронные клетки мастурируя и не могу понять ни раздуплить ничо не могу
Я ВОТ Заметил У НЕЙРОСЕТОК ПРОБЛЕМА СО ЗРАЧКАМИ, ВОЗМОЖНО ПОТОМУ ЧТО ОНА ПЫТАЕТСЯ НАРИСТВАТЬ БЛИКИ СВЕТА НА ЗРАЧКАХ, МОЖНО ЛИ ЭТУ ОПЦИЮ КАК ТО ПОФИКСИТЬ?
Я генерирую всегда на 20 степсах, так более артовый результат выходит, дальше уже уклон в реализм 50-70 норм и чем ближе к сотке, тем явственней проступает васянский контраст и эффект прифотошопленного ебала.
Художник ОЧЕНЬ ролляет. Все эти плакаты бы не получились, если бы я отдал их не главному художнику пропаганды Третьего Рейха, а какому-нибудь обоссаному грегу рутковскому.
Во всех локалках вшит корректировщик лиц gfpgan, который весьма обоссан в случае артов и уважаем для фотографий, а в automatic1111 даже вшит охуительный codeformer.
Hans Schweitzer. Вообще рекомендую гуглить художников ручками, чтобы представлять что они рисовали и как. Нейронка знает даже обоссаных ноунеймов с девианта, и даже художников русских визуальных новелл. Шишкин хорошо рисует природу и пейзажи, но пропагандистские плакаты я бы ему не доверил, он ими не занимался.
cfg_scale: 7 ddim_eta: 0 ddim_steps: 100 height: 512 n_iter: 50 prompt: seductive 10 year old emma watson as an imperial guard in warhammer, ultra detailed, perfect face, artstation, matte painting, by Akihito Yoshida and wlop, 8k sampler_name: k_dpm_2_a seed: 1432951413
По реквесту генерируете? Эх, как же хочется худенькую, бледную, не очень высокую, девственную, нецелованную, с тонкими руками, небольшими ступнями, синяками под глазами, растрёпанными или неуложенными волосами, ненакрашенную, забитую хикку, лохушку без друзей и подруг, закрытую социофобку, одновременно мечтающую о ком-то близком, чтобы зашёл к ней в мирок, но ничего не ломал по возможности, дабы вместе с ней изолироваться от неприятного социума.
У кого есть возможность, сгенируруйте запрос из следующего : беременная девушка с короткими волосами в свадебном платье целует парня, возле реки Либо парень сзади, целует беременную девушка с короткими волосами, которая стоит перед ним в чёрных трусах
>>274078108 Чувак, пожалуйста, ты мог бы сгенирировать этот запрос? >парень сзади, целует беременную девушка с короткими волосами, которая стоит перед ним в чёрных трусах и кожаной куртке (чтобы девушка была и беременной, и в кожаке и в трусах)
Пожалуйста, сгенерируйте обложку для несуществующей книги. Что-нибудь вроде унылого серого города на фоне и толпы одинаковых серых людей, окружающих одного яркого/рыжего/необычного человека. Заранее спасибо.
Короче, появилась гениальная идея, поднимаем нейронку img to txt, берём картинки из каждого нового поста, обрабатываем, если видим в них что-то из нашего банлиста - добавляем картинки в скрываемые. Таким образом можно было бы легко избавиться от вайперов и шитпостеров.
>>274079131 пох на вайперов но imgtotxt функция в той же нейронке было бы очень полезно чтобы формулировать запросы хорошие, я не понимаю почему ее нет, казалось бы несложно сделать
>>274078962 Вау, просто нет слов, будто бы реальное фото, а не результат работы нейронки. >>274079106 А во вторую девушку, я прям влюбился. Эх, жаль что она не реальная Отличная, великолепная работа!
>>274079203 окей на реддите кто-то говорит что так не работает. ладно. вот зато нашел адаптацию этой херни под наш стейбл https://replicate.com/methexis-inc/img2prompt прочем выдает совсем не то на чем сгенерировали но ничего но добавьте в шапенцию, лучше чем >определение запроса по картинке через clip >>274065283 (OP)
>>274079757 >>274079748 >>274079838 А вот можно ли как-то одну из подобных выдуманных девок постоянно снова генерить в разных позах и обстановках? Можно бы тогда запилить фейк инсту ей.
>>274079956 Вангую, что нет, для этого нейросеть надо научить образу этой бабы, что требует 40 гб видеопамяти. И как-то получить штук 20 разных картинок этой выдуманной бабы для обучения нейросети. Ну тут еще можно что-то придумать с фотошопом и img2img. Сложно короч, просто так сейчас не сделаешь
>>274080046 Вангую можно какой-то микс из известных баб найти, который няшно и одинаково везде выглядит и генерится на одном сиде. И потом менять им позы просто. Хотя хз что выйдет, при смене позы в промте, думаю и внешка в сиде поменяется.
>>274080178 Миксы внешек каждый раз по-разному выглядят, так что это не то. Нужно чтобы вон как эмму генерит и все время одна внешка. А это только если нейросеть выдуманной бабе обучить.
>>274080218 Нужно нейросеть дописать, чтобы из определенных миксов генерила всегда одну внешку. Хз, возможна ли такая функция. А потом ее уже раком ставить в разные позы.
>>274065283 (OP) Котаны, кто рендерит локально, засандальте промпт ниже. Интересно посмотреть, что там такое. У меня его постоянно цензурой замыливает.
The perfect human model little cute angelic girl posing, accurate details, detailed face, fantasy, dramatic, intricate, elegant, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, art by gustave dore, octane render
>>274081278 На 4 гигах vram идет у меня, но GFPGAN приходится отключенным держать, иначе сразу переполнения памяти. Хз может есть какой билд, где оба работают, я не нашел.
>>274082436 >>274082496 >>274082530 Отличные фотки, а можно поэспериментировать, чтобы была фоточка со спины, и можно было б увидеть задницу в чёрных леггинсах?
Chloe moretz , Hot body , deep focus, d & d, fantasy, intricate, elegant, highly detailed, digital, painting, artstation, concept art, matte, sharp focus, illustration, art by artgerm and greg rutkowski and alphonse,no bra, buttocks, uncensored, no pants, no underpants, no clothes, open breasts У кого без цензуры. Сделайте плиз
https://github.com/crowsonkb/k-diffusion А вот это чё не смотрел никто? Если я правильно понял, то можно на любых картинках модели обучать и на их основе потом генерить что-то? На буржуйском пишут, нихуя не понятно.
>>274085007 на сколько я знаю что обучать модельку нужна карточка с овер дохуя памяти к примеру в описании waifu модели чувак написал что юзал 8 gpu по 40гб в каждой (nvidia a100)
иначе ты 300 лет будешь ждать, и с 1 раза не получится конечно же
dancing Ricardo Milos in a red bandana looks quite comical, and with cheerful music it turns out even funnier. Milos' dance is quite consistent with typical gay erotica: a should be considered abstract, since it does not make much sense and is intended only to yell (or flex).
>>274085393 Сейчас очень упрощённо попытаюсь пояснить. Берёшь нейросеть, показываешь ей картинку с описанием, картинок и описаний к ним нужно оче много, а сами описания должны быть как можно более подробными и качественными. В целом набор данных(dataset) не обязательно представляет из себя картинки, всё зависит от того чему ты учишь свою нейросеть. Чем качественнее и объёмнее датасет - тем качественнее результат обучения. Само обучение представляет из себя расчёт связей между нейронами. Искусственный нейрон, если упрощать, тождественнен (представляет собой) какому-то параметру, по сути одно это из слов в описании картинки которую ты загружаешь. Если представить, что у нас есть картинка на которой нарисовано красивое красное яблоко, а описание переданное нейросети представляет собой "красивое, красное, яблоко", то вот эти слова и станут для нашей новой нейросети нейронами. Чем больше нейронов, тем более качественный результат может выдавать нейросеть. Представь себе всю сложность описания изображения в деталях. Ту же самую картинку с яблоком можно описать целой страницей текста, но если у твоей нейросети всего 3 нейрона, для "красное", "красивое" и "яблоко". То 90 процентов информации в твоём датасете учтено не будет. И так, мы взяли примерно 100к изображений с разными яблоками, засунули их в нейросеть, она покумекала и установила, что есть некоторая связь между таким-то набором пикселей и словом красивое, есть некоторая связь между другим набором пикселей и другой переданной нами характеристикой изображения и так далее. Приступаем к обучению. Предположим что запросу "красное красивое яблоко" у нейросети среди сотни тысяч нейронов активируется тысяча. Почему тысяча, ведь мы задали всего два слова? Потому что нейросеть не в курсе что такое яблоко, а тем более что такое красивый. Она просто оперирует математикой, её нейроны это набор закономерностей которые она увидела среди всех изображений датасета. Поэтому по запросу "красивое яблоко" активировался и нейрон "круглый", и нейрон "квадратный", и нейрон "груша". И если просто спрашивать нейросеть раз за разом "красивое яблоко" она просто будет выдавать тебе рандомные картинки, порой даже близко не походящие на яблоко. Что мы можем наблюдать ИТТ, правда сетка у нас круче, а спрашиваем мы не яблоки, а какую-нибудь ебанутую хуйню. Получившиеся картинки мы засовываем в другую нейросеть(потому что руками это делать слишком долго), которая определяет что на картинках и говорит говорит по каждой из них на сколько % результат соответствует каждому из слов в запросе. Нейросеть смотрит на всё это и понимает, что картинка с изображением похожим на красное яблоко соответствует словам красное на 90% и яблоко на 87%, и решает что нейрон "круглое", "красное", и "яблоко" в такой-то связке дают "красное яблоко", а вот нейрон "квадратный" который активировался когда сеть генерировала квадратную синюю хуйню в данной ситуации к запросу не подходит. И подобное продолжается долго. Очень долго. Очень очень очень долго. На железе за многие миллионы долларов. Проходят миллионы итераций подобного цикла "запрос-генерация-оценка-правка весов нейронов". Сверху подключается что-то похожее на чёрную магию благодаря которой нейросети типа DALL-E 2 и Stable Diffusion таки выдают хорошие результаты. А на выходе мы имеем файл относительно небольшого объёма, в котором сохранены значения "важности" определённого нейрона для каждого из параметров возможного запроса. Представь себе, слов в англюсике значительно меньше миллиона. А параметров у современных моделей миллиарды, а иногда и десятки. Вот таким нехитрым способом, на основе теории пятидесятилетней давности, при помощи очень мощных компьютеров, избыточно большого количества параметров, колоссальных датасетов в миллионами изображений и миллиардами пар текст-изображение, ну и, конечно же, такой-то матери, ты можешь написать "красное яблоко" а в ответ тебе почти всегда покажут красное яблоко. Но как же всё-таки приятно написать "красное яблоко" и в ответ получить что-то действительно похожее на красное яблоко.
holly taylor, Hot body , deep focus, d & d, fantasy, intricate, elegant, highly detailed, digital, painting, artstation, concept art, matte, sharp focus, illustration, art by artgerm and greg rutkowski and alphonse,, open buttocks, uncensored, genitalia, breasts
>>274087994 Потрясающее объяснение, спасибо за труд бобук ты ли это
Я так понимаю, без знаний уровня Ph.D по математике или компуте сайенс, в этой черной магии разобраться просто не реально
Или как или что, ну если я правильно понял, stable diffusion, использует pytorch. Значит ли это что они сами ничего совсем уж низкоуровневого не реализовывали?
Предыдущий - сдох до переката. Помянем.
StableDiffusion - некстген нейросеть для генерации картинок из текста, которая способна не то, что создавать структурированные картинки, но и делать их практически неотличимыми от реальных, и всё это не за полчаса, а за десятки секунд. Киберпанк начинается прямо сейчас, на наших глазах.
Сайт проекта:
https://beta.dreamstudio.ai/dream
Порядок действий для dreamstudio:
Регистрируешься с временной почтой https://10minutemail.net/m/?lang=ru
либо https://10minutemail.com (впн) либо https://mailnesia.com и тебе даётся ~200 генераций. Когда они закончатся, пересоздай акк. 200 генераций - это базово. Увеличение разрешения или других параметров повышает "цену", будет расходоваться больше попыток. Когда кончаются генерации делаешь новый акк на новую фейкопочту. Дело 20 секунд.
Базовые настройки, чтобы генерация была более-менее терпимого качества. Можно спокойно менять под ваши нужды.
Cfg scale: 7
Steps: 50
FaQ:
1. Как отключить цензуру?
- На сайте никак, эту возможность убрали.
- Поставить локальную версию. Гайды ниже.
Нейронка вышла в открытый доступ. Новая версия весов 1.4
Можно поставить себе на комп. Нужна карта NVIDIA и овердохуя ( от 6 гигов) видеопамяти.
Гугл коллаб от того же анона- спасибо ему. Всё просто и выполняется в 2.5 клика.
https://colab.research.google.com/drive/18YLSgh5gGjjsilyeSH-fB65Ml9M-e_a6
Твой гугл диск никому не нужен, доступ необходим для подргузки весов.
Что тако гугл коллаб? - Нейронка ставится на сервера гугла. Тебе дадут достаточно мощную машину, 12GB RAM, 16GB VRAM. Можно пользоваться ~4 часа в день.
---------------------------------------------------------
Устаревшая сеть от Анона из треда
https://github.com/Mimocro/waifu-diffusion-gradio-hosted-by-colab
Другие сетки красноглазиков с GitHub.
https://github.com/AUTOMATIC1111/stable-diffusion-webui
https://github.com/sd-webui/stable-diffusion-webui
Фикс на видеопамять, позволяет запускать шарманку на 4 гб видеопамяти, а на 8 гб позволяет разрешения вплоть до 1472х832:
https://github.com/Doggettx/stable-diffusion
Ставить attention.py, model.py, txt2img, img2mg поверх своей модели
---------------------------------------------------------
обрезанная однокнопочная версия для тех, кто не может в командную строку, чисто порофлить
https://grisk.itch.io/stable-diffusion-gui , на 4гб можно майнить 256*512
---------------------------------------------------------
Памятка по параметрам и добавкам к тексту запроса:
СОВЕТЫ ПО ПАРАМЕТРАМ:
Width - ширина картинки
Height - высота
cfg_scale - чем больше значение, тем ближе картинка соответствует запросу, жертвуя реализмом + повышается насыщенность цветов и появляются артефакты. Чем меньше значение, тем более фотореалистичная картинка получается. По умолчанию стоит 7.
Если на картинке видны голубые-жмыхнутые артефакты, то надо увеличить steps либо поставить k_euler sampler
----------------------------------------------------------------
ДОБАВКИ К ЗАПРОСАМ:
Вообще это разграничение на на начало и конец условно, по факту чем ближе слово к началу, тем больше оно влияет на результат, но, правда, не всегда.
В НАЧАЛО
A lomography photo - делает фото смазанным, со смещёнными тонами и небрежно снятым
A можно добавить сеттинг или время сьёмки film still - придаёт фото атмосферность и киношный вид
National geographic photo - художественная фотография
Matte painting - реалистичная картина, пейзаж
Concept art - рисунок,иллюстрация, простые персонажи, предметы
Headshot portrait - портрет лица
Full body portrait - портрет с телом до колен
В КОНЕЦ
Cinestill (Polaroid) - делает фото с "плёночными" выцветшими цветами
Bokeh - размытие фона
perfect faces, fine details - значительно улучшает лица
4k - добавляет больше деталей
Octane render, unreal engine - 3д графика
Sticker - делает стикер
by greg rutkowski - добавляет атмосферности ЛЮБЫМ сюжетам
by stephan koldi - атмосферная цветовая гамма, туман
by thomas kinkade - очень яркие, но приятные глазу тона, европа
by ivan aivazovsky - мягкая картинка, но с сильным контрастом, вода
by ivan shishkin - Шишкин, для природы
by marc simonetti - эпик и масштаб, реалистичная картинка
by stephen hickman - сказочный эпик
by makoto shinkai - аниме
by yoshitaka amano - чисто ретровейв стиль который чуток отдаёт аниме
by laurie lipton - депрессивно и монохромно(черно-бело)
by lisa frank - укуренная наркомания блин
by wangechi mutu - стремный средневековый стиль
by artstation - красиво, нежные цвета мало дефектов
by hatsushika hokusai - старый традиционный японский стиль
by ralph steadman - Страх и ненависть
by pauline haynes - слегка яркий стиль и конченный стиль, но только слегка.
Пример простого, но хорошего запроса:
beautiful matte painting of cute soviet block of flats hrushevka in end of forest by ivan shishkin, by artstation
_________________________________
ПРОЧИЕ УТИЛИТЫ:
https://lexica.art/ - ищем готовое, вдохновляемся, копируем промты
https://krea.ai/
https://libraire.ai/
https://promptomania.com/stable-diffusion-prompt-builder/ - удобный для простого обывателя конструктор запроса
@restoration_photo_bot (тeлeгpамм) - исправление лиц (colab https://colab.research.google.com/drive/1sVsoBd9AjckIXThgtZhGrHRfFI6UUYOo)
https://arc.tencent.com/en/ai-demos/faceRestoration - хорошее исправление лиц
https://colab.research.google.com/github/pharmapsychotic/clip-interrogator/blob/main/clip_interrogator.ipynb#scrollTo=rbDEMDGJrJEo - определение запроса по картинке через clip
АПСКЕЙЛ
https://replicate.com/nightmareai/latent-sr - самый лучший апскейл фото и регулярных текстур(ветки деревьев, водная гладь) медленный результат, около 10 минут обработка (colab https://colab.research.google.com/drive/19euI_7GAgbvMoZsuPj9SZseDeuFnwBj8#scrollTo=_hrsrSgFpB1V)
https://replicate.com/jingyunliang/swinir - быстрый результат (colab https://colab.research.google.com/drive/1a2YQVAu5J-ygsn3xJfgncvqn613zZJEY?usp=sharing) (удобный discоrd бот https://дискорд.гг/WxPKSrNgzJ)
http://waifu2x.udp.jp/ - апскейл для рисованных картинок, аниме
https://replicate.com/nightmareai/real-esrgan - простой апскейл с хорошими результатами
Topaz gigapixel с пресетом low resolution - быстрый результат, можно апскейлить много за раз, работает как программа на компе