Инструкция: Самое простое начать с сайта replicate. Регистрируете GitHub, и соединяете акк. на сайте replicate. Все, теперь вы восхитительны, и работают все поля ввода. Коллаб - это чуть более сложная штука, но с большими возможностями, у нее лимит 6 часов в день (удаления куки, вроде, не поможет).
Steps делай около 500-800, а в prompt вводи то, что хочешь сделать, только лучше trending on artstation или best of behance в конце оставь, остальные крутилки и кнопки лучше не трогай и нажимай на submit внизу страницы. Через 10-15 минут у тебя красивая картина. Если долго висит на starting, то значит ты попал в длинную очередь, зачастую нужно просто подождать. Важно - при окончании лимита на сайте, удаляйте куки браузера (replicate_anonymous_id - вот эту папку) и можно начинать по-новой.
Так же один анон предлагал "оживлять" эти арты программой "Фотошоу ПРО"
Ещё попробую немного объяснить пару вещей, на столько на сколько понял сам, чтобы не отвечать сто раз на одни вопросы: - Добавление "Trending on artstation" в конце запроса - ИИ начинает ориентироваться на сайт www.artstation.com, кому-то помогает улучшить визуал запроса, кому-то нет, эксперементируй. - Если хочешь ориентироваться на какой-то стиль художника - указывай в запросе его(на ангельском естественно), в дефолтном запросе стоит пример "by greg rutkowski and thomas kinkade". - Удобнее всего делать запросы утром, т.к. при увеличении запросов от людей, ИИ начинает дольше их обрабатывать. - Список знакомых нейросетке художников (см База данных тегов и художников Disco Diffusion). - В английском гайде также советую такую форму написания текста для начала: NOTICE THAT THIS PROMPT LOOSELY FOLLOWS A STRUCTURE: [SUBJECT], [PREPOSITIONAL DETAILS], [SETTING], [META MODIFIERS AND ARTIST]; THIS IS A GOOD STARTING POINT FOR YOUR EXPERIMENTS
Смотрите что нагенерировал, с двух последних аж шишка колом анон с тампоном A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by new horizons jupiter photography A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by NASA jupiter photography A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by new horizons and nasa jupiter photography
The young try hard, tear each other into tight tops. The dark attendants help them, guide, support. Here the penultimate young screamed, the last grunted - and the caterpillar is ready. Has developed. Freeze by greg rutkowski and thomas kinkade, Trending on artstation. Кусок из дня опричника...
>>271452476 гиант чикен бу бексинский, фэариес бу бексинский, треазурес бу бексинский, гиант сноуфлакес бу бексинский >>271452532 гиант кукумбер бу бексинский, гиант машрум бу бексинский, блэк гоат бу бексинский, вампирес бу бексинский >>271452566 гиант фрог бу бексинский, гиант потато бу бексинский, голден койнс бу бексинский, гиант пигеонс бу бексинский >>271452610 фловерс бу бексинский, еагл спидер сентипеде бу бексинский, гиант томато бу бексинский, лантернс бу бексинский
>>271453213 Там вроде на генерацию нет ограничения по времени. Типа, если он будет делать её 1ч40, то просто на следующую тебе будет сообщения, мол, лимит исчерпан. Я вот как раз одну генерил почти два часа, через эту опцию - Use ViTB14 model, она одна из самых тяжелых по памяти и времени.
>>271453564 Тут согласен, очень хорошо детали прорисовывает, и всякие тени. Сам подсел на 1000 шагов + ViTB14, лучше одна пикча в 2 часа, чем скетчи за 30 минут.
У меня странная фобия. Я почему-то очень боюсь, что эта сетка пропадет именно тогда, когда она мне максимально нужна будет и я стараюсь нагенерить пикч, которые мне хотя бы в теории могут понадобиться)))))
>>271455480 Для ориентира, вот, все из того же гайда. THE ROUGH ORDER OF SPEED/MEM USAGE IS (SMALLEST/FASTEST TO LARGEST/SLOWEST): VITB32 RN50 RN101 VITB16 RN50X4 RN50X16 RN50X64 VITL14
>>271456718 Если что, видеопамять ты используешь не свою, а ту, что свободна на сайте, там вроде 32 гига, обычно. Посмотри чуть выше ссылку, там есть прогонка одной и той же картинки (точнее слов) и их комбинации, как бы, не сказать, что уж очень все понятно станет, но хотя бы примерно. Галочка секондари модел - это более упрощенная модель диффузии, а значит более быстрая, но скорее всего, менее точная, если заряжаешь пикчу 1000 шагов и 1ч30+, то есть смысл её отрубить, чтобы использовалась более продвинутая и тяжелая модель. Все эти VitL это что-то типа оттенков\характеров, наверное правильнее характеров, из них самая тяжелая это VITL14 (я обычно не убираю галочки с остальных дефолтных) вместе с 1к шагами и без галочки на секондари модел, одна картинка будет генериться где-то часа 2. Самое жрущее память - это ширина и длинна самой пикчи, я генерю себе обложки, поэтому использую квадрат 1280x1280. С попыткой в 1920x и такими настройками, скорее всего, через минут 5 вылетит с ошибкой на нехватку памяти.
Еще прикрепил разные наблюдения одного анона, надеюсь он потом оформит их в пдф.
>>271457461 Механический жук-капиталист вальяжно всасывает пищу через трубочку, пока насекомый-пролетарий допивает свою масленую жидкость. Нейрокартина после большего бадабум, автор неизвестен.
>>271457829 1-3 "A grand temple of the star god, endless cosmos, by Bekzinsky, Trending on artstation." 4 "On seashore far a green oak towers, And to it with a gold chain bound, A learned cat whiles away the hours By walking slowly round and round. by greg rutkowski and thomas kinkade, Trending on artstation.", "yellow color scheme" 4 это одна из первых моих попыток, не понимал вообще как это работает
>>271457346 1280х1280 - классный варик для облоги, оптимальный я вычислил что 1920х960 или 1920х768 оптимальный для эпичных панорманых полотен Красивее всего по балансу и визуалу получается 960х1536, вертикальнее не пробовал, может еще лучше будет. но 960х1536 - тупо портретка.
>>271460007 И он начнет одновременно две пикчи генерить? А какой лимит, сколько можно 2-3-10? И я так понимаю, если используешь тяжелые настройки, то может вылететь с ошибкой на нехватку памяти?
>>271462570 Ну, ничего так. Есть предположение, что если мало описательных слова, буквально два три, может быть имеет смысл увеличить значение clip_guidance_scale до 20к, например, может быть он нарисует что-то более конкретное.
>>271462692 У меня clip_g... стоит 35000, может переборщил Но вот пик рендерится, абсолютно тот же сид, те же настройки, то же разрешение и т.д Но без secondary model То есть различия пиздец видны
>>271462808 >Но без secondary model Ну она довольно сильно влияет, в гайде говорится, что дефолтная модель (если убрать галочку) более точная и из-за этого дольше времени уходит на рендер, преимущества сенодари только в скорости.
арты в стиле Бэнкси должны пиздато смотреться с этими кривыми линиями что нейросеть рисует, только я поебень ей скормил : girl with car ears holding a rifle in banksy style
Gandalf the Grey with gold hair planting a tangerine in an airport, Go pro footage, Award winning A hobbit wearing a bright magenta dress holding a sloth in a prison cell, Cover of National Geographic magazine An elf talking to a beetle in a football stadium, Neoclassical painting
Academic pencil drawing of a man stands inside a colossal catholic church with huge columns and statues of saints, trending on artstation, trending on google
realistic painting of scared human face made of worms, oil painting Первая без secondary model, вторая с ней. Но почему-то по времени одинаково делались.
>>271467748 По-моему они просто от балды накидали то, что срабатывало. Такие модификаторы любой дурак сделает. Годные модификаторы это те, что дают более менее одинаковые предсказуемые варианты в различных сочетаниях, типа моего любимого Melancholic dreary picture
>>271468264 Да я сам еще ничего не нашел, я чужими пользуюсь. Я просто про то, что ежели уж делать список, так менее рандомный. А в идеале еще и структурированый.
A beautiful colourful drawing of a man stands inside a colossal catholic church with huge columns and statues of saints, trending on artstation, trending on google
Смотрите какая лошадка красивая! 0: ["cute gray little pony mare from My Little Pony with nice hairy pale blue mane, meadows with orange and red flowers, few trees in behind, cloudy sky, little muted colour, low contrast", "pale blue mane: 1" ],
ХУЙ ЗНАЕТ КОМУ ЭТО МОЖЕТ ПОНАДОБИТСЯ(так как сид все время разный, и стиль художника своеобразный) НО МОГУ СДЕЛАТЬ ЭТОТ ФАЙЛИК С ПОДПИСЯМИ к тому где какая diffusion_model, diffusion_sampling_mode
>>271472398 Пик2 - вот это ракурс конечно, и столько разных деталей, вообще круто получилось. Даже интересно стало, есть ли реальная пикча-вдохновение\референс или это нейронка сама так смогла.
>>271472632 хз A beautiful painting of a card game between demons, ghosts, skeletons, vampires and beautiful naked sexy girls, drinking whisky and smoking cigarettes in abandoned hall with candles and statues, realistic, contrast, Trending on artstation
>>271472632 Нейронка рисует сама. Она грубо говоря как ты, насмотревшись на кучи чужих работ, запоминает закономерности и фишки, а затем рисует сама. Ну только куда лучше память чем у человека, но хуже понятия о реальном мире.
>>271473146 Может быть используешь один и тот же seed, еще можешь попробовать добавить какое-то уточняющее слово о ее расположении, стоит\сидит в пещере, далеко\близко от какого-то объекта.
>>271473271 >>271473146 Дополню, что для уточнений лучше использовать clip_guidance_scale побольше, и, мне кажется, объединенные по смыслу словосочетания, лучше заключать в кавычки. Ну грубо говоря, чтобы он ведьму двигал, а не пещеру. Но у меня это работает через раз.
Первый блин был комом (вообще нечто невразумительное получилось - пытался людей сгенерировать), а вот вторая попытка более удачная. Словом, вкатился в ваше аутирование
>>271491260 не фига, не всегда стоит вырубать секондари, я сейчас доделаю сравнение с vitl14_366 и секондари и без с ddim и plms, на plms явно не все так однозначно. И да без секондари время больше ощутимо
>>271492458 ну и еще я делаю на 800 шагах, может этого слишком много, и он перебирает с деталями преваращая все в пиксельную кашу + там стиль фотореализм, сейчас параллельно делаю beautiful painting, тоже там сравню, потом приложу резалты.
A beautiful painting, sword fight of the statue of the motherland and the statue of liberty, lightning and gray sky, trending on artstation, trending on behance ViTL14_336 Guidance 18800 585 steps
С включением/выключение секондари модел ещё не экспериментировал.
Если все пойдет хорошо то буквально через часочек будет несколько сравнений >>271492334 с одинаковыми сидами в разных стилях. Уже часть готова не хочу в разброс лить, залью лучше сразу 3 поста по несколько картинок.
>>271498911 вот сейчас тебе могу ответить, сейчас параллельно генерю ddim и plms, разницы в скорости нет вообще вроде как. Скорее всего разница в скорости в том, что plms гораздо более детальный (и как бы шумный), поэтому возможно ему нужно меньше шагов (я генерю на одинаковых 800)
>orange sunset on a colorful planet, Impasto, Trending on artstation >beautiful oil painting of ocean full of stars and galaxies, impressionism, Trending on artstation. >beautiful oil painting of aurora in magic forest, impressionism, Trending on artstation. >beautiful oil painting of orange sunset, blue ocean, snow mountains, impressionism, Trending on artstation. На sunset постоянно колобка какого-то рисует, лол. А аврору приняла за имя.
Бля ее вообще реально запустить из-под докера с винды? Очень не хочется переключаться на линукс. Делаю команду докера, как на сайте, а он не может к локалхосту подключиться.
1. Подписка на replicate имеет смысл? Сумма небольшая, а как насчет полученных плюшек - можно будет нонстопом генерить в десятке вкладок параллельно, намного быстрее, с пресловутыми 25000 шагов?
2. Кто-нибудь экспериментировал с source и target image, насколько релевантные результаты получаются?
3. Как насчет запроса с простым перечислением ожидаемых на картине объектов, существительное + прилагательные + расположение, без всяких предлогов и глаголов? Сеть воспринимает такое лучше?
4. Есть возможность генерить по запросу не одну картинку, а сразу таблицу с сотней тамбнейлов небольшого разрешения, с сохранением рандом сида для каждой, чтобы потом можно было отобрать понравившиеся для нормального разрешения? Какой минимальный размер тамбнейла? Например, 128х128 обрабатывается всего лишь раз в 5 быстрее, чем 1280х1280, но самое неприятное - при том же сиде получается заметно другой результат.
5. На что влияют другие опции генератора, кто-нибудь уже пробовал менять галочки в этих десятках полей?
Пример сравнения ViTL14_366 с secondary_model и без. По времени без секондари модел явно дольше. Запрос: Empty streets of America if the Soviet Union had won the Cold War, widescreen, Artstation trending steps: 800 seed: 2866258134 clip_guidance_scale: 12000 diffusion_model: 512x512_diffusion_uncond включены все модели по умолчанию, плюс ViTL14_366
1ый пик: diffusion_sampling_mode: ddim, use_secondary_model: on 2ой пик: diffusion_sampling_mode: ddim, use_secondary_model: on 3ий пик: diffusion_sampling_mode: ddim, use_secondary_model: off 4ый пик: diffusion_sampling_mode: ddim, use_secondary_model: off
>>271503332 Второй пример сравнения ViTL14_366 с secondary_model и без. По времени без секондари модел явно дольше. Запрос: A big bang was born in absolute emptiness, widescreen, high contrast, Photorealism, Artstation trending steps: 800 seed: 2096749512 clip_guidance_scale: 15000 diffusion_model: 512x512_diffusion_uncond включены все модели по умолчанию, плюс ViTL14_366
1ый пик: diffusion_sampling_mode: ddim, use_secondary_model: on 2ой пик: diffusion_sampling_mode: ddim, use_secondary_model: on 3ий пик: diffusion_sampling_mode: ddim, use_secondary_model: off 4ый пик: diffusion_sampling_mode: ddim, use_secondary_model: off
Обычно когда даешь детальное описание, выходит фигня. А если буквально тремя-четыремя словами сможешь описать то, что тебе нужно, то часто выходит годнота.
>>271503332 >>271503370 >>271503493 Попытки снять галки с secondary_model приводят к ошибке, no output file или как-то так только сейчас понял что надо было сохранять сид
Пример сравнения ViTL14_366 с secondary_model и без. По времени без секондари модел явно дольше. Запрос: Empty streets of America if the Soviet Union had won the Cold War, widescreen, Artstation trending steps: 800 seed: 2866258134 clip_guidance_scale: 12000 diffusion_model: 512x512_diffusion_uncond включены все модели по умолчанию, плюс ViTL14_366
1ый пик: diffusion_sampling_mode: ddim, use_secondary_model: on 2ой пик: diffusion_sampling_mode: plms, use_secondary_model: on 3ий пик: diffusion_sampling_mode: ddim, use_secondary_model: off 4ый пик: diffusion_sampling_mode: plms, use_secondary_model: off
Второй пример сравнения ViTL14_366 с secondary_model и без. По времени без секондари модел явно дольше. Запрос: A big bang was born in absolute emptiness, widescreen, high contrast, Photorealism, Artstation trending steps: 800 seed: 2096749512 clip_guidance_scale: 15000 diffusion_model: 512x512_diffusion_uncond включены все модели по умолчанию, плюс ViTL14_366
1ый пик: diffusion_sampling_mode: ddim, use_secondary_model: on 2ой пик: diffusion_sampling_mode: plms, use_secondary_model: on 3ий пик: diffusion_sampling_mode: ddim, use_secondary_model: off 4ый пик: diffusion_sampling_mode: plms, use_secondary_model: off
A beautiful epic academic painting, steam locomotive from hell made of human bones rides on a river of blood, trending on artstation, trending on behance
>>271502571 >2. Кто-нибудь экспериментировал с source и target image, насколько релевантные результаты получаются? Совсем чуть-чуть, если нужно сохранить загруженную картинку, то нужно использовать скип-степс, и инит\таргет скейл - они отвечают за приоритет картинки над словами, вроде как. >3. Как насчет запроса с простым перечислением ожидаемых на картине объектов, существительное + прилагательные + расположение, без всяких предлогов и глаголов? Не пробовал, но пробовал просто перечислить предметы, выходило не очень, что ожидаемо. >Например, 128х128 обрабатывается всего лишь раз в 5 быстрее, чем 1280х1280, но самое неприятное - при том же сиде получается заметно другой результат. Размер изображения довольно сильно влияет на результат, думаю, оно как бы скейлится и перемножается, т.е. на мелком изображении (128\512) довольно часто есть риск получить картинку, либо с очень едкими и кислотными цветами, либо пересвеченную, либо еще что-то. >5. На что влияют другие опции генератора, кто-нибудь уже пробовал менять галочки в этих десятках полей? Галочки - это, типа характер обработки. Тут довольно все сложно и не однозначно, в ссылках выше есть попытки как-то это систематизировать, и понять закономерность.
A beautiful academic painting, vivid and vibrant, meat train rides through a field of human corpses and guts, trending on artstation, trending on behance
>>271512343 Прекрасная картина, Рон утирает слезы (слева), на верху похоже родители Гарри, но сам Гарри стоит с Джинни за Гермионой, а она похоже, что идет под венец одна, одетая в мужской костюм. Нейронке похож не только картинки скармливали, но и тонны фанфиков.
>>271512972 >>271513063 >>271513117 A beautiful painting of a ghosts flying over tv and bed, realistic, contrast, Trending on artstation
A scary painting of a hut on chicken legs in forest with mushrooms and bones around, realistic, contrast, Trending on artstation
A scary painting of an old witch with fangs and claws eating bloody corpse in forest, realistic, contrast, Trending on artstation
A scary painting of an old witch with fangs and claws walking in forest, realistic, contrast, Trending on artstation
A beautiful painting of a crazy pig-crucian hybrid with Ukrainian Flag, realistic, contrast, Trending on artstation
A beautiful painting of a crazy pig-crucian hybrid with USA Flag, realistic, contrast, Trending on artstation
A beautiful painting of a giant pigeons, realistic, contrast, Trending on artstation
A beautiful painting of a board game, realistic, contrast, Trending on artstation
A beautiful painting of a card game between anonymous persons with masks on their faces, drinking whisky and smoking cigarettes, realistic, contrast, Trending on artstation
A beautiful painting of a collectible card game, realistic, contrast, Trending on artstation
A beautiful painting of playing cards and dice, realistic, contrast, Trending on artstation
>>271503995 Только сейчас обратил внимание, что на пик4 она попыталась нарисовать типа ту картинку - от большого взрыва и до наших дней. Вообще про plms вроде пишут, что он более экспериментальная и менее обкатанная модель. И из-за чего, думаю, во-первых она так чудит, во-вторых теряется смысл сравнения. Если все еще есть запал, попробуй посравнивать режим секондари модел, например - все картинки ddim, но менять галочки или ползунки.
>>271516633 Сохраняй сид, и делай снова с теми же параметрами, она детерминированная, как я понимаю Чтобы сохранить seed, мотни логи почти до самого верха, там будет
>>271517536 Справа под картинкой логи, мотаешь в самый верх, там где идет инициализация модели - будет номер сида выпавшего случайно. Копируешь и в следующий раз вставляешь в поле сида при генерации и все. Я не с компа, так бы тебе скрин отправил
Сайт нейросетки:
https://replicate.com/nightmareai/disco-diffusion
Сайт гугло-коллаба
https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
Инструкция:
Самое простое начать с сайта replicate. Регистрируете GitHub, и соединяете акк. на сайте replicate. Все, теперь вы восхитительны, и работают все поля ввода. Коллаб - это чуть более сложная штука, но с большими возможностями, у нее лимит 6 часов в день (удаления куки, вроде, не поможет).
Steps делай около 500-800, а в prompt вводи то, что хочешь сделать, только лучше trending on artstation или best of behance в конце оставь, остальные крутилки и кнопки лучше не трогай и нажимай на submit внизу страницы. Через 10-15 минут у тебя красивая картина. Если долго висит на starting, то значит ты попал в длинную очередь, зачастую нужно просто подождать.
Важно - при окончании лимита на сайте, удаляйте куки браузера (replicate_anonymous_id - вот эту папку) и можно начинать по-новой.
ВИДЕОГАЙД с работой в Colab:
https://www.youtube.com/watch?v=NsuIfEWCGnQ[РАСКРЫТЬ]
ВИДЕОГАЙД АНИМАЦИЯ ЧЕРЕЗ DISCO DIFFUSION и COLAB!!
https://youtu.be/wD-4wz8mukA[РАСКРЫТЬ]
Так же один анон предлагал "оживлять" эти арты программой "Фотошоу ПРО"
Ещё попробую немного объяснить пару вещей, на столько на сколько понял сам, чтобы не отвечать сто раз на одни вопросы:
- Добавление "Trending on artstation" в конце запроса - ИИ начинает ориентироваться на сайт www.artstation.com, кому-то помогает улучшить визуал запроса, кому-то нет, эксперементируй.
- Если хочешь ориентироваться на какой-то стиль художника - указывай в запросе его(на ангельском естественно), в дефолтном запросе стоит пример "by greg rutkowski and thomas kinkade".
- Удобнее всего делать запросы утром, т.к. при увеличении запросов от людей, ИИ начинает дольше их обрабатывать.
- Список знакомых нейросетке художников (см База данных тегов и художников Disco Diffusion).
- В английском гайде также советую такую форму написания текста для начала:
NOTICE THAT THIS PROMPT LOOSELY FOLLOWS A STRUCTURE:
[SUBJECT], [PREPOSITIONAL DETAILS], [SETTING], [META MODIFIERS AND ARTIST]; THIS IS A GOOD STARTING POINT FOR YOUR EXPERIMENTS
Подробный гайд по параметрам disco diffusion:
https://dreamingcomputers.com/disco-diffusion/disco-diffusion-cheatsheet/
https://docs.google.com/document/d/1l8s7uS2dGqjztYSjPpzlmXLjl5PM3IGkRWI3IiCuK7g/edit
Тулзы для апскейла:
1)https://replicate.com/nightmareai/real-esrgan
2)https://replicate.com/jingyunliang/swinir (анон говорил что лучше того что выше)
Огромный список инструментов с AI:
https://pharmapsychotic.com/tools.html
База данных тегов и художников Disco Diffusion:
https://docs.google.com/spreadsheets/d/14xTqtuV3BuKDNhLotB_d1aFlBGnDJOY0BRXJ8-86GpA/edit#gid=0
+ Еще интересный материал по настройкам
https://peakd.com/hive-158694/@kaliyuga/model-comparison-study-for-disco-diffusion-v-5-ai-resources-by-kaliyuga
----------------------------------------------------------------
Первый тред: https://arhivach.ng/thread/807012/
Второй тред: https://arhivach.ng/thread/807026/
Третий тред: https://arhivach.ng/thread/807108/
Четвертый тред: https://arhivach.ng/thread/807214/
Пятый тред: https://arhivach.ng/thread/807251/
Шестой тред: http://arhivach.ng/thread/807472/
Седьмой тред: https://arhivach.ng/thread/807482/
Восьмой тред: https://arhivach.ng/thread/807577/
Девятый тред: https://arhivach.ng/thread/807600/ и https://arhivach.ng/thread/807657/
Десятый тред: https://arhivach.ng/thread/807712/
Одиннадцатый тред http://arhivach.ng/thread/807819/
Двенадцатый тред http://arhivach.ng/thread/807898/
Далее треды создаются без номеров.
----------------------------------------------------------------
Приятного создания нейро-картинок.