• Z-Image-Base • FLUX.2 klein (4b и 9b) • Z-Image-Turbo • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
>>1564971 Там какие-то хуи спустя день выкатили RotorQuant. Типа зачем ограничиваться старпёским вращением векторов, если можно всё в алгебру Клиффорда свести. https://github.com/scrya-com/rotorquant
Сап, освоил qwen image edit и klein 9b image edit. Даю 1-2 картинки, пишу им чо делать, все ок. А если взять обычные не-едит модели, например в комфи шаблон flux.2 klein 9b text to image, в чем разница будет? Я же смогу после clip text encode также подмешать латент для img2img, не? Или она не обучена такому? Иначе не понято, в чем прикол именно едитов, кроме императивного промпта. Могу конечно сам проверить, но пока влом качать.
>>1565184 Edit модели работают с Reference Latent, результат напоминает ControlNet: исходное изображение удерживается и не разваливается так как это происходит при обычном i2i на высоких sigmas.
>>1565184 Ты не понял. Есть edit и не-edit модели. Qwen-Image-Edit-2511, FLUX.2 [klein] 9B/4B это edit-модели, они умеют работать с Reference Latent. Есть не-edit модели: Z-Image-Turbo. Она с Reference Latent работать не умеет. Ей Replace the cat from image 1 with a dog не напишешь. Там надо с inpaint и ControlNet делать. От того, что ты используешь edit-модель для t2i, она edit-моделью быть не перестаёт.
>>1565244 Да, про RL понял. То есть в едитах происходит: пропмт -> +RL[ -> +RL] -> семплер пустой латент -> семплер
А в обычных text/image to image: пропмт[ -> +ControlNet] -> семплер [пик в латент + шум | пустой латент] -> семплер
Кстати могу поделиться мелким опытом с анонами. Если надо заменить тянку во 2ом пике тянкой из 1го очень редко нужно конечно, но вдруг..., то лучше сначала просто едитом заменить во 2ом пике тянку на mannequin blueprint. Так ее фичи меньше протекают в результат, и модель лучше понимает, где ее границы. Пре-ролл едит-контекста как бы делаешь, с очисткой от мусора.
Интересно, а кто-нить давал едиту вместо пустого латента сильно зашумленный референс, типа едит + i2i в одном флаконе? Это вообще можно сделать с флюксом? Я пробовал вместо (-> +RL -> +RL) делать параллельно, и потом смешивать "condition concat/avg/etc", но по факту лучше всего получается без этого. Как смешать пустой латент с чем-то еще я пока не допер.
>>1565304 > Как смешать пустой латент с чем-то еще я пока не допер. Зачем тебе что-то смешивать? Референс подается в conditioning, в латент суй, что угодно - хоть пустой, хоть vae encode от инпута.
>>1565320 А нафига тогда у флюкса своя нода для латента, ето неспроста же? Я щас суну обычный латент, а там формат говно. Или у них там шиза уже, и можно не смотреть на это?
>>1565304 Тяжело с твоими стрелочками. Узел Reference Latent получает на вход Latent и Conditioning и выдаёт Conditioning, который заводится на Sampler. Если использовать Reference Latent, то в него вцепляется намертво и ему практически всё равно будет, что ты будешь подсовывать на вход latent samplerа (хоть пустой, хоть непустой). Для работы edit нужен старт с высоких sigma (denoise 1.0, если так понятнее). Единственный вариант, который я отбросил, это подсовывать непустой latent, но стартовать sigmas не с 1.0, а с 0.998. Тогда будет интересный эффект. Но даёт искажение освещения. Если ставить низкие sigma порядка 0.7 и ниже, то этого для изменения Reference Latent будет недостаточно, слишком крепко держит. А вот если без Reference Latent, то для обычного i2i уже пойдёт.
>>1565323 > щас суну обычный латент, а там формат Empty latent уже хуй знает с каких пор универсальный. А Vae decode гарантировано подходит, сам знаешь почему.
>>1565387 > Вот разница Попроси нейронку объяснить тебе, какое отношение это имеет к тому, что тут обсуждалось, раз сам категорически отказываешься размышлять. Заодно уточни, в чем разница между классами в бэкэнде и нодами во фронтэнде.
>>1565387 Поскольку для i2i он получает latent с помощью VAE Encode, куда на вход подаётся исходное изображение, а VAE используется от FLUX.2 [klein], то полученный в результате VAE Encode latent будет кто бы мог подумать именно такой, какой нужен для FLUX.2 [klein]. Он не понимает что такое latent и не понимает, что в этом конкретном случае ничего не получится перепутать, только если намеренно на VAE Encode неверный VAE от другой модели не использовать.
>>1565343 Эта нода на самом деле всегда выдаёт латент от SDXL. Просто в семплере есть код фикса латента - если он не корректный, то он меняется на нужный.
Реквестирую легковесные модели для генерации картинок с цензурой и без. Чем меньше, тем лучше. Текущий чемпион для моих задач deliberateCyber_v60, весит 2 гига.
Нагуглил ещё stable-diffusion-v1-5-pruned-emaonly-Q4_0, весит полтора гига, но генерирует хуйню
А чё, а как? решил вкатиться в нейродроч впервые, а эта ебанина ложит хуй на половину промта. Это цензура? Думал поискать лоры чтобы исправить, но там кажется нет ничего? Или нахуй флюкс для этих целей?
(и да насраивать помогал мне гемини всё это, так что наверняка что-то не так в настройках?)
>>1566108 1) нет базовых знаний; 2) нет понимания возможностей конкретных моделей; 3) нет понимания особенностей написания prompt под конкретные модели для получения требуемого результата.
Результат будет неудовлетворительным.
Два варианта: а) разбираться в теории, разбираться с ComfyUI для гибкой реализации теории на практике; б) тыкать одну кнопку generate и не быть привередливым.
При отсутствии знаний о том, что может выдать конкретная модель и как направить генерацию в нужном направлении, получение желаемого, а не рандомного результата не предполагается.
>>1566108 >насраивать помогал мне гемини всё это лол, тебе гемини наискала самых популярных статей, но как положено ИИ-шке не докапалась до того, что пик популярности локального имэджгена пришелся на Автоматик1111, который нахуй тупо сдох уже как 3 года и все его попытки воскресить в виде Форджа и прочих уже тоже устарели.
Включи мозги и сам научись юзать Комфи, ну и еще используй модели более свежие чем годичной давности (к примеру последние Z-image-base и Flux Klein 9b).
>>1566108 >гемини Он норм, но как и все нейронки путают даты. Пиши в следующий раз ему: актуализируй информацию на текущую дату март 2026 - типа такого и всё будет ок
>>1566333 >каждая 2ая продаванша Это какой-то больной спидораком человек с огромными проблемами кожи. Такой только в КВД можно увидеть, да и то не всегда.
Я вообще не вникаю в ваш срач, если честно. Продолжаю постить эстетику натуральности, не нравится не смотрите. Спрашивали как получилась кожа спидозная, дал кусок промпта, лолбля.
Расскажите мне отличия инференса диффузных сетей от ллм. Почему их не так просто разбить на две карты для обычного инференса, как ллм? И в то же время блок свап элементарно делается, очень похоже на выгрузку экспертов в llm для моэ.
>>1566466 >Продолжаю постить эстетику Блять, это почти клоузап, как можно на кляйне сделать такое мутное и всратое говно? Это непостижимо! Застрелись, нахуй.
>>1566471 >разбить на две карты для обычного инференса, как ллм мне до сих пор не понятен смысл всех этих телодвижений, т.к действия выполняются последовательно, а не параллельно. ни о какой ускорении не может идти речи, пока нода настроенная на вторую карту не закончит, она ничего не передаст на следующую ноду, которая настроена на 1-ю, или наоборот. это какая-то ловля блох, абсолютно бессмысленная хуита.
>>1566542 Гугл анонсировал алгоритм, который позволяет кэшировать контекст моделей, значительно снижая этим потребление памяти. Инвесторы запаниковали, начали сливать акции, снижая стоимость компаний. Ну а следом цена оперативки вниз пошла. Не всей, и не везде. Скоро по идее обратно скакнуть должна.
>>1566543 >по идее чьей идее? >и не везде это ты про днс?)
если маятник качнулся. то это дело не одного месяца. я думаю всё проще, подвальные пидарасы вернувшись с новогоднего бухыча надеялись обнаружить у себя полные корзины заказов, а нашли там лишь дохлую крысу. причем не помогла даже мартовская распродажа. у них просто перестали покупать их подвальное говна по такому прайсу.
>>1566595 >это ты про днс?) Это вообще. В америке такая же фигня. Буквально сегодня видел как стример один над ситуацией угарал, потом глянул цену своей памяти, чтоб сравнить с тем, что неделю назад было - и нифига она не упала. >чьей идее? Память раскуплена парктически предзаказами, контрактами. Заводы могут выпускать только определенное количество. Плюс от того, что в тот же объем памяти теперь больше контекста влезет - вовсе не значит, что этой памяти меньше использовать станут. Скорее уж будут увеличение окна контекста как новую фичу презентовать. "2 миллиона за ту же цену, что 100к раньше! Спешите купить подписку на нашу новую супер-модель!" >я думаю всё проще Не думай, тебе противопоказано.
>>1566605 >как стример один вона, чё... >>1566605 >Память раскуплена парктически предзаказами, контрактами. В том числе и по контрактам крупных сетевых магазинов аля смартбай или амазон, или ты думаешь, что амазон можно нахуй послать. Серьёзно? >>Заводы могут выпускать только определенное количество. Вендоры заявляли, уже после начала хайпа о том, что пластин у них хватит на пару лет точно. Вся эта хуйня рукотворная, громче всех "держи вора" кричит сам вор. Сео ведущих компаний до сих пор ещё не вышли с тюряги после последней попытки картельного сговора, сроки были от 6 до 12 лет. И это была далеко не первая попытка, и как видим не последняя. >тебе противопоказано врач из тебя такой же, как и АНАЛитик)
>>1566620 >динственный я никогда не ставил его себе. и че типа в ксамплере клацаешь по шедулеру, а от туда нихуя не выпадает? да ну нахуй... пруфы есть?
>>1566620 >Конечно единственный >Конечно единственный >>1566631 >Классика твоего пиздабольства, шиз. >Конечно единственный теперь мне понятно откуда у тебя такие страшные ёбла)
>>1566474 Ссылка говна, там общие слова написаны, а мне хочется понять детально.
Вот что лоботомит мне ответил на следующий вопрос: >В рамках одного шага денойзинга модель (U-Net или DiT) обычно прогоняется 1 или 2 раза.
Тогда почему нельзя разделить блять модель на две карты? Сначала работает первая карта, затем активации перекидываются на вторую карту и уже она дорабатывает. В рамках одного шага модель полностью проходится последовательно - так происходит в llm. В диффузных не так?
>>1566488 Речь не про ускорение, а про последовательный инференс, когда модель лежит на нескольких картах. Т.е. мне не нужен тензор параллел. Мне нужно понять, почему я не могу разбить модель на 2 карты, чтобы в рамках одного шага сначала отрабатывала одна карта, затем другая.
>>1566656 >разбить модель на 2 карты SLI? при условии, что это 2 одинаковые видяхи) >Речь не про ускорение тогда нахуя? из любви к исскуству? >чтобы в рамках одного шага сначала отрабатывала одна карта, затем другая. это твоя сверхценная идея? давно с дурки?
>>1566661 Пчел... У меня риг, я могу любую опен сорс модель вместить в мультигпу врам. Но толку от этого нет, потому что на данный момент настоящая мультигпу обработка картинко- и видеомоделей требует а) либо модель целиком в каждой карте, что бессмысленно б) модель распределена по картам, но между картами должно быть быстрое соединение. Вариант б) же в мире ллм быстрого соединения не требует, там буквально можно на второй х1 псине сидеть. Я не понимаю, в чем детально отличается инференс ллм и диффузий, что в последнем случае требуется быстрое соединение. >тогда нахуя? Ну вообще говоря это действительно про ускорение, но не то, о котором было написано. Если модель будет обрабатываться последовательно картами, то не будет блок свапа, который требует быстрого соединения между картой и рам.
Проще говоря, в ллм в обычном инференсе почти нет разницы - у тебя 100 Гб одна карта или 4 карты по 25 Гб. У тебя просто карты в рамках прохода модели работают поочередно, переброс активаций занимает пренебрежимо малое время. Почему так нельзя сделать с диффузными? Причем блок свап, внезапно, можно делать (то есть последовательно стримить веса из рам на карту в рамках одного шага), но разбить модель на две карты, чтобы они последовательно отработали - уже нихуя? Что это за ебаный масонский заговор?
>>1566708 >то не будет блок свапа у тебя один хер будет своп, подключаемы лоры свопятся в первую очередь, безотносительно сколько у тебя оперативы. я даже не спрашиваю нахуя тебе это надо (вдруг ты псих и сбежал из дурки), но просто представь себе режим в котором гипотетически придётся работать картам при таких условиях, допустим это будет не 1 шаг и пол шага, а допустим 2 шага, карта входит в рабочий режим не сразу а постепенно, это пиздец какая потеря времени, а потом после того, как она их отработает она передаст полученное другой карте, и та тоже начнёт мееедленно набирать мощность, то на что ушло бы 1 мин. превратится в 4 минуты, мало того, при наборе мощности тратится дохуя энергии, идеальный режим для видяхи это режим майнинга (постоянная стабильная загрузка), а не твои вот эти ебучие качели, ты убьёшь нахуй свои условные карты, и убьёшь блок питания. я без понятия работает-ли режим SLI в диффузии, но это единственный способ как-то задействовать твои условные 2 видяхи.
>>1566092 Для имитации художественных стилей делиберате, dreamshaper и artUniverse_v80 (более поздние версии уже не то). Но это действительно уже прошлый век, как справедливо заметил анон. Если ты не успел два-три года тому назад нагенерировать в 1.5 тысячи картинок, то сейчас это просто неэффективная трата времени и машинных ресурсов. Что касается sdxl, то для художественных стилей artium и sdvn8Artxl.
>>1566176 Ты прежде чем писать очередное поучение от гуру, хотя бы поинтересовался, что такое комфи, о котором тут все пишут, и является ли оно не локальным имэджгеном.
>>1567118 ты буквально пизденыш, который родился только вчера и нихуя не понимает.
Я был там, когда Автоматик1111 сдох, я был там когда комфианон засрался с автоматиком и решил выпустить собственный интерфейс - ComfyUI (тогда я еще сидел на Автматике1111 и ссал на комфи). Потом пришлось по очевидным причинам пересесть на Комфи и перекинуть в него все скачанные локальные модели, которыми я пользуюсь. Поэтому да, КомфиЮЙ это интерфейс как для локального имэджгена, так и для нелокального через API. Более того, это еще и интерфейс для видеогена, аудиогена (включая песни и речь), ллм текста, OCR и всего прочего.
Что происходит с тредом? Всем настолько похуй, что никто не захотел перекатывать, кроме соседа-анимешника, который ненавидит этот тред и всё, что с ним связано. В итоге один из полутора картинко-анонов отвалился, а двое из оставшихся поланона решили раз и навсегда определить, чей слоп хуевее. В добавок этому ОП пытается изо всех сил оживить тред, но не может из себя выдавить ничего, кроме токсичных постов о том, как все пидорасы, а он д'Артаньян. Даже на толстоту вида "ебать вы тут попущи)" и ще пару попыток от местного клоуна нет реакции. Ничего не упустил?
Ну вот, вкидываю: https://github.com/yaoliliu/FreeFuse Кто-нибудь пробовал? По описанию звучит как мастхэв, который должен работать под капотом на всех моделях по умолчанию, и одновременно недостающее звено для окончательной победы над вангёрлингом, но необходимость использовать специальный загрузчик лор и специальный сэмплеры не даёт так просто встроить это решение в свои воркфлоу, поэтому у меня самого руки пока не дошли проверить.
>>1567465 >ничего, кроме токсичных постов о том, как все пидорасы специально для сферических парнокопытных с нибиру: 1. аппатия. 2. депрессия. 3. душнилово. 4. неопределённость, отсутствие хоть какой-то преспективы. 5. массовый психоз 6. наличие озлобленных и токсичных пидарасов в треде. 7. наличие неодекватов с межсезонным обострением в треде. 8. невероятная лёгкость присесть на бутылку за нихуя. 9. обнищание, невозможность сделать апгрейд или купить обнову без продажи внутренних органов. 10. -------------- Список можете дополнить.
>>1567514 > звучит как мастхэв Спорное утверждение. Очень дохуя всего для одной специфической задачи - поместить двух персонажей с разных лор на один пик одной кнопкой. Для любых следующих махинаций (типа инпейнта/апскейла/черта лысого) с этим пиком нужно практически весь воркфлоу с нуля рядом строить, т.к. реюзить нечего и обе+ лоры второй раз в пойдут, если обычными лора лоадерами грузить. Если часто делаешь конкретно эту специфическую задачу, то норм, может и мастхэв with caveat.
>>1567569 если модель "знакома" с обоими персонажами, то всё делается голым промтом, с некоторыми оговорками. >>1567568 >для голой SDXL вполе неплохой результат боюсь у нас разное понятие о прекрасном, к счастью...
>>1567810 У тебя стиль джинкс в скелетора протёк, посмотри теперь на их пример. >всё что оно своего добавляет - маски из промпта Всего-то, блядь, всего лишь отделение мух и котлет на уровне латента!
>>1568099 > всего лишь отделение мух и котлет на уровне латента! > на уровне латента! У тебя хрустальный шар бракованный. Лучше бы сказал, что в обоих хуках Jinx загружена.
>>1568556 А я про RAM и говорю, у меня 16. Имея 32 ГБ RAM я вообще не знаю для чего эти оптимизации нужны, там можно оба ггуфа ван 2.2 держать спокойно.
>>1568562 > А я про RAM и говорю Ни разу не встречал OOM на RAM. > для чего эти оптимизации нужны Я особо не вникал, потому что карта красная, но подозреваю, что это должно исправить раздувание RAM от нескольких моделей в кэше. Сейчас там вообще свалка из всего, начиная от intermediates и заканчивая абсолютно всеми моделями, которые были использованы в воркфлоу, даже если они больше не нужны. В идеале нужен вариант с выгрузкой самой старой модели из RAM, оставляя в кэше только intermediates, чтобы не перегенерировать ничего лишнего. Один хуй заново её загрузить с диска быстрее, чем диффузить на свопе. Например, есть воркфлоу - генерация на qwen-fp8 -> своп ебала FaceID -> апскейл - и всё, 64Гб RAM закончились, если дальше инпейнтить чем-то, чего еще нет в кэше - начинаются жуткие тормоза и ожидания по минуте на загрузку модели, проще перезапустить комфи и начинать инпейнтить с пустым кэшем. Но это чисто гадания на кофейной гуще, опять же, нихуя не вникал, что оно на самом деле делает, но показалось, что что-то подобное, когда это только добавили.
НОРМАЛЬНЫЕ МОДЕЛИ-ТЮНЫ, ГДЕ МОЖНО БЕЗ ВОЗНИ С ЛОРАМИ ГЕНЕРИТЬ ПРОН ЕСТЬ?! Или всё так и будем пердеть на Сдохле? Нахуя я тогда в прошлом году 5070Ти брал?
>>1569072 ну для меня клейн вдохнул 2 жизнь в веселье генераций, прост берешь фотки кидаешь в модель, и хоть приложи фотку меховых стринг чтоб на бабеху надеть, все тебе сделает, может даже в аниме 2 реал с заменой ебала на целевую бабеху. че хочешь делай хоть жопович из резидента еби во всех позах. А если еще лору натренить (для на том же цивите если думать совсем не хочется) то еще и ебало будет гарантированно держать в любых выкрутасах.
>>1569072 >Качаешь хромую и генеришь прон в промышленных масштабах. Я её видал и выглядит оно как полное гавно с поёбанной анатомией эпохи полторашки и с "понифейсом" (думаю, тут в курсах, о чём это я), как у тебя на пике. А жрёт при этом мама не горюй! - раза так в два больше родителя (Флюса). Лодстоун обосрался чуть ли не наравне с Астралохом.
>>1569342 Звиняй, анон, но выглядит это просто ужасно.
>>1569169 С ними она вроде справляется. Ты точно с чем-то другим не путаешь?
>>1570682 Про минуты ничего сказать не могу. Всё зависит от разрешения генерации. Кроме того, edit ещё медленнее (kv оптимизации не использую из-за опасения снижения качества). Смотри в сторону 12+ Гбайт VRAM и 32+ Гбайт RAM. В теории как бы можно и меньше за счёт дополнительной выгрузки на SSD (и его ресурса и дополнительных тормозов), но я бы без нужды это не рассматривал. Лучше, конечно 16+ Гбайт VRAM и 64+ Гбайт RAM, чтобы вообще не беспокоиться.
>>1570682 Могу сказать про rtx 4060 ti 8 vram / 16 ram >хотя бы дистиллированный Дистиллят не значит меньше жрёт ресов, если что. Ну смотри.... Стандартные разрешения 1MP типа 1024х1024 и т.п. базовый кляйн с кфг 4 20 шагов генерит секунд 40-50 так же, как обычный флюкс 1 дев 20 шагов при кфг 1, короче округляй до минуты в зависимости от семплеров и прочих приблуд. Дистиллят за счёт меньшего кол-ва шагов генерит ясное дело мгновенно, как какая-нибудь полторашка или сдохля. Если ещё какие вопросы, задавай
>>1570866 А кто мне запретит? Ставлю обычно шагов 40. Мне же не еблю генерить на потоке во время дрочки. Нагрузку не ощущаю, всё в пределах 1 мин. Или у тебя какой-то хейт просто и отрицание? >>1570958 Всё так. Яндекс больше слушай. И я писал про модели в фп8. В фп16 никто не юзает. В гуфах будет эффект ещё лучше, но мне не нравится гуфф из-за артефактов сетки и прочей хуйни.
>>1570958 >VRAM: для базовой модели — 29 ГБ, для дистиллированной — 19,6 ГБ напиздела или взяла инфу с официального гитхаба - в реальности это за счет отпимизации в ComfyUI
>>1571012 ок, я думал какие-то рабочие проекты. Смотрю, генерация прям плотно входит в рекламу, рендеры-хуендеры, оживление картинок. Год назад таких запросов не было, а сейчас уже типа обычное явление
>>1571028 >какие-то рабочие проекты Чисто как редкое хобби хочется развлечься, время убить, не более. Может кто-то для работы юзает и для дрочки - считаю это норма, почему бы и нет, если в кайф.
>>1571383 Эта хуйня часто бывает у некоторых чмох, когда они упираются "это не я должен чинить", и им похуй что починить можно за 10 минут, а пользователи страдают. Я как-то раз в подобном сраче по MPC-BE участвовал, где два пидора на разрабах отказывались вставлять в плеер фикс проблемы декодера, и оно не пофикшено спустя почти 10 лет. До сих пор бомбит.
Китайские косорылые уёбки вынуждены сбрасывать цены на свой подвальный мусор. Ещё пару недель и цены откатятся до прошлогоднего уровня. За неделю цена серверную рефабнутую планку 16 гиг упала на 1.5 косаря. Не отслеживаю цены на инкрустироанные брильянтами ddr5 для гламур-сборок, как там дела обстоят?
>>1564964 (OP) Котаны а существует вообще нормальная лора для 8 шагов для Z-Image-Base?
На цивите находил 2 раздачи но на выходе какой то кал с артефактами и шумом. Для флакс2база нормальная же лора, прям идеально все, почему под зетку не могут сделать?
>>1572078 А тебя? Зачем вообще обращать внимание на подобные помои посты? Ему сказали, что база только для обучения LoRAs персонажей, он свято верует и верещит «Абырвалг», как Шариков, когда видит другое. То, что на SD и ранних Qwen-Image были 8/4 step lightning LoRAs, которые работали в связке с базовой моделью и позволяли вместо 50 шагов выводить за 8 шагов, это уже не вписывается в мирок. То, что для FLUX.2 [dev] есть единственная 8 step LoRA adapter от fal.ai и по-другому вывод за 8 шагов на FLUX.2 [dev] не получить, тоже. То, что базовой моделью можно добавлять вариативности, стартуя с высоких sigmas, а потом доводить distillom, аналогично. Наконец, базовой моделью можно проходить определённые участки sigmas с произвольным шагом, подо что distill просто не заточен. Distill хорошо работает на указанном количестве шагов на sigmas от 1.0 до 0.0, проходя их за 8/4 грубых шага, подражая при этом denoise базовой модели-учителя. Когда требуется плавно, за десяток шагов полирнуть sigmas, скажем от 0.5 до 0.0, то базовая модель это сделает лучше.
По твоему вопросу, попробуй Strength для LoRA-ускорялки Z-Image-Base уменьшить где-то до 0.65.
>>1572109 >Ему сказали Это официальная рекомендация от разработчиков, но 🤡🤡🤡 на дваче умнее, придумывают шизопроекты как удобнее забивать гвозди микроскопом, чтобы гвозди не гнулись и микроскоп не ломался и с умным видом обсасывают детали. А дурачье на цивите почему-то Base не оценило, дебилы наверное, что с них взять. Не то что безпруфные профессора на дваче.
Им дали ZIT 9 шагов. Нет мы будем базу юзать с лора в 9 шагов даже если от этого возрастает время и качество хуже. Ведь это же база!!!11 Одноклассники не поймуут
>>1571891 1 пик. Нижняя губа сбоку отгрызена. Очки все кривые. Серьги натыканы хуй пойми как. Бижутерия на шее кривая, бусы ополовинены. В остальном норм. Нужно эдитом и фотошопом допиливать поверх.
>>1572220 Я вот тоже этого прикола не понял. Есть дистиляты на 8 шагов, есть база на 20. Ну выбрал ты базу, раз она такая охуенно вариативная, ну так и сиди на 20 шагах и не выебывайся. Не, мы выберем базу, накатим лору на 8 шагов, а потом запалируем дистилом... Весна, шизофрения...
>>1572109 >Ему сказали, что база только для обучения LoRAs персонажей Камунити нейрослопщиков состоит из настолько даунов, что они даже базу продолжают игнорить и продолжают в целом обучать лоры на турбе, без комментариев. Про вариативность и сигмы они вообще не поймут, если бы не возможность пиздить чужой воркфлоу они сейчас бы в автоматике сидели до сих пор.
>>1571757 Я не думаю что цены на память так уж радикально упадут, весь компьют де-факто коммодитизирован, есть объективная цена 1 гб как есть для 1 гигафлопса, поэтому если память не скупит скам альтман то ее скупит кто-то другой.
может кто подсказать? впервые поставил flux-2-klein, в шаблонах выбрал текст в изображение, но пишет что у меня нет моделей, в папке это всё есть, я так понимаю проблема в том что подсвечено фиолетовым цветом, но решить проблему не получается
>>1572911 Фиолетовое это bypass. Тебе это мешать не будет. Совет про refresh тебе дали верный. Ещё посмотри внимательно в workflow, там в узле Markdown Note указаны папки в которых всё должно лежать. Разложи всё скачанное в точности в те папки, которые там указаны. В узлах загрузки моделей, vae и так далее, перевыбери из списка, как тебе посоветовали.
>>1572939 Изучай интерфейс ComfyUI. Твой второй скрин это subgraph, вся лапша у него внутри. Ещё раз проверь пути размещения моделей, text encoder, vae по соответствующим папкам в папке models ComfyUI. Это надо в ручном режиме делать. Или качать сразу в правильные папки.
>>1572951 Странно. Перезагрузи сервер ComfyUI. Отключи Nodes 2.0 в настройках, как вариант. Ну и сообщения об ошибках запости, а то дальше на кофейной гуще гадать занятие безблагодатное.
>>1572951 У тебя должно выбираться из меню то же, что на скрине у >>1572949 Я вижу, что на твоём скрине vae вообще не те, а которые для внутреннего preview используются.
>>1572997 Странно, что был выключен. Без Nodes 2.0 у тебя узлы должны были выглядеть как на скрине >>1572949 Попробуй заново Workflow из TEMPLATES открыть. Любой, для FLUX.2 [klein] 4B и посмотри какой будет результат.
Почему sdxl (+dmd) все еще ебет? Просто от нехуй делать пробнул старые вф и оно выдает бывает лучше чем новье, чисто на тюнах, без всяких лор и прочего. Имеется ввиду нсфв конечно же
Ты сам ответил на свой вопрос. Если ты этого не понял, прочти https://bfl.ai/legal/usage-policy Всё, что хоть как-то можно отнести к NSFW в моделях, веса которых уходят на open source, нещадно искореняется.
>>1573119 > все еще ебет? Уже нет, возможность качественной отрисовки хуя в жопе, как безусловного плюса, начисто херится анатомическим кретинизмом сдохли, и ты с этим нихуя не поделаешь. А всего то надо - просто отпустить несчастную, она хорошо поработала, но вовремя неумолимо, так что - р.и.п. Лично я заебался всякий раз ломать и ебать эту тупую дуру через колено и проводить в Фотошопе больше времени чем в комфи, и я туда больше не хочу возвращаться, это слишком трудозатратно и утомительно.
>>1573247 Невозможность качественной отрисовки хуя в жопе начисто херит все попытки исключить сдохлю из нсфв воркфлоу. Возможность генерировать что-нибудь с пары роллов без инпейнта совсем никак не влияет на умение модели качественно отрисовывать хуй в жопе.
>>1573265 Всё, что нужно заново отрисовать или задеталить я могу сделать в сдохле, но в концепте она просасывает зетке и кляйну, да у зетки до сих пор нет эдит-модели, но и у сдохли всё появилось не на вторые сутки, правда... Я вспоминаю как я буквально вручную рисовал условную пизду в 1.5 а потом умудрялся деталить её при общем незании об этом предмете)). В день, когда я смогу отрисовать хуй в жопе на зетке, я грохну сдохлю и освобожу добрую половину накопителя.
>>1573267 > В день, когда я смогу отрисовать хуй в жопе на зетке, я грохну сдохлю и освобожу добрую половину накопителя. Весьма сомнительно. У меня папки со сдохлями, понями и ILами + лоры (ускорялки, FaceID) + контролнеты 100Гб. В то же самое время Z с лорами и контролнетами - 40Гб. Если у тебя сдохлей нахордилось на полдиска, тебе и с выходом мифической нсфв зетки будет жалко всё это добро удалять.
>>1572767 >Я не думаю что цены на память так уж радикально упадут Чел, ты можешь вообще не думать о них, я освобождаю тебя от этой неподъёмной ноши) Но это не отменяет факта буквально лавиноого обвала цен (пик 2), ~300 руб. за сутки. Да, она дорожала медленней) Китаёзы уже заметно паникуют, память потянула просадку продаж на материнки на 1700 и am5, и соответствено процов на эти платформы, если на ddr5 они ещё как-то нервно хорохорятся, то на мусорную память типа пикрила, цена наёбывется капитально (см. пик 3). на wb просадка ещё ниже, т.к конкуренция на этой платформе сильнее.
Пытаюсь сделать мапу города, но получается немного не то. То слишком близко, то угол не тот и т.п.
SDXL/Ill - могут вообще не понимать, либо стиль плавает, либо не понимают "modern city" и делают древние города + геометрия кривовата/полный трэш. FLUX.2 klein - Выдаёт то, что нужно и геометрия хорошая, но фокус слишком близко (пик 1). В Forge вроде есть что-то типа инпеинта, когда можно пикчу догенерить по краям (вверх, вниз и т.д.). С klein такого же нет?
Подскажите промт что ли или как можно сделать вообще? Надо расстояние примерно как пик 2-4.
>>1573294 >Надо расстояние satellite view ? можно в качестве референса взять гугл-карту крупного города под нужным тебе углом и через i2i пороллить с хорошим денойзом.
>>1573294 Не особо понял чего ты хочешь. >слишком близко, то угол не тот Нейронка тоже вряд ли сможет нормально работать, если ты не сможешь внятно словами описать то, что тебе нужно (а это уже половина prompt).
>расстояние примерно как пик 2-4 Это aerial shot. >Выдаёт то, что нужно (пик 1) Так тебе изомерию что ли? Тогда — isometric aerial view.
>В Forge вроде есть что-то типа инпеинта, когда можно пикчу догенерить по краям (вверх, вниз и т.д.). С klein такого же нет?
FLUX.2 [klein] 9B/4B это edit-модели. Дописывай в prompt что нужно сделать с изображением, будут изменения. Но это не то, что тебе нужно.
>Подскажите промт
Да любой вроде, со словами: aerial isometric view of a modern city with skyscrapers and a pond in a park at night.
>>1571395 у меня браузер под комфи анально огрожен от сети кулхацкеры сосите, все ваши трояны останутся со мной на едине, в моем комфортном огороженном пыточном аквариуме
Окей, для чистоты эксперимента взял родные воркфлоу из комфи с рекомендуемыми настройками, ничего не менял, не добавлял. Взял кляйн 9б, Кляйн базу 9б, ЗИТ. 4 шага Кляйна нихуя не отличается в лучшую сторону с Кляйном базовым на 20 шагах, а ЗИТ на 8 шагах похож как брат близнец на 20 шагов Кляйн базу. Никто не осилил прорисовку спиц у байка. У кляйнов так же диспропорция размеров предметов и похерена проекция. Кляйн не знает ни одну знаменитость, а ЗИТ знает даже тех кого я не знаю. Всё кал говна, но из-за фичи "edit" и всё же лучшего среднего качества текстур придётся оставить Кляйн 9б не базовый. Я кончил.
>>1573821 Ну ты прав, тут скорей мои заморочки нежелания иметь несколько похожих инструментов для одного дела. Молоток с пластикой ручкой или молоток с резиновой.
>>1573828 Это не заморочки, а такая полезная вещь как бритва Оккама. Те, кто ей не пользуются, любят плодить сущности, а потом героически с ними возиться.
>>1566708 Мда, у меня нет слов. Вчера пошел разбираться, потому что ни от кого помощи нет - все только кукарекать бессмыслицу могут что тут, что в ллм треде. И таки разобрался. Если раньше с блоксвапом на хуйняне у меня картинка генерилась минуты три в кванте, то теперь минуту в полных, нахуй, весах. Какой же пидор на комфианоне сидит, хосспаде, раз до сих пор не завез поддержку мультигпу в подобном формате. И какой же он пиздабол, мол, никто эту модель не сможет запустить. Эх, провернуть бы такое с нативными комфимоделями, квен и ван летали бы у меня.
>>1574556 >пидор на комфианоне ну ты если код комфиуи читал и разбирался в "архитектуре", то скорей всего мог заметить что там франкенштейн которого нахуевертил школьник какой-то китайский, но внезапно народ подхватил
а чем в итоге ты нагрузку на мультигпу распихал? я нашел пару проектов типа ComfyUI-MultiGPU но пока не крутил
>>1574758 > Кому нахуй нужно это говно из 20 века мне. 1. вчера 2. сегодня -190 за сутки. ждёмс... 3. модненькая, со стразами ddr5, не в куре динамики, буду теперь и её отслеживать, прям интересно...
>>1574315 пытаюсь уже 3-й день скачать, со своим каналом в 20 мбит, где-то на 60% заканчивается тикет от циви, и закачка рвётся, докачки нет нихуя. Качаю в 4 потока, один хер не успеваю.
>>1574791 >Удачи без вариантов) остаётся зоонаблюдать весь этот пиздец, но до новогодних цен нужно всего то пару-тройку дней потерпеть. менять платформу для меня бессмысленно, т.к видяха pci-e v3.0 так что + 16 гиг к имеющимся 32-м для более комфортной работы, почему бы и нет.
>>1574818 >допиздецовая цена не думаю, что цена на ddr5 в ДНСе показательна, но она хотя-бы показывает соотношение цен) Пикрил: Цена самую днищенскую планку оттуда.
>>1574818 Я прошлым летом хотел взять ддр4 64гиг за 12к, но что-то мялся и ждал пока упадет(типо дорого было). Ведь я тогда знал, что цены на память всегда падали. Ждал. Сейчас она стоит 46к. Не взял.
>>1574827 > ддр4 64гиг за 12к как тебе такое предложение? приплюсуй к этому набору камень, какой-нибудь: xeon 2678 v3 за 2125 руб. Тут уж не до жиру, и похуй что макс частота памяти будет не выше 2133). Зато сука, аж 64 гига!
>>1574818 >>1574827 Я это ты из параллельной вселенной, но там ты купил таки эту оперативку. Правда хз, ок могу запускать жирные gguf, скорости там не шибко большие.
Чет краем глаза зацепил тематику ZIT vs ZIB+turbo_lora Конечно на чистой базе ловить нехуй, вариативность вариативностью, но аутпуты там ебать говно, понятно почему базу не выпустили первой. Вопрос, а все же как немного оживить трубу? Лоры на ней работают весьма сомнительно, а промптинг скатывается в перечисление того, что нужно через запятую в порядке убывания. Кляйн9б в т2и слаб, либо я кривой (вероятно)
>>1574789 Да какая модненькая, ддр5 это уже протухшее говно. >>1574818 Не следил за ценами, но почти два года назад взял Trident 5600 парное 32+32ГБ за ~24к. Сейчас этот устаревший кал стоит 80к ЛОЛ как же я охуел. Ему цена блядь 10к, ибо сейчас его нужно дохуя, оптимально ну гигов 144-192, чтобы нейронки гонять.
>>1575041 > 3-я версия Она как бы тоже не оче. Стиль успешно проебан (2). Посмею предположить, что это очередной случай изобилия нейрослопа в датасете, как это было с первыми трейнами ХЛ, которые тренировали на генерациях с сд15. У этой >>1574447 хоть и контрастность меняется, но зато стиль ближе к промпту, но эмоции тоже чересчур анимешные, что как бы намекает.
>>1575351 О, я тебя поздравляю. Посмотри на увеличенный пикрил твоего изображения: На этой области видно особенно хорошо, но заметить можно будет по всему изображению. Именно по этому признаку я понял, что ты генерил на FLUX.2 [klein] 9B из коробки (FLUX.2 [dev] не дал бы такую убитую геометрию и кривые спицы).
С этими погаными зелёными (а у тебя ещё и синими) мусорными пикселями я столкнулся ещё во время знакомства с FLUX.2 [dev]. Там они лезут на некоторых seed ещё жёстче.
Про это нигде ничего не сказано. Вот это подтолкнуло на некоторые мысли:
Модель другая, проявления артефактов похожие. Сначала я думал, что виноват VAE (как по этим ссылкам про SD). Конечно, местная публика сказала, что это не так и вообще с VAE всё в порядке, потому что у FLUX.2 [dev] и FLUX.2 [klein] VAE один и тот же, а на [klein] у них этих пиксельных артефактов нет. Только я замечал, что и на [klein] они тоже есть, но выражены они в меньшей степени. А твой пример независимо иллюстрирует, что зелёными и синими пикселями подгаживает в картинку нормально.
Впрочем, как оказалось дальше, VAE если и виноват, то не напрямую, а косвенно.
Пока могу сказать, что с этим issue я не справился никак и просто убираю с помощью пост-обработки. Заметил только, что для FLUX.2 [dev] на некоторых seed этого мусора больше, а на некоторых меньше или вообще практически нет, при этом я менял только seed, оставляя все остальные настройки генерации нетронутыми в попытке выявить причину возникновения этой дряни. Ещё раз повторюсь, перед этим я много чего начал крутить, но ни количество шагов, ни размеры latent, ни последовательность sigmas, ни использование LoRAs, ни квантование (я пробовал и bf16 и fp8 модели, даже GGUF) напрямую с интенсивностью этого пиксельного мусора оказались вроде бы не связаны. Это актуально для t2i. Использование edit иногда усугубляет ситуацию, но прямой связи пока не обнаружил.
Проверка гипотезы о том, что это могут быть «горячие» пиксели, которые получаются из-за ошибок превышения порога при работе модели (fireflies/stray noise) на практике не подтвердилась. По крайней мере, как ожидалось, избавиться от них с помощью узла Clamp Outliers для latent перед VAE decode не удалось.
Когда ты увидишь какие-нибудь артефакты генерации конкретных моделей, как например эти гадкие зелёные пиксели (или, например halftone dithering pattern для линейки Qwen-Image), то «развидеть» их ты уже не сможешь, станешь присматриваться и будешь замечать везде. Now live with it.
>>1575838 Интересно было почитать. Ты прав, насчёт модели. Взял промпт из воркфлоу комфи стандартный про мотоцикл, чуть изменил текст добавив девку и охренел от результата как он похерил и спицы и масштаб, тогда уже и надпись изменил. Про пиксели даже не знал, это вообще жесть какая-то.
Вот пикрел флюкс 1 (не 1.1) дев фп 8 кстати t2i. Спицы вроде получше, не вижу разноцветных пикселей.
>>1575855 >Про пиксели даже не знал, это вообще жесть какая-то. Не то слово. Меня в целом FLUX.2 [dev] (а позже и FLUX.2 [klein] 9B для быстрого рефайна) вполне устроили. А когда заметил эти фокусы с пиксельным мусором, здорово расстроился, потому что победить это полностью, по крайней мере мне, пока никак не удалось. Сначала хотел вообще бросить всё, сидеть на ZIT-Turbo, как местные и не выделываться. Даже начал опять смотреть в сторону Qwen-Image с которого ушёл из-за его фокусов с кривым Qwen-Image-Edit-2509/2511 и halftone dithering pattern (который и в Qwen-Image-2512 остался). Потом как-то приноровился из FLUX.2 эти пиксели вычищать ко второму проходу и на рефайне, вроде полегчало.
>не вижу разноцветных пикселей Да, тоже не наблюдаю. По крайней мере, точно не так как на FLUX.2 [dev]/[klein] при неудачных раскладах.
>Спицы вроде получше Но не на заднем колесе. Там грустно.
>флюкс 1 (не 1.1) дев фп 8
Я уже как крайний вариант рассматривал его на роль рефайнера, в случае если бы мне с FLUX.2 [klein] 9B хоть как-то справиться бы не удалось. В целом FLUX.2 [klein] 9B шумит меньше, чем FLUX.2 [dev], а на небольших sigmas, вроде вообще себя хорошо ведёт. Если не знать об этих пикселях, то там они вообще практически незаметны будут.
>>1575871 есть какой-то семплер, который используется для рисования всяких архитектурных форм для которых нужны прямые и чёткие линии, смотрел как-то видос одного кулика, кторый вайбкодил элементы дизайна жилых помещений.
>>1575864 >пиксельным мусором, здорово расстроился, потому что победить это полностью, по крайней мере мне, пока никак не удалось. Дай контрольный пример для опытов. Ничего лишнего, никаких лор или кастом нод. Минимальный воркфлоу, максимум пиксельного мусора. Я что-то и не смог увидеть его.
>>1574315 Ты о какой версии сейчас, о 3-й или 4-й? Я щас потыкал в 3-ю, хуйня конечно, всё коричневое, (на баланс белого автор традиционно забивал болт), гамма не то что-бы тёплая, она цаета клинового сиропа, пиздец... Доходит до смешного, допустим лора перса, где цвет волос как у соломы, она (модель) умудряется делать из неё шатенку, на весе: 0.6), я даже не проверял её на nsfw, даже просто целоваться она не умеет также, как и оригинальная турба.
Любой фотореалистичный prompt с тёмными и светлыми контрастными областями и мелкими деталями. На тёмном фоне эти пиксели видно лучше, но иногда и на светлом проступают. Если при увеличении изображения у тебя нет такого, как на пикрил из поста >>1575838 то тебе повезло. От workflow ничего не зависит. У меня это вылезает на default workflow из Templates ComfyUI. На FLUX.2 [dev] сильнее, на FLUX.2 [klein] реже и еле заметно. Я не исключаю, что что-то где-то может быть и на моей стороне, но пока не нашёл. А тут у Анона на default workflow увидел знакомые проблемы и убедился, что не только у меня.
>>1575918 >переполнение весов А хотя... Тут проблема фп8 и фп16 (в идеале нужно бф16) реально может быть и фиксануть по идее можно через типа Guidance Scale
>>1575898 >Любой Ага, спасибо. Теперь ясно, что проблема в целом исключительно у тебя. Скорее всего у тебя кастомные семплеры/шедулеры, в целом. Пример с дефолтом мы скорее всего не увидим. А беседу ты ведёшь здесь сам с собой. И чего я в целом ожидал.
>>1575918 >со времён полторашек Именно поэтому у моделей тех времён был свой собственный встроенный кастомный вае, для данной конкретной модели, который невелировал подобные вещи.
>>1575898 > как на пикрил из поста >>1575838 Выглядит, как артефакты от bicubic скейла на каком-то этапе в воркфлоу. Тут ты их видишь? У меня глаза уже не те.
>>1575919 Я уже писал, что пробовал и bf16 и CFG крутил, и Clamp Outliers даже на FLUX.2 [dev] default workflow. Не влияет никак. К [klein] у меня претензий практически нет, так как там почти незаметно.
Будет время, перепроверю всё ещё раз. Перекачаю VAE (хотя вроде уже перекачивал). Запущу на отдельном чистом instance portable ComfyUI и посмотрю. Только эти два момента и осталось проверить.
>>1575918 > Это точно проблема вае. Это точно не проблема вае, иначе они бы появлялись на пикрелейтед. >>1576268 Вопрос анально вшитой ватермарки уже рассмотрел и отбросил?
>>1576293 А теперь делаем тест правильно. Сурс цифровое фото raw кратно правильно кропаем, смотрим на участки градиентов и размытий и ой какая неожиданность видим фиолетовые, зелёные и синие пиксели. 2 - сурс 3 - поствае Все обводить не стал, там их дохуя. Факт наличия даже одного это уже достаточно.
Ебучий наноартефачный битый латент от говноделовсделано в дерьмании, почему я не удивлён? Флюскал как был калом, так и остался. Увижу теперь у кого-нибудь разноцветные пиксели буду ссать в рот. Готовьтесь, говноделы-флюсодауны.
Дело в 128 каналах вае и "переполнении" говна/отсталости версии cuda на данный момент наверное. Короче в комфи есть вариант --vae-fp32 заюзать, попробовать decode/encode tiled (tile size 4096 отрубить по сути), юзать рескейл до ввода lanczos или bicubic. Но мне лень тестировать, можете попробовать кому приспичит.
Спасибо. Ценные находки. Будет теперь над чем поэкспериментировать на досуге. Просто проверить VAE Encode > VAE Decode без модели я не сообразил, к сожалению.
>>1576795 Эти долбоёбы каждое обновление что-то ломают, количество Issues в репозитории на гитхабе растёт в геометрической прогрессии. Зато теперь цвет нодам можно легко менять!
>>1576842 да это я сам накостылял. но охуел от их встроенной эвристики когда при переключении на light_theme у них есть специальный флаг который активирует магически-динамическую математику цветов после которой все цвета которые ты сам выбираешь идут по пизде, потому что они не смогли захаркодить просто цвета темы а решили вычислять их в динамике плюсуя рандомные значения в разных местах, где-то делая инверсию цвета, а где-то clamp что ниже 128 128 128 цвет не может уйти. довольно смешно
>>1576842 Хуй знает, у меня как работало на latest, так и работает всё. Даже редактор кода, вставленный в ноду, уже пол года без изменений работает. Надо просто пользоваться API, а не ломать существующий код фронта.
>>1576865 1.5 ебало представили кто на не-английском запускает эту залупу и кто решил что это охуенный приоритет для фронта 1.3.22 запусти сервак в терминале и еще у тебя есть в браузере теперь точно такой же терминал
1) Использование более мелкого варианта VAE из набора для FLUX.2 [klein] 9B https://huggingface.co/black-forest-labs/FLUX.2-klein-9B/tree/main/vae не помогло вообще никак, проблемы все те же (проверял наравне с flux2-vae.safetensors); 2) --fp32-vae --cpu-vae не помогли, тут, пожалуй, больше и добавить нечего; 3) Подмешивание небольшого количества шума между VAE Encode и VAE Decode на положение пиксельных артефактов влияния не оказывает (смотрел только на тестовом сегменте изображения, здесь и далее так же, потому что задолбался смотреть внимательно всё изображение); 4) Незначительное изменение контрастности входного изображения перед VAE Encode на положение пиксельных артефактов влияния не оказывает; 5) Clamp Outliers для latent не помогает потому что «пиксели» не такие «горячие»; 6) При прогоне чистого белого изображения на выходе выдаёт такое же белое изображение без видимых артефактов; 7) При прогоне чистого чёрного изображения на выходе выдаёт такое же чёрное изображение без видимых артефактов; 8) Чуть-чуть помогает нормализация каналов latent, но проблемы это не решает.
>>1577284 2.5) Забыл про Tiled VAE Decode/Tiled VAE Encode. Тоже эффект практически нулевой (два варианта узлов, какие были под рукой). Как вариант ToDo попробовать изменить значения overlap, чтобы tiles побольше друг на друга налезали, может, будет эту пиксельную дрянь затирать. Но это тоже, скорее всего, нормально работать не будет.
>>1577284 >>1577285 Спс за тесты, скачал, потом гляну. Насчёт 6) и 7) ожидаемо. Если 2) не помог и предположить, что у самих разрабов проблем нет, то они тестировали на не потребительских видяхах. Остаётся ждать выхода либо оптимизированного вае, либо молиться на каждое обновление CUDA и торча, что там проблема исчезнет. Херово, что даже костыли не помогли.
Скинул гемини все данные по проблеме, вот что рекомендует:
1. Использование TAEF2 (Tiny AutoEncoder for Flux 2) Это самый эффективный способ на сегодня. TAEF2 — это дистиллированная (крошечная) версия VAE, созданная специально для исправления ошибок оригинального декодера. Как работает: Он не пытается «вычислить» каждый из 128 каналов с нуля, а использует упрощенную математическую модель. Результат: Цветные точки исчезают в 100% случаев. Минус: На экстремально мелких деталях (дальние ресницы, поры кожи при 4К) картинка может стать чуть «мягче». Где взять: Ищи в менеджере ComfyUI или на HF по тегу taef2. Узел в Comfy называется VAE Loader, просто выбери там файл taef2.safetensors. 🛠 2. Узел "Latent Center & Rescale" (Без потери деталей) Если хочешь оставить родной VAE, тебе нужно «причесать» латенты перед декодированием. Точки на градиентах возникают из-за того, что значения латентов в этих местах «улетают» за пределы нормы. Вставь между VAE Encode и VAE Decode: Узел Latent Standardize (из набора ComfyUI-Essentials или NodeBox). Настройках выстави: shift (смещение) в 0 и scale в 0.95–1.0. Это слегка сожмет динамический диапазон латента, не давая VAE «психануть» на контрастных переходах. 🧪 3. Метод "Dithered Encode" (Бредовое, но рабочее решение) Раз на чистых цветах точек нет, а на градиентах есть — значит, VAE не справляется с плавным переходом чисел. Возьми картинку перед VAE Encode. Добавь узел Image Grain или Add Noise (очень слабое значение, около 0.005–0.01). Это создаст микро-шум (дизеринг), который «разбивает» идеальный градиент. VAE воспримет это как текстуру, а не как математическую аномалию, и выдаст чистый цвет без фиолетовых вылетов.
>>1577622 Спасибо. Уже пробовал всё кроме Latent Center & Rescale (это попробую) и добавления пиксельного шума в изображение, а не в latent. AI ассистенты, к сожалению, фантазируют. С существовующими узлами taef2 на ComfyUI запустить так и не смог. Ни с помощью набора TAESD custom nodes, ни с помощью всевозможных VAE загрузчиков. Ни safetensors, ни pth. Может, у тебя получится.
Я ещё думаю, что для FLUX.2 [pro] и [max] у них может быть другой VAE, который они в open source не зарелизили, а спецом дали этот косячный. Но это уже фантазии.
>>1564964 (OP) У гугла в андроиде есть фича "Автокадрирование". Оно дорисовывает края, а потом предлагает кадрирование исходя из содержимого. С дорисовыванием всё понятно, а вот каких-то локальных алгоритмов позволяющие предлагать автоматический кроп я не нашёл. Пробовал координаты в vision llm, но он думает вечность, как будто промахивается, и на композицию в общем-то не смотрит. Есть какие ещё идеи?
>>1577720 >Кроп чего? Он делает кадрирование любой фотки, даже без персонажей. Прост фоткаешь на ходу на отъебись кусок мира, потом нажимаешь "сделать заебись" и он делает нормальное кадрирование с композицией, диагоналями, уравновешиванием, вот всем этим. Хочу так же на локалке делать.
>>1577649 >запустить так и не смог Да, не сможешь стандартым методом. Нужно искать кастом ноду для этого и где-то она есть, вроде даже у автора этого вае на гитхабе. Мне было лень искать, поэтому... Предварительный результат такой. Смотри точки в районе вилки у колеса на стандартном вае есть россыпь говна, на таеф нет их зато есть куча другого говна в коде ноды и вообще качество картинок не айс и надо прогонять ещё тесты в базовой версии но мне пока лень
>>1577790 >Хочу так же на локалке делать. Ты просто неофит, а так знал бы, что это технологии древних и давно есть. Делается даже не полторашке и сдохле элементарно
>>1577924 Спасибо. Это очень ценный результат. То, что taef2 разноцветного пиксельного мусора не даёт, а оба существующих VAE для FLUX.2 дают, причём без CUDA, на чистом --fp32-vae --cpu-vae, озадачивает.
>>1578016 Повышением температуры. Этот >>1577964 эксперт тебе щас полуторачасовое видео с дабл пенетрейшн на 4x_NMKD-Siax_200k с промпта сгенерировает, если еще чутка подкрутить.
Вы тут со своими призрачными точками совсем обнейронились уже. Лучше бы выясняли, как заставить клейн не накидывать зерна мешками. Пишу ему давай цифру, самую современную и профессиональную за 100500 милльёнов, получаю гигантское зерно с super8.
>>1578136 >Пишу ему давай цифру, самую современную и профессиональную Ну, ты тоже с мистикой какой-то. Вот : shower water Plated Slagwurm Pentax Optio V10 on bra, art by no anus
>>1578158 > Найдёшь хоть одну нейронку без зерна - свисни. Максималист дохуя штоле сука? Либо ведро на квадратный сантиметр, либо вообще нихуя, между этими двумя крайностями ничего быть не может? Ну вот: 1 - сдохля - зерна нет, есть немного нейрошума, 2 - зит - зерно есть, но ближе к IMAX, чем к super8, 3 - квен - зерна нет, вместо него квеновая хуета. > А пока изучи как строят изображение нейросети. А ты уже всё изучил? Теперь делишься мудрость, раздавая советы типа пойди изучи - это всё, чему ты обучился? >>1578163 > shower water Plated Slagwurm Pentax Optio V10 on bra, art by no anus Спасибо. Просто магический промпт.
>>1578186 >вместо него квеновая хуета У них у всех своя хуйня - то, что ты называешь зерном. 1 жипегхуйня. 2 зернохуйня. 3 сеткахуйня. 4 манямедаунхуйня.
>>1578195 > у всех своя хуйня Нюанс в том, что 1, 2 и 3 лечится теми или иными способами и их комбинацией, а огромное зерно клейна - это как маленький член, с этим уже нихуя не поделаешь, можно только смириться.
Нет времени объяснять, нужно протестировать! На Klein, вместо euler ставим SamplerDPMPP_SDE с параметрами как на картинке и получаем выправленную геометрию деталей(пальцы, тарелки, кран, ручки мебели и прочее). Всё становится как-то правильнее. От вас подписка, лайк и отзыв.
>>1578249 Ты какой-то не особо умный. Всё время просишь промпт. У тебя свои закончились? Для меня нет смысла генерировать(видеть генерации от тебя) точно по тому же промпту, по которому я выложил картинки. Я по нему уже генерировал и сделал вывод. Нужно генерировать по твоему промпту и смотреть на твои картинки. В этом заключается всеохватывающий тест. Мне нужна какая-то обратная связь, иначе нет смысла сюда больше писать. Каждый сам по себе.
>>1578299 >Мне нужна какая-то обратная связь, иначе нет смысла сюда больше писать. Каждый сам по себе. Э, не делай выводы по одному анону. Лично я подписался. Завтра буду тестить, сегодня лень. Отпишусь. >>1578309 Как обрезать, ты о чём? Подробней плиз. другой анон
>>1578299 > Всё время просишь промпт Промпта-то мне как раз не надо, у меня своих полно. Просто интересно было, как ты умудрился получить пик2, который потом сумел исправить. Дефолт клейн на euler такого пиздеца не выдает же. > Ты какой-то не особо умный. Ты грубиян. Отписался. >>1578309 Охуеть. Спасибо. Где ты раньше был? Только что-то он на высоких шагах галлюцинирует сильно, типа пик2.
>>1578342 > галлюцинирует сильно У меня ещё NAG включен. Попробуй семплер другой, я на res multistep генерю. Лорами полирни. Вообще оно только детализацию лучше делает, консистентность немного роняет, всё же оно не рассчитано на такой шедулинг.
>>1578392 >на res multistep самая сильная плесень, на эйлере её почти нет если кфг выше: 1, и ещё мультистеп зеленит сильно.
Как в зимаге промтить длинну платья без лоры-слайдера, т.к слайдер своим сильным весом ломает перса. В зимаге, в отличии от сдохли абсолютно не работают: 1. underbutt 2. mini-dress 3. extremally short dress
работают: thighs level length (делает юбку, платье заметно короче, но недостаточно)
На видосе: т.н. pool dress, пробовал тег: boutinela - не работает тоже.
>>1578537 >pool dress проверено: это относится ко всем видам коротких платьев, пикрил: extremally short slitted tennis black mini-dress как видите, по прежнему никакого андербута.
Штошь, если этот "ремесленник" >1578571 возбудился значит мы на верном пути. Ведь у него нет стремления взаимопомощи и он всячески будет противодействовать.
>>1578558 Тебе ещё в том треде пояснили. В современных text encoders забудь про магические теги, которыми пользуются три дрочера с бору. Просто естественным языком пишешь "из-под платья видно нижний край жопы" и всё тебе будет.
>>1578599 >и всё тебе будет. ни-ху-я У тебя юбки в основном, но чтобы даже юбка так задралась она должна быть достаточно свободной и должно ещё быть дыхание ветерка, в моём случае платье tight, и при таком раскладе ты хоть до головокружения можешь на него дуть, ничего не произойдёт. Но у меня всё-же получилось на одном сиде. Сука, я чуть не обосрался от натуги, это очень тяжело. Блядь, в кои веки появилась модель с нормальной анатомией, но сука тупаяяяя, шо пиздец...
extremally short black tennis dress on both views, (the lower part of the buttocks is visible from under the hem at the back), high waist, slightly arched back,
>>1578729 Столько времени потрачено в локалке столько сил чтобы палец в жопу бабе засунеть! в то время как бесплатный безлимитный печанс делает красоту
>>1578848 age difference, skuf guy is much older than girl, >>1578852 >ясно Я рад за тебя, хоть кому-то, что-то тут ясно. Для всех повторяю ещё раз, зетка на редкость тупорылая, ты можешь промтить тегами, ты можешь заплетать кружева из слов, результат будет один и тот-же. Те, кто считает по другому не в работали с ней ни секунды.
Долбодятлики, на обниморде лежит z-image-turbo-sda, которая якобы возвращает з имаге 70% проебанной по сравнению с базой диверсити, при сохранении 8 шагов. Это для неумеющих в подрубание турболоры посередине воркфлоу.
>>1578880 >для неумеющих в подрубание У меня есть вот это: z_image_turbo_distill_patch_lora_bf16.safetensors Я до сих пор в душе не ебу что это, нахуя это и куда это совать, и с каким весом.
>>1578904 уже с весом 0.2 заметно блюрит задник но усиливает промт, но только на тех сидах, где промт отыгрывает, на тех сидах что "никому не обязаны" он нихуя не работает. Хуита, корочь...
Зетка что фп8, что фп16 или бф16 турбо/базовая, даже разные эблитерейтед и обычный квен фп8/бф16 разница на уровне погрешности сида, плацебо хуита. Тестить заебался даже уже. В итоге оставил ZIT фп8 с квеном фп8 скейлед - лучший результат по непонятным причинам. Ну к примеру селебрити узнаваемые в нём, а в версии бф16 уже блять какая-то микрохуйня в мимике не та. Так что кто думает, смело юзайте фп8.
Black Forest Labs just released FLUX.2 Small Decoder: a faster, drop-in replacement for their standard decoder. ~1.4x faster, Lower peak VRAM - Compatible with all open FLUX.2 models
>>1578858 Почему всякий раз когда я иду что-то проверять, выясняется, что ты пиздишь? > A woman is wearing an extremely tight, micro-mini bodycon dress in vibrant fuchsia pink. The dress is provocatively short, riding up to reveal the lower part of the buttocks
>>1579021 О, спасибо. Надо затестить на досуге. Если он точками срать не будет, это прямо хорошо будет. Потому что я уже задолбался и гугл замучал. Latent clampил, измерял значения по каналам. Пытался размазать tiled vae decode с большим overlap. Делал normalize и standardize. Всё либо без толку, либо портит изображение. Гугл почти дословно сказал «вместо того, чтобы тратить часы на поломаннуютархитектуру, сделай пост-обработку в пиксельном пространстве послегvae decode» (я так и делал, но он лучше идею предложил).
>>1579046 >дроч на точки Зачем ты этим занимаешься? У тебя слишком дохуя свободного времени и тебе нечем заняться или ты пилишь коммерческие хайресы? Выглядит как битва с ветряными мельницами, есличесно.
>>1579040 >всякий раз когда я смотрю на твои картинки, я не могу понять пиздишь ты или рофлишь. 2 пикрил по твоему как то отражает написанное тобой? Или это просто: сид неудачный (с)?
>Diversity У меня тут возникла идея, добавлять разное в генерации путем изменения промпта не теряя смысла и навайбкодил тулзу, которую можно в ноду оформить. Это как пример, можно сделать еще сложнее, подключив какую нибудь 0.5 лоботомита или T5. Я ведь долбаеб да? Это уже сделано кем то давно?
Есть какие-то решение для инпеинтинга нормальные нсфв. СДХЛ модели так до сих пор и не могут в инпеинт. Абсолютно не понимают анотомии, лепят горбатого к стенке.
а 1.5 прогонять через ""DLSS 5" каждый раз потом еще в фотошопе ебаться заёбывает.
Хочется просто закинуть картинку и получить результат.
>>1579569 Что именно? Промаксу уже полтора года https://huggingface.co/xinsir/controlnet-union-sdxl-1.0 Про натвиз знают все, кто не вчера вкатился. Для удержания контекста - комбайн контролнета по обстоятельствам (depth, normal, openpose, densepose) по маске + tile CN по инвертированной маске. Хочешь, возьми webp-релейтед, только не факт, что оно у тебя заведется - для SAM3 нужно файлы groundingdino в venv ковырять, nested сабграфы в текущем stable фронтэнде поломаны. Ну и один хуй, лучше под себя собирать, чем в чужом пытаться разобраться.
>>1579584 Ну тоесть СДХЛ не может в инпеинт без пердолинга. Ну там через автоматик. Я понял.
Я щас делаю так, накидываю примерные контуры в скетче или в фотошопе коллаж некий, а потом прогоняю через обычную модель СДХЛ, потом обратно в фотошоп, заёбывает копипастить конечно.
Но всё равно лучше чем макароны разматывать и зависимости.
Всё понял, удаляюсь еще на пол годика. Через пол годика вернусь с тем же вопросом.
>>1579594 Странное у тебя определение пердолинга. Т.е. один раз собрать сабграф за полчаса - это пердолинг. А переключаться в фотошоп и рисовать скетчи для каждого инпейнта - нет? Асло, скетч можно рисовать не отходя от кассы.
>>1579117 >На новом тоже есть. Есть, но в целом, существенно лучше, чем на старом, по крайней мере, по первым впечатлениям. Они хотя бы уже не так сильно в глаза бросаются.
>>1579709 Это что, новый вае от них? Раз есть артефакты, то не вариант. Вот эта картинка на taef2 вроде нет этих разноцветных пикселей, смотрел глаза сломал, вроде нет. Нода сама багованная, лень допиливать, может пока только декодировать и то с оговорками.
Вот интересно, они этот релиз совсем под другим соусом подали. Делают вид, что выпустили не от того, что их VAE гадит мусором, а как оптимизацию для ускорения decode. Это как бы вовсе и не попытка фикса кривого говна, а такая себе новая ускоряющая оптимизация.
Узел для taef2 сам написал? Я пытался было поискать что-то готовое, но ничего подходящего и работающего из коробки не нашёл. Узлы TAESD https://github.com/neocrz/comfyui-usetaesd которые поддерживают всё, кроме taef2, его никак не воспринимают. По поводу результата, я пригляделся бегло к твоему пику. Так сразу вроде особо ничего не заметил. Если что-то и есть, то оно хотя бы в глаза не бросается. Я в своём workflow для теста (помимо визуального сравнения узлами compare исходника и после VAE Decode) вырезал подозрительный кусок 256×256 пикселей после VAE Decode, а потом апскейлил его в 8 раз с помощью nearest neighbour. Тогда пиксели становятся гигантского размера и пиксели с цветом, отличающимся от соседей из того куска 256×256 хорошо и чётко заметны.
>>1579764 > подозрительный кусок 256×256 >>1579709 > в целом, существенно лучше, чем на старом Так а смысл на этом куске сравнивать? Тут >>1579051 они в разных местах концентрированы, например. И таки да, на новом их в целом меньше, но есть области, где их больше.
Кусок я брал потому, что слишком много разных комбинаций надо было прогонять (я пробовал с --fp32-vae --cpu-vae и так далее), workflow остался с этого момента. Сейчас просто новый VAE воткнул для быстрого сравнения, а на этом куске хорошо видно было.
Смотреть по отдельным каналам, как у тебя, наверно правильнее. Так заметнее будет. Но пиксели тоже разноцветные. В целом я уже видел: синие, зелёные, розовые.
>>1579788 Вот эту хуйню (пик1) я бы никогда не разглядел без разделения, а потом при ебическом увеличении их заметил на оригинале, и это новый вае. А точки другого цвета всё равно выделяются на синем канале, т.к. темнее окружающих.
В общем, расстроился. Только пикрил слепил по мотивам >>1579269 Выпал в осадок с того как пионЭры взяли и низкие сигмы убили, считая, что это от них у них зерно плёночное лезет. Да не просто так, а через жопу denoised_output. Оригинально. А теперь вот, опять, точки вилкой чистить.
>>1579594 > Через пол годика вернусь с тем же вопросом Думаешь в через полгода в темплейтах появится воркфлоу, который будет за тебя решать, что ты хочешь заинпейнтить?
>>1579848 >Причина этой боли? Я вижу нападки илитарного клуба пиксельдрочеров, которые заняты мифической борьбой с невидимым врагом, на работяг, которые пытаются (и успешно) решать настоящие (видимые) проблемы. И в результате увод обсуждения в какую-то хтонь, "нужную" двум(1) двачерам. При увеличении количество шагов больше задуманного (4) происходит излишний перешарп, который надо срезать. И если кто-то думает, что этим срезается микротекстуринг и будет мыло, то это только теоретики. Пик1 дефолт 4 шага. Пик2 манипуляция сигмой (8 шагов в итоге). Видно не вооруженным глазом (без необходимости увеличения в 10х и просматривания цветовых каналов отдельно), что количество конечностей в используемом методе больше похоже на норму. А микротекстуры по четкости превосходят дефолт при срезанных лоу-сигма шагах. И на это катят бочку? Ну, ок.
>>1579867 попробуй вот это: https://civitai.com/models/1657256?modelVersionId=2707196 с весом: 0.1-0.2 всё ещё не убивает твой микротекстуринг, но убирает разъёб в виде плесени (не совсем понятно где кончается одно, и начинается другое, по твоему)), но это хорошо работает на зетке, и на кляйне тоже наверняка сработает. при такой схеме вф упрощается до базовой без необходимости переизобретать велосипед, со всеми этими сигмами-хуигмами, а юзать ксемплер как все нормальные люди)
Аноны, какие сейчас есть бесплатные удаленные сервисы для запуска своего интерфейса на мощности GPU, вроде ГуглКолаба? Чтобы вот была среда и пользователь сам туда всё что ему надо ставил?
>>1580029 Без кастом но ноды(хотя бы одной) не возможно сделать нормальный инпеинт в комфу. Например, картинка 1024х1024 и ты инпеинтишь лицо(ага). Оно занимает область, к примеру, 128х128. Ты его маркируешь маской и подаешь на вход ксепмлера с нужным денойзом. И на выходе получаешь хрень того же размера. По нормальному нужно скейлить из 128 в 1024, потом уже подать на ксемплер и потом на выходе сжать в 128 и точно совместить по маске в то место где взял. Нет в стандартном наборе таких нод. Нода через которую вставить есть, а вот нода которая берет координаты маски нет. Что поразительно и удивительно. В комфу нет в стандартном наборе достаточного ассортимента нод, чтобы сделать инпеинт с апскейлом\даунскейлом. Я для себя завайбкодил эту ноду. Можешь сделать так же(скопируй в нейронку мой рассказ и она тебе напишет ноду) или ищи в каком-то наборе. Буду возле компа сделаю скрин о чем я рассказал.
>>1580072 То что ты описал, это всё не то. Ты вот говоришь, что что-то там невозможно. Но например на голом автоматике инпеинт 1.5 работает приемлемо без всяких контролнетов и прочей чуши.
Почему сдхл до сих пор так не допилили? Может есть модели какие-то новые помимо сдхл, которые просто работают. Нафиг эту лапшу городить то, ну опопмнитесь. Чё за аутизм.
>>1580099 Не работает. Он вообще не понимает тело, размеры, пропорции, стыки на краях инпеинта. Получается полная ерунда. Переключаешь на 1.5 инпеинт модель и она всё нормально делает.
>>1579903 Ну хуй его знает. Bilateral разве не сильно размазывает. Как я уже выше писал, я их вообще не вижу, пока кто-то не обведет. Это такая проблема, которая решается сама собой, если их специально не искать с лупой или другими инструментами типа разбивания каналов. Внезапно, при инпейнте они даже на синем канале становятся едва незаметны (если про них вообще знать заранее), после даунскейла и вставки. Если ресурсов хватает, может стоит делать суперсемпл, а потом скейлить обратно, если так сильно напрягают.
>>1579878 > без необходимости переизобретать велосипед, со всеми этими сигмами-хуигмами, а юзать ксемплер как все нормальные люди) Все нормальные люди юзают фокус и считают, что сдхл не умеет в инпейнт.
Бля, я просто охуеваю с этих шизофреников. Перебираю воркфлоу сдхл инпеинт, в надежде найти такой, который бы сделал не шизофреник. Так после очередной установки у меня по столу динозавр какой-то начал бегать. Я не понимаю, как они из дурки на цивит умудряются постить, это пиздец.
>>1579812 >Выпал в осадок с того как пионЭры взяли и низкие сигмы убили, считая, что это от них у них зерно плёночное лезет. Да не просто так, а через жопу denoised_output. Оригинально. Да, я только хотел как раз написать про это итт, что это плохая идея, ребятки. Сорт оф плацепо
Так а где скачать базовые воркфлоу для инпеинта сдхл? Я из треда качал, где баба на машине сидит. Это вообще делал полностью отбитый чел, там наверно слоя 4 сабграфов. Ему в дурку пора. Я из цивита качал, там вообще пиздец, какой-то динозавр начал по столу бегать. Это уже коунворлд какой-то.
>>1580483 >4 слоя сабграфов во во, только и слышишь по треду: обнваил конфи и маи воркфлоу пиристали работат...
>из цивита Вот где дурка - так это там. Какие-то полностью отбитые красноглазики выкладывают 100in1, с какими-то хуйпойми какими нодами от васяна из 2020года, вторая половина нахуй вообще не работает, третья - хуй проссышь как в этой какаше разобраться
>>1580709 а еще прикол из цивиты, когда красноглазики заменяют стандартные ноды какими-то кастомными от васяна, которые делают абсолютно тоже самое, с такими же настройками, только ДРУГИЕ ЕПТА!1 И выкладывают это для нубов на цивиту. Нахуя они это делают, а главное зачем - я хуй его знает.
>>1580722 > Нахуя они это делают, а главное зачем - я хуй его знает. Потому что есть очень маленький процент лоу айсикью населения, который является целевой аудиторией всех этих васянских воркфлоу на цивите - хлебушки, которые не способны самостоятельно мыслить и протянуть макаронину от одной ноды к другой. Вот для них эти воркфлоу и выкладывают на цивите, а хлебушки всё равно жалуются, потому что не понятно нихуя. Этим хлебушками проще годами каждый день качать новый воркфлоу с цивиты, нихуя не понять, удалить и пойти качать новый, который тоже даже не пытаются понять, чем попробовать самому протянуть макаронину. И так по одному воркфлоу в день, годами пробуют бесконечный поток нипанятных воркфлоу с цивиты и жалуются, что плохие шизы нипанятно сделали. А авторам всех этих воркфлоу базы текут за каждое скачивание. Лохов хоть и немного, но они качают очень много воркфлоу.
>>1580722 Сорт оф шизоиды. Я вот например за всё время пользования комфи стремался кастом нод вообще любых и если сильно припекало, то брал эту чужую и полностью код перелопачивал под себя, вырезая говно и видя что он стерилен - это наверное тоже сорт оф шиза. На самом деле в этом во всём нет смысла, т.к. желторотая макака на фронтенде чингчонг узкоглазый чуйчленьвынь или как его, сам тащит всё говно с разных паков и инжектит в комфи.
>>1580722 Ну я вот слабо понимаю зачем вообще нужен адвансед сэмплер по сравнению с обычным, и что такое добавляет перенос шума из одного сэмплера в другой по сравнению с генерацией этого шума с нуля посредством регулирования денойза в стандарте, так что можно сказать это идеалогия комфи по умолчанию.
>>1580948 1. Делать всякое с шедеврами. 2. У некоторых семплеров есть дополнительные настройки и такие семплеры вынесены в отдельные ноды. Иначе нет доступа к этим настройкам. 3. Если ты сам не смог до этого додумался хотя бы, просто пересмотрев все имеющиеся ноды семплинга, то ты или туп(если посмотрел, но не понял) или ленив (если не смотрел).
>>1580948 > зачем вообще нужен адвансед сэмплер по сравнению с обычным Изначально был добавлен для поддержки хл рефайнера. В первый подключается база, которой денойзится большая часть шума, во второй - рефайнер, в латент которого кидается недоделанный латент из первого вместе с остаточным шумом. Что с ним сейчас можно сделать ограничивается только твоей фантазией и здравым смыслом, при наличии. >>1580950 Узнал себя? Обиделся?
>>1580953 Для скедулеров есть еще один какой-то сэмплен нод, который в темплейте клейн едита, в котором отдельно прописываются сигмы и все такое. Адвансед это именно стандарт, только в возможностью срыгнуть остаточный шум, такое вроде только в ване 2.2 реально нужно и то я не уверен.
>>1580958 А ну тогда понятно, это тупо костыльный легаси. Просто название такое, продвинутый сэмплер, я всегда на него смотрел и думал что я какие-то великие фичи упускаю.
>>1580965 Ну это не совсем костыльный легаси. Свои не плацебо задачи найдутся - в редких случаях может потребоваться начать денойз одним сэмплером, а закончить другим (или вообще смени модель посреди генерации, но это проще хуками с таймстепом сделать), но SamplerCustom для этого всё-таки больше подходит из-за гибкости, чем AdvancedKSampler.
>>1581068 Очень много красных нод, скорее всего кто-то из дурки выкладывал. Попробуй скачать следующий воркфлоу, может быть в этот раз, наконец, повезет.
>>1581068 Любил я как то такие воркфлоу. Скачивать все ноды которые отсутствуют. По 10-30 пакетов качалось бывало. А потом вдруг кто то начал майнить у меня на видимокарте
>>1574793 докачка есть, но через анус броузер вивальди. запускаешь скачку и останавливаешь, у файлика делаешь copy download address этот урл скармливаешь wget с докачкой когда стопнется - еще раз в броузере запускаешь скачку, заново copy download address и этот новый адрес - вгету с докачкой.
>>1582070 Кросева. Пропорции в кляйне конечно заебись, есть у него с этим странности. Вижу ты спицы уже специально промптишь лол. Кстати как побороть прорисовку и выправление всего текста, не задумывался? Крупные надписи ещё ладно, но другие у меня так же херачит и даже 3й прогон с этим вот дпмммп не хочет исправлять, эт сильно калит. Но есть решение "remove any text from image"
>>1582098 > Вижу ты спицы уже специально промптишь лол. Да хуй там был. vintage convertible coupe - это клейн уже сам троллит любителя спиц (ты?). > как побороть прорисовку и выправление всего текста 1. Инпейнтить нужный нужный текст, либо вообще стереть лишние надписи инпейнтом. 2. Прописать все надписи в промпте, а не только одну нужную, но это гарантия, что весь остальной промпт будет проигнорен. 3. Генерировать на ZIT (пик2), но он упорно отказывается делать некоторые вещи, которые клейн без проблем рисует. Хуй знает, чего так.
>>1582123 Ну 2й пик прям "верю", синема. >ты? Да я, но это уже так, чисто когда не к чему придраться. Чем лучше модель, тем больше от неё ожидаешь - снежный ком. Я пока что силами самого кляйна (edit - это гейченджер просто 10/10) в следующих прогонах по цепочке просто пишу что оставить или убрать. Самый безобидный костыль получается.
Вы когда-нибудь задумывались, действительно ли для каждого этапа шумоподавления нужна вся модель целиком? Чтобы это выяснить, я обработал 2000 изображений с 8 уровнями квантования. Вкратце: первые три шага не имеют значения — вы можете использовать 2.5-bit модель и получить такое же качество, как при 8-bit. Вот как на самом деле выглядят все шаги при разных уровнях квантования. Шаги с 1-го по 3-й идентичны — структура формируется одинаково независимо от точности. https://www.reddit.com/r/comfyui/comments/1shx9c9/i_tested_what_happens_when_you_use_a_tiny_25bit/
>>1582429 > И нахуя? Держать дополнительно мелкий квант > I ran 2,000 images across 8 quantization levels to find out Есть подозрение, что у него ферма, где о таких мелочах не задумываются. Релевантность для локальной генерации сугубо нулевая.
>>1564964 (OP) Чисто я с !@#$% комфи и флекса1 вот что ему !@#$% не так? yaml прописал, структура папок, json с отсылкой все есть, все обновленно и пылает как свежие куличи. Пробовал и через цельный 23гб файл в чекпоинте - ругается на негативку, пробовал и в дифы и прочее то видит но ошибка, то не видит и.. эх
Flux Dev You can find the Flux Dev diffusion model weights here. Put the flux1-dev.safetensors file in your: ComfyUI/models/diffusion_models/ folder.
Ну..... я просто хотел создавать картинки для сцен во время беседы хнык.. желательно анимированные, вроде даже нашел там рашн фонс вуменс тудас сюда как лора модель, но вот.. эх
>>1582427 Напомнил как я к древним моделям юзал линеарквадрипук на 2 шага с дристилят лора и дальше генерил от 2 шага без лора, получалось улучшить кокохерентность, но было много гимора в другом. Сорт оф пердолинг
>>1582439 Вместо потока сознания лучше подать на вход конкретные скрины workflow, логов, сообщений об ошибках, если рассчитываешь на какое-то участие.
1) Качаешь Portable ComfyUI; 2) Открываешь workflow для FLUX.1 из TEMPLATES; 3) Качаешь то, что будет написано в Note и раскладываешь строго по папкам, как там написано. 4) Запускаешь с тестовым prompt и смотришь какие будут ошибки (если будут); 5) Тащишь конкретные проблемы во вкладку google ai сюда.
Помощи и решения это не гарантирует. Какие-нибудь идеи могут подкинуть. Troubleshooting начинается с того, что пытаешься запустить всё на самом дефолтном дефолте и, если ошибок не возникает, начинаешь двигаться дальше.
>>1582472 Пустой номер как бы намекает на чит-запрос удалить текст и цифры хе-хе, ещё и запрещённую технику ракурса применил, при котором не видно СПИЦ
>>1581935 > у файлика делаешь copy download address >этот урл скармливаешь wget с докачкой >когда стопнется - еще раз в броузере запускаешь скачку, заново copy download address и этот новый адрес - вгету с докачкой. ровно и это я и делаю, но только через копирование адреса на скачку через лису с последующей скачкой через download master (форк wget-a), файлик честно бъётся на 4 куска (по умочанию), какой е-то время всё нормально, но после того, как один из сегментов заканчивается раньше остальных, то возобновиться в новом вместе он уже не может, остаётся 2-3% недокачанного и всё останавливается. У меня черепаший интернет 20 мбит, и скачать модель для сдохли у меня времени токена хватает, а вот что-то покрупнее, уже нет. Официальное лекарство от этой хуйни: >>1574821 Я давно задумовался об этой хуйне, и так-бы и не узнал, что он существует если бы не спросил у чата гпт) Помимо ссылок на файл можно скармливать торренты. Ставить на паузу не пробовал, но качать в 8 потоков не получится гугл не даст (типа слишком много суеты вокруг вашего файла), мега теперь не доступна. Поставил в один поток и за ночь успешно выкачал, это единственный рабочий способ для меня.
>>1582581 При отдалении на портрет по пояс там начинается рендер майнкрафта. Кляйн не умеет в глаза "искаропки" >>1582583 Какие такие циферки? Чини детектор
Почему так?.webm Инженеры есть? Видяхе плохо? Утром (да и всегда почти) шло буквально в секунду разницы между временем генераций, а тут чет тормоза пошли.
>>1582695 Да, судя по температуре чипа из твоего скрина, и этой кастом ноде в ствоём воркфлоу всё явно из-за майнера. Короче только покупка новой карточки теперь и переустановка винды.
>>1582473 Все, спасибо. А то я куда не суну свой нос включая нейронки мне они затирали про то что надо мол целый файл юзать так проще читается, не нужно было все распихивать. Я вручную сделал вчера как психанул, спасибо. И хороших выходных, анон!
>>1582782 Не. Это кейс рандомного фейла клейна по необъяснимым причинам. Литерали следующий сид выправляет на любых сигмах. Если не считать, что у него своя атмосфера и уникальная реакция на пленку в промпте. А на предыдущем сиде с любым стилем пиздец выходит.
>>1582805 Для синематика норм эти 0.9-0.7 оно выправляет анатомию и геометрию прибавляя мыльца. У меня тут >>1582575 например с 0.7 уходит в 0.3 линейно, получаем мегадетализацию прибавляя прешарпа. Нужно нодой мануалсигма вручную вписывать сигмы под каждый промпт, хули мелочиться
>>1582830 Детализация же с 0.3 до 0.0 как раз? От 1.0 до 0.8 самые крупные мазки, набросок будущей структуры. Потом проработка (0.8-0.3) и в конце детализация.
>>1582943 Почти, но ты что-то сильно сигмы сгребаешь. Какой набросок, какой конец. Всё может и не закончится 0.0. По твоей логике переход по 0.9, 0.8, 0.7 (где это конец) будет наброском каким-то там. На деле это будет эффект синематика с блюрм и мылом, с хорошо проработанной геометрией, но без детализации, тут ты не увидишь пор, пузырьков в сперме и т.п. 0.3 это вообще для детализации окей, но 0.1 уже пиздец артефачный, тут не детализация, а уже пшено разноцветное живёт. Я специально сделал 0.7 -> 0.3 в конце для того чтоб порезаться
>>1583214 Это была ирония конечно же. Эквалайзер не поможет никому. Чтоб вписывать их или эквалайзером двигать, нужно вычислять правильные сигмы, это тебе не 0.9, 0.8 поставить, но с ноды поржал, еально же кто-то двигает отбалды
>>1583218 Для distill не вариант, а на базе можно и подвигать. На этом schedulers разные основаны. Почувствуй силу, сделай свой собственный beta57 в три клика.
>>1583259 У тебя квантование основной модели fp8 или bf16? Там в эту сторону надо смотреть. Но это не гарантия, что починится. Qwen-Image ущербные с момента выпуска. Я пытался ими пользоваться, до тех пор, пока их врождённые дефекты не достали окончательно.
>>1583269 > квантование основной модели fp8 > Qwen-Image ущербные с момента выпуска Да, это так. Как модель для готового пика - она очень хуевая. Как первая ступень - норм, где-то проигрывает, где-то выигрывает. 1 - квен, 2 - клейн, 3 - ZIT. Текст, например у квена лучше получается. Это >>1583243 на ZIT пиздец долго нужно роллить, чтобы все три надписи получить. Клейном даже и пытаться не стоит - если и напишет, то всё остальное поплывет один хуй (пик4).
Пробнул Flux2 dev для edit, и теперь блевать охота от Кляйна. Соблюдает все, консистентность, анатомию, как будто чувствует и видит. И это на турба лоре. Но ждать по минуте... Нахуй так жить..
>>1583494 Я использую FLUX.2 [dev] с момента его выхода. Сначала был разочарован, но когда разобрался с особенностями, стало легче. Особенно, сейчас, когда удалось практически решить проблему с пиксельным мусором VAE Decode в косячном VAE; даже в новом small. Собственно на FLUX.2 [dev] я и ушёл с линейки Qwen-Image, удалив зоопарк Qwen-Image, Qwen-Image-Edit, Qwen-Image-Edit-2509, Qwen-Image-Edit-2511, 8 step lightning LoRAs и дополнительные LoRAs типа samsung для псевдофотореала. С интересом читаю твой пост. Сначала тут толпой во FLUX.2 [dev] кидались экскрементами и пели дифирамбы Z-Image-Turbo (за то, что на кофеварке можно запустить). Потом, кидались фекалиями во FLUX.2 [klein] 9B на фоне Z-Image-Turbo. Спустя какое-то время распробовали FLUX.2 [kelin] 9B как модель для построения исходника для последующей деталировки, которая следует prompt, а не представляет собой игру в рулетку Z-Image-Turbo. Как следствие, поток кала в сторону FLUX.2 [klein] 9B несколько снизился. Приятно при этом было понимать, что FLUX.2 [dev] на пару ступеней выше, а FLUX.2 [klein] 9B этакий тизер FLUX.2 [dev], хотя и с определёнными преимуществами в виде производительности на скромном железе (но знали об этом не только лишь все). Теперь, кто-то ещё смог увидеть FLUX.2 [dev] на фоне FLUX.2 [klein]. Так вот, без Flux_2-Turbo-LoRA_comfyui.safetensors от fal.ai, на 28+ шагов он раскрывается ещё полнее. Упирается всё только в объём потребляемой VRAM и замедление при offload в RAM. Ещё, признаюсь честно, есть у меня с ним некоторые сложности в фотореале (он специфический и не такой, как на Z-Image-Turbo из коробки), а также на FLUX.2 [dev] очень мало LoRAs. Во всём остальном, про Qwen-Image я практически больше не вспоминал (кроме проблемы цветных пикселей в VAE Decode). С Z-Image-Turbo планировал заняться плотнее, со всякими ControlNet и прочими кунштюками (даже что-то попробовал). Но с FLUX.2 [dev] всё это мне стало без надобности. Edit на FLUX.2 [dev] феноменальный по сравнению со всем, что доступно в open-source сегменте.
>>1583523 >игру в рулетку В том то и дело, что лучше наверное получить желаемый результат в dev за 1-5 минут или пытаться за 10 быстрых генераций в дистилах потратив столько же времени чтобы поймать нужный шум, и то с большим шансом получить слоп. Но на цивите 10 лор всего и которые еще и не работают с Turbo.. Бля какой пизедц Но даже все недостатки эти с временем генерации, мыльностью, присущей флюксам и малым сообществом перекрывают лучшие стороны модели - это ее параметры, которые работают почти на уровне корпов. Т.е позволяют делать с объектом редактирования наиболее точные изменения, соблюдая оригинал в полном виде, даже привнося какие то скажем художественные элементы
>>1583532 >мыльностью, присущей флюксам >привнося какие то скажем художественные элементы Давай не будем будить и будем говорить как есть: флюкс мылит. То что он медленный тоже минус, но ладно, это можно потерпеть, когда уже наелся шестилапых. А вот его глянец нельзя устранить ожиданием.
>>1583690 Бля. Я уже понадеялся получить тру онлайн экспериенс на своей картохе. Может быть даже с рекламными банерами и редиректами при нажатии Run. Печалька.
A crashed russian space rocket in a field on the river bank, spring, twilight. Nearby, Yuri Gagarin (russian first man in space) lies dead on the ground, an Easter bunny stands above him with a crowbar in his hand. Easter eggs fall from the sky all around. Everything is covered in blood. Jesus Christ stands nearby and laughs.
>>1584101 > Гагарина никто из них не знает Ну при желании это инпейнтом правится. А вот анатомию сложнее исправить, особенно когда есть переплетения рук, ног и тел, как тут >>1583296. Так что для всего есть свои конкретные задачи. Если бы на zit тайловый контролнет нормально работал, цены бы ему не было для второго прохода, но пока ничего лучше сдохли для этого нет.
Bust-up portrait of Donald Trump with a completely neutral expression, looking straight ahead. He is holding a large half-eaten Easter cake (kulich) with a visible bite mark showing the yellow interior. His lips and the corners of his mouth are messy with white sugar icing and bread crumbs. He is wearing a classic navy blue suit and a bright red silk tie. Detailed skin texture with visible pores, subtle wrinkles, and his signature tanned complexion. Sharp focused blue eyes, hyper-detailed iris, perfectly round pupils. His iconic hairstyle is highly detailed with visible individual strands of hair. Warm cinematic lighting, blurred background of a luxury office. Photorealistic masterpiece, 8k, shot on 50mm lens, f/2.8, raw photography style, sharp focus on the face and the bitten cake.
Подскажите плез, как вносить разнообразие в генерации современных моделях? Это касается и Flux klein и z-image, один и тот же промпт, разный сид а генерации в целом одинаковы. Меняются только детали. Я так понимаю это фишка дистил/турбо моделей, где лоботомия из за запеченных данных или как?
Я где то видел давно постили какие то способы, но мне тогда было не до этого, и хз в каком из 50 тредов назад это было.
>>1584532 >один и тот же промпт >генерации в целом одинаковы >Меняются только детали
Вроде бы как к этому всё время стремились, а не так, чтобы по одному prompt, но на разных seed выдавались вообще не похожие на prompt изображения или дичь.
1) Меняй prompt. Хочешь, переписывай руками, детализируй описаний, хочешь строчи простыни слопа с помощью LLM; 2) Используй latent noise injection с псевдослучайным значением в пустой latent при каждой генерации t2i.
>>1584537 >вообще не похожие на prompt изображения или дичь Да почему же. Ну например ракурс. Если он не прописан, то какие нибудь корп модели или сдхл старый делал разные ракурсы, просто вот так. А тут всегда будет что то одно. И это как пример, есть еще куча всяких других, я думаю мысль понятна
>>1584532 Чем больше промпта, тем сильнее оно будет уводить в одну сторону. Либо добавляй/меняй промпт каждый Run для разнообразия, либо сокращай до нескольких токенов, если хочешь, как на сдохле сиды роллить. 1girl, standing, tank top, big boobs, shorts, sneakers, redhead twin tails
>>1584537 >Вроде бы как к этому всё время стремились Бред. Никто к этому не стремился. Вся диффузия из случайного шума собирается. А раз шум случаен - то и сети должны его случайным образом в заданный промпт интерпретировать. А не так, чтоб ноль вариаций.
>>1584582 >Бред. Это твой пост. Стремятся к coherence и following prompt.
>Вся диффузия из случайного шума собирается. Псевдослучайного, да ещё и с гауссовским распределением.
> А раз шум случаен - то и сети должны его случайным образом в заданный промпт интерпретировать.
Сети учат разваливать описанные изображения из тренировочной базы на шум. А потом, выполнять обратную операцию, по восстановлению изображения из шума, согласно prompt.
В идеале, то, что описал в prompt, то и получишь. А если не получишь, то потому что чего-то не дописал. Когда какие-то моменты в описании явно отсутствуют, тогда проявляется твоя псевдослучайная вариативность.
>>1584586 >Когда какие-то моменты в описании явно отсутствуют, тогда проявляется твоя псевдослучайная вариативность. Ага. Вот то-то и оно, что не проявляется. Если ты промптишь что-то вроде "вангёрл, стэндинг, фром сайд" - никакой "псевдослучайности" на некоторых моделях нет. На любом сиде это всегда будет на 90% одна и та же картинка. Хотя промпт - пустой, и этой "псевдослучайности" должен быть целый вагон, ведь "вангёрл, стэндинг, фром сайд" можно зарендерить околобесконечным количеством способов.
>>1584589 >на некоторых моделях Опять пошло «в некотором царстве, в некотором государстве…». Начали с чего? Вот тебе Z-Image-Turbo (хотя я ей не пользуюсь). Вот тебе prompt и 10 сидов.
>На любом сиде это всегда будет на 90% одна и та же картинка. Не будет.
>Хотя промпт - пустой Пустой prompt, это prompt в котором ничего не написано. (про то, что у него при этом тензор ненулевой, говорить не буду; просто уточняю, что если ты в эту тему полезешь, то мне найдётся что сказать). Если ты хоть какие-то токены указал, модель за них зацепится.
>>1584603 Написал про одну и ту же картинку (я тебе специально выделил твой же текст), а теперь начинается сверхманевренность и жалкая попытка троллинга тупостью. Ну, окей.
Вот тебе, которые смотрят в разные стороны. И ещё кот. Достаточная вариативность?
Помимо того, чтобы насрать в latent (это, я вижу, в Z-Image-Turbo мало влияет), можно насрать ещё и в conditioning.
>>1584606 Нашёл решение за десять минут, хотя не пользуюсь Z-Image-Turbo и не знаю его особенностей. @ Выложил для альтернативно-одарённого. @ Альтернативно-одарённый что-то недовольно бухтит.
Ещё, пользуясь случаем, в тысячный раз повторю, что booru теги и прочее надо оставить во временах SDXL и для новых моделей писать prompt на естественном языке, благо там LLM на text encoder.
>>1584597 >Пустой prompt, это Ох, ну ты серьезно сейчас? "Пустой" в данном контексте - без деталей. Без спецификации этой вангёрл, в какой позе она стоит, что на ней надето, и куда она смотрит. И вот с этим у некоторых новых семейств моделей как раз проблема - если не задавать маниакально спецификации, то практически на каждом сиде у тебя будет одно и то же, почти без вариативности. Старые модели, основанные на SD, такой проблемы не имели. >>1584605 А что она везде азиатка? кек Кот, кстати - проеб. Кота в промпте не было. Вот такого поведения в моделях как раз и надо избегать. >>1584607 >Нашёл решение за десять минут >решение Решение для чего? Что в нормальных моделях должно и так работать, из коробки? Вау, какой молодец. >booru теги и прочее надо оставить Ну будет вместо "1girl, standing, outdoors" - "woman standing outdoors". Для обсуждения роли не играет. Кстати, ты как минимум с двумя анонами считая меня разговариваешь, есличо.
>>1584392 >я в шоке и я тоже, обычно это шизо-алебарда какая-нибудь а-ля соулс-лайк) >>1584219 graybearded Armenian old guy Khachatur sitting on a bench, he's dressed in tank top and shorts, (eye contact), slutty looks,
Пишу промпт сам, выдаёт хуй пойми что с кривым ебалом и светящимися глазами. Взял промпт из примера модели, выдаёт пиздатую няшу-стесняшу. Спиздил части промпта из примера с описанием качества, лица и тд, и вставил в свой промпт- кривое смазанное ебало.
Как вы блять генерируете этих сасных няш, даже в отдалении? У меня что-то адекватное выходит, только если лицо крупным планом.
И ещё, где можно подсмотреть примеры поз и их названия или описания? А то чет сложно мысли в правильные английские термины переводить.
ЧТО НОВОГО АКТУАЛЬНОГО
• Z-Image-Base
• FLUX.2 klein (4b и 9b)
• Z-Image-Turbo
• Flux 2
• Qwen Image / Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/Comfy-Org/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/
► Предыдущий тред ► https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03