К сожалению, значительная часть сохранённых до 2024 г. изображений и видео была потеряна (подробности случившегося). Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Stable Diffusion тред X+189 /sd/

 Аноним 01/05/26 Птн 10:31:52 #1 №1602441 
image.png
image.png
image.png
image.png
Тред локальной генерации

ЧТО НОВОГО АКТУАЛЬНОГО

• Z-Image-Base
• FLUX.2 klein (4b и 9b)
• Z-Image-Turbo
• Flux 2
• Qwen Image / Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/Comfy-Org/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

► Предыдущий тред >>1596721 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Аноним 01/05/26 Птн 10:36:52 #2 №1602443 
image.png
Как подключить beta57 scheduler отдельной нодой без KSampler?
Это нужно добавить beta scheduder и выставить a=0.5 b=0.7 и это будет равноценно пикрилу или есть нюансы?
Спасибо
Аноним 01/05/26 Птн 10:41:47 #3 №1602445 
>>1602443
Нода шедулер симпл, в ней выбери из списка.
Аноним 01/05/26 Птн 10:43:03 #4 №1602446 
>>1602430 →
Про деформацию хорошее замечание. Реально такое есть - начинаешь разбираться и тянуть определенное качество сам и сразу начинает плыть собственное чувство эстетики, вплоть до полной потери эмоций и отклика от эстетики.

Но в этом плане плюс генераций в том, что ты конвертируешь текст в изображение, и эта дистанция принципиально избавляет от непосредственности в процессе создания. Ты не художник, ты манипулируешь художником. Если бы результат на выходе был удовлетворительным - можно было бы не поплыть и кайфовать с этого. Не ты рисовал, ты просто технически пришел к такому результату, где ии рисует тебе то, что радует.
Проблема в том, что этого достичь пока непонятно как
Аноним 01/05/26 Птн 10:49:57 #5 №1602453 
image.png
>>1602445
> Нода шедулер симпл
Нет такой. Есть только такие
Аноним 01/05/26 Птн 10:51:01 #6 №1602455 
>>1602225 →
Какая анима лучше сейчас, preview2 или preview3?
Аноним 01/05/26 Птн 10:53:26 #7 №1602458 
>>1602446
Ценность того что дается легко, во множестве и случайно стремится к нулю чел.

Попробуй в голове составить виденье того чего ты хочешь хотя бы примерно, определиться со стилем, композицией набрать референсов, потом прогнав генерацию и отобрав нужное инпейтом фиксить до идеала - тогда у тебя получится арт ничуть не хуже чем те что получаются от рисобак, без ощущения нейрослопа.
Аноним 01/05/26 Птн 10:53:41 #8 №1602459 
>>1602455
Да. А сам-то как думаешь, если есть 1, 2 и последняя 3?
Аноним 01/05/26 Птн 11:14:03 #9 №1602471 
>>1602443
> выставить a=0.5 b=0.7
Да.
> или есть нюансы
Нет.
Аноним 01/05/26 Птн 11:18:23 #10 №1602472 
image.png
image.png
>>1602459
> думаешь
В этом и была проблема
In progress
У модели приписка base, а про base пишут - модель для обучения или специального применения, не для базовой генерации
Аноним 01/05/26 Птн 12:06:25 #11 №1602501 
image.png
>>1602155 →
> всё остальное уже есть
Аноним 01/05/26 Птн 13:47:21 #12 №1602556 
Есть только одно: маркетинг и продвижение + коллабы.
Песня может быть хуже 10 других похожих, но она сыграет в новом блокбастере и все будут ее любить, потому что ее услышал миллиард человек, а остальные 9 - услышало пара соток анонов.
И так во всем. Картинка из треда и та же самая картинка в каком-то популярном канале на лям подписоты - это разное. А если она распечатана и вставлена в рамку на модной выставке - это еще одна реальность.

На самом деле, положа руку на сердце, чисто картинки/фотки, музон, да и видеоряд месами - все это вне контекста очень сложно оценивается.
Именно поэтому какие-то художники были успешными при жизани, а например Ван Гог нахуй никому не был нужен.
Но как только за картинки начинают платить лямы ништяков - человеки вынуждены оценивать ее уже по-другому.
Один и тот же кадр на странице просто какого-то чела в телеге, и тот же самый кадр но подписанный модным челом и опубликованный в популярном канале - это разные кадры, хотя и одинаковые.
Аноним 01/05/26 Птн 13:56:31 #13 №1602561 
ComfyUI00100.png
16gb vram slop и однобокость не позволяет креативить
Даже банальные тестовые идеи показывают, насколько хуевый контроль и сама модель не знает эстетики. Просто лепит соответствие, максимально не эстетичное
Отдельная беда - это генерация оригинального заднего плана. Она не может просто взять и по промту нарисовать гигантичное футуристичное красивое здание на 2/3 ширины кадра уходящее за пределы экрана. Она будет рисовать офисники и всё в таком духе.
Она будет рисовать картуниш механизм руки
Аноним 01/05/26 Птн 14:27:33 #14 №1602578 
Идея с промт оркестрацией под мультипроход t2i > iti > ... > image
Суть в том, что промт энхансер (пусть даже корп llm) генерит не 1 промт, в расчет на t2i, а разбивает промты в расчет на мультипроход, рассчитывая, что одна идея будет собираться в несколько этапов соблюдая соответствующие правила для каждого прохода. Особенно если t2i и iti модели отличаются.
Здесь простор для экспериментов возникает в:
- выборе подходящих моделей под каждый шаг
- еще более важно: поиск наиболее эффективной и стабильной разбивки (генерить ли фон / главные объекты раздельно, или сразу генерить второе в iti, и тогда что генерить первым)

А вообще, если бы была дообученная под специфичную диффузию модель, которая шарит в композиции и эстетике и знает как это описывать удачными промт-паттернами, это в один проход могло бы улучшить качество. Вот только где это высрать, сами авторы моделеке кроме общих правил промта не делают никаких реально существенных примочек.
Промтить через общие ллм, которые мало что знают про конкретные модели или тем более писать промт самому, не зная ничего о том, что внутри модели это какой то бред ебланский. Неужели нельзя на основе данных об обучении модели, сразу создавать еще лоры или файнтюны для локальных ллм - промт энхансеры, адаптированные под модель. Ведь корпоративные рисовалки наверняка применяют подобные подходы, и оркестрацию многопроходки, и обученный промт энхансер

Где вместо просто Standing, в диффузию уходит подобранное сюжет и конкретную модель нечто вроде "Standing in a relaxed, natural contrapposto stance" или "Standing with a slight lean toward the object".

Вы спросите что мешает это же делать через гпт? То что они с трудом даже справляются с форматом промта специфичной модели. То что они хуево всему этому обучены, "видению" того как лучше и красивее и точному описанию этого на языке диффузии (который они не знают).

Интуитивный промтинг, перебирание слов и формулировок вручную почти не работает, уходят часы на гринд сидов. Это говно из жопы, копинг.
Аноним 01/05/26 Птн 14:32:05 #15 №1602587 
>>1602561
>Отдельная беда - это генерация оригинального заднего плана.
А меня больше прохожие умиляют.
Но надо заметить, что "гигантичное футуристичное красивое здание" это не то описание, по которому нейронка сгенерит то, что ты под этим имел в виду.
Аноним 01/05/26 Птн 14:36:35 #16 №1602594 
>>1602587
> "гигантичное футуристичное красивое здание
Я попробовал около 5 разных подходов. Включая Bladerunner стайл.
Там были гигантские здания во весь экран.

Это второй раз, когда я наталкиваюсь на такую хуйню. Он точно так же не может нарисовать нормальные эффектные массивные руины большого города в заднике.
Есть вероятность, что я просто не зацепил нужную ассоциацию. Пока не знаю, надо отдельно сидеть и экспериментировать, с целью выяснить, могу ли я в принципе получить примерно то, что хотел. Если да, то в такой модели значит надо гриндить шаблоны промтов.
Аноним 01/05/26 Птн 15:00:55 #17 №1602615 
ComfyUItempgbuuz00060.png
>>1602561
Я тебе больше скажу, даже сумарно 40gb vram и 64 ram не дают креативить... потому что нет нормальных локальных моделей которые работали бы с нормальной скоростью и с нормальным датасетом.
Аноним 01/05/26 Птн 15:31:16 #18 №1602632 
>>1602561
>креативить на локалке
Ты ещё через ллм в svg попытайся креативить. Локал только для голых срак создан, всё остальное в банане про, графическое в гпт 2.
Аноним 01/05/26 Птн 16:17:34 #19 №1602671 
>>1602430 →
То, что ты описал, это не деформация, а уровень профессионализма, когда знаешь как должно быть и все косяки автоматом бросаются в глаза. Несколько лет отработал в печатном издании на верстке текста, даже не вчитываясь в текст уже вижу как сверстано, висячие строки, двойные пробелы и тд. А вот проф.деформация начинается тогда когда начинаешь выдрачить там где это не нужно. 3 зеленых пикселя на 2к картинке, сделать идеальную генерацию через 100500 нод без плесени, пережара с первой попытки и тд
Аноним 01/05/26 Птн 18:49:29 #20 №1602768 
>>1602671
Это главный бич всех хобби. Сначала ты без задней мысли кайфуешь для души, а потом превращаешься в желчное чудовище, ищущее зеленые пиксели.
Аноним 01/05/26 Птн 18:54:04 #21 №1602773 
image.png
image.png
image.png
>>1602561
как фиксить этот цифровой шум?
убирать лоры только?
это simple + euler
Аноним 01/05/26 Птн 19:05:58 #22 №1602780 
>>1602773
>>1602768
Идеально совпало. Вся суть™
Аноним 01/05/26 Птн 19:12:08 #23 №1602784 
>>1602780
Не совпало, вспомнил когда читал про зеленые пиксели.
Было бы неплохо знать что на это влияет. Но жертвовать чем то существенным ради этого я бы не стал, и так на лимитах через жопу всё.
Аноним 01/05/26 Птн 19:40:13 #24 №1602803 
>>1602225 →
Есть какие то годные лоры или файнтюны не тематические аниме?
Кроме вот этих что нашлись:
https://civitai.com/models/2414435?modelVersionId=2746109
https://civitai.com/models/2545707/anima-aesthetic-improvement
https://civitai.com/models/2583128/anima-rl
https://civitai.com/models/2505242/scenery-anima
Аноним 01/05/26 Птн 19:48:50 #25 №1602810 
>>1602784
>Было бы неплохо знать что на это влияет.
Кривой VAE FLUX.2, которому не помог выпуск обновления. Загаживает изображение цветным мусором как вотермаркой. Какие-то пиксели более заметны, какие-то менее, но изображение загажено всё.
Не лечится.

Костыли:
1) upsample изображения в более высокое разрешение и его последующее скукоживание, чтобы разноцветный мусор съело в процессе (не поможет если пиксельный мусор слипся и стал более одного пикселя в размере);
2) Удаление пиксельного мусора ценой некоторой потери «цветового разрешения». После VAE Decode изображение разбивается на YCbCr и к каналам CbCr аккуратно применяется bilateral фильтр, а затем каналы снова собираются в выходное изображение.

мимо
Аноним 01/05/26 Птн 20:11:09 #26 №1602831 
ComfyUI00111.png
Анима > Гред рудковский лора > Klein edit
Минусы?
Главный минус, что нет пизды
Аноним 01/05/26 Птн 22:30:18 #27 №1602959 
Так что теперь получается нунчака и не нужна вовсе? Она имела смысл на контексте (ебать, помните, была такая модель?) и вроде всё, а теперь те модели заменены лучшими. Ещё вроде на Qwen Image делал, но то ли не сделал поддержку лор, то ли получалась говнина вместо качества, что сейчас проще на клеин с лорами данриси гонять и делать в разы лучше.

>>1602831
На клейн есть пизда. Скачай.
Аноним 01/05/26 Птн 23:23:26 #28 №1602993 
ComfyUI00207.png
>>1602361 →
>товарищ майор, я чисто кораблики на ней генерю вот пруфы, а эти извращения просто были для теста
Лол, если уж на то пошло, нахуя мне ЕЩЕ ОДНА модель для кума, если с этим и так прекрасно справляются годами отточенные воркфлоу для сдохли? Аниму я скачал для того, чтобы проверить предел её возможностей, и по части генерации кума она выигрывает лишь в том, что из коробки знает больше стилей, чем любой чекпоинт сдохли. При этом имеет фатальный недостаток в виде отсутствия контролнета, а с 0.6В энкодером особо не навоюешь. Так что не, пока анима - для пейзажей и корабликов, а про изврат после релиза 1.0 подумаем. Если контролнет завезут, вроде обещали.

>>1602803
Да не, пока особо ничего интересного нет. Есть неплохой фэнтези-детайлер, эстетик импрувмент ты уже запостил, и еще там была интересная лора на освещение с нестандартными концепциями. Ну оно и понятно, сообщество пока присматривается и ждет полного релиза.
Аноним 02/05/26 Суб 00:14:04 #29 №1603020 
ComfyUItemphojfj00034.png
ComfyUItemphojfj00023.png
ComfyUItemphojfj00025.png
Аноним 02/05/26 Суб 00:34:32 #30 №1603034 
FLUX2dk00026.png
>>1602831
>Минусы
Kleinовский CGI-feel. И его ничем не перебить.
Текстуры, освещение (и, вероятно, заpromptченный dramatic lighting, cinematic lighting) в комплексе воспринимаются как CGI или скриншот из видеоигры.
Возможно ли что-то с этим сделать, непонятно.
Аноним 02/05/26 Суб 01:00:04 #31 №1603048 
>>1603034
> Kleinовский CGI-feel.
То же самое в корп генераторах будет, почти уверен, хоть и пизже по деталям/выразительности.
Щас будто бы не существует моделей, которые могут нереалистичное изобразить фотореалистичным. И это согласуется с главным принципом ллм.
Разве что стиль можно выбрать поинтереснее чем cgi, он и проще
Аноним 02/05/26 Суб 03:02:13 #32 №1603112 
Что по ernie?
Аноним 02/05/26 Суб 03:42:06 #33 №1603122 
>>1603112
Кал про который сразу забыли. Как я писал на релизе, а мне не верили.
Аноним 02/05/26 Суб 03:52:55 #34 №1603123 
1777683176885.png
Аноним 02/05/26 Суб 06:16:49 #35 №1603139 
>>1603112
У Эрни нормально работает инпаинт, со времён сдхл такое впервые вижу.
Аноним 02/05/26 Суб 16:35:05 #36 №1603435 
Вы тут вымерли все...?
Аноним 02/05/26 Суб 16:43:23 #37 №1603442 
image
Скукатв
Аноним 02/05/26 Суб 16:44:51 #38 №1603443 
>>1603442
Движухи захотелось?
Аноним 02/05/26 Суб 17:37:31 #39 №1603496 
изображение.png
Сделай пожалуйста реалистичное фото.

У девушки цвет волос темно желтый.
Аноним 02/05/26 Суб 18:05:13 #40 №1603529 
d18c5641-d0ac-4e6c-a656-aed648836142-0.jpg
>>1603496
Аноним 02/05/26 Суб 18:10:20 #41 №1603535 
image.png
image.png
>>1603496
>Сделай пожалуйста реалистичное фото.
>
>У девушки цвет волос темно желтый.
Gemini 3.1 Flash (первая), Gemini 3 Pro вторая

промпт копи-паст твоего
Аноним 02/05/26 Суб 18:53:13 #42 №1603557 
testing123.jpg
>>1603496
Аноним 02/05/26 Суб 19:03:26 #43 №1603562 
>>1603557
>>1603535
>>1603529
Надо наверно возраст 20 лет в промт добавить.
Аноним 02/05/26 Суб 19:05:00 #44 №1603564 
2993128823950742494358126205072495821518636n.jpg
Можно еще с этим кадром реалистичное фото сделать? Пусть будут желтые волосы, возраст 20 лет.
Аноним 02/05/26 Суб 19:05:43 #45 №1603566 
>>1603139
у turbo или обычного?
Аноним 02/05/26 Суб 19:06:03 #46 №1603567 
image.png
Как промтить такие волосы, то есть прям не афро-афро, а чтоб как на пикриле? (в зетке и кляйне)

>>1603562
>20 лет
ага, желательно... чтобы тебе их не дали)
Аноним 02/05/26 Суб 19:13:12 #47 №1603569 
image
>>1603564
А тебе зачем?
Аноним 02/05/26 Суб 19:15:16 #48 №1603571 
>>1603569
> зачем?
что бы и дальше вайпать засохшую тред-мумию
Аноним 02/05/26 Суб 19:24:43 #49 №1603575 
71+f-VRZw2L.ACSY879.jpg
>>1603569
Да просто интересно как персонаж бы выглядит.

В аниме вот такая внешность, но в манге стиль лучше проглядывается.
Аноним 02/05/26 Суб 19:28:44 #50 №1603578 
image.png
image.png
Сделайте плз что-то среднее между костюмом палача и костюмом пингвина
Аноним 02/05/26 Суб 19:33:11 #51 №1603582 
>>1603578
блядь, пошёл нахуй уже...
Аноним 02/05/26 Суб 21:05:52 #52 №1603629 
>>1603567
Загрузил твой пик в грок, чтобы спросить о прическе, он мне заблокировал все по причине несовершеннолетия субъекта, ну ты и пидор.
Аноним 02/05/26 Суб 21:07:55 #53 №1603630 
image.png
>>1603629
>ну ты и пидор
я то нет...
Аноним 02/05/26 Суб 21:21:50 #54 №1603633 
>>1603629
Грок несовершеннолетие по дойкам определил?
Аноним 02/05/26 Суб 21:27:27 #55 №1603636 
>>1603633
По лицу.
Аноним 02/05/26 Суб 21:30:38 #56 №1603638 
>>1603629
Замажь литсо и опять загрузи, делов то...
Аноним 02/05/26 Суб 21:31:56 #57 №1603640 
a5dad548-a548-4315-823e-8ddd91bf69db-2.jpg
>>1603567
Короче, вот какой промт он все-таки высрал:

woman with voluminous curly hair, 3C-4A curls, long defined ringlets, caramel brown with golden highlights, natural frizzy volume, central parting, tropical wild curls, detailed texture

Зетка по нему рисует пикрил.

>>1603638
Помогло обрезание сисек, его трясло от сочетания сисек с детским лицом.
Аноним 02/05/26 Суб 21:39:48 #58 №1603645 
>>1603640
неплохо, но это не совсем то, там что вроде: burnt out - то бишь типа слегка выгоревшие волосы, у тебя получилась модельная завивка для показа, и нужен какой-то пробивной одноэтажный токен.
Аноним 02/05/26 Суб 21:44:56 #59 №1603647 
130.jpg
144.jpg
>>1603575
Аноним 02/05/26 Суб 22:08:52 #60 №1603653 
>>1583617 →
>Давай кати уже, у меня накопились геймченжеры. Срочно надо поделиться.
И где? Оказывается уже несколько тредов прошло. Были запощены эти игроизменщики?
Аноним 02/05/26 Суб 22:10:09 #61 №1603655 
>>1603139
>со времён сдхл
Ты flux.fill не юзал что ли? Да и нынче вроде edit модели нормально работают с зарисованными областями.
Аноним 02/05/26 Суб 22:47:39 #62 №1603674 
image.png
>>1603640
>>1603567
ох, ебать, какая-же всётаки зетка тупорылая, ничего не знает ни о каких выгоревших волосах. Как же я заебался с ней.

распущенные, свободно спадающие mixed-race afro 4с curly blonde:0.8 fluffy hair with shiny ends
Аноним 02/05/26 Суб 23:09:14 #63 №1603685 
>>1603569
Красиво, можно еще?
Аноним 02/05/26 Суб 23:13:04 #64 №1603687 
>>1603685
>можно
нет, пиздуй в аниме-загон, и там заёбывай всех своими кастратами.
Аноним 02/05/26 Суб 23:25:47 #65 №1603695 
>>1603496
>>1603564
У нас для этого отдельный тред есть, если кто не знал >>1591303 (OP)
Аноним 03/05/26 Вск 00:04:03 #66 №1603705 
>>1603695
Спасибо.
Аноним 03/05/26 Вск 01:17:47 #67 №1603732 
1777760268660.png
Аноним 03/05/26 Вск 01:28:45 #68 №1603736 
>>1603732
она обоссалась или обблевалась? что было в промте?
Аноним 03/05/26 Вск 01:30:49 #69 №1603737 
>>1603736
Открыто для интерпретации.
Аноним 03/05/26 Вск 01:44:56 #70 №1603741 
>>1603737
ну, тыж там чёт писал...
Аноним 03/05/26 Вск 01:59:38 #71 №1603744 
image.png
>>1603736
Кляйн и вроде зетка ещё ссут изо рта и судя по струйке из её рта он промптил обоссывание.
Аноним 03/05/26 Вск 02:08:08 #72 №1603746 
>>1603744
зетка умеет ссать?
может быть она ещё и срать умеет?
Я до сих пор не пробовал, кстати...
Аноним 03/05/26 Вск 02:16:46 #73 №1603747 
>>1603741
Слюна стекает на платье. Лужа под ногами.
Аноним 03/05/26 Вск 11:05:21 #74 №1603858 
https://www.reddit.com/r/StableDiffusion/comments/1t23isk/lciet_longcat_image_edit_turbo_lightweight_and/

Длиннокоты едит модель выпустили
Аноним 03/05/26 Вск 11:12:34 #75 №1603861 
image.png
image.png
>>1603858
Не могу пройти.


И еще вопрос: кто-нибудь тут реально делал инпейнт на хромофуре? Мне другой агент советует фордж, мол, меньше ебли будет, илюха типа все уже настроил. Спасибо за ответ, а то не знаю что пользователю сказать.
Аноним 03/05/26 Вск 11:14:36 #76 №1603863 
image.png
Аноним 03/05/26 Вск 11:15:06 #77 №1603864 
image.png
>>1603861
Ладно, я поторопился насчет выпустили, 3 месяца назад. Но гуфы вот недавно подъехали с воркфлоу на комфи
https://huggingface.co/vantagewithai/LongCat-Image-Edit-Turbo-GGUF
Аноним 03/05/26 Вск 11:19:59 #78 №1603866 
>>1603864
Все говорят что говно и приведенные примеры это что вообще, я такое на сд1,5 делал когда контролнеты появились. Приложи раздетую юаюу с пиздой тогда поговорим.
Аноним 03/05/26 Вск 12:05:11 #79 №1603894 
Охуенно, flux 2 klein промт гайд страница просто выпелена, и .md файл туда же. Щас где официальный гайд и принципы брать?

Flux 2 гайды написанные для корпоратной версии это говно из жопы и близко не адаптированное для klein, к тому же написанное бабой.

Мб у кого сохранился .md файл?

https://docs.bfl.ai/guides/prompting_guide_flux2_klein
https://docs.bfl.ai/guides/prompting_guide_flux2_klein.md
Аноним 03/05/26 Вск 13:54:28 #80 №1603952 
>>1603894
в кеше яндекса что то сохранилось, попробуй оттуда вытащить
Аноним 03/05/26 Вск 14:19:47 #81 №1603968 
>>1603952
https://web.archive.org/ только веб страница, которая еще валит сервис, но я сохранил её
А вот .md файла который там был сохранен нет.

> в кеше яндекс
я не могу найти где это и что
Аноним 03/05/26 Вск 14:50:16 #82 №1603987 
>>1603894
Вчера родился чтоль?
https://web.archive.org/web/20260420011101/https://docs.bfl.ai/guides/prompting_guide_flux2_klein
Аноним 03/05/26 Вск 14:51:54 #83 №1603989 
image.png
>>1603987
Я её уже сохранил. Страница через 5-10 секунд редиректит в пикрил
И я сказал что там еще был https://docs.bfl.ai/guides/prompting_guide_flux2_klein.md файл с текстовым форматом гайда. Вот его и не получается найти.
Аноним 03/05/26 Вск 15:20:24 #84 №1604005 
>>1603989
Пздц, теперь всю оставшуюся жизнь ты будешь думать, что у тебя ничего не получается именно из-за потери гайда, а не потому что руки кривые. Ну, может так и легче жить даже.
Аноним 03/05/26 Вск 16:09:30 #85 №1604032 
>>1603989
Норм шиза
Аноним 03/05/26 Вск 20:21:28 #86 №1604173 
>>1604005
>>1604032

Я этот мдшник скармливал ллм как доп. контекст и основа для промтинга. В мдшке в отличие от страницы нет лишней хуеты выжирающей токены и отвлекающей внимания.
Кроме того её составляли сами разрабы, и ниче лучше для исходной точки нет. А ты можешь себе коупить, что ты знаешь лучше, по факту ты в душе не ебешь как и на что лучше реагирует модель.
Для flux.2 dev вообще есть своя модель для promp upsampling, которой нет для клейна, и она в отличии от гпт и гемини знает че делать.
На клейне кроме соло рыла с пиздой в t2i ничего не создать, кроме голимого слопа.
Аноним 03/05/26 Вск 20:31:36 #87 №1604182 
>>1604173
Скиллишью
Аноним 03/05/26 Вск 22:41:53 #88 №1604262 
image.png
>>1603866
Вот еще сравнение с клейном. ТЛДР - например можно требовать раскрашивать только определенные части тела.

https://www.reddit.com/r/StableDiffusion/comments/1t2us8t/lciet_and_klein9b_a_quick_fair_comparison/

длиннокот более строго следует промпту. а качество мб файнтюнами поднимут. свою нишу найдет короче
Аноним 03/05/26 Вск 23:08:10 #89 №1604281 
>>1604173
>скармливал ллм как доп. контекст
Допустим, а где же 2 картинки на одном сиде, с одним и тем же промтом, одна с мдэшником, а другая без, и типа, смотри ребзя, какая разница охуительная, какое понимание промта, расстановка приоритетов, и всё такое? Есть шанс увидеть такое? Или я спросил это у тебя без должного уважения?
Аноним 03/05/26 Вск 23:09:05 #90 №1604284 
>>1604182
покажи скилл на генерации клейна, что то кроме фоток бессмысленно позирующих тян
Аноним 03/05/26 Вск 23:09:25 #91 №1604285 
>>1604182
Поиск философского камня в 2к26)
Аноним 03/05/26 Вск 23:10:45 #92 №1604288 
>>1604281
Я и не брался доказывать ценность мд, но теперь я его в принципе не могу достать и это важнее, чем размышления нужен он или нет.
Аноним 03/05/26 Вск 23:15:34 #93 №1604293 
>>1604284
Это когда есть что показывать) А нахуя? Можно просто сыпать заумными словечками, цитируя бред нейронки.
Аноним 03/05/26 Вск 23:18:22 #94 №1604295 
>>1604262
Брат, не поверишь, я только этим и занимаюсь, что раскрашиваю фрагменты лиц, я дорвался до этого, так до сих пор остановиться не могу.
удаление цифрового шакала после Кляйна Аноним 04/05/26 Пнд 02:24:37 #95 №1604370 
smooth-and-soft-v0-q1fb0zffsuyg1.webp
Flux2-Klein00110.png
что писать в промте после 1-й проходки? Пробовал: remove artefacts of digital compression - не то чтобы это прям сильно помогло, возможно контуры стали чуть чётче но внутри них координально ничего не поменялось. Вообще, вторая проходка гарантированно наваливает артефактов, вытаскивая уже имующиеся и добавляя свои, как с этим бороться не превращая картинку в картун?
1. оригинал
2. убрал лишнее, сделал Piper чуть моложе (не сильно, не ссыте, нах)
3. ваш вариант, с вашей рецептурой
Аноним 04/05/26 Пнд 04:28:40 #96 №1604408 
>>1604262
>качество мб файнтюнами поднимут
Спустя 3 года впопенсорса можно уже понять что ничего никто и никогда не поднимет. Вышел кал - значит и будет кал. Максимум данриси бустанет фото качество или дислит выйдет и на этом всё.
Аноним 04/05/26 Пнд 10:16:57 #97 №1604555 
изображение.png
>>1604370
Под "удали артефакты" поднимается очень сложный процесс "удали потери сжатия, чтобы после удаления потерь что-то появилось, додумай сам".
Для сетки лучше говорить "сделай ретушь/реставрацию", "повысь резкость", "сделай реконструкцию текстур". В предельном случае "преобразуй картинку в идеальное студийное RAW фото", но надо будет наваливать всяких уточнений про "сохрани лицо узнаваемы и так далее"

Про многошаговые аретфакты - нихуя не поделать. Можно попробовать не дрочить VAE и сохранять исходный латент. Но имхо проще в конце просто попросить перегенировать всё без шакалов, пусть и ценой потери сходства с источником.
удаление цифрового шакала после Кляйна Аноним 04/05/26 Пнд 10:26:52 #98 №1604568 
2026-05-0414-21-361246-2.png
2026-05-0417-13-338447.png
>>1604555
я попробую всё из того что ты перечислил, оегче конечно было бы достать исходную картинку в идеальном качестве, но зачастую референс запредельно шакальный, спасибо за подсказку.

я тут было вспомнил молодость и прогна на сдохле имг2имг с денойзом 6.5, слегка уточнил мордашку (с лорой перса и без) и заролил поней анус.
Аноним 04/05/26 Пнд 13:40:27 #99 №1604692 
Собираюсь тестить эту лору https://civitai.red/models/1972981?modelVersionId=2818111 с обычными klein моделями.

Какой text encoder нужен, если базовый не будет работать?
Есть flux2-klein-9b-uncensored-q8_0.gguf - не подойдет?
i2i режим тоже буду юзать
Аноним 04/05/26 Пнд 14:06:02 #100 №1604707 
Выкладывать nsfw незаконно ведь публично? под статью порнография попадает не? До самого последнего момента об этом не задумывался, хотел выложить и приуныл
Аноним 04/05/26 Пнд 15:37:46 #101 №1604775 
>>1604707
Так и карандаши нельзя продавать. Ведь при помощи их можно нарисовать порнографию с малолоетками.
Аноним 04/05/26 Пнд 16:06:41 #102 №1604803 
>>1604707
Получается что так. Забыл когда мог даже ради рофла что-то выложить в картинках, даже карикатуры. Доебаться смогут ко всему, сказав что это не 1000-летный суккуб, а
Аноним 04/05/26 Пнд 16:11:31 #103 №1604810 
image.png
Как заставить клейн едит не рисовать или убрать блики от фронт-софтбокса?
У него просто везде софтбокс студийный.
Аноним 04/05/26 Пнд 16:33:05 #104 №1604828 
image.png
>>1604707
Аноним 04/05/26 Пнд 19:34:18 #105 №1604911 
>>1604810
студийное фото в негатив пробовал?
Аноним 04/05/26 Пнд 20:06:50 #106 №1604933 
>>1604810
В процессе edit или t2i? Edit сложнее, там можно попробовать relight scene with practical lighting. Скорее всего не поможет. При t2i на klein не давать в prompt цвета в явном виде, писать very soft natural lighting, practical lighting, very dim lighting, dark silhouettes.

>>1604911
У FLUX.2 нормального рабочего negative prompt нет by design и разработчики прямо указывают на гимнастику с positive prompt для обхода.
Аноним 04/05/26 Пнд 21:16:44 #107 №1604944 
>>1604933
Блики изначально дает cinematic shot, но он же неплохо трансформирует в реалистик вместе адекватным освещением/цветами. Проще изначально как то этого избегать

Частично лечится natural lighting RAW shot, но с металлических объектов блик не уходит.

Еще заметил, что клейну катастрофически нехватает лоры на реалистичные текстуры и лэндскейп. Он может в текстуру кожи и лицо на файнтюне, но вот материалы и лэндскейп любой нестандартный - сразу в лучшем случае cgi, но чаще семириал.
Аноним 04/05/26 Пнд 21:44:23 #108 №1604958 
изображение.png
изображение.png
изображение.png
изображение.png
Заключительные попытки в Эрни
Аноним 04/05/26 Пнд 22:43:08 #109 №1604975 
>>1604958
Ну чет такое себе...
Аноним 05/05/26 Втр 02:28:26 #110 №1605069 
FLUX2dk00025.png
Аноним 05/05/26 Втр 02:35:06 #111 №1605070 
>>1605069
Линолеум прям как у меня.
Аноним 05/05/26 Втр 11:47:19 #112 №1605177 
посоветуйте реалистичную nsfw модель для картинок.
Аноним 05/05/26 Втр 11:52:22 #113 №1605181 
https://github.com/capitan01R/Comfyui-flux2klein-Lora-loader/blob/main/README.md
Кто-то пользовался уже? Что думаете?
Аноним 05/05/26 Втр 12:02:45 #114 №1605191 
>>1605177
Realistic_image_model.safetensors
Аноним 05/05/26 Втр 12:33:19 #115 №1605204 
>>1605191
Он просил нсфв.
Аноним 05/05/26 Втр 13:13:02 #116 №1605234 
5729bc.jpg
>>1605204
Аноним 05/05/26 Втр 13:52:12 #117 №1605262 
ComfyUItemprcaih00032.png
Посоветуйте модель + лора + промт стиля который может красиво и детализированно (не SD мазня) рисовать относительно сложные сцены с хорошей фантазией (несколько проработанных объектов + проработанный бэкграунд). Какой-нибудь семи риал, либо digital painting в реализме.

Анима плывет свыше 200 слов и часто плохо понимает пространственные инструкции. Пока сижу с лорой greg rutkowski, неплохо, но стабильность низкая, много мазни, сложно контролировать и не понятно как уточнять стиль, с этой лорой.
Аноним 05/05/26 Втр 15:41:09 #118 №1605332 
image.png
>>1604707
ейроскуф есть там все мужики свои
Аноним 05/05/26 Втр 15:41:48 #119 №1605333 
>>1605262
зит тоже не одупляет
Аноним 05/05/26 Втр 16:00:26 #120 №1605348 
image.png
image.png
image.png
image.png
Короче, мужики ))) вопрос такой ебаныйрот поставил эту изю комфуи, обматался всем чем положено, вчера там, зит себе скачал, енкодер етот квеновский, еще какую-то хернюшку контролнет короче, сперва неудачные ворфлов собирал, и пару нерабочих еще нашел, ну тупо, но потом короче натянул https://github.com/scraed/LanPaint (сам зит работает, базару ноль, быстрей сидрикселя, промптится немножко на русском хоть и туповат), и вот тут хуйня такая на пиках. Пик 1 - я после 1 суток попыток. Пик 2 - делаю маску в дефолтном менеджере масок. Загружаю все это на пик 3 (да я там выпилил какую-то лору на пиксель арт, но она ни на что не влияла). И на выходе я получаю дрисню времен первой поняхи импейнта. Настройки семплера ланпейнета - я крутил. Можно сделать чуть лучше, но не сильно это влияет. Я заметил что хитрый пидор в примерах ланпейнета не красил какие-то участки, а замазывал полпикчи сразу, и так - да что-то там, с плохо впихнутым в маску оно генерит (у меня там плотная кистть но на неплотной там какие-то мультики). Тут еще хорошо получилось, неудачнфый пример. Но как присмотритесь там шум есть, как будто песка насыпали. И в зависимости от пика это может быть какой угодно мусор - полупрозрачная ткань, бумсы, песок камни полный пиздец. Я не понимаю, даже, это пережарка или недожарка? Все крутил, все равно сорт оф хуйня на выходе.

Объясню свою конечную цель: промптить естественным языком. Разумеется я вот здесь и сейчас могу получить хороший результат на сидиэкселями, но 4 года промптить тегами немножко заебало. И не пишите что там надо по английски писать и прочий бред, я все это знаю и я знаю чё я делаю, хуйня тут выходит не поэтому. Дело в том что это именно зит а не зимага бейс? Мне качать 60 гиг надо чтоб проверить? Еще я видел есть зимага АЛЛОгараж
, она лучше/хуже? С виду там васянка со встроенными лорами времен первых порнотюнов на сидиксель.

Помогите короче мужики, тут без бутылки не разобраться и с ней тоже. У железного дурака спрашивал, он ту еще хуергу несет. Про лору на детали тоже не надо, я видел там юзают, но должно же нормально изкоропки быть, тут хуйня какая-то явно происходит. Цензуры встроенной я тоже не заметил, это не похоже на сопротивления модели, у меня есть ворфлоу где просто текст ту имидж там все генерится сисик-писик, как может, но генерит.
Аноним 05/05/26 Втр 16:16:24 #121 №1605360 
>>1605348
>Дело в том
что для edit не нужно насиловать ЗИТку, а нужно взять flux2.klein 9b distil.
Аноним 05/05/26 Втр 16:28:20 #122 №1605363 
image.png
>>1605360
Мне показалось, что там в будущем будут норм тюны и как бы она быстро запускается как сидиксель.

>flux2.klein 9b distil.
А это наверное что-то тяжелое уже. У менявсего 16гб врама и 32 рама. Не хотелось бы по минуте ждать. Но, есть какие-то на примете готовые воркфлоу для инпейнта? А то на цивитае даже там ну статьи какие то сумбурные, даже ланпейнт я на гите искал уже, а на реддите просто говна за щеку навалили неработающего.
Аноним 05/05/26 Втр 16:29:06 #123 №1605365 
В идеале, конечно, я бы хотел инпейнтить на хроме. ^_-
Аноним 05/05/26 Втр 16:31:50 #124 №1605368 
image.png
Теперь меня как будто энкодер квеновский цензурить начал. Такое может быть?
Аноним 05/05/26 Втр 16:33:32 #125 №1605370 
>>1605363
нет, оно очень легкое и быстрое, легче квен едит. в твой конфиг со свистом залетит в 5 секунд на картинку
Аноним 05/05/26 Втр 16:38:10 #126 №1605374 
>>1605370
Ок, спосеба, попробую. А то я в восприятии флюкса застрял на временах его старта кляйна этого, много свободного доступа было для онлайн моделей, а сейчас все прикрутили и на фокусе сидеть уныло чот.
Аноним 05/05/26 Втр 16:51:15 #127 №1605379 
>>1605360
> flux2.klein 9b distil.
Дистил не может в реалистичную текстуру кожи. А лор к этому нет, разве что снофс какой-нибудь, который сам по себе плоховат

> А это наверное что-то тяжелое уже
Он как раз в 4 степа работает по секунде. Жаль что он хуйня
Аноним 05/05/26 Втр 16:54:01 #128 №1605381 
>>1605363
>готовые воркфлоу для инпейнта
Там не нужны какие-то хитровыделанные воркфлоу для старта. Берешь вф i2i из темплейтов - и уже можно редачить через промт. Если нужна маска, то в это же вф добавляешь пару нод. В твое железо спокойно лезет 9В, base-версию не качай, как по мне оно не стоит того, чтобы пердолится на 20+ шагах. Дистил делает тоже на 4-8. 8 шагов - примерно 15сек, у меня такие же статы 16/32
Аноним 05/05/26 Втр 17:00:26 #129 №1605384 
>>1605379
>хуйня
Альтернативу предложить сможешь? Нет? Я так и думал
Аноним 05/05/26 Втр 17:07:11 #130 №1605387 
image.png
>>1605348
клейн работает, но тоже не сразу.

Мне наоборот инпейта не хватает в клейне, т.к. он очень туго реагирует на промт в эдите. Хотелось бы выделить область с которой он должен работать.

>>1605384
Я уже писал в треде про альтернативу много раз. Тот кто в глаза не ебется видел. А кого устраивает дистил - сидите на нем. Я про дистил забыл. Толку от скорости мало, когда это слоп без нормальных лор
Аноним 05/05/26 Втр 17:15:51 #131 №1605391 
>>1605387
>писал в треде много раз
Хз, может это было в каком-то другом треде, лично я не видел. Квен, как по мне, тяжелее и хуже. Я его вообще удалил.

>Хотелось бы выделить область
У клейна нет проблем с масками, даже получше, не перерисовывает всю картинку.

>без нормальных лор
Тренируй лоры сам кто? я?
Аноним 05/05/26 Втр 17:19:37 #132 №1605395 
>>1605391
> Хз, может это было в каком-то другом треде, лично я не видел.
В прошлом. Тот же клейн просто не дистил

> Тренируй лоры сам
Не умею пока, рано мне
Аноним 05/05/26 Втр 17:20:07 #133 №1605397 
>>1605379
> Дистил не может в реалистичную текстуру кожи

ничего не мешает сделать рефайн отредактированного изображения в модели где есть реалистичная кожа, тот же зит
Аноним 05/05/26 Втр 17:36:03 #134 №1605403 
>>1605395
>клейн не дистил
У меня единственный вопрос к базе - нахуя я это скачал. Потестил, КАРДИНАЛЬНОЙ разницы не увидел. Возможно она и лучше, но генерировать по минуте уже не хочу.
Аноним 05/05/26 Втр 17:42:59 #135 №1605405 
>>1605403
База еще хуже дистила. Кто бы что не говорил - не увидел преимуществ в t2i в fp8
Аноним 05/05/26 Втр 17:58:11 #136 №1605409 
image.png
image.png
image.png
image.png
>>1605387
>клейн работает, но тоже не сразу.
Что это значит? И еще вопрос: если я в воркфлоу хромофур подсуну - будет инпейнтить? Он же тюн флюкса.


А на зите я тут такую хуйню заметил. Там был другой семплер, адвансит. Но почему так? Написано везде что можно с ним только жесткую кисть использовать на маске. Но я вижу он не учитывает контекст картинки а инпейнтит строго в окне отмеченном не захватывая края (не помню как это по вумному называется). я зит мучаю потому что он уже скачан, конечно.
Аноним 05/05/26 Втр 18:28:35 #137 №1605424 
>>1605409
>почему так
1. Очевидно, что нет ноды, которая размывает края маски на заданные размеры
2. Очевидно, что нет ноды, которая тянет контекст с загруженного имиджа

>я зит мучаю
чтрадай
Аноним 05/05/26 Втр 18:30:34 #138 №1605426 
>>1605409
Ну и да, у тебя скачан LanPaint - идешь на гитхаб и читаешь про настройки, там все написано
Аноним 05/05/26 Втр 19:00:28 #139 №1605436 
>>1605424
>1. Очевидно, что нет ноды, которая размывает края маски на заданные размеры
>2. Очевидно, что нет ноды, которая тянет контекст с загруженного имиджа
>
Очевидно ты пишешь хуйню.
Аноним 05/05/26 Втр 20:33:45 #140 №1605480 
>>1605409
А нахера ты эту полоску внизу оставил, чтобы что?
То, что лапша не умеет нихуя толком в импЭйнт, это как бы уже общее место, те кто кричит, что у тебя типа скилишью: >>1605436
, ещё ни разу не проиллюстрировали свой собственный скилл на хотя-бы удобоваримом примере. Интерфейс у импаинт-ксамплера чудовищный, половина из крутилок нихуя не даёт (или тупо не работает), а другая половина при всех вариантах выдаёт хуету а-ля 1.5 в лучшем случае. Не теряй своё время с этой ебалой, юзай эдит Кляйн, или Фотошоп + фокус, если нужно побырику что-то наролить..
Аноним 05/05/26 Втр 21:01:05 #141 №1605498 
>>1605480
>А нахера ты эту полоску внизу оставил, чтобы что?
Чтобы посмотреть.

>То, что лапша не умеет нихуя толком в импЭйнт, это как бы уже общее место, те кто кричит, что у тебя типа скилишью:
Вот и я не понимаю, почему оно так жестко по маске, если я туда еще сверху костыльной чуши накидаю, то это только утяжелит воркфлоу, полагаю.

>Не теряй своё время с этой ебалой, юзай эдит Кляйн
Ты имеешь в виду полное изменение всей фотографии? Потому что выше вроде бы про инпейнт говорили.
Аноним 05/05/26 Втр 21:02:33 #142 №1605499 
Вообще, еще дело в руках. У меня стоит люструспони тюн какой-то, он жестко проебывает руки, рисует даже на детализации в фокусе какие-то микроанимешные закорючки вместо рук.
Аноним 05/05/26 Втр 22:07:29 #143 №1605534 
image.png
>>1605498
>Ты имеешь в виду полное изменение всей фотографии?
пример: >>1604370
ты просто в промте пишешь что нужно сделать, в данном случает я написал, что нужно убрать нижнее бельё и обувь оставив всё как есть, а затем ролишь, м выбираешь лучший вариант. Мало того, можно ретушировать (довести до кондиции херовый референс), если тот недоступен в хорошем качестве, здесь анаон говорит о том, что именно нужно: >>1604555
Аноним 05/05/26 Втр 22:12:02 #144 №1605539 
082.jpg
>>1605498
Аноним 05/05/26 Втр 22:14:58 #145 №1605541 
>>1605498
>про инпейнт
зачем тебе импейнт, если можно без него?
Повоторяю, если тебе там приспичило отредактировать что-то по маске, то есть прекрасный инструмент для этого, это Фокус, больше нихуя не надо, выбираешь модель которая умеет в то, во что ты хочешь и подходит по гамме к референсу и хуяришь... там всего 2 ползунка тебе нужно, это: денойз и контест, чем выше контекст тем лучше будет результат, но это всегда качели, большое выделение снижает качество рисовки а высокий денойз добавляет шизы, ищешь золотую середину, помогаешь фотошопом.

>>1605539
да-да, это тот самый пример, когда сигна соответствует исполнению)
Аноним 05/05/26 Втр 22:45:08 #146 №1605555 
image.png
>>1605534
> а затем ролишь
Уже маркер того, что не оптимальный метод. В зависимости от сложности условий - иногда % успеха может уходить к 1к50.

Можешь показать воркфлоу клейн+импейнт?
У меня с прошлого треда бенчмарк, с которым клейн едит в общем режиме почти не справляется. 5ый палец убрать с бутылки, да и третью коленку тоже не так просто.
Такую хуйню только импейнтом либо заново генерить
Аноним 05/05/26 Втр 22:47:02 #147 №1605556 
>>1605534
А как снофс работает со стандартным текст энкодером с цензурой?
Разве квен 3_8 не должен быть зацензурен, что бы игнорить порно-промты?
Смысл тогда в uncensoured текст энкодерах? Я зачем то выкачал такой специально для клейна. Хуета непонятная уебская повсюду
Аноним 05/05/26 Втр 22:50:21 #148 №1605559 
image.png
>>1605534
так там нет ворфлоу
Аноним 05/05/26 Втр 23:19:23 #149 №1605578 
Дальше сам.png
>>1605555
Аноним 05/05/26 Втр 23:21:58 #150 №1605579 
>>1605578
нет, ты решил одну проблему и создал новую

Хотя как ты пофиксил мотик я не знаю.
Аноним 05/05/26 Втр 23:45:38 #151 №1605584 
>>1605579
>создал новую
мне похуй

>как ты пофиксил мотик я не знаю.
я тебе подробно расписал в прошлом треде, что тебе нужжно сделать, но ты промухал как всегда.
Аноним 05/05/26 Втр 23:57:51 #152 №1605588 
image.png
>>1605579
> пофиксил мотик я не знаю
Загадка века. Премию Тьюринга дадут разгадавшему.
Аноним 06/05/26 Срд 00:05:30 #153 №1605593 
>>1605588
>Загадка века
разгадка в прошлом треде.
Аноним 06/05/26 Срд 00:06:23 #154 №1605595 
ComfyUItempvpcpi00001.png
>>1605584
>>1605588
Аноним 06/05/26 Срд 01:16:09 #155 №1605633 
>>1605556
>А как снофс работает со стандартным текст энкодером с цензурой?
Нормально работает, потому что его, text encoderа, задача не делать inference, а перегнать слова-токены в эмбеддинги.

>Смысл тогда в uncensoured текст энкодерах?
Ну хотя бы в том, чтобы проигнорировать всё то, что о них писалось, а потом упорно продолжать есть кактус, because you can.
Аноним 06/05/26 Срд 01:36:49 #156 №1605649 
>>1605556
>Смысл тогда в uncensoured текст энкодерах?
я сравнивал, разницы никакой, снофс говно, концепты у него поневские, уёбищные с проёбами в анатомии, порно ты один хер не сможешь на нём делать, для ебли нужен wan 2.1-2.2 с nsfw лорой, ни zit ни клфйн не умеют в порнуху.
Аноним 06/05/26 Срд 01:56:13 #157 №1605664 
>>1605556
Я тебе вот чего скажу, что снофс, что кляйн бесполезная хуита, разве что в кляйн-эдит снять с кого-нибудь трусы, всё... Композиционно кляйн абсолютно беспомощен, все его концепты из коробки - уебанские. Поэтому хуйнёй не занимайся, ковыряй zit, он гораздо интересней.
короткие стрижки zit Аноним 06/05/26 Срд 03:56:55 #158 №1605691 
ComfyUItempmdhht00011.png
ComfyUItempmdhht00007.png
ComfyUItempmdhht00008.png
1. very short bob cut
2. buzz cut
2. side parted pixie cut
бля... Это всё, ребзя. НИкаких гарсонов, никаких андеркатов. если у кото-то что-то получалось, поделитесь...
Аноним 06/05/26 Срд 06:55:27 #159 №1605724 
>>1605691
> гарсонов
fuzzy short woman haircut
> андеркатов
slick back man haircut + бритые виски немопню как
пробуй просто описать, две недели блять уже дрочишь свои волосы
Аноним 06/05/26 Срд 07:26:59 #160 №1605732 
>>1605724
>две недели блять уже дрочишь свои волосы
ну так они-ж всё никак не отрастут
щас попробую...
Аноним 06/05/26 Срд 08:01:32 #161 №1605743 
1.png
2.png
Аноним 06/05/26 Срд 08:04:23 #162 №1605744 
image.png
>>1605724
>fuzzy short woman haircut
1. ну, как бэ ок, выглядит так, будто у buzz cut слегка отрасли волосы. slick back не работает, зетка просто рисует хвост сзади и какие там виски уже никого не ебёт.

Предлагаем ещё варианты!
Аноним 06/05/26 Срд 08:30:53 #163 №1605754 
>>1605743
Ну наконец-то что-то хорошее в треде!
Аноним 06/05/26 Срд 08:44:15 #164 №1605758 
>>1605754
себя не похвалишь - ходишь как обосранный
Аноним 06/05/26 Срд 10:07:53 #165 №1605778 
изображение.png
>>1605691 >>1605744
Ты застрял в своём узком тезаурусе из 3 слов и пытаешься из него что-то толковое выжать. Хотя когда ты приходишь к Инге Михайловне в парикмахерскую Молодость ты ей не говоришь "side parted pixie cut", сидишь с покерфесом 30 минут, и в конце говоришь "я не это хотел". Ты говоришь "как раньше" или показываешь картинку из журнала "как тут", она видит, что тут 4 выбрить, там 8 оставить, здесь прорядить, там протушевать, зачесать, здесь на уровне виска, тут до плеча. То есть наваливаешь кучу дополнительного констекста, которого в названии из трёх слов не хватало.

Потому просто возьми референс который тебе надо. Скорми его в vision llm, тот же квен, и попроси максимально подробно описать причёску в тех терминах, в которых text encoder мыслит.
И уж когда ты начнёшь писать промты в той же форме что и текст энкодер, тогда можно делать выводы о пригодности-непригодности самой модели.


A cinematic close-up portrait of a young Caucasian skinhead girl named "Jax," embodying a raw, rebellious street spirit. She has a distinct skinhead hairstyle: the back and sides of her head are completely shaved smooth, while a thick, straight, blunt-cut dark fringe (bangs) covers her forehead, framing her intense gaze. Her expression is one of defiant indifference and stoic confidence, with a piercing look directed at the camera. A small beauty mark is visible on her cheek. She wears a faded black oversized punk band t-shirt and small silver hoop earrings. The camera angle is a slight high-angle shot, creating an intimate yet confrontational perspective that emphasizes the geometry of her haircut and the intensity of her eyes.
Аноним 06/05/26 Срд 10:50:53 #166 №1605803 
>>1605778
> в которых text encoder мыслит.
твой квен может мыслить всё что ты захочешь, но если модель не занет что это, то нихуя не и будет. И если я буду тратить на описание причёски по 20-30 слов, то у меня не останется ничего для основного промта. профессура, ёптить...
Аноним 06/05/26 Срд 10:53:14 #167 №1605807 
>>1605778
>3 слов
обычно это одно слово: канадка, или полубокс, или полька, одно слово.
Аноним 06/05/26 Срд 10:56:29 #168 №1605813 
>>1605778
> в vision llm
Я другой чел. А поподробнее можно? Откуда модель знает в каких терминах мыслит текст энкодер? Что за vision llm?
Есть какая то локальная модель, которая хорошо промт-энхасит, лучше чем фри гпт/гемини, которые просто не имеют ни фантазии, ни художественного видения, только хуевые шаблоны первые попавшиеся.
Аноним 06/05/26 Срд 10:58:13 #169 №1605817 
>>1605813
>в каких терминах мыслит текст энкодер?
хороший вопрос.
Аноним 06/05/26 Срд 11:00:30 #170 №1605818 
изображение.png
>>1605803
> но если модель не занет что это
Ещё раз. Бессмысленно рассуждать о диффузионной модели, если ты с текстовым энкодером говоришь на разном языке
> не останется ничего для основного промта
Ну очень жаль, что ты всё ещё мыслишь категориями полторахи, и пытаешься делать какие-то выводы о сегодняшних моделях
Аноним 06/05/26 Срд 11:08:01 #171 №1605822 
изображение.png
>>1605813
Вот смотри. У тебя в качестве текст энкодера используется вполне конкретная LLM. Совершенно нормально взять этот же квен и спросить его "вот картинка, расскажи какими бы словами ты её описала". Чтобы она извлекла из себя, какие у неё текстовые конструкции совпадает с конкертными визуальными токенами. Не отгадывать путём проб и ошибок, а в лоб спросить текстовую модель что она знает.

Целиком реверс промт конечно делать квеном тупо. Но спросить его "какими словами можно описать такую причёску, такую одежду, такой ракурс, такое цветовое решение" можно и нужно.
Аноним 06/05/26 Срд 11:08:37 #172 №1605823 
>>1605818
> категориями полторахи
Это не я мыслю это зетка так работет. там количество токенов в промте чуть больше чем в сдохле. ох уж эти теоретики! твоё описание причёск годится только для выебонов. но никак не для реальной работы.
Аноним 06/05/26 Срд 11:10:41 #173 №1605826 
>>1605822
Вот-вот, давай, спроси...
Аноним 06/05/26 Срд 11:11:30 #174 №1605828 
>>1605823
>там количество токенов в промте чуть больше чем в сдохле
Количество токенов на входе бесконечное. Есть ограничение на размер скользящего окна и на размер выходного эмбеддинг вектора.
Аноним 06/05/26 Срд 11:14:02 #175 №1605829 
На улице +26, генерить перехотелось.
Летом генерить с кондеем в комнате получается по стоимости за электричество как токены во flux 2 max. Либо терпеть жар 35С в комнате
Аноним 06/05/26 Срд 11:15:45 #176 №1605831 
>>1605828
бла-бла-бла...
а на деле через 15-20 слов зетка уже забывает о чём там речь шла в начале
Аноним 06/05/26 Срд 11:20:25 #177 №1605836 
>>1605831
Да в общем то соглы, чего это я правда. Промты больше 20 слов не работают. Модели причёски рисовать не умеют. В локалках только застой и разочарование. Точки ещё эти зелёные. Пора завязывать.
Аноним 06/05/26 Срд 11:24:40 #178 №1605840 
>>1605836
сдохля базовая и та больше знала знала причёсок
Аноним 06/05/26 Срд 11:25:25 #179 №1605841 
Есть редкие промты, которые дают в локальной модели очень хороший и стабильный результат. Например афро-тян в желтых листьяю в вагоне метро.
Другие же промты дают исключительную хуйню.

Если дело в промте, почему эту проблему не пытаются решить промт-энхансером прямо в воркфлоу? Проблема смещается из плоскости танцев с бубноми (копингом) вокруг промта в плостью системного промта для энхансера.
Огромный плюс в том, что любой прогресс с таким системным промтом для конкретной диффузии - будет масштабироваться на любые промты, сколько то улучшая результат.
В идеале получить энхансер, который умеет "придумывать красиво" заполняя или корректируя все слабые / некорректные места твоего промта.

Но для этого нужно обучение локальной ллм под промтинг конкретного типа, или вовсе специально для модели.

Что точно известно: GPT / Gemini - думающая / Pro - мало что понимает в этом плане. Самые разные запросы, не приводили к значимому эффекту, они выдают промт с рэндомно-посредственным описанием, на уровне худ. реализаций, композиции.
Аноним 06/05/26 Срд 11:26:23 #180 №1605842 
>>1605828
>бесконечное
Было гладко на бумаге)
Аноним 06/05/26 Срд 11:35:23 #181 №1605851 
>>1605841
Ты так скоро додумаешься давать нейронке картинку и просить описать ее.
Аноним 06/05/26 Срд 11:37:51 #182 №1605853 
>>1605841
Как же заебала вся вот эта ваша маниловщина. Нихуя из этого не будет, если бы это было возможно, то это давно бы сделали. Весь пиздец заключаетчя в том, что языковые модели, даже локальные, настолько ушли вперёд, что между ними образовалась пропасть, и чем дальше, тем глубже и шире.
Аноним 06/05/26 Срд 11:45:58 #183 №1605857 
>>1605853
>ними
Кеми?
Аноним 06/05/26 Срд 11:46:03 #184 №1605858 
>>1605778
Ты просто написал промт специфичной прически, ассоциированной со специфичной суб-культурой - и о чудо, в модельке оказалась эта челка.

То до чего докопался этот >>1605691 - это проблема не промта, а именно ограниченность локальной модельки. Ты сам не решишь её промтингом. У моделей крайне ограниченный набор возможностей в видении всевозможных узкоспециализированных образов.
Например клейн не способен нарисовать в принципе НИЧЕГО красиво, кроме людей и close up shot объектов по центру.
И как правильно замечено, даже если промт на 100 слов работал - невозможно работать, если 100 слов уходит на одну прическу.
А еще, когда заставляешь локальную модель через силу высрать что то детальным описанием - она начинает рисовать это отвратительно не естественным с говной.
Аноним 06/05/26 Срд 11:48:27 #185 №1605859 
image.png
>>1605857
Аноним 06/05/26 Срд 11:50:34 #186 №1605862 
neuroslop.jpg
@artmonkey нарисуй a cinematic close-up portrait of a young Caucasian skinhead girl named "Jax," embodying a raw, rebellious street spirit. She has a distinct skinhead hairstyle: the back and sides of her head are completely shaved smooth, while a thick, straight, blunt-cut dark fringe (bangs) covers her forehead, framing her intense gaze. Her expression is one of defiant indifference and stoic confidence, with a piercing look directed at the camera. A small beauty mark is visible on her cheek. She wears a faded black oversized punk band t-shirt and small silver hoop earrings. The camera angle is a slight high-angle shot, creating an intimate yet confrontational perspective that emphasizes the geometry of her haircut and the intensity of her eyes
Аноним 06/05/26 Срд 11:52:36 #187 №1605866 
>>1605841
Множество хороших промптов очень сильно отличается от модели к модели и от зрителя к зрителя. Кому-то нравится вылизанный 1girl слоп с цветокором, кому-то надо навалить аналогового зерна, расфокуса, боке и кросспроцессинга, кому то надо композици, ракурс, рыбий глаз и голландский угол, кто-то на аниму чёрно-белую дрочит.
То есть ты вполне можешь наколдовать энхансер на llm для какой-то одной ситуации, много кто так делает. Но унивесральной балалайки собрать не удастся, потому что на вкус и цвет фломастеры разные. (все картинки с осенней негритянкой - говно)
Аноним 06/05/26 Срд 11:52:56 #188 №1605868 
neuroslop.jpg
@artmonkey сделай кинематографичное фото девушки-скинхедки с недовольным лицом и дурацкой прической с лысой башкой и только челкой
Аноним 06/05/26 Срд 11:53:40 #189 №1605869 
>>1605862
А там по французски вставки будут как в войне и мире?
Аноним 06/05/26 Срд 11:56:44 #190 №1605875 
image.png
>>1605868
>дурацкой прической
Аноним 06/05/26 Срд 11:58:02 #191 №1605877 
>>1605862>>1605868
Вот вроде текста меньше, а согласованность картинки пропала. Из средней портретной фотографии в ширпотребный нейросплоп.
Аноним 06/05/26 Срд 12:27:28 #192 №1605899 
ComfyUItempfpsth00003.png
ComfyUItempfpsth00004.png
>>1605851
Пробовал тут >>1598719 →. Клейн полностью провалил реверс промт, доказал что эта модель не способна в композицию и минимальную эстетику в чем то, кроме 1girl standing. Ты можешь хоть обмазаться промтом, уточняя композиции и формы, через 100-200 роллов, возможно получишь какой то сносный компромисс, далеко смещенный от изначального ожидания. Это не рабочий сценарий.

ZIT не далеко от него ушел, хоть и лучше рисует реализм. Но у зита какое то свойство рисовать грязь и неприятные цвета.

Если локальные модели ограничены в образах и фантазии - здесь ощущается тупик, выход из которого видится только в воркфлоу с отдельным концепером на отдельной, желательно быстрой модели с подобранным стилем рисовки, который проще всего трансформируется в реализм.
Концепт арт > Трансформ в реализм
Аноним 06/05/26 Срд 12:30:47 #193 №1605902 
@artmonkey нарисуй как двачер пытается сгенерировать фотопортрет девушки с обычной причёской, то есть сидит перед компьютером в кресле, на мониторе видно фото девушки с обычной причёской и заголовок окна "SD". у двачера ничего не получается он злится впадает в фрустрацию начиная рвать волосы на себе на головой маленькие тучки как в аниме и мультиках
Аноним 06/05/26 Срд 12:57:03 #194 №1605920 
>>1605902
Хрен тебе.
Аноним 06/05/26 Срд 13:04:51 #195 №1605928 
>>1605899
зум аут добавь, додик. вообще они привязаны к размеру кадра и площади лица на кадре, переделывай.
Аноним 06/05/26 Срд 13:06:38 #196 №1605932 
>>1605928
> они привязаны
кто они, и в каком смысле привязаны?
я прически просто генерил
Аноним 06/05/26 Срд 13:19:31 #197 №1605942 
image.png
image.png
image.png
>>1605862

Но вообще зит какой то однотипный.
Аноним 06/05/26 Срд 13:39:39 #198 №1605962 
2.png
1.png
Аноним 06/05/26 Срд 13:43:26 #199 №1605967 
изображение.png
>>1605962
Году в 10 у всех телефонов такой фильтр был.
Аноним 06/05/26 Срд 13:53:28 #200 №1605975 
изображение.png
>>1605899
Гемма+Эрни практически дословно нарисовали
Аноним 06/05/26 Срд 14:44:06 #201 №1606002 
ComfyUItemptxllx00006.png
ComfyUItempzkkeg00001.png
>>1605975
> дословно
Клейн тоже.
Проблема вообще не в следовании промту. В теории модель может следовать промту на 100% ограничиваясь 300 словами, но будет в 100% случаев выдавать крайне убогие изображения, и я даже не про текстуры и освещение, а про детали образов и композицию.

Это у вас в вашей голове возникают определенные целостные образы когда вы читаете промт на 300 слов, поэтому может возникать иллюзия, что следование промту это всё что необходимо для диффузии. В действительности же, если у модели ограничены эти образы, композиции и деталей - она будет выдавать хуйню, как например клейн в реализме.
В то время как всякие рисовалки
Аноним 06/05/26 Срд 14:59:52 #202 №1606011 
Реально ли щас тренировать на 12 гб лору на клейн? И если да, есть ли какой-то нормальный гайд?
Аноним 06/05/26 Срд 15:12:22 #203 №1606022 
sshot-080.png
>>1602441 (OP)
Есть тут еще "терпилы" кроме меня?
Терпите?
Аноним 06/05/26 Срд 15:14:30 #204 №1606024 
Вот такое надо. Только это под z-image.
https://huggingface.co/BennyDaBall/qwen3-4b-Z-Image-Engineer
Аноним 06/05/26 Срд 15:27:32 #205 №1606033 
>>1606022
Какую dev можно вместить в 16vram 32ram без ебли ссд? И что это может дать в сравнении с klein 9B FP8?
Там вроде бы толком нет норм файнтюнов и лор для dev.
Аноним 06/05/26 Срд 15:33:47 #206 №1606036 
>>1606033
дев того не стоит, поверь
кляйн единственный вменяемый сейчас за свои деньги

Нет ну надо же было мистраль-3 наебнуть вместо квена9b, пзц дегенераты.
Аноним 06/05/26 Срд 16:03:45 #207 №1606060 
>>1606002
Вот же пример.
>>1605862 >>1605868
Разрыв консистентости происходит не из-за размера промпта, а от противоречивых элементов. Нет ничего плохого в четырёхабзацном промте, если он согласован.
Аноним 06/05/26 Срд 16:24:13 #208 №1606076 
>>1606022
Смысол терпеть дев, если ты его лоботомизируешь турболорой? Тут можно 20 хайрез прогонов базированым кляйном сделать и зачерепикать результат.
Аноним 06/05/26 Срд 16:25:07 #209 №1606078 
140427-apps-news-the-best-stupidest-and-most-famous-internet-memes-around-image21-nurci9klpe.webp
Вы в курсе, что этот ваш комфи уай скоро будет ПЛАТНЫМ?
Аноним 06/05/26 Срд 16:28:44 #210 №1606081 
изображение.png
>>1606078
Я жду пока в ollama вкорячат генерацию. Буду агентом через апи генерить. Лапшу двигать в 2к26 - реально какой то каменный век.
Аноним 06/05/26 Срд 16:43:15 #211 №1606094 
>>1606078
в смысле ПЛАТНЫМ?
Аноним 06/05/26 Срд 16:53:21 #212 №1606107 
>>1606078
Пруфов конечно же не будет
Аноним 06/05/26 Срд 17:14:52 #213 №1606125 
ComfyUItempkesqs00001.png
>>1606107
У кого-нибудь есть системный промт или локальная ллмка, которая из двух строчек промта может придумывать на 200-300 слов, представляя стабильно интересное, адекватное, без ебучий шаблонных ассоциаций или допотопных культурно устаревших клише?
Вообще любая реально положительная практика prompt enhancing интересно. Сталкиваюсь с тем, что фри модели GTP/Gemini буквально точно так же фантазируют дроченную хуету, в формате работы "я описываю абзац словами что я хочу что бы он разработал, подсовывая промт инстуркцию моделю - и он генерит"

Единственное что я не пробовал - писать полный промт самому, а их просить точно переводить на english. Но как быть с моделями использующими теги не понятно.
Писать на англише с моим B2 бессмысленно, нет такого словарного запаса что бы подбирать точные эпитеты и названия вещей.
Заебался уже от борьбы с ветряными мельницами.
Аноним 06/05/26 Срд 17:15:27 #214 №1606127 
>>1606078
Никогда не будет, школьник. Почитай что такое лицензия и как наследуются они в попенсорсе и какие ограничения. Комфи это тупо гуй с солянкой модулей
Аноним 06/05/26 Срд 17:17:42 #215 №1606130 
>>1606127
Ты видно школу закончил в прошлом году, а мысли формулировать не научился. Лобная доля еще не сформировалась?
Аноним 06/05/26 Срд 17:20:34 #216 №1606132 
>>1606125
пишешь спеку на нужный формат системного промпта, закидываешь в дикпик, получаешь системный промпт, закидываешь в энхансер, готово, вы великолепны.
Аноним 06/05/26 Срд 17:34:34 #217 №1606146 
>>1606132
> в дикпик
причем здесь фотка с членом?
Аноним 06/05/26 Срд 18:02:10 #218 №1606153 
>>1606130
Ну так спроси у нейронки своей что я тебе написал, пусть по пунктам расшифрует, я же не виноват, что у тебя минусовый айсикю.
Аноним 06/05/26 Срд 18:19:41 #219 №1606168 
image.png
image.png
>>1606127
>Комфи это тупо гуй с солянкой модулей
Ну так модули будут платными и сосай. Да поябавшись сможешь взять бесплатно, но за удобство - ПЛОТИ. Так то вон фейсфужен тоже бесплатный, но за инсталлер денех просят, но можешь сам покурить манувалы конечно развернуть питон хуе мое. Но ты тупой просто, да там в гомфи уже 2 страницы рекламы со спонсорскими модулями. Потом они тебе сунут рекламу на стол, ну смождшь ее руками в каждой версии выпиливать, а они ее перепрятывать будут с обновами и у тебя все будет крашится, ты будешь плакать, и снова искать куда они рекламу запрятали (на фьюжене так нсфв фильтр прячут, причем там смешно спрятано, иди почитай/посмотри сам). Тебе ту спецолимпиаду прям в гуй завезут, а ты пукай дальше про лиценьзию свою прыщезадротскую, которую обойти не сложно поссав тебе в пингвиний клюф.
Аноним 06/05/26 Срд 18:35:40 #220 №1606178 
image.png
image.png
image.png
image.png
>>1606125
>Единственное что я не пробовал - писать полный промт самому, а их просить точно переводить на english. Но как быть с моделями использующими теги не понятно.
Аноним 06/05/26 Срд 19:16:03 #221 №1606208 
>>1606178
Не совсем понял, что ты хотел показать.
Картинки, что ты скинул можно до бесконечности генерить.
У них отсутствует хоть какая то композиция, сломана динамика, стиль уебищный.

Дизайн/композиция в моем слопе на порядок лучше - проблема в том, что я такое даже не заказывал. Мне не нужны были часы в пузе, я хотел сгенерить стимпанк, и в одну из 10 попыток создания промта через LLM, она проебала контекст и создала вовсе не стимпанк, но это оказался лучший вариант из всего что было. Показывать что было помимо этого даже смысла нет. Какие то забастовки роботов из книжек 70ых годов, роботы на заводе, во всех случаях визуал роботов был невероятно убогий.

Ты думаешь LLM тебе пишет заебись промты, но это иллюзия. Хуевые ллм, как и во всём - плохи и в промтинге, создании образов и сцен. Скопировать сцену с кафе, телкой и роботом не является проблемой. Проблема получать промты, который стабильно выдают описание визуального дизайна, композиции и нарратива.
Нужен промт энхансер под норм модель-иллюстратор с удобным техническим стилем (вариативность + ясная детальность). С анимой, это уже частично работает. Проблема в том, что пока я буду это искать, выйдет новая модель, которая из коробки будет сама художничать.

Впрочем чего я ожидаю в треде про 1girl standing, который видимо закрепился по инерции, со времен SD с которой это было главным достижением.
Аноним 06/05/26 Срд 19:47:02 #222 №1606222 
Skufotronic - Хромщик.mp4
>>1606208
>У них отсутствует хоть какая то композиция
А психбольной, понятно.
Аноним 06/05/26 Срд 21:31:04 #223 №1606287 
image.png
>>1606168
Ну заплачь ещё, библы питона у него платными станут, ору чёт с этого залётыша из /б
Аноним 06/05/26 Срд 21:34:10 #224 №1606289 
GrcIlsOEx3.png
OVb3h7cTR0.png
gChGluTg7T.png
RqiGcjjwax.png
>>1606222
Представил, что у тебя в голове всплывает от слова композиция.
На 1girl стендинге далеко не уедишь
Аноним 06/05/26 Срд 23:50:35 #225 №1606350 
как называется эта болезнь?
у ксамплера после рандом генерации ставишь fixed > генеришь и он генерит новое, т.к. нельзя остаться на сиде
Аноним 06/05/26 Срд 23:56:37 #226 №1606353 
>>1606350
Отправил скрины твоего воркфлоу в саппорт комфи
Аноним 06/05/26 Срд 23:58:36 #227 №1606355 
>>1606350
Fixed надо сразу ставить, значение сида после рандом генерации это уже новое значение для следующей.
Аноним 07/05/26 Чтв 00:12:11 #228 №1606364 
>>1606287
Это разве не ты тут плачешь после каждого обновления? Читать научись. Так то можешь вообще без гомфи на чистом питоне все крутить, чё не крутишь? И не будешь, а будешь сидеть с рекламой.
Аноним 07/05/26 Чтв 00:16:49 #229 №1606368 
image.png
Аноним 07/05/26 Чтв 00:20:34 #230 №1606372 
>>1606355
какая же ебанутая хуйня

почему то в Seed (rgthree) абсолютно адекватно это работает, к счастью он подключается к ксамплеру
Аноним 07/05/26 Чтв 01:41:42 #231 №1606424 
image.png
image.png
Прочувствуете, как шарашит:
1. heavy fringe pageboy
2. short blunt bob cat with hard bang
Аноним 07/05/26 Чтв 01:48:43 #232 №1606427 
image.png
short woman haircut with covering forehead bang and shaved nape
Аноним 07/05/26 Чтв 02:02:35 #233 №1606434 
image
>>1606424
>>1606427
В негатив boy добавь хоть.
Аноним 07/05/26 Чтв 02:13:23 #234 №1606440 
image.png
>>1606434
>В негатив boy добавь хоть
чел я не в состоянии контроллировать твою эрекцию
Аноним 07/05/26 Чтв 02:32:18 #235 №1606448 
тред в своем репертуаре продолжает генерить страшных баб
Аноним 07/05/26 Чтв 02:37:03 #236 №1606450 
>>1606448
>страшных баб
не бывает, бывает мало тестостерона
Аноним 07/05/26 Чтв 03:27:45 #237 №1606458 
>>1606350
Это называется долбм разработчиков. В настройках Комфи ищи позицию before/after и смени её на противоположное значение. Она влияет когда изменится сид : до или после генерации.
Я спрашивал об этом здесь именно в такой же ситуации как у тебя, но как обычно мне пояснили, что все жрут и ты жри. Типа если хочешь перегенерировать, то кидай картинку мышкой. Ебану
.
Аноним 07/05/26 Чтв 03:38:34 #238 №1606460 
>>1606350
>у ксамплера
ни разу не было такой хуйни, фиксед значит фиксед, у тебя какой-то рандомайзер в вф который подсирает тебе.
Аноним 07/05/26 Чтв 07:32:39 #239 №1606508 
>>1606440
NAG кто запрещает использовать?
Аноним 07/05/26 Чтв 08:13:16 #240 №1606521 
>>1606508
Это была ирония+сарказм, мой левополушарный дружок.
sage[mailto:sage] Аноним 07/05/26 Чтв 08:50:54 #241 №1606532 
>>1606427
Тебя даже гугл не поймет, что ты там имеешь ввиду под своими выдроченными словечками.
Аноним 07/05/26 Чтв 09:07:31 #242 №1606537 
image.png
>>1606350
из за этой хуйни я использую ноду для сидов. она еще выручает если хочешь сгенерированную картинку открыть как вокрфлоу
Аноним 07/05/26 Чтв 10:23:40 #243 №1606585 
>>1606532
А мог бы просто промптить цыганских детей.
Аноним 07/05/26 Чтв 10:27:03 #244 №1606589 
>>1606532
>выдроченными
мои словечки тебе в дышло не полезут
Аноним 07/05/26 Чтв 10:30:29 #245 №1606594 
>>1606585
>промптить
Как кто?
Аноним 07/05/26 Чтв 10:59:34 #246 №1606618 
ComfyUItemphrpse00006.png
>>1606589
почему ты цыгано-генератор?
Аноним 07/05/26 Чтв 11:32:59 #247 №1606635 
Ну, ёпт, у вас уже всё полотно готово. Прямо весь кадр уже сформирован. Расставлены все персонажи и окружение. Всё продумано до мелочей. Абсолютный шедевр почти готов. И вот только одна маленькая деталь не вписывается. Только она мешает. Это прическа. Вот она - та заноза которая не даёт вам сделать шедевр. Вот, если бы были нужные прически, то вот тогда бы вы - ух! Так ведь? Как же жаль, что именно прическа прямо сдерживает ваши шедевры. Блокирует весь процесс творчества. Какой кошмар. Надо куда-то жаловаться.
Аноним 07/05/26 Чтв 11:58:59 #248 №1606657 
>>1606618
Alejandro, Alejandro
Ale-Alejandro, Ale-Alejandro
Alejandro, Alejandro
Ale-Alejandro, Ale-Alejandro
Аноним 07/05/26 Чтв 12:08:56 #249 №1606664 
Нихуя себе, клейн оказывается не может голову тян на одной фотке, вклеить в другую фотку с телом.
Не говоря уже про то, какой слоп выходит из под 9b-kv-fp8
Аноним 07/05/26 Чтв 12:09:03 #250 №1606665 
>>1606635
>та заноза
Маня, какова тебе на вкус моя заноза?
Аноним 07/05/26 Чтв 12:46:01 #251 №1606696 
321.jpg
>>1606664
Аноним 07/05/26 Чтв 13:16:35 #252 №1606714 
>>1606664
Скиллишью
Аноним 07/05/26 Чтв 13:50:40 #253 №1606730 
>>1606664
еще как может, изучи вопрос поподробнее, там с этим вообще проблем нет
Аноним 07/05/26 Чтв 14:07:51 #254 №1606741 
image.png
>>1606730
> изучи вопрос
Изучи практику. Вот это ебало натянуть на вертикальную фотку, сохраняя волосы, прическу, скинтон и лицо без слопа попробуй. Можешь ничего не скидывать, просто сам увидишь. Это не бояров в свитер одевать.
Аноним 07/05/26 Чтв 14:19:03 #255 №1606745 
>>1606741
>слопное ебало, но без слопа
жениться вам барин пора, а не вот это вот всё...
Аноним 07/05/26 Чтв 14:50:06 #256 №1606764 
>>1606664
скилл ишью
Аноним 07/05/26 Чтв 15:01:00 #257 №1606769 
>>1606764
> скилл ишью
> пердеж про то, что локальная генерация ничего не может кроме 1girl в сравнении с корпоратными
Аноним 07/05/26 Чтв 15:01:11 #258 №1606770 
>>1606741
>Можешь ничего не скидывать
У меня получилось. Олин в один.
Аноним 07/05/26 Чтв 15:11:13 #259 №1606775 
53.jpg
Аноним 07/05/26 Чтв 15:14:58 #260 №1606777 
>>1606769
> не может кроме 1girl
> сам генерит только 1girl
> тоже не выходит
Знаешь как называется?
Аноним 07/05/26 Чтв 15:23:41 #261 №1606785 
Flux2-Klein26.jpg
>>1606741
Лично у меня все получилось! Не расстраивайся! У тебя тоже все получится!!
Аноним 07/05/26 Чтв 15:25:48 #262 №1606787 
>>1606777
У меня всё выходит, просто я не скидываю т.к. лица слишком молодые. И мне почти сразу же надоело. Голых тян делать проще чем что то другое полноценное.
Аноним 07/05/26 Чтв 15:35:15 #263 №1606794 
>>1606787
педофилова беда
Аноним 07/05/26 Чтв 15:49:04 #264 №1606805 
image.png
>>1606785
рассказывай
Аноним 07/05/26 Чтв 16:25:24 #265 №1606823 
изображение.png
>>1606741
Шизонтелло. Ты буквально берёшь нарисованное в фотошопе франкенштейновое ебало, и удивляешься, что сеточка не может с ним совладать
Аноним 07/05/26 Чтв 16:27:27 #266 №1606825 
>>1606823
долго же ты ебался, а в итоге сгенерил пластик
но тело неплохо прекрепилось да, но ты понял я думаю что проблемы там есть
Аноним 07/05/26 Чтв 17:20:12 #267 №1606851 
>>1606825
>сгенерил пластик
Там на исходнике буквально следы кистей фотошопа. Не слишком ли много ты хочешь от такого шлака?
Аноним 07/05/26 Чтв 17:28:03 #268 №1606857 
>>1606132
> готово, вы великолепны.
Попробовал погенерить промты через фри гпт/гемини.
Небольшое улучшение есть, но в основном во времязатратах, не качественные.

Проблема одна и та же - фантазия LLM в описании графической сцены говно из жопы. То есть просто даже рассматривая сюжет, выбранные детали образов, и так далее - полная хуета.
В системном промте отдельные инструкции на предварительную проработку сцены, смысловая слитность, современный взгляд на любой артворк, композиция, микродинамика, движение, возрастная ЦА 22+ помимо промт rules.

Всё равно, для киберпанка - бирюзовые светящиеся глаза, унылый бэкграунд. Стимпанк - допотопные роботы с часами в еблете из 90ых. У сцен вайб постеров (именно компановка, перенасыщенность суетой).

Возможно ли, что локальный не супер жирный квен или гемма - могут выдавать энханс лучше чем фри гпт/гемини (которые базовые, не думающие)? Имеет ли смысл с локальными ебаться, если волнует только качество?
Аноним 07/05/26 Чтв 17:32:32 #269 №1606864 
>>1606825
Хуйню не неси, неосилятор, сделано вполне годно
Аноним 07/05/26 Чтв 17:42:36 #270 №1606872 
>>1606864
>годно
Нет текстуры ткани, нет текстуры кожи, нет текстуры волос, зеленые пиксели и плесень... Годно, ясчитаю
Аноним 07/05/26 Чтв 18:07:07 #271 №1606885 
>>1606872
Пздц. А то что перечислил разве есть в исходнике?
Аноним 07/05/26 Чтв 18:22:33 #272 №1606892 
изображение.png
>>1606857
В энхансе промпт сильно решает. Есть бесконечное количество способов расширить промпт. "Ты агент сделай заебись промт энхансе", "Ты постановщик проработай сценографию", "Ты безумный уличный художник дай подробное графическое описание ", "Вот кадр, мне нужен text2image промт для генерации в аналогичном стиле " дают сильно разные результаты. И нельзя сказать что одно лучше другого. У каждого варианта своя сфера применения. Некоторые из них можно и на локалочках тягать. Но общего универсального промта нет. Я не нашёл.
Аноним 07/05/26 Чтв 18:30:33 #273 №1606894 
>>1606864
> сделано вполне годно
соболезную вашему видению, там нейророжа клейн дистяляторная с крупной текстурой

если у тебя 4B конечно, то ноль вопросов
Аноним 07/05/26 Чтв 18:42:14 #274 №1606902 
>>1606892
> Но общего универсального промта нет.
Нужен. Хотя бы в рамках одной модели/лоры, которая генерит концепт арты для последующего трансформа в детали / реализм.
Ничто не мешает в системном промте создать тэг-корректор, указывающий на общий вектор работы, сохраняя все остальные принципы.
И проблема не в промте. Они просто хуево фантазируют и представляют ранги эстетики, обучались на текстах, в душе не ебут, к тому же кастрированные и слабые, не подписочные.

Учитывая что ручные ситуативные системные промты - АБСОЛЮТНО нихуя не дают, потому что результат такой же бедный и рэндомный, а времени на ручные дрочения уходит немерено, не вижу смысла тратить на кастомный подход время.

Я заметил, что мой систем промт уже не влезает в контекст фри гпт. Она начинает генерить картинку часто, хотя в начале написано что нужно сделать.
Локальная ллм тогда тем более не схавает такой объем, но есть какая то надежда, вдруг они получше работают, ведь фри ГПТ жадные стали и деградировали её в усмерть.
Аноним 07/05/26 Чтв 19:23:24 #275 №1606921 
anima2026050720521700001.png
anima2026050720593100001.png
anima2026050721143800001.png
anima2026050721175600001.png
в принципе из анимы околореалистик можно сделать уже даже сейчас
Аноним 07/05/26 Чтв 19:39:37 #276 №1606927 
>>1606921
> уже даже сейчас
А смысл? Не нужен ей нахуй этот реализм.
Локальные модели которые могут в реализм, не могут больше нихуя буквально, кроме бытовой фотографии с унылым задником.
Аноним 07/05/26 Чтв 19:51:55 #277 №1606939 
>>1606927
>унылая бытовая фотография с унылым задником
Ты сейчас буквально описал любую твою фотографию сделанную на телефон.
Аноним 07/05/26 Чтв 19:53:58 #278 №1606942 
>>1606927
чтобы дрочить на персонажек,меня просто анимешные стили уже заебали
иногда хочется оживить вайф, да и просто аниме приедается, а другие модели как ты сам написал обычно немощи, а анима люстронубаев и обычных сильно пизже будет может быть надеюсь
Аноним 07/05/26 Чтв 19:56:31 #279 №1606946 
Был в спячке год.
Куда всю порнуху с civitai дели?
Аноним 07/05/26 Чтв 19:59:13 #280 №1606948 
327.jpg
>>1606942
хочется? возьми оживи...
Аноним 07/05/26 Чтв 20:04:55 #281 №1606953 
>>1606872
>>1606894
Я про перенос рожи. Всё перечисленное вами это уже другой вопрос.
Аноним 07/05/26 Чтв 20:05:52 #282 №1606955 
fluxpro20Ultrarealisticcinematicpostapocalypticscenea.jpg
Flux.2 pro по этому промту >>1597835 →

Какая же параша, и это продают за далары. Flux.2 max не пробовал.
Но то что делает Pro, можно на локале генерить или даже лучше.
Корпоратные генераторы в целом кал оказывается, кроме новой GPT - до её уровня дотянуть вот это интересная задача.

Всё остальное, включая гемини хуйню убогую городят
Аноним 07/05/26 Чтв 20:07:11 #283 №1606956 
anima2026043017550200012.png
>>1606948
а хотя бы такое
Аноним 07/05/26 Чтв 21:49:06 #284 №1607034 
>>1606939
> Ты сейчас буквально описал любую твою фотографию сделанную на телефон.
Буквально так. Что сказать хотел?
Аноним 07/05/26 Чтв 21:52:50 #285 №1607038 
>>1606942
Если у тебя упор в память то ок. А так anima > klein 9б уже хорошая связка даже если в исходнике не реализм. Только вот рисованный ландшафт и прочая неорганика плохо трансформируются
Аноним 07/05/26 Чтв 21:57:32 #286 №1607040 
>>1607034
что ты унылый еблан и нейронка тут не причем
Аноним 07/05/26 Чтв 22:02:33 #287 №1607045 
Кто-нибудь знает читкода для клейна, особенно Edit, как заставить его рисовать адекватные эмоции на лице, выражения лица. Кроме всяких явно крайних? Мертвые лица в основном
Аноним 07/05/26 Чтв 22:03:44 #288 №1607048 
.jpg
Оставлю один кляйн наверн. Долго придрачивался, вполне тащит голый промпт и без лара или эдит фичи. Держу в курсе
Аноним 07/05/26 Чтв 22:04:46 #289 №1607049 
>>1607040
Сам выше признал, что это унылая бытовуха, то что тебе нравится генерить. Но унылый еблан я.
Противоречие какое то
Аноним 07/05/26 Чтв 22:10:13 #290 №1607054 
.jpg
Кляйн тупо топ, никакие нсфв лора не нужОны енти ваши
Аноним 07/05/26 Чтв 22:35:25 #291 №1607072 
klein9b-distill.jpg
Аноним 07/05/26 Чтв 22:42:37 #292 №1607079 
>>1607045
Попробуй начать описывать выражение лица и эмоции...
Аноним 07/05/26 Чтв 23:18:53 #293 №1607105 
>>1607079
Работает, но похоже с очень большим шагом в градациях,
отдельно потесчу потом.
Обычно реалистичней и эффектней смотрятся тени эмоций, без морщин на лице, но явно читаемых. Мб можно нагриндить какие то keywords
Аноним 08/05/26 Птн 01:39:55 #294 №1607182 
>>1606921
Она уже реализм делает. И может в нсфв в отличие от современного флюкс кала и зет кала. Это на аниме сделано:
>>1605962
>>1605743
Если базу промпта стилевую нормальную задать, ощущается как бигапсы/натвизы только в порнуху и более сложные позы умеет.
Аноним 08/05/26 Птн 01:47:03 #295 №1607184 
Flux2VAEFix00006.png
FLUX2dk00027.png
>>1606955
>Какая же параша, и это продают за далары.
В принципе, на этом можно было бы закончить, потому что ты прав. Когда ты покупаешь продукт, как потребитель ты не обязан знать какие-либо тонкости под капотом. Тех кто считает иначе, должен порешать рыночек (пока что-то не очень).

Теперь на секунду забудем о сказанном выше.
Если речь о локальной генерации, то я могу сказать сразу, что prompt не универсален и пишется под структуру и особенности конкретной модели.
Конкретно prompt, который ты взял написан не для FLUX.2.
Я переписал этот prompt под структуру FLUX.2 [dev] с учётом сохранения хотя бы части начального замысла и не используя JSON-форматирование для чистоты эксперимента (в руководстве от BFL заявлена поддержка prompt до 32K токенов, поэтому экономить не надо; лишнего писать тоже).
Кроме того, в корпоративных моделях зачастую работает upsampler для prompt, который перелопатит его ещё раз бесконтрольно навалив отсебятины. FLUX.2 на локальной генерации по умолчанию не использует prompt upsample и генерит строго по prompt.

Cinematic movie still with dramatic lighting of a shadowy silhouettes of a man and a very young girl standing together. The man and the young girl have partially robotic bodies. The man's and the young girl's arms and legs are biomechanical, resembling advanced android prosthetics with metallic joints, exposed mechanisms, subtle wear, scratches, and faint glowing elements. The faces of the man and the young girl are fully human, highly detailed, natural skin texture, realistic imperfections.
They are holding their biomechanical robotic hands tightly. The man stands slightly in front, protective, tense posture. The girl looks frightened and vulnerable, slightly leaning toward him. In her other robotic biomechanical hand, she clutches a worn, dirty teddy bear.
The background shows a devastated city: collapsed buildings, burning ruins. Occasional flashes from explosions illuminate parts of the scene.
Medium shot, eye-level angle, slightly off-center composition (rule of thirds), subtle handheld feel.
Shot on full-frame cinema camera, 35mm lens, aperture f/1.8, shallow depth of field, sharp focus on faces, background softly blurred (bokeh), ISO 800, shutter speed 1/125.
Blue hour, evening. Dark, moody, and dramatic — low-key practical lighting with strong contrast, cold desaturated tones mixed with warm highlights from fire and explosions. Deep shadows, rim lighting outlining the man's and the young girl's silhouettes.
Distant explosions, sparks, embers, and thick volumetric smoke filling the air. Dust and debris float in the atmosphere. Volumetric lighting, atmospheric haze, motion blur from drifting particles. Cinematic detail, sharp texture detail.


Первый пикрил — генерация.
Второй — рефайн.
Аноним 08/05/26 Птн 09:34:19 #296 №1607293 
>>1607184
Это сарказм такой или ты одну и ту же фотку скинул случайно.
С промтом для флакс я в курсе, только на деле это все равно копинг. Промт не решает ключевых проблем. И промт апсемплинг тоже не решает - он нужен только что бы извлечь побольше потенциала из модели с промтом в 1-2 предложения. Но этот потенциал относительно ущербный при генерациях в реализме.
У флакса2 похоже 2 ключевых родовых болезни которые дошли и до клейна:
- отсуствие видения композиции, динамики из коробки
- отсутствие ризонинга и оркестрации процесса с учетом п.1 делает модель абсолютно безвкусной и относительно бесполезной для сложных генераций

Это не уникальная для флакса/клейна болезнь. Но она стала заметна, благодаря gpt image 2, которая показала, что с ризонингом и разбивкой процесса на этапы, подобно реальному рисованию - генератор буквально начинает имитировать "хороший вкус" и рисовать не только технически, но эстетически хорошо - независимо от промта. Промт не решает художественную проблему моделей никак.
Флакс2 хорош и привнес многое в техническом плане даже в клейн, упрощает то, что раньше было сложнее. Но потенциал в креативном синтезе примитивен. Местные оправдывают это тем, что модель локальная, а я многого хочу. Но как видно, API версии аналогично хуевые. Если бы гпт image2, я бы тоже наверное так думал. Но теперь понял, что надо просто искать другой подход, и не ждать от 1 pass генерации ничего кроме 1girl standing, который надоедает за неделю.
Аноним 08/05/26 Птн 09:38:33 #297 №1607297 
изображение.png
изображение.png
изображение.png
изображение.png
Продолжаем ебаться с промт энхансом
Аноним 08/05/26 Птн 09:42:28 #298 №1607302 
>>1607297
Смысл? Всё кроме вангёлов это кал для нетакусиков-фантазёров, которые думают, что их нейрослоп перестанет быть нейрослопом и имеет хуйдожественную или эстетическую ценность
Аноним 08/05/26 Птн 10:00:57 #299 №1607313 
изображение.png
изображение.png
изображение.png
изображение.png
>>1607302
>Смысл?
Чтобы ты спрашивал
Аноним 08/05/26 Птн 11:55:23 #300 №1607406 
>>1607302
Нихуя себе нейродрочер подорвался.
Ну всех разная эстетика. Тянки, включая голых тоже могут быть эстетичны, но вангерлы над которыми ты трясешься - это больше потеха для хуя, чем что то интересное.
Аноним 08/05/26 Птн 12:15:22 #301 №1607418 
>>1607406
Ох, подорвался так подорвался, не то слово, аж трясусь и плачу, настолько меня задело, аж поспешил ответить тебе!
Аноним 08/05/26 Птн 13:30:02 #302 №1607474 
>>1607418
Беспричинный переход к развешиванию ярлыков действительно говорит о том, что ты трясся и плакал, будучи задетым чем-то, понятным только тебе.
Аноним 08/05/26 Птн 13:46:43 #303 №1607482 
>>1607474
Но пока что трясёшься и плачешь только ты, крича в каждом посте как я ущемил твоё видение прекрасного и проткнул тонкую натуру, растоптав высокие материи нейропоноса, который ты делал кроме вангёлов. Давай покажи же свои шедевры "не вангёлы" которые достойны. Уже даже интересно
Аноним 08/05/26 Птн 13:59:59 #304 №1607488 
>>1607482
>Давай покажи же свои шедевры "не вангёлы"
Присоединяюсь к оратору. Но, я чувствую, показа так и не последует)
[mailto:[email protected]Аноним 08/05/26 Птн 14:19:00 #305 №1607501 
привет друзья нужен разраб в проект NSWF нужно правльно настроить backend и генерацию фото - текст

проблема на сейчас в неправильной передаче промта с бэка в модельку из за этого результат отстойный, нужен профессионал

напишите мне в телеграм @pythongodbless обсудим условия!

СРОЧНО!
Аноним 08/05/26 Птн 14:25:48 #306 №1607506 
>>1607182
>Если базу промпта стилевую нормальную задать
Примеры будут? В инпейнт может?
Аноним 08/05/26 Птн 14:32:09 #307 №1607514 
>>1607482
>>1607488
> Давай покажи же свои шедевры
Кто вам сказал, что уже есть шедевры или понимание как их стабильно делать?
Я отвечу. 2 дауна внутри вашей головы
Аноним 08/05/26 Птн 14:57:22 #308 №1607539 
>>1607514
>Кто вам сказал
не виляй так сильно, хвост отвалится
Аноним 08/05/26 Птн 15:24:30 #309 №1607579 
>>1607048
>>1607054
Супер вообще, очень естественно.
Аноним 08/05/26 Птн 15:25:57 #310 №1607581 
>>1607579
>>1607054
У телочки на ноге пальцы не в том порядке.
Аноним 08/05/26 Птн 15:43:23 #311 №1607593 
>>1607579
>>1607581
>>очень естественно, но пальцы не в том порядке
Аноним 08/05/26 Птн 15:54:09 #312 №1607598 
>>1607048
У нее ноги разной длинны.
Аноним 08/05/26 Птн 15:59:28 #313 №1607601 
>>1607598
зато естественная
Аноним 08/05/26 Птн 16:28:46 #314 №1607627 
image.png
short curly pageboy
Аноним 08/05/26 Птн 16:46:02 #315 №1607640 
image.png
braided loose wavy hair
Аноним 08/05/26 Птн 16:47:11 #316 №1607642 
>>1607640
это ж Свини мелкая
Аноним 08/05/26 Птн 17:04:26 #317 №1607656 
image.png
>>1607640
модель умеет в лишай, нужно просто уметь промтить
Аноним 08/05/26 Птн 17:23:39 #318 №1607665 
image.png
>>1607656
>уметь
beautiful braided loose wavy hair
Аноним 08/05/26 Птн 17:24:33 #319 №1607666 
1.jpg
2.jpg
Качество не важно, если есть душа...
Аноним 08/05/26 Птн 17:27:06 #320 №1607668 
>>1607656
>>1607665
к сожалению у Сидни от природы хуёвенькие волосишки, но ведь любим мы её не за это)
Аноним 08/05/26 Птн 17:33:49 #321 №1607670 
>>1607665
beautiful dawn syndrom girl
Аноним 08/05/26 Птн 17:34:27 #322 №1607671 
.jpg
>>1607656
Зато естественно, прям как у половины профессионалов итт. Своё, родное
Аноним 08/05/26 Птн 17:53:10 #323 №1607681 
Дайте нормальный 9b klein inpaint workflow пж
Аноним 08/05/26 Птн 17:56:45 #324 №1607683 
>>1607593
Какая разница, если ебать дрочить?
Аноним 08/05/26 Птн 18:22:43 #325 №1607695 
ComfyUItempgpzit00002.png
Аноним 08/05/26 Птн 18:43:19 #326 №1607698 
>>1607670
Да-да, я в курсе, что она выбешивает красножопое блевачьё, это нормальная реакция на раздражитель.
Аноним 08/05/26 Птн 19:06:38 #327 №1607715 
>>1607665
>>1607640
>>1607627
Толку-то? Смотреть можно, трахать нельзя. Вот если бы с ними можно было прон генерить, тогда б я понял все здешние дискуссии около Флюса. А так, цена ему - нуль.
Аноним 08/05/26 Птн 19:24:41 #328 №1607726 
ltx2.3flf2v00039.mp4
>>1606948
Аноним 08/05/26 Птн 19:29:59 #329 №1607729 
>>1607681
Нашел inpaint и он работает, вот только руки он пофиксить не может во взаимодействии.
Надо какой то чит, как рисовать руки держащиеся или с чем то взаимодействующие
Аноним 08/05/26 Птн 19:41:50 #330 №1607737 
824794-65942092de0d61f00853d006fdbbe0bd.jpg
>>1607698
Ты что против дружбы народов? Против объединения пролетариев всех стран?
Странно, а лишнехромосомная вроде за.
Аноним 08/05/26 Птн 19:46:17 #331 №1607744 
image.png
>>1607729
Братан, чисто по братски, отсыпь в кулечек.
Аноним 08/05/26 Птн 19:50:45 #332 №1607748 
>>1607681
Клейн не может в инпеинт по маске. Сама модель слишком тупая, и лепит горбатого к стенке постоянно. Воркфлоу тут не при чем.

Клейн это хуйня бай дизайн.
Аноним 08/05/26 Птн 19:53:14 #333 №1607751 
>>1607744
https://civitai.com/models/2376685/simple-flux-2-klein-inpainting-workflow
Аноним 08/05/26 Птн 19:56:38 #334 №1607753 
>>1607748
Тогда тут что: >>1607751


Я вот с зита убрал крупу, как-то, но он все равно внутри маски не учитывает контекст фотки.
Аноним 08/05/26 Птн 20:05:32 #335 №1607757 
image.png
>>1607751
а на клянье что цензура? ааа голова аж заболела
Аноним 08/05/26 Птн 20:11:45 #336 №1607760 
>>1607715
>ему
Кому ему, флюксу?
Это не флюкс, это zit.
Аноним 08/05/26 Птн 20:31:41 #337 №1607784 
>>1607506
Не шарю про инпеинт, не юзаю его. Все примеры можешь прямо у автора брать в его промптах:

https://civitai.red/models/2585622?modelVersionId=2904690
(тут качество выше)

https://civitai.red/models/1862761/nicegirls-ultrareal
https://civitai.red/models/1662740/lenovo-ultrareal
(если лоры на оригинальную аниму вешать тут nsfw в разы сильнее, но ниже качество)

Стиль очень сильно плавает, поэтому много гемора чтобы подобрать базу промпта которая +- стабильно будет генерить.
Если установить семплер который юзает автор, генерация в 2 раза медленнее будет, но при каких-то сетапах качество в 2 раза вырастет. (я юзаю стоковый)
Аноним 08/05/26 Птн 20:36:40 #338 №1607786 
>>1607753
Это я не знаю что но, скорее всего тут просто выход маск подключен к инпеинт нодам.
Что само по себе тупость клейна никак не решит. Это модел выдает зачастую такой же уровень инпеинта, как сдхл. Тоесть лепить просто в область маски что-то невразумительное.
Для сдхл и сд15 не случайно были отдельные инпеинт модели. А поскольку клейн это тоже самое. Он раз через раз выдает такие очень плачевные результаты. И комфи уаем это никак не исправить.

Клейн лучше использовать в связке к консистентными лорами. Тогда он более-менее работает.
Аноним 08/05/26 Птн 20:44:21 #339 №1607791 
>>1607786
Сразу видно вкатуна. Для сдохли не нужны отдельные инпеинт модели вообще. Так как это было в бородатые времена точного названия не скажу и там их несколько вариантов было и один из них был лучший по моим тестам с отрывом, но есть такая штука брашнет, она подключается к любой сдохле и модель начинает идеально инпеинтить.
Аноним 08/05/26 Птн 20:52:44 #340 №1607806 
>>1607791
>и модель начинает идеально инпеинтить
Ох уж эти охуительные истории. Вам стабилити хоть платит за все эти охуительные рассказы про то как сдхл и клейн охуенно все делает?
Аноним 08/05/26 Птн 21:01:25 #341 №1607815 
>>1607806
Мне наплевать на твой срач с местными шизами. Я со времен сд1.4 прогнал вообще все модели которые выходили и тулзы к ним. Сдхл+брашнет(мейби другая похожая технология, их там несколько было, название не помню)+контролнет это пик инпеинта был долгие годы. Как и клейн сейчас это пик эдит модели СРЕДИ лоКАЛА. Ахуенно никто не делает и банана очень сильно косячит и даже новый гпт имаге 2 имеет тонну косяков в эдите. Каждая модель сильна в чём-то своём.
Аноним 08/05/26 Птн 22:20:30 #342 №1607849 
image.png
>>1607815
>Ахуенно никто не делает
Грок. Спецом на твой вкус сделал, филь.
Аноним 08/05/26 Птн 22:22:31 #343 №1607850 
>>1607806
Для сидикселя и правда не нужны отдельные модели, они уже не нужны были под 1/3 существования 1,5. Ты ебанутый какой-то. В лапше меньше надо было сидеть.
Аноним 08/05/26 Птн 22:47:15 #344 №1607863 
>>1607815
>Как и клейн сейчас это пик эдит модели СРЕДИ лоКАЛА.
Это тролинг чтоли такой? Не соблюдает ничего, после прогона персонаж уже на себя не похож. А вот в квен едит все збс, не без минусов, но лучше в десятки раз, жаль лор нет
Аноним 08/05/26 Птн 22:56:50 #345 №1607869 
>>1607863
скилишуе
> Не соблюдает ничего, после прогона персонаж уже на себя не похож.
скинь схему и тебе полную шляпу хуёв накидают
Аноним 08/05/26 Птн 23:16:03 #346 №1607872 
>>1607869
> скилишуе
Скиловый почини клешню >>1607695 клейном что бы за руки держались не руиня качество
Аноним 08/05/26 Птн 23:19:01 #347 №1607874 
>>1607869
>Выдрачивай лоры, семплеры, наматывайся на лапшу пока не получится удачный ген, иначе скиль ишуе бляя

В то время как в квен 2511 достаточно нажать вкладку темплейтс, открыть дефолт процесс комфи и он из коробки сделает консист фейс и анатомию с промптом вангер стэндинг, просто потому что модель не говно в отличие от..
Вот непойму вам нравится ебля ради ебли? Не ну ладно бы результат был оправдан. Но тогда уж лучше лору сделать раз так нравится кляйно слоп
Аноним 09/05/26 Суб 00:06:51 #348 №1607895 
Удивительно что за 4 месяца для клейна лору на руки не сделали.
Имба же была бы
Аноним 09/05/26 Суб 00:18:15 #349 №1607898 
FLUX2dk00027.png
Аноним 09/05/26 Суб 00:33:05 #350 №1607912 
>>1607806
>Ох уж эти охуительные истории
Обрати внимание на то что все эти истории абсолютно не подкреплены никакими пруфами в виде относительно удачных кейсов, в полторахе ближе к её окончательному виду появился чекбокс: soft-impaint, без которого бесшовное вживление нового объекта было вообще невозможно, в сочетании с правильно выбранным размером окошка контекста и увеличении уровня блюра можно было добиться довольно неплохих результатов, прополив до 6-8 попыток. В фокусе этот механизм существовал бай дизайн, и импаинтить там, благодаря внутренней модели было одно удовольствие. В лапше же всё настолько убого и примитивно, что пользоваться этим практически невозможно, отсюда и некое презрительное отношение к импаинту как таковому, они не в курсе, что может быть как-то по другому (менее топорно).
Аноним 09/05/26 Суб 00:43:12 #351 №1607923 
>>1607791
>Сразу видно вкатуна. Для сдохли не нужны отдельные инпеинт модели вообще
Да, ну, бля! Серьёзна? Это кто вкатун то тут?
Зайди в любой популярный чекпоинт на циви, и там среди рисовальные моделей обязательно будет отдельная модель для импаинте, и даже не одна. Ебало захлопни и не позорься больше, вкатун, блядь...
Аноним 09/05/26 Суб 01:36:30 #352 №1607960 
>>1607923
Прическу сделал?
Аноним 09/05/26 Суб 02:14:26 #353 №1607987 
>>1607923
>будет отдельная модель для импаинте, и даже не одна.
Это для долбоебов типа тебя, только базы плати и лайки ставь - они тебе еще туда лору с салом и снегуркой запекут.
Аноним 09/05/26 Суб 02:16:24 #354 №1607989 
>>1607987
>пук-среньк, сопли. слёзы, тряска...
давай, давай, порадуй меня своей истерикой.
Аноним 09/05/26 Суб 02:20:10 #355 №1607993 
>>1607987
Из какой жопы вы лезете?
https://share.google/aimode/1aMHWHvxjlWYTzfl1
Аноним 09/05/26 Суб 02:24:20 #356 №1607995 
>>1607989
>>1607993
Не визжи, лапшедаун. Фокус лучше установи, движки пощелкай, глазки потом от говна разлепи и почитай что тебе выше писали.
Аноним 09/05/26 Суб 02:28:56 #357 №1607996 
>>1607995
>Фокус лучше установи
а я его и не сносил. это у вас, у лапше-дебилов что ни день, то новый геймченджер (на самом деле нет), каждый день революция, тряска, матросы бегут к зимнему дворцу)
Аноним 09/05/26 Суб 03:05:29 #358 №1608014 
изображение.png
>>1607993
Эталонная тряска as is.
Аноним 09/05/26 Суб 03:12:51 #359 №1608017 
>>1608014
>as is
глюк ас из, продолжай...
Аноним 09/05/26 Суб 03:21:29 #360 №1608019 
>>1607923
https://tencentarc.github.io/BrushNet/ - читай не обляпайся. Я когда пердолился во времена сдохли, все эти твои "инпеинт" модели себе на диск скачал и прогнал. В итоге как я и написал любая сдохля+брашнет(или мейби павер-паинт, точно не помню)+контролнет дают лучший результат с отрывом на сдохле.

Нравится хуйнёй страдать, можешь ещё купить у хруста подписку на флекси, тоже жёсткие "геймченджеры" сдохли выдавал.
Аноним 09/05/26 Суб 03:30:37 #361 №1608023 
>>1608019
фотошопу (старому, до 22 года) вообще никакие модели не нужны, продолжай оправдываться, но сначала подмойся, вкатун...
Аноним 09/05/26 Суб 05:24:37 #362 №1608036 
>>1608017
Да-да, верю каждому твоему слову.
Ведь ты не промахнулся мимо кнопки. Злые хрюкошайтаны переключили раскладку, а потом вернули обратно.
Ой вей, у каждого так бывает 10 раз в день.
Аноним 09/05/26 Суб 06:24:59 #363 №1608054 
>>1608036
как ты это себе представляешь, ведь для этого нужно нажать на комбинацию аж из целых 3-х кнопок, то есть одно жататие, 1 лат буква, а потом ещё одно, как такое можно не заметить, у нет эпилепсии братишка, может ты проэцируешь свой опыт? Это какой-то глюк с гугловским помощником, и честно говоря, мне похуй.
Аноним 09/05/26 Суб 08:56:32 #364 №1608077 
Развели какой то срач дедов, вместо того что бы 1гел шедевры выкладывать
Аноним 09/05/26 Суб 09:24:22 #365 №1608083 
Почему модели, которая работает с инпейнт областью и видит только её, нельзя в контекст дать полное изображение? То есть видеть/знать она будет картину в целом, но обновит со знанием контекста только маску.

Можно такое технически в комфи сделать? Выше ссылка на инпейнт клейна, но там модель видит только маску
Аноним 09/05/26 Суб 09:34:02 #366 №1608086 
>>1608083
там вроде есть размер контестного окна, но чтобы нарисовать хорошо нужно небольшое "окно" или скорее область интереса, если выделение большое, то ничего особо делать не надо, а если объект небольшой то контеста надо дать побольше, но учти чем больше контекста тем хуёвее рисует, нужен компромис.
Аноним 09/05/26 Суб 09:46:35 #367 №1608090 
image.png
detailed curly high-crowned updo, messy side curls
Аноним 09/05/26 Суб 10:10:19 #368 №1608102 
>>1608083
>>1608086
Да, такое есть, регулировка размера контекста отдельно от размера области инпеинта. То есть размер перекрытия инпеинта. Эта область (с перекрытием) вырезается из оригинала, затем продается в (к)семплер и инпеинтится. Однако, как я писал сильно ранее, в Комфи нет в стандартном наборе нод средств вклеить выход картинки с семплера обратно в оригинал.
Задумайтесь. Нет такого в стандартном наборе нод. Не предусмотрен такой инпейнт.
Вот я выделяю руки на картинке маской. Это примерно 128х128. Далее обрезка с расширением поля контекста. Далее ресайз до 1024 по больше стороне. Далее ксемплер с нужным денойзом. Далее ресайз в размер оригинала из 1024 в 128. Далее вклейка этого куска(128) в оригинальную картинку в нужную позицию(x,y) (это делается кастомной нодой - именно её нет в Комфи). Готово.
Если результат нравится, но надо ещё вот пальчик подправить, то через одно место кидаешь результат в инпут ноду - в результате этого в инпут папке скапливается хламовник. То есть и здесь не задумано что кто-то будет инпеинтить.
Аноним 09/05/26 Суб 10:17:24 #369 №1608105 
>>1608090
что за модель и лоры?
Аноним 09/05/26 Суб 10:20:11 #370 №1608107 
>>1608102
>Далее ресайз до 1024
не надо ресайз, после того как ты высрал сырец, открой его в фотошопе и увеличь на 1.5 с сохранением деталей (чекбокс), а уже потом открывай в импаинте или в чём ты там будешь делать, там должна быть такая хуита, типа блур какой-то что-ли, этот блур он как-бы замазывает края (швы). Я просто полтораху вспоминаю, как там было сделано. Выложи скрин ксамплера для импаинта.

>>1608105
zit ванильный, лора тощей натахи.
Аноним 09/05/26 Суб 10:28:58 #371 №1608108 
По прежнему нихуя по адекватным лорам / файнтюнам клейна. Месяц прошел, охуеть блять. Такой потенциал проебан
Аноним 09/05/26 Суб 10:32:05 #372 №1608112 
>>1608108
>потенциал
нельзя проебать того, чего нет. и это все понимают, все кроме тебя) максимум на что способна эта ебатень это снять с кого-нибудь труселя и попытаться редуксануть старый долгострой из sdxl.
Аноним 09/05/26 Суб 10:38:12 #373 №1608114 
ComfyUItempjprtz00004.png
>>1608112
> долгострой из sdxl.
Вопрос нахуя нужна эта мазня в принципе.

Ты просто не знаешь как её юзать и что она может. Один только фиксинг рук дохуя бы дал. А если дотренить на текстуры и освещение она станет лучше zit
Аноним 09/05/26 Суб 10:48:56 #374 №1608118 
>>1608114
>лучше zit
не станет, он не знает ничего о композиции, он не знает как сделать красивее, пока его держишь за ноги а эдите, чтобы хуйни не навалил, с ним ещё можно работать, но рисовать с нуля, неее, на это кляйн не способен.
Аноним 09/05/26 Суб 11:13:51 #375 №1608132 
image.png
Кто и куда спиздил у меня фейсдетейлер...
Аноним 09/05/26 Суб 11:21:09 #376 №1608139 
>>1607760
Какая разница, если то и то - соевое гамнище, не умеющее в хард-прон.
Аноним 09/05/26 Суб 11:29:30 #377 №1608145 
F2-Klein-9b-dist-i2i2026050913273700001.png
>>1607872
> 3767Кб, 1669x942
ухватил твою культю, немощь, а если бы ты специально не сделал уебанское разрешение остальная картинка тоже не пострадала
Аноним 09/05/26 Суб 11:32:04 #378 №1608148 
>>1608118
Зит тоже рисует нелепый понос на генераторе, если говорить про полноценную эстетику.
Аноним 09/05/26 Суб 11:34:03 #379 №1608149 
>>1608145
Ты говно наролил сидами. Нужно было нормальную приятную роботическую руку.
Я ролил раз 50 и импейнтом раз 50, он что то рисует, но взяться за руки нормально не может.

То что ты сделал у меня было
Аноним 09/05/26 Суб 11:43:07 #380 №1608156 
>>1608148
Образец нелепого поноса в студию, с ароматом.
А вообще, что промтишь, то и рисует.
Аноним 09/05/26 Суб 11:47:36 #381 №1608159 
>>1608139
В эротику zit умеет. От харда я уже подустал, вернее от безвкусици, и блевотных поневских концептов.
Аноним 09/05/26 Суб 11:51:14 #382 №1608165 
F2-Klein-9b-dist-i2i2026050913432200002.png
F2-Klein-9b-dist-i2i2026050913273700001.png
>>1608149
не, это сразу получилось, с 3 ролла в 1 проход, дальше можно что-то выдумывать-подключать но я не хочу

>Ты говно наролил сидами
ну поплачь,
почини клешню - чек
не руиня качество - чек
остальное пох
Аноним 09/05/26 Суб 13:15:00 #383 №1608205 
А лору на текст сделать это тоже такая большая проблема, что никто не делает и не выкладывает? Или тренят себе и не шарят просто?
Аноним 09/05/26 Суб 13:25:48 #384 №1608212 
image.png
Жесть, прям вижу как ебанат из блек форест лаб обучал флакс на нейрослопе и cgi по тэгам distopia, cyberpunk и все производные.
Он даже в эдите и даже лица рисует в CGI/слоп если есть словечко в промте.
Аноним 09/05/26 Суб 13:37:41 #385 №1608215 
>>1608165
Есть стойкое ощущение того, что мужик стоит на маленькой приставной табуретке
Аноним 09/05/26 Суб 13:39:37 #386 №1608216 
>>1608212
>distopia
Кстати, друуна серпиери это дистопия?
Аноним 09/05/26 Суб 13:52:04 #387 №1608221 
>>1608107
>увеличь на 1.5
Какой-то бред написал. Вот здесь руки как ты будешь инпеинтить? Ну, увеличить исходник >>1608114 размером 2368x1312 в 1.5 и что дальше? Инпаинт нужен не только своих картинок, они могут быть большие. Нормальный инпаинт маской делается с вырезом участка, ресайзом в дефолтное разрешение модели(потому что могли сильна именно в дефолтом разрешении) и только потом прогнать через семплер. Это идеальные условия, которых надо придерживаться.
Аноним 09/05/26 Суб 14:01:59 #388 №1608224 
>>1607898
>это не у меня бомбануло, это у вас
Аноним 09/05/26 Суб 14:09:05 #389 №1608231 
>>1608215
Когда ты обратил на это внимание - да, чето такое есть, видимо по пропорциям, ширине плеч мужика он слишком высоковат. Возможно передние персонажи в принципе слишком высоко парят над землей, относительно бэкграунда. Это пространственный слоп. Такое вообще контрить невозможно.
Аноним 09/05/26 Суб 16:18:34 #390 №1608304 
>>1608165
Ты композцию заруинил вместе с цветом. Если уж руки смогли взяться, нахуй было робота смещать и поворачивать
Аноним 09/05/26 Суб 19:06:49 #391 №1608421 
ComfyUItempkcxji00034.png
Аноним 09/05/26 Суб 20:29:05 #392 №1608469 
>>1608304
так я тоже скилишуе, но клейн не виноград
Аноним 10/05/26 Вск 01:49:11 #393 №1608701 
>>1606927
Локальные модели которые могут в реализм

Это зиты твои не могут и кляйны, а квен может!
Аноним 10/05/26 Вск 01:51:28 #394 №1608703 
>>1606946
переехало на civitai.red
Аноним 10/05/26 Вск 01:52:50 #395 №1608704 
>>1607048
пластик
Аноним 10/05/26 Вск 02:49:20 #396 №1608733 
IMG20260510015403638.jpg
IMG20260510015359462.jpg
Новый HoMM понравился, некоторые мобы впечатлили с:
Аноним 10/05/26 Вск 06:39:06 #397 №1608780 
>>1608148
>Зит тоже рисует нелепый понос на генераторе
Попробовал в сложноту, описал древне-римскую секс-оргию в термах, зетка привычно уже обосралась, тогда как кляйн хотя-бы пытался в сложноту и разнообразие и как водится спутывая тела, путал сам себя, но это была хотя-бы заявка.
Первая опенсурс модель без VAE Аноним OP 10/05/26 Вск 08:14:34 #398 №1608797 
image.png
image.png
Вышлая первая опенсурс модель на UiT - без этапа VAE (МОДЕЛЬ РАБОТАЕТ СРАЗУ НА ПИКСЕЛЯХ БЕЗ ИХ КОНВЕРТАЦИИ В ЛАТЕНТ)

Поддержки ComfyUI пока нет, поэтому ждемся

https://huggingface.co/HiDream-ai/HiDream-O1-Image-Dev
https://huggingface.co/HiDream-ai/HiDream-O1-Image

HiDream-O1-Image — это изначально унифицированная базовая генеративная модель для изображений, построенная на пиксельном унифицированном трансформере (Pixel-level Unified Transformer, UiT) без внешних VAE и отдельных текстовых энкодеров. Она напрямую кодирует исходные пиксели, текст и условия, специфичные для конкретной задачи, в едином общем пространстве токенов, поддерживая генерацию изображений по тексту, редактирование изображений и персонализацию по заданному субъекту с разрешением до 2 048 × 2 048.

Ключевые особенности

Пиксельный унифицированный трансформер — одна сквозная модель, работающая напрямую с исходными пикселями, без VAE и отдельного текстового энкодера.

Одна модель — множество задач — генерация изображений по тексту, рендеринг длинного текста, редактирование по инструкциям, персонализация по заданному субъекту и генерация раскадровок в рамках единой архитектуры.

Промпт-агент с элементами рассуждения — встроенный «думающий» агент, который перед генерацией уточняет неявные знания, композицию и рендеринг текста.

Нативное высокое разрешение — прямая генерация изображений с разрешением до 2 048 × 2 048 и чёткой мелкодетализированной проработкой.

Исключительная эффективность и универсальность при масштабе 8B — при всего 8 млрд параметров модель достигает сопоставимого качества с более крупными open-source DiT-моделями, а в ряде случаев даже превосходит их и ведущие закрытые модели.
Аноним 10/05/26 Вск 09:35:34 #399 №1608821 
>>1608797
блядь, опять эти большеголовые карланы из фейсбучной модели, забыл как называлась.
Аноним 10/05/26 Вск 09:38:47 #400 №1608824 
>>1608797
безусловно, вае это зло, а хуёвое вае (типа флюксового) - здо вдвойне.
Аноним 10/05/26 Вск 10:08:10 #401 №1608836 
Посоветуйте универсальный конфиг zit / zit edit под 16@32 универсальный, что бы текстуры свет пореалистичней были, если базовый не достаточно хорош. Мб файнтюн сразу качать?
Хочу посмотреть zit после клейна
Аноним 10/05/26 Вск 10:13:44 #402 №1608840 
>>1608836
> zit edit
а он уже есть, я что-то пропустил?
Аноним 10/05/26 Вск 10:21:04 #403 №1608845 
>>1608840
У zit нет edit режима?
А ну пиздец тогда.
Аноним 10/05/26 Вск 10:23:38 #404 №1608850 
>>1608836
>Мб файнтюн сразу качать?
Нет, они все васянские, туда абы-как впердолили поневские nsfw-концепты и всё попереломали к хуям. хочешь чтобы пиздёнка более-менее нормально смотрелась, найди лору с нормальной анатомией где баба лицом к тебе и юзай её с весом (0.2) этого будет достаточно. для света ничего специально не нужно, он там нормальный. воркфлоу там простой как лом, юзай эйлер, кфг выше 1.3 не поднимай, и будет тебе счастье.

>>1608845
>А ну пиздец тогда.
там типа есть вф с типа контролнетом, ну это хуета голимая, я с нуля промтом лучше сделаю.
Аноним 10/05/26 Вск 10:26:35 #405 №1608853 
>>1608797
еще и без текстового энкодера. Интересно как это повлияет на следование промптам?

https://www.reddit.com/r/StableDiffusion/comments/1t8ypmd/hidream_01_out_2k_images_in_20seconds_on_a_4090/

Что то уже есть для комфи, но лучше подожду официальной поддержки
Аноним 10/05/26 Вск 10:48:01 #406 №1608863 
>>1608850
Так в итоге не понятно что качать, только turbo? Почему все юзают только турбо, хотя там для base дохуя чего лежит в доступе? Мне не только Nsfw и 1girl надо, главное что бы пластика как в клейн дистиле не было
Аноним 10/05/26 Вск 10:53:38 #407 №1608866 
>>1608863
base и turbo по сути разные модели. используй обои
Аноним 10/05/26 Вск 11:35:30 #408 №1608882 
image.png
>>1608797
> персонализация по заданному субъекту и генерация раскадровок в рамках единой архитектуры.
> Промпт-агент с элементами рассуждения — встроенный «думающий» агент, который перед генерацией уточняет неявные знания, композицию и рендеринг текста.
В связке с клейном могло бы стать имбой

Судя по размеру модельки, она под 24gb? На 16гб как обычно придется юзать урезанное не используя часть памяти
https://huggingface.co/Comfy-Org/HiDream-O1-Image
Аноним 10/05/26 Вск 11:57:32 #409 №1608894 
>>1608882
по твоей ссылке bf16. fp8 весит уже где то 8.8гб, уже терпимо. может и гуфы подвезут
Аноним 10/05/26 Вск 12:37:47 #410 №1608906 
>>1608882
Так если оно без ВАЕ и вообще без латента - там совсем другие требования к памяти должны быть, нет? Декодирование вроде самый затратный процесс.
Аноним 10/05/26 Вск 12:42:08 #411 №1608907 
>>1608733
Графика и худ. дизайн - редкостная унылая хуйня. Безвкусица чуть ли не хуже чем в 4-5ых героях. Огромная ошибка, считать что в играх типа героев графика настолько вторично, что можно сделать её на отъебись нанимая зумерков, эстетика которых ограничивается формой своей залупы.
Аноним 10/05/26 Вск 12:59:26 #412 №1608922 
>>1608863
>только turbo
Качай трубу. Базовая того не стоит, она грузячая.
Аноним 10/05/26 Вск 13:09:55 #413 №1608923 
>>1608922
у базы свои плюсы есть, если обмазать двухшаговыми турболорами
Но проблема в том что в турбе с сисиком-писиком намного лучше чем в базе, в базе хтонь лезет.
Аноним 10/05/26 Вск 13:35:57 #414 №1608933 
>>1608923
> у базы свои плюсы есть,
Какие? Примеры конкретные есть или можешь продемонстрировать?

Я пробовал клейн базу с турбо / дистил лорами. Бейз буквально не дает ничего, кроме пластика. Разница в вариативности и фантазировании настолько мала, что проще другую модель использовать для этого.
Аноним 10/05/26 Вск 13:44:22 #415 №1608936 
>>1608923
Очень долго, долго, долго, и хуёво..,
Аноним 10/05/26 Вск 13:48:57 #416 №1608942 
>>1608933
В базовой, если соотношение сторон h:1000 w:2000 то фигуры людей приземистые и кряжистые, как в кляйна, а в турбе пох.
Аноним 10/05/26 Вск 13:55:48 #417 №1608949 
>>1608863
Там хуевый импейнт без учкета окружающего как в чпокусе и где угодно. Не трать время.
Аноним 10/05/26 Вск 14:06:03 #418 №1608960 
>>1608949
> как в чпокусе
когда руки иэ жопы растут, то всё как в чпокусе.
Аноним 10/05/26 Вск 14:12:03 #419 №1608966 
test.png
>>1608853
В каментах пишут про квадратные артефакты по всему изображению. Попробовал fp8, у меня также шакалит.
Аноним 10/05/26 Вск 14:14:08 #420 №1608969 
>>1608797
Если убрать весь текст, то это не лучше полторашки. Даже в сдохле не так криво всё. ЗАТО БЕЗ ВАЕ
Аноним 10/05/26 Вск 14:18:14 #421 №1608975 
>>1608966
а сколько времени генерируется?

Еще как вариант его использовать в связке с рефайнером, надо только понять какие плюсы он дает.
Аноним 10/05/26 Вск 14:26:16 #422 №1608984 
Screenshot2026-05-10-14-24-28-093io.github.xororz.localdream.jpg
Screenshot2026-05-10-14-24-40-935io.github.xororz.localdream.jpg
на ведроид сдохлю завезли https://github.com/xororz/local-dream
Аноним 10/05/26 Вск 14:31:55 #423 №1608989 
>>1608984
пысы NPU ускорение доступно только на квалкомах, начиная с snapdragon 8 gen 3 и выше. на остальных устройствах на CPU будет где-то в 5-10 раз медленнее
Аноним 10/05/26 Вск 15:06:56 #424 №1609012 
2.jpg
мммм эти внезапные усики на кляйне...
Аноним 10/05/26 Вск 15:08:29 #425 №1609015 
>>1609012
САМАЯ РЕАЛИСТИЧНАЯ МОДЕЛЬ!
Аноним 10/05/26 Вск 15:15:10 #426 №1609017 
>>1609015
Грустно, но это правда. Натуралистичность по дизайну
Аноним 10/05/26 Вск 15:24:43 #427 №1609025 
Что это такое?https://huggingface.co/Keltezaa/flux2_klein_9B_Realism_Engine_V2
Аноним 10/05/26 Вск 15:26:39 #428 №1609027 
>>1609025
это лора
Аноним 10/05/26 Вск 15:44:18 #429 №1609041 
ComfyUItempdavbt00047.png
Аноним 10/05/26 Вск 19:11:35 #430 №1609161 
>>1605778
>>1605818
Дай воркфлоу с настройками
Аноним 10/05/26 Вск 21:50:20 #431 №1609266 
Чем апскейлер отличается от edit модели, если апскейлкер типа 4x-UltraSharpV2.pth все нейро-искажения артефакта сохраняет и шарпит, а едит модель в теории может исправить форму?

Только тем что апспейлер быстрее и меньше памяти жрет за то же разрешение?
Аноним 10/05/26 Вск 21:58:28 #432 №1609273 
>>1609266
> Чем молоток отличается от учебника
Даже не знаю, что тебе ответить. Ты бы лучше спросил, что в них общего ничего
Аноним 10/05/26 Вск 22:23:43 #433 №1609288 
>>1609266
ответ уже есть в твоем вопросе
Аноним 11/05/26 Пнд 00:10:33 #434 №1609380 
Пробовал подключить comfy для генерации в РП через агента и везде выдается кал, может у кого был опыт какую модельку выбрать? Использую самый дефолт просто разок семплирует. Что-то я упускаю.
Аноним 11/05/26 Пнд 00:25:44 #435 №1609389 
>>1609380
ваи+дмд - аниме, биг ласт 1.5+дмд - фото. Всё в фп8. Минимальный вес, 1-3 сек на генерацию.
Аноним 11/05/26 Пнд 01:03:02 #436 №1609408 
>>1609380
> в РП через агента
Чё...?
Аноним 11/05/26 Пнд 01:10:17 #437 №1609414 
>>1609389
Попробовал wai illustrious, помогло просто увеличить размер изображения, этот пидарок отправлял запрос в 512х768
>>1609408
РП-ролеплей, агент - отдельная модель которая готовит из последних сообщений промпт для генерации.
Аноним 11/05/26 Пнд 02:18:34 #438 №1609439 
>>1609414
>из последних сообщений
в этом треде?
Аноним 11/05/26 Пнд 03:23:35 #439 №1609448 
>>1609025
>>1609027

>это лора
говно-лора, уже на весе: 0.6 на клоузапах растягивает головы по вертикали, однако на малых весах фиксит мультяшную анатомию (сука, кто её туда блядь запихнул), где у взрослых людей детские тела с большой головой. Как тут: >>1609041
Аноним 11/05/26 Пнд 07:30:53 #440 №1609478 
А что там, кстати, сам comfyui починили? Была проблема с субграфами.
Аноним 11/05/26 Пнд 09:31:37 #441 №1609499 
>>1609448
> однако на малых весах фиксит мультяшную анатомию
Не верится чет.
Это примерно как "фиксит руки или глаза"
Аноним 11/05/26 Пнд 11:47:32 #442 №1609565 
image.png
>>1609499
это происходит (искажение анатомии). когда промтишь арт-стайл типа рисунок карандашем т. д. на реалистике такого нет. пикрил: о чём примерно идёт речь, обязательно узенькие плечики и несоразмерно большая голова, впервые я эту лажу увидел в рисунках фейсбучного аи. не помню уже как оно там называлось. там ещё гамма ржавая была по дефолту. это какой-то корпорантский стиль, или х.з.
Аноним 11/05/26 Пнд 18:01:16 #443 №1609807 
Comfyui всё!
https://github.com/gjnave/HiDreamStudio
Аноним 11/05/26 Пнд 18:22:43 #444 №1609831 
Какая версия клейна на 4gb vram лучше всего будет?
Аноним 11/05/26 Пнд 19:14:37 #445 №1609899 
>>1609831
да
Аноним 11/05/26 Пнд 19:23:20 #446 №1609907 
>>1609807
> всё!
Это что-то уровня "ПК всё!" с приложенной фоткой айфон 1.
Аноним 11/05/26 Пнд 19:38:47 #447 №1609912 
F2Ksds00008.png
>>1609899
Аноним 11/05/26 Пнд 22:24:34 #448 №1610036 
Безымянный.png
хелпаните по флюксу какой энкодер качать
А то я ток люстрой пользовался вобще не шарю за энкодеры.
Аноним 11/05/26 Пнд 22:31:57 #449 №1610039 
image.png
>>1610036
из дефолтного темплейта для FP8
Аноним 12/05/26 Втр 00:17:30 #450 №1610138 
oSN9l-WzyXhAKRX5EDLq3dicyinIP16GoGPOgH93TMqk0yimXwgDYgHyPWTpvV2ZTJ8Uxw.jpg
Ну как там потомки, пони 2 релизнулась?
Аноним 12/05/26 Втр 04:04:19 #451 №1610261 
Да-уж, с геймчейджерами как-то не задалось в последнее время, Кляйн оказался лакированым говном с проёбаной анатомией, а зетка тупым кастрированным поленом с трудом понимающую человеческую (какую угодно) речь.
Аноним 12/05/26 Втр 10:18:24 #452 №1610338 
image.png
image.png
image.png
В комфи добавили поддержку HiDream-O1-Image

https://github.com/Comfy-Org/ComfyUI/pull/13817

если честно, я пока хз зачем она нужна, в сисик писик не умеет.
Аноним 12/05/26 Втр 10:39:42 #453 №1610361 
>>1610338
Чё сколько врама на этого монстра надо?
капча пиздец стала
Аноним 12/05/26 Втр 10:43:16 #454 №1610365 
>>1610338
Новая имба. Наконец-то хейтеры зиты и кляйна смогут себя реализовать
Аноним 12/05/26 Втр 10:46:38 #455 №1610368 
image.png
image.png
>>1610338
пики выше - это dev версия, т.е. дистилированая.

Полная немного пореалистичнее выглядит но все равно не очень весело.

>>1610361
rВ комфи залетело 11600MiB, на 12гб врам думаю будет работать
Аноним 12/05/26 Втр 10:51:40 #456 №1610370 
>>1610368
Впечатление такое что оно само не понимает что оно рисует, особенно по первому пику.
Аноним 12/05/26 Втр 10:53:59 #457 №1610372 
>>1610368
Имба: реалистичная текстура кожи, нет желтизны кляйна, нет плесени зетки, зеленых пикселей в тенях не обнаружил 👍
Аноним 12/05/26 Втр 11:05:14 #458 №1610382 
>>1610338
>>1610368
Забыл уточнить, я использовал эти модели,

hidream_o1_image_dev_mxfp8.safetensors hidream_o1_image_mxfp8.safetensors

ща попробую обычный fp8, но мне кажется разницы не будет.
Аноним 12/05/26 Втр 11:25:06 #459 №1610405 
>>1610368
Прикольно, попробовать надо будет.
Мне кажется этот o1 надо будет прямо в корне по другому промтить.
Аноним 12/05/26 Втр 11:26:14 #460 №1610406 
>>1610338 >>1610368
Хотя вот то что у девочки сначала кожаная рука, а потом - механическая, это как-то сильно ломает надежды
Аноним 12/05/26 Втр 11:34:56 #461 №1610411 
image.png
image.png
image.png
>>1610406
Я использовал промпт из >>1607184
Ща вчитался что там написано:

The man stands slightly in front, protective, tense posture. The girl looks frightened and vulnerable, slightly leaning toward him. In her other robotic biomechanical hand, she clutches a worn, dirty teddy bear.

Вроде все правильно.

1) hidream_o1_image_fp8_scaled.safetensors
2) hidream_o1_image_dev_fp8_scaled.safetensors

расход врам кстати поменьше будет, 8,6гб, скорость генерации не такая уж и плохая
Аноним 12/05/26 Втр 11:36:26 #462 №1610413 
image.png
>>1610411
скрин обрезался
Аноним 12/05/26 Втр 11:39:52 #463 №1610418 
>>1610411
Попробуй пиксельарт. Мне кажется это вообще модель не для реализма.
Аноним 12/05/26 Втр 11:40:44 #464 №1610420 
>>1610338
В эдит может? Не ясно, зачем нужен еще один генератор вообще, даже с сисиками-писиками.
Аноним 12/05/26 Втр 11:44:59 #465 №1610429 
>>1610413
>80s
ммм, найс...
Аноним 12/05/26 Втр 11:52:07 #466 №1610433 
Хосспаде, какое говно
Аноним 12/05/26 Втр 11:55:03 #467 №1610441 
>>1610420
>>1610338
Нашел уже, может. Ну, в общем, действительно неплохая моделька, похоже. Размер небольшой, синематик-фотореалистик может. Для местных зажравшихся и сумасшедших пикседрочителей и гунеров не нужна, конечно, а вообще хорошая штука. Лицензия открытая, вроде. В своем роде действительно геймченджер.
Аноним 12/05/26 Втр 11:57:57 #468 №1610444 
image.png
>>1610420
не похоже, хотя в тестовом воркфлоу какие то ноды для едита. надо разобраться.

>>1610418
dev cat girl and bowl rice. pixel art

похоже ёё сильная сторона - это иллюстрации всякие.
Аноним 12/05/26 Втр 12:01:05 #469 №1610452 
>>1610444
Ну, я Реддит читнул, вроде может. Ноды тоже неспроста.
Аноним 12/05/26 Втр 12:06:41 #470 №1610460 
image.png
>>1610452
может не доделали еще, у меня не работает чот.
Аноним 12/05/26 Втр 12:08:31 #471 №1610463 
>>1610460
Мне кажется тут такого микропромта не достаточно.
Аноним 12/05/26 Втр 12:08:34 #472 №1610464 
>>1610460
Может быть, но:

HiDream-O1-Image is a natively unified image generative foundation model built on a Pixel-level Unified Transformer (UiT) without external VAEs or disjoint text encoders, which natively encodes raw pixels, text, and task-specific conditions in a single shared token space — supporting text-to-image, image editing, and subject-driven personalization at up to 2,048 × 2,048.
Аноним 12/05/26 Втр 12:24:22 #473 №1610478 
image.png
>>1610420
Потому что нормальных локальных генераторов по сути нет либо только в иллюстрациях. ZIT- 1girl only. Klein - 1girl only.
Генераторов со встроенным ризонингом тем более нет.

То что он нарисовал обнимание девки и эмоции на лицах - уже может о чем то говорить. Клейн например эмоции сам нормально рисовать не умеет, а с промта рисует через раз либо хуету невнятную.

>>1610338
>>1610368
>>1610411
Для сцены с робо руками в апокале у тебя явно не тот aspect rate стоит - постерный. 16:9 тут лучше подходит, особенно для раскрытия бэкграунда. Но уже по постеру видно, что у него около-клейновская фантазия, буквально клейновский задник и сюжет.
Ризонинг не особо заметен.
6 пальцев - чек
Наличие взаимодействия рук и эмоций уже неплохо.

То что мыло рисует означает просто что можно юзать только с рефайнером, еще бы это стоило того. Не понятно только почему они выкатили мыло, когда не демонстрационных скринах мыла не было. Буду тоже пробовать.
Аноним 12/05/26 Втр 12:38:15 #474 №1610494 
>>1610411
А где t2i workflow брать?
Аноним 12/05/26 Втр 12:44:20 #475 №1610500 
>>1610494
в PR есть тестовый воркфлоу, там и ссылки на перепакованые модели от комфи

https://github.com/user-attachments/files/27607439/hidream_o1_image_testing.json
Аноним 12/05/26 Втр 12:48:03 #476 №1610507 
>>1610494
Я вф на t2i и i2i отсюда брал https://github.com/Saganaki22/HiDream_O1-ComfyUI/tree/main/example_workflows

Мимо
Аноним 12/05/26 Втр 12:58:40 #477 №1610520 
>>1610478
Так там еще и ризонинг? Ну, тогда это вообще серьезная заявка. Может быть на нем еще не научились нормально делать, промпт нужен. Текстуры у модели слабые, это под доработку модель. Но в целом, как база неплохая. Ну и может потом разработчики разовьют это еще. Архитектура интересныя, фичи хорошие.
Аноним 12/05/26 Втр 13:10:23 #478 №1610537 
>>1610507
>>1610500
Почему совершенно разные воркфлоу. В этом >>1610507 нода предлагает на выбор модели которых у меня нет, и не видит мою hidream_o1_image_dev_mxfp8.safetensors при запуске.

Для image_testing ноды в мененджере не ищутся. Хуета какая ебучая
Аноним 12/05/26 Втр 13:19:02 #479 №1610546 
>>1610537
В >>1610507 он смотрит на путь ComfyUI\models\diffusion_models\HiDream-O1-Image-bf16\model.safetensors
Попробуй так ее сохранить. Ну или поставить галочку на ноде download = true, он сам скачает при генерации
Аноним 12/05/26 Втр 13:28:33 #480 №1610553 
>>1610537
В checkpoints положи
Аноним 12/05/26 Втр 13:54:17 #481 №1610584 
бумагу на Qwen-Image-2.0 выложили
https://www.reddit.com/r/StableDiffusion/comments/1taxowh/qwen_image_2_papers_does_that_mean_anything/

делаем ставки, будут ли веса на обнимилицо?
Аноним 12/05/26 Втр 14:06:37 #482 №1610600 
image.png
image.png
там какие то уебища на разрабах

- Я скачал hidream_o1_image_dev_mxfp8.safetensors
положил в \diffusion_models\HiDream-O1-Image-Dev-FP8
- Скачал все файлы кроме модели отсюда https://huggingface.co/drbaph/HiDream-O1-Image-Dev-FP8/tree/main и положил в \diffusion_models\HiDream-O1-Image-Dev-FP8
- Скачал HiDream O1 нод пак в менеджере

В итоге генерит мозайку. Ебанина пиздец. Кто так делает нахуй
Аноним 12/05/26 Втр 14:15:04 #483 №1610611 
image.png
>>1610600
бери вф из пр и не забудь обновить комфи до головы
Аноним 12/05/26 Втр 14:45:32 #484 №1610624 
image.png
>>1610611
мб mxfp8 просто не работает

а еще эти ноды для другого workflow неоткуда брать, их просто нет в менеджере
Аноним 12/05/26 Втр 14:56:02 #485 №1610632 
>>1610624
они в стандартной поставке комфи https://github.com/Comfy-Org/ComfyUI/pull/13817/changes#diff-86867154173748a4a65c0c6202ab76723653a9ede24909368b749298b382ff9c
1) обнови комфи до апстрима
2) убедись что все зависимости установил (ноды могут пропадать если в них случился какой то сбой)
Аноним 12/05/26 Втр 15:15:35 #486 №1610644 
>>1610611
Воркфлоу я брал отсюда https://github.com/Saganaki22/HiDream_O1-ComfyUI/tree/main/example_workflows
Аноним 12/05/26 Втр 15:20:04 #487 №1610646 
>>1610368
>>1610338
Что это за дрисня уровня полторашки?
Аноним 12/05/26 Втр 15:26:53 #488 №1610647 
/nf
Аноним 12/05/26 Втр 15:38:19 #489 №1610652 
image.png
>>1610644
зачем? это васяно вф для васяно нод. речь про оффициальную поддержку в комфи.
Аноним 12/05/26 Втр 15:40:35 #490 №1610654 
>>1610646
>уровня полторашки?
полторашка на фоне этого говна выглядит не так уж и плохо. как же заебали эти ньюфаги, готовы уцепиться за любой кал. засрали полтреда слопом прямиком из 2019 года.
Аноним 12/05/26 Втр 16:07:42 #491 №1610665 
image.png
image.png
image.png
image.png
>>1610429
я обнаружил что mxfp8 намного медленнее отрабатывает (на 5060ти), на fp8 генерируется за 35 секунд против 80-200 секунд для mxfp8.

Еще баг с клеточками бы им победить. в целом у меня ощущение что модель тупо недообучили
Аноним 12/05/26 Втр 16:13:52 #492 №1610667 
>>1610654
>>1610646
перекатывайте дрисней
Аноним 12/05/26 Втр 16:26:10 #493 №1610673 
image.png
image.png
image.png
>>1610665
> mxfp8
Покажи на каком воркфлоу запускаешь и как ноды качал?
Всё как описано установил, комфи / ноды обновил, но нод всё равно нет.
Через командную строку репа не качается
Аноним 12/05/26 Втр 16:34:07 #494 №1610677 
image.png
>>1610673
1) у меня вф из пр https://github.com/user-attachments/files/27607439/hidream_o1_image_testing.json
2) никаких нод не качал даже, это комфи ноды
3) убедиться что комфи обновлен до последних коммитов (git pull & git show 8e53f001a492cc818768a308362adbd3d75a1c43), stable ветка тут не годится.
4) обновить зависимости


А вообще, зачем тебе это надо? вон аноны сказали что это говно.
Аноним 12/05/26 Втр 16:36:57 #495 №1610679 
>>1610677
> зачем тебе это надо? вон аноны сказали что это говно.
потрогать, финальное качество меня не так сильно волнует, важно как и что он может генерить
Аноним 12/05/26 Втр 16:47:58 #496 №1610685 
>>1610600
Ты джрпг решил генерить?
Аноним 12/05/26 Втр 17:01:14 #497 №1610695 
>>1610677
>аноны сказали что это говно
Это ожидаемо. На реддит всё выглядит прекрасно. Как обычно.
Аноним 12/05/26 Втр 17:12:21 #498 №1610714 
>>1610695
это типичная западная культура позитивной токсичности - говоришь амазинг - подразумеваешь говно
Аноним 12/05/26 Втр 17:21:19 #499 №1610717 
>>1610714
Я не читаю что там пишут. Я смотрю картинки и делаю выводы.
Аноним 12/05/26 Втр 18:03:25 #500 №1610743 
анончик, подскажи нюфане куда копать - нужен нейрослоп где на разнообразных милф надевать разнообразные украшения (кольца, серьги и тп)

куда копать?
вкатываться в эту комфи из топа или есть что-то проще, для пролетариев?

Чёт для меня весь этот новояз с нодами-хуёдами вообще непонятен, но интерфейс, как понел, это сорт оф грассхопер из носорога
Аноним 12/05/26 Втр 18:14:23 #501 №1610747 
>>1610677
> git pull & git show 8e53f001a492cc818768a308362adbd3d75a1c43
С этим сработало, спасибо. Но я не понял почему при обновлении comfy из менеджера у меня нихуя не обновлялось.
Как мне впоследствии обновляться не имея этого ID?
Я не врубаюсь, что я сделал в принципе. Вот эта обнова https://github.com/Comfy-Org/ComfyUI/pull/13817 её как проще всего накатывать, потому что пул реквест что ты скинул, я не ебу где его брать, а UI комфи обновить это не предлагает.

>>1610652
Судя по тому, какое мыло генерит, мы вообще уверены что дефолт воркфлоу / настройки корректны? Рекомендованы только степы, про CFG не сказано нихуя. Где там обещанный Reasoning-Driven Prompt Agent вообще, и как его подключать?>>1610665
Аноним 12/05/26 Втр 18:25:02 #502 №1610758 
image.png
image.png
image.png
>>1610665
> mxfp8 намного медленнее
Там в темплейте написано что он лучше качество выдает, у меня на 5070ti 18-20sec в 2mpx 28steps

Из за ебанской установки и непрозрачной архитектуры, ощущение что модель в комфи неправильно работает. Писали что там есть какой то агент с ризонингом, а в комфи то он работает вообще или нет?

На пик4 клейн. Качество хоть и высокое, но нарратив хуже чем у новой мутной залупы: буквально покушать принес.

У меня всё нормально с воркфлоу хайдримы?
Аноним 12/05/26 Втр 18:32:32 #503 №1610766 
>>1610747
id коммита это для проверки.
так то достаточно git checkout master && git pull делать. а из манагера мб делало до стабильной ветки (в тег)

по поводу мыла - я ебу, может нужно подождать оффициального релиза, наверное какие то мокрописьки упустили/не доделали. там и редактирование непонятно как работает
Аноним 12/05/26 Втр 18:44:08 #504 №1610776 
>>1610747
>Я не врубаюсь, что я сделал в принципе. Вот эта обнова https://github.com/Comfy-Org/ComfyUI/pull/13817 её как проще всего накатывать, потому что пул реквест что ты скинул, я не ебу где его брать, а UI комфи обновить это не предлагает.

смотри, если PR замержен (там Merged) то оно в апстриме и надо только подтянуть из гита.

А если PR еще пилится, но в жопе свербит потыкать фичу
- можно сделать так:

curl -sL <url пулл реквеста>.patch |git apply -

например

curl -sL https://github.com/Comfy-Org/ComfyUI/pull/13735.patch |git apply -

оно применяет но не коммитит pr и откатить изменения можно тупо git checkout . ну или лучше ветку себе сделать экспериментальную. базовая работа с гитом короче.
Аноним 12/05/26 Втр 19:04:04 #505 №1610789 
ostris-about-hidream-o1-lora-on-toolkit-v0-lyrnxerm4e0h1.webp
>>1610717
выглядит ошеломительно
Аноним 12/05/26 Втр 20:09:13 #506 №1610823 
image.png
Есть ощущение, что у модели нихуя нет никакого ризонинга в том комфи воркфлоу что скинули. Где вообще ллмка-то которая ризонит? Она типа встроенна в модель с диффузией или что?

Я генерю один и тот же промт в 1 строчку без уточнений - и тянется абсолютно одинаковый бэкграунд, очень похожий нарратив.

Если я ввожу Random background. Или Get creative with the background - это игнорируется.
Где ризонинг нахуй и как он в действительности работает- то что телка держит книгу в руках и смотрит в лицо мужику, ну мое почтение. Клейн даже такое не умеет сам достраивать.

Те кто шарят - видели в глаза этот ризонинг, он там есть или нет, или его донастраивать нужно?
Где вот эта gemma? Я её не качал, воркфлоу без этого работает

Да я даун, нихуя не понимаю
Аноним 12/05/26 Втр 20:20:01 #507 №1610838 
>>1610823
Reasoning-Driven Prompt Agent — Built-in "thinking" agent that resolves implicit knowledge, layout, and text rendering before generation.

а так кури матчасть. это UiT модель, не путай с DiT

Это иронично, но логично: то, что на бумаге выглядит как «избавление от посредников», на практике часто упирается в нехватку обучающих ресурсов.
«Мыло» и пластиковый эффект в HiDream-O1, скорее всего, вызваны двумя причинами:

1. Недообученность (Underfitting): Работать с сырыми пикселями на порядок сложнее, чем с компактным латентным пространством. Чтобы UiT выдал такую же четкость, как DiT, ему нужно в разы больше данных и вычислительных часов. Если модель «не дожали», она выдает усредненные, «безопасные» значения пикселей — отсюда эффект пластика.
2. Проблема высокого разрешения: VAE в традиционных моделях берет на себя всю «грязную» работу по отрисовке текстур. Без него трансформеру приходится самому учиться рисовать каждый прыщик и ворсинку. Если веса модели недостаточно велики, она просто не может запомнить такую детализацию и «заглаживает» картинку.

В чем тогда смысл её крутить?
Её преимущество сейчас не в эстетике, а в структурной логике:

Соблюдение промпта: Посмотрите, насколько точно она расставляет объекты. Благодаря единому токенному пространству она должна лучше понимать пространственные связи («слева», «под», «внутри»), на которых латентные модели часто спотыкаются.
Редактирование: Попробуйте задачи на дорисовку или изменение части изображения. Архитектурно она должна делать это бесшовнее, чем DiT через маски.

Пока это выглядит как Proof of Concept: разработчики доказали, что «так можно», но по качеству картинки они сейчас в позиции догоняющих (примерно на уровне Stable Diffusion 1.5 по детализации, но с логикой современных моделей).

Аноним 12/05/26 Втр 21:05:57 #508 №1610865 
>>1610838
так а где gemma 4 31B то находится? я отдельно её не качал, она на домашнем железе то едва запустится
а там рассказывают про какой то промт агент с ризонингом
Аноним 12/05/26 Втр 21:41:11 #509 №1610884 
image.png
image.png
>>1610865
хм... кажется про ризонинг они напиздели

я тут в карточке модели немного полистал, это короче просто промпт рефайнер, в комфи отдельной нодой можно присрать или рефайнить через чатик дикпика. как у эрины. к модели оно имеет слабое отношение.
Аноним 12/05/26 Втр 22:04:31 #510 №1610888 
>>1610884
так а в чем архитектурное решение то тогда,
к любой модели можно прицепить любую ллмку с любым систем промтом,

смысл то в том, что помимо ризонинга ллмка еще и очень хорошо знает модель которая рисует, либо еще более сложно и интегрирована

нихуя не понял, в любом случае gemma 4 31B это 30гб vram+ и нахуй они её предлагают и как её использовать, где воркфлоу нихуя нет,
ебучие пиздтоглазые неадекваты
Аноним 12/05/26 Втр 22:08:02 #511 №1610891 
>>1610888
своруй у них системный промпт, лол

https://github.com/HiDream-ai/HiDream-O1-Image/blob/main/prompt_agent.py
Аноним 13/05/26 Срд 03:47:20 #512 №1611003 
>>1610888
>неадекваты
Это вы неадекваты, бросаетесь на любой высер, ищите там, где искать нехуй, а потом разочаровываетесь, ищите виноватых, что ваши надежды и чаяния не оправдадлись.
Аноним 13/05/26 Срд 06:53:11 #513 №1611029 
>1610838
Объясните тогда мне такое. Почему бы не сделать ультра супер пупер vae с хорошими текстурами? Какого хрена они клепают новые модели и используют б/у vae? Теоретически можно сделать новое vae к существующим моделями которые выдают "пластик" и заставить их выдавать шедевры?
Аноним 13/05/26 Срд 07:01:29 #514 №1611032 
>>1611003
Я надеялся, что я не прав, и технически подкованные объяснят, как именно там ризонинг устроен или как его подключать.
Я не врубаюсь как оно работает, с кучей файлов в папке с safetensor. Мб со временем люди вынесут на блюдечке рабочий интересный вариант.
Сейчас пока что фантазирование и постановка кадра модели едва заметно лучше клейна. То есть даже юзать для креативного черновика сомнительно, хоть и можно если t2i клейна совсем в горло не лезет.
Например 1 строчка промта "стимпанк люди с роботами" в клейне люди стоят с тарелками еды и половником в мастерской как дауны, а в хайдриме реалистично что то обсуждают или смотрят на друг друга, но задник убогий, и в постапокале тоже.
Аноним 13/05/26 Срд 07:05:18 #515 №1611035 
>>1611029
Причём зачастую видно как vae убивает нахуй всё что ты напромтил, на превью одно, а на выходе голимая хуита, для sd моделей это была обычная практика - для каждой модели делать свои собственный vae, а тут вдруг что в облом им стало, что поменялось, в чём сложнось?
Аноним 13/05/26 Срд 07:56:43 #516 №1611049 
>>1611029
>>1611035
Ебать вы. Вае просто латент пиксели переводит, у него нет контекстного понимания что там изображено. Он видит просто цифры в тензоре. Максимум может замылить, цветовой баланс похерить, контраст там.
Аноним 13/05/26 Срд 08:36:13 #517 №1611062 
>>1611049
А теперь, по твой логике, зачем модель БЕЗ vae? Что-то бы что?
Аноним 13/05/26 Срд 08:37:57 #518 №1611063 
image.png
Рэндомные генерации хайдрим с "постапокалом".
Задник почти идентичный клейновскому.
Даже если хайдрим начнет сейчас генерить текстурки как клейн, во многом нихуя не изменится. Разве что позинг + эмоции намного лучше чем в клейне с его тупорылым покерфейсным стоянием всего.
Аноним 13/05/26 Срд 08:57:13 #519 №1611066 
Я помню во времена sdxl в этом треде постоянно приходил чел и докапывался, что модель не может сгенерировать лежащую девушку на кромке крыши или что-то такое. Тоже всем недоел, как вы.
Упрутся в один столб посреди поля и проехать не могут. Прямо вот пока не разрешиться идея-фикс ничего другого генерировать нельзя!
Аноним 13/05/26 Срд 10:11:38 #520 №1611085 
>>1611049
или деталировку угробить к хуям
Аноним 13/05/26 Срд 11:29:11 #521 №1611121 
>>1611062
Логика этого а ля бля лосслесс без сжатия - латента нет, сразу огромная сетка пикселей - идеальный мелкий текст и нет артефактов сжатия, универсальность обучения: оно подходит скорей для спец-задачек снимков медицина/космос. Нужно намного больше врама для тех же задачек, что моделям с вае и тем же качеством на глаз по сути, и даже имея много врама это всё равно будет дольше в генерации. Тупо нишевая хуйня для текста и графиков, карт и т.п. Нахуй не нужОно
Аноним 13/05/26 Срд 13:34:58 #522 №1611182 
>>1611066
> не разрешиться идея-фикс
Нет никакой идеи фикс, просто рэндомные кейсы которые наглядно подсвечивают ограничения. Если кто то их тестит на разных моделях, это не идея фикс.

> проехать не могут.
Проехать к 1girl standing или куда?
Аноним 13/05/26 Срд 15:02:41 #523 №1611230 
сперва эти пидоры всё цензурят с тряской, а приходят домой и их голову в рот ебут с разгона до соплей, промытые нормисные турбогниды
Аноним 13/05/26 Срд 15:25:26 #524 №1611241 
>>1611230
Нормисы не люди
Аноним 13/05/26 Срд 17:14:12 #525 №1611282 
Я тут решил потыкатю эрни и обнаружил что не добавили поддержку гуфов для мистрали

https://github.com/city96/ComfyUI-GGUF/pull/436
https://github.com/city96/ComfyUI-GGUF/issues/439

Не понимаю почему они месяц не могут замержить?
Аноним 13/05/26 Срд 22:03:31 #526 №1611456 
Пока вы тут аутируете, завезли революцию
https://www.reddit.com/r/StableDiffusion/comments/1tazxqz/int8_in_the_age_of_mxfp8_an_investigation_into/

новый int8 ебет fp8, при этом еще и быстрее намного. Амперы сделались great again
Аноним 13/05/26 Срд 22:22:56 #527 №1611471 
>>1611456
для врамобояр если только
Аноним 13/05/26 Срд 22:28:58 #528 №1611478 
ComfyUI00158.png
ComfyUI00159.png
image.png
klein 9b fp8
4mpx
SamplerCustomAdvanced: 14.35 сек (пик1)
KSampler (Advanced): 15.94 сек (пик2) - на 11% дольше
Сид, настройки идентичные. Промт 1 строчка.

Почему разница такая существенная?
В KSampler помимо значительно большей детализации / текстур - пережженая картинка - как фиксить? Это simple scheduler? В таком виде его юзать явно не стоит.

У SCA плюс только один - картинка не пережженая, в остальном хуже и глюков заметно больше.
Аноним 13/05/26 Срд 22:44:11 #529 №1611493 
>>1611471
флюх 9 гб стал весить, пчел. Даже в 3060 залетит со свистом
Аноним 13/05/26 Срд 23:32:35 #530 №1611526 
>>1611478
Ты мешаешь тёплое с мягким, тебя сложно понять.
Твоё сравнение некорректно.

Вкратце: KSampler (Advanced) это придаток к обычному KSampler для разбиения на этапы по количеству шагов и докручивания. Начинается на KSampler, затем передаётся на KSampler (Advanced), который может подхватить latent на нужном шаге и доденойзить его (уже, возможно с другими параметрами cfg, sampler, scheduler). Тебе уже об этом когда-то писали (или просто вы задаёте одинаковые вопросы и наступаете на одни и те же грабли). Копните поглубже теорию, сэкономите нервы и время вместо шаманства.

SamplerCustomAdvanced это швейцарский нож, который позволяет подключать различный шум, экзотические сэмплеры и скеджулеры. Кастомизируется практически всё, в отличие от KSampler.
В данном случае у тебя sigmas задаёт узел Flux2Scheduler. Если ты их выведешь отдельно, то они будут несколько отличаться от тех, которые будут в simple scheduler в твоём KSampler (Advanced).
А поскольку ты работаешь с distill на 4 шага, то изменение sigma от расчётных, на которые он обучен, на таком малом количестве шагов способно подтолкнуть FLUX.2 [klein] рисовать другое. FLUX.2 [klein] 9B distill вообще очень чувствителен к изменению sigmas. База на большом количестве шагов тебе это может простить. А distill обучен под определённое количество шагов (4) с определёнными sigmas, которые выдаёт узел Flux2Scheduler с поправкой на разрешение изображения (входы width и height).
Можешь использовать узел custom sigmas и поменять sigmas, чтобы посмотреть как это будет влиять на выходное изображение (при сохранении seed и разрешения генерации).
Аноним 13/05/26 Срд 23:41:29 #531 №1611531 
>>1611526
Фикс.
Два KSampler (Advanced) можно соединить.
На втором задаётся add noise — enable, return with leftover noise enable и количество шагов steps, и ещё (start at step 0, end at step n). А на втором, add noise — disable, return with leftover noise disable и количество шагов steps вместе с (start at step n+1, end at step можно оставить default 10000; всё равно, отработает только указанное количество steps).
Забыл уже как KSampler работает, так как только SamplerCustomAdvanced уже более полугода для всего использую (FLUX.2 [dev], FLUX.2 [klein] 9B, LTX 2.3).
Аноним 14/05/26 Чтв 00:12:19 #532 №1611552 
>>1611456
Сомнительно.
Я наверно плохо смотрел, но по ссылке идёт сравнение только по циферкам, а хотелось бы оценить результат глазами.
Для себя я как-то визуально определил: BF16>FP8>GGUF Q8 (мне показалось, что отдельные веса, отквантованные с более высокой точностью в итоге погоды не делают; а удел GGUF это дефицит VRAM при наличии RAM для offload) и ниже, а дальше уже всё остальное. Поэтому был несколько удивлён ранжированием, где GGUF Q8 на первое место ставят. Но это, я так понимаю, опять по абстрактным циферкам, а не по результату генерации.

Не особо хочется со всем этим разбираться, так как FP8 меня в целом устраивает. Но если кто-то попробует, то будет интересно посмотреть на результаты визуального сравнения.

Там ещё вроде бы не очень сложно модель перегнать в INT8. Если решусь, то наверно есть смысл FLUX.2 [dev] перелопатить.
С другой стороны смущает фраза:
Requirements:
Working ComfyKitchen (needs latest comfy and possibly pytorch with cu130)
Triton

Windows untested, but I hear triton-windows exists.

Я как-то (зачем-то) пробовал его ставить, но получалось криво. Да и вроде не нужен был особо, поэтому я дальше разбираться с ним не стал.
Аноним 14/05/26 Чтв 00:25:40 #533 №1611559 
>>1611552
Так циферки и замеряют отклонения от латента на bf16. Q8 ггуф это ультрабесполезная хрень, потому что вместо него можно гонять полную модель с оффлоадом и получать ту же скорость.
Давай промт, потестирую. Для меня это ультраполезно оказалось в базовой модели, почти в два раза сократилось время на шаг
Аноним 14/05/26 Чтв 00:37:12 #534 №1611568 
>>1611559
>Давай промт, потестирую.
Спасибо.
Мне в целом prompt не особо важен.
Если можешь, просто запости два изображения рядом. Одно на bf16 (или fp8, что у тебя есть), а другое на этом int8 conv. Желательно какой-нибудь общий план с мелкими деталями и крупными персонажами на переднем плане.
Впрочем, не принципиально, что есть пойдёт. Мне посмотреть артефакты в мелких деталях и текстуры.

Если всё-таки нужен prompt, то вот, но он не универсальный. Под FLUX.2 я бы его по-другому написал теперь.

A close-up shot depicting a Caucasian man and a Caucasian woman looking at each other. There is a spherical object hovering between them in the centre of the image, left half of the object is Earth, right half is an intricate clockwork mechanism. There is a birch tree with lush leaves in the foreground. Sunny day. Hyperfocal, deep depth of field.
Аноним 14/05/26 Чтв 00:56:48 #535 №1611575 
output00212.png
output00213.png
>>1611568
Вот, можешь угадывать, какой из них bf16, какой int8convrot
Аноним 14/05/26 Чтв 01:08:56 #536 №1611581 
>>1611575
Спасибо.
Затрудняюсь назвать.
00213 — bf16?
Аноним 14/05/26 Чтв 01:12:43 #537 №1611583 
>>1611581
Ага. Ну я на картинках вообще не вижу какой-то критичной разницы - где у одной артефакты, там и у другой артефакты. У int8 еще пару деревьев выросло. Но я не включал детерминированные алгоритмы, так что хз это из-за моделей или нет.
Аноним 14/05/26 Чтв 01:42:23 #538 №1611594 
FLUX2dk00028.png
A cinematic movie still of people and steampunk robotic automatons. The people and automatons are working together, performing routine maintenance operations. Some automatons and people are arranging and laying out the merchandise on the stalls. A few other are watering the flowers with water hoses. Some are engaging in a conversation.
A busy bustling street of a Victorian England industrial city.
Cinematic movie still with dramatic lighting. A full shot from eye level shot on 35 mm lens, f/16. Practical lighting, dramatic lighting, warm highlights, cool shadows. Sharp texture details. Atmospheric haze.


Не экономьте токены на FLUX.2.
Аноним 14/05/26 Чтв 01:44:09 #539 №1611595 
>>1608863
Если машина мощная то качай обе, делай базовый рисунок базой а потом делай имг-имг через турбу для качества. Если гпу 8ГБ то качай турбу и к ней z-image-turbo-sda лору для частичного обращения взад коллапса вариативности. Все, других моделей нет и ненужно, жди з-имаге турбо 2 на 24 гб под РТХ 5090. Все модели после это кал под бенчмарки у которых вариативности нет от слова совсем, которые используют отдельную ллм для рефайна промтов всилу отсутствия вариативности, и у которых нет лор потому что всем похуй и никому не сдался весь этот зоопарк из одинаковых моделей.
Аноним 14/05/26 Чтв 03:37:57 #540 №1611617 
>>1611456
Если в кратце - какие преимущества и на каких карточках?
Ниже вес? Скорость выше? Что там еще обещают?

Если Анима по скорости с SDXL-моделями сравняется - будет интересно. Но маловероятно, как мне кажется.
Плюс лоры-контролнеты наверняка несовместимы будут...
Аноним 14/05/26 Чтв 05:38:38 #541 №1611630 
>>1611595
>z-image-turbo-sda лору
дай ссылку, иначе заебусь искать
Аноним 14/05/26 Чтв 08:02:02 #542 №1611658 
>>1611595
>Если машина мощная
Да даже если и не мощная, можно так делать, просто в два воркфлоу
Аноним 14/05/26 Чтв 08:13:52 #543 №1611665 
image.png
>>1611594
> FLUX 2
> 8 одинаковых мужиков в пальто и шляпе
Спосибо, не
Аноним 14/05/26 Чтв 09:56:43 #544 №1611714 
Суть инсайда с Реддита заключается в новом подходе к квантованию диффузионных моделей с использованием INT8 ConvRot (с алгоритмом сферического вращения весов).Этот метод решает главную проблему старого целочисленного квантования: он убирает выбросы в значениях (outliers), из-за которых генерация на обычных INT8-моделях раньше превращалась в кашу. Главные инсайты: По качеству картинки (метрикам SNR и сходства с оригиналом BF16): BF16 > GGUF Q8 > INT8 ConvRot > MXFP8 > FP8. Новый тип квантования выдаёт картинку значительно чище, чем стандартный FP8, и точнее передаёт детали. По скорости работы: INT8 ConvRot даёт ускорение генерации в 1.43× — 1.88× раза по сравнению с базовым BF16. Он работает быстрее, чем новый и тяжёлый формат MXFP8. Видеокарты RTX 30-й серии (Ampere) аппаратно не поддерживают формат FP8 (он появился только в RTX 40 / Ada Lovelace). Зато архитектура Ampere (и даже старая Turing RTX 20) идеально и нативно ускоряет INT8 на аппаратном уровне. Для владельцев RTX 3060/3090 это буквально бесплатный буст производительности. Даже владельцам RTX 4060 Ti (8 ГБ VRAM) и выше, есть смысл попробовать, но с оговорками: Плюсы: Экономия памяти (VRAM): Модель в формате INT8 весит столько же, сколько в FP8. Для 8 ГБ VRAM это критически важно при запуске тяжёлых моделей уровня Flux.1 Dev. и выше. Выше качество: получаем генерации, которые по деталям и точности ближе к оригинальному тяжёлому весу BF16, обойдя по качеству мыльноватый FP8. Аппаратная поддержка: RTX 4060 Ti и выше отлично переваривает целочисленные вычисления. Минусы и нюансы: Разница в скорости уже на RTX 4060 и выше не будет шокирующей: На архитектуре Ada Lovelace (RTX 40) компания NVIDIA уже добавила мощные блоки для FP8. Поэтому безумного прироста скорости именно по сравнению с FP8 не будет (в отличие от владельцев RTX 3090, у которых FP8 тормозил). Главный выигрыш — чуть лучше качество картинки при том же потреблении VRAM. Проблемы совместимости на старте: Технология только заехала в ComfyUI через кастомную ноду INT8-Fast от автора исследования. Некоторые пользователи уже жалуются, что тяжёлые новые модели (например, Wan 2.2) пока вылетают с ошибками нехватки буфера или памяти на определенных этапах. Вердикт: Если сейчас на FP8 не хватает чёткости лиц/текста, или картинка кажется пластиковой — можно попробовать кастомную ноду INT8-Fast для ComfyUI. Если текущая скорость и картинка на FP8 полностью устраивают, можно подождать неделю-две, пока метод "причешут", оптимизируют и добавят во все популярные сборки без костылей.
Аноним 14/05/26 Чтв 10:07:00 #545 №1611724 
Ждём фикс в новых дровах от нвидии на замедление инт8, ибо нехуй.
Аноним 14/05/26 Чтв 10:14:02 #546 №1611730 
>>1611714
>чуть лучше качество картинки при том же потреблении VRAM
Бля, я в упор не вижу разницу между 16 и 8. Ещё можно добываться там до 4-5 бит, но 8 реально вкусовщина.
Аноним 14/05/26 Чтв 10:14:56 #547 №1611732 
>>1611714
Короче всё будет чище, точнее, детальнее но без гениталий и сисек. А единственные позволенные волосы будут дреды, потому что соевые ебланы с неопределённым гендером так решили.
Аноним 14/05/26 Чтв 10:16:10 #548 №1611733 
>>1611724
А то типа оно щас вшух как быстро, да?
Аноним 14/05/26 Чтв 10:40:51 #549 №1611749 
>>1611730
В геометрию: струн, СПИЦ, проводов надо посмотреть. По идее они должны быть как в оригинале кривым месивом говна
Аноним 14/05/26 Чтв 10:45:52 #550 №1611753 
>>1611665
Прописывай каждого отдельно (и их действия), чтобы неодинаковые были (я не стал). Лучше через JSON-prompt, потому что там ещё и токены протекать могут начать с одного на другого если a man, another man слишком много будет. Или обозначай их мужик1, мужик2, Вася, Петя.
На FLUX.2 (и на distill особенно) нужно конкретно писать что-то, если хочешь чтобы это рисовало (если, конечно ещё модель это знает). Не напишешь, не нарисует.
Аноним 14/05/26 Чтв 11:51:09 #551 №1611799 
>>1611575
брат сделай тест
> В геометрию: струн, СПИЦ, проводов надо посмотреть.
как он просит
Аноним 14/05/26 Чтв 12:38:39 #552 №1611843 
>>1611730
Ты о чём? Сравнивают не между mx/fp/int/mixed/scaled 8, а bf16=? Как выяснили bf16 и int8 не отличаются в качестве, что заебись, ещё как бонусом у int8 скорость чуть выше. Нет смысла юзать что-то другое вообще. Даже глупо будет бф16 юзать теперь
Аноним 14/05/26 Чтв 13:08:39 #553 №1611867 
>>1611594
>>1611753
> Не экономьте токены на FLUX.2.
Что бы фактически просто изменить сцену на еще большую нейрослопную нелепость? Там короткий промт был просто для тестов. Токены в t2i клейне тебе не помогут получить достойную картинку. А i2i настолько слаб генеративность - что качественно исправить собственную же хуйню не сможет. Может улучшить только изначально хорошо поставленную картинку.
Набрасываешь говно на вентилятор, копинг/тролинг.
У клейна в генерации днищенская фантазия и художественности нет как класса
Аноним 14/05/26 Чтв 14:37:54 #554 №1611932 
Собираюсь обновить комфи, лучше по новой установить или старый обновить? Если установить чистый - мне кастом ноды нужно по новой скачивать или можно из старого перекинуть?
Аноним 14/05/26 Чтв 16:07:45 #555 №1611975 
image.png
image.png
не просто лора, а адаптер который из флюкса вырезает vae
https://www.reddit.com/r/StableDiffusion/comments/1tclfpo/asymmetric_flow_models/
https://huggingface.co/Lakonik/AsymFLUX.2-klein-9B

Генерация на основе потоков в многомерных пространствах сложна, поскольку предсказание скорости требует моделирования многомерного шума, даже когда данные имеют сильную низкоранговую структуру. Мы представляем асимметричное моделирование потоков (AsymFlow), параметризацию скорости с асимметричным рангом, которая ограничивает предсказание шума низкоранговым подпространством, сохраняя при этом предсказание данных в полноразмерном пространстве. На основе этого асимметричного предсказания AsymFlow аналитически восстанавливает полноразмерную скорость без изменения архитектуры сети или процедур обучения/выборки. На ImageNet 256256 AsymFlow достигает лидирующего значения FID 1,57, значительно превосходя предыдущие модели диффузии пикселей типа DiT/JiT. AsymFlow также предоставляет первый в своем роде способ тонкой настройки предварительно обученных моделей скрытого потока в модели пиксельного пространства: выравнивание низкорангового пиксельного подпространства с латентным пространством обеспечивает бесшовную инициализацию, которая сохраняет высокоуровневую семантику и структуру латентной модели, поэтому тонкая настройка в основном улучшает низкоуровневые несоответствия, а не переобучает генерацию пикселей. Мы показываем, что пиксельная модель AsymFlow, доработанная на основе FLUX.2 klein 9B, устанавливает новый уровень передовых технологий для генерации текста в изображение в пиксельном пространстве, превосходя свою латентную базу на HPSv3, DPG-Bench и GenEval, при этом качественно демонстрируя существенно улучшенную визуальную реалистичность.
Аноним 14/05/26 Чтв 16:11:20 #556 №1611978 
>>1611932
проще обновить. просто гит пулл.

в случае очень старого комфи можно сделать такой батник

@echo off

setlocal enableDelayedExpansion

set MYDIR=..\ComfyUI\custom_nodes\
for /F x in ('dir /B/D %MYDIR%') do (
set FILENAME=%MYDIR%\
x\requirements.txt
IF exist !FILENAME! (
echo UPDATE !FILENAME!
git pull
..\python_embeded\python.exe -s -m pip install -r !FILENAME!
)
)

pause
Аноним 14/05/26 Чтв 19:53:34 #557 №1612172 
>>1611932
Лучше не обновляй а установи новый в другую папку, потому что кастом ноды на новой версии не работают.
Аноним 14/05/26 Чтв 20:15:27 #558 №1612192 
F2Kupscaled00008.png
>>1612172
Так и рождается вековая мусорка
Аноним 14/05/26 Чтв 20:41:19 #559 №1612212 
>>1612192
о, вы мое говно зарефайнили.
Аноним 14/05/26 Чтв 20:49:09 #560 №1612223 
>>1612172
>кастом ноды на новой версии не работают
что опять у них случилось?
Аноним 14/05/26 Чтв 20:54:33 #561 №1612226 
>>1611975
Погрешность плацебо
Аноним 14/05/26 Чтв 23:42:30 #562 №1612368 
2054879600975782167.mp4
Аноним 15/05/26 Птн 00:26:33 #563 №1612399 
image.png
>>1611526
пасиб, потестил с sigmas preview, видимо это и в правду костыль для клейна
Кривая скедьюлера напрямую влияет на грязь и запекание, и f2s на разных разрешениях это корректирует. Но фактически на 512х512 flux2scheduler имеет практически идентичную кривую с simple.

То есть на 1mpx клейн перепекает свой слоп и получается более cartoonish / глянец.
Корректировать это можно и нужно например power sigma выставляя коэфф 0.5-2. Правда эта палка о двух концах и там в обоих случаях на дистиле говно выходит, лучше simple, который всегда перепекает светотень.
Beta57 на дистиле вообще засирает картинку. Но я не пробовал менять семплер, мб найдется какая то компенсация.
Аноним 15/05/26 Птн 00:58:37 #564 №1612414 
>>1612399
>Кривая скедьюлера напрямую влияет на грязь и запекание
а на разъёб по анатомии и запекание туловищ в многоножку она не влияет?
Аноним 15/05/26 Птн 01:13:54 #565 №1612427 
image.png
потестил int8, автор этого говна оказался васяном-красноглазиком
Аноним 15/05/26 Птн 01:19:42 #566 №1612433 
image.png
>>1612427
> int8
геймченджер, геймченджер!!!!1111
>>HiDream
геймченджееееер!!!! Аааааааааа!!!!!
Аноним 15/05/26 Птн 01:24:13 #567 №1612437 
>>1612427
Спасибо.
Я ещё вчера подозревал. И решил не торопиться.
>>1611552
>Windows untested, but I hear triton-windows exists.
Аноним 15/05/26 Птн 01:30:49 #568 №1612444 
>>1612433
В теории, потенциально...
>>1612437
Судя по сравнению "качества" от примеров, оно что-то совсем не заметно в лучшую сторону или на уровне погрешности. Насчёт скорости там даже у автора написано, что будет медленней "пока". По хорошему нет смысла сейчас. Если официально поддержи в комфи не будет, то проект переоценён
Аноним 15/05/26 Птн 01:33:06 #569 №1612447 
>>1612427
Переведи на васянский. На винде не переделать модельку?
Аноним 15/05/26 Птн 01:37:16 #570 №1612452 
>>1612447
автору претить создать реквайрментс с тритоном для винды, он что-то там слышал что оно есть но ему похуй, ясное дело я сам установил тритон для винды и сразу стало понятно, что автор это уже видел и не осилил вайбкодинг свой, чтоб пофиксить, сделал вид, что вообще не в курсе что там в ентих ваших виндах
Аноним 15/05/26 Птн 08:27:43 #571 №1612553 
>>1612427
https://github.com/DazzleML/comfyui-triton-and-sageattention-installer
все равно пригодятся тритоны
Аноним 15/05/26 Птн 08:43:34 #572 №1612559 
>>1612452
Т.е. на винде не перегнать или не нужно ставить тритон? Там что весь тред на маках линуксах сидит
Не видел, что бы писали поголовно, что на винде не работает.
Не хочется зазря фп16 выкачивать, поэтому уточняю
Аноним 15/05/26 Птн 11:21:45 #573 №1612655 
>>1612559
под винду просто ручками ставятся пакеты под конкретную версию куды и питона. это в рекваременты не положить потому что в винде собирать пакеты та еще боль, в линуксе проще но тоже нет смысла туда класть пакеты для оптимизонов

хочешь оптимизона - дрочись сам, по дефолту без оптимизонов
Аноним 15/05/26 Птн 11:49:20 #574 №1612681 
>>1612655
>хочешь оптимизона - дрочись сам
А потом кто-то сделает инсталлер всего нужного в один клик.

Ну серьезно, что, так трудно отсканировать версию куды с питоном, скачать что надо, и собрать? Тут даже ИИ не нужен.
Аноним 15/05/26 Птн 12:05:20 #575 №1612700 
>>1612655
Оптимизация чего, скорости конвертации модельки, или качества этой конвертации что в последующем скажется на скорости/качестве генерации?

Так и не понял, можно ли нормально на винде сделать bf16>int8 или нет
Аноним 15/05/26 Птн 15:57:28 #576 №1612967 
image.png
image.png
>>1612553
Это рабочий варик для тритона? Нихуя не понятно.

Сконвертил аниму, протестил - стало медленнее. "Охуенно легко сделать самому" когда знаешь дохуя технической хуеты. Когда не знаешь.
Во всём треде этот ебучий triton упоминается 2 раза без подробностей. Фактически всё работает без него почему то, и модель замедляется. Ебейшая дичь
Аноним 15/05/26 Птн 16:20:07 #577 №1612980 
>>1612967
Анон, забей. Этот гейчленжер только в головах вайбкодеров, кто знает какую ещё безумную идею им завтра ИИ подскажет.
Аноним 15/05/26 Птн 16:49:56 #578 №1612999 
>>1612980
Так в треде аниме уже писали, что скорость повышается. И на реддите люди писали, что ускоряет.
Да и тут тестили >>1611559 и подтвердили ускороение качество.
Всмысле забей нахуй?
Винда еще люто глючить стала и зависать намертво в отдельных UI после всех установок вокруг комфи. Заебался
Аноним 15/05/26 Птн 17:27:12 #579 №1613038 
>>1612967
для тритона да, а до новых фп9 я не добрался

>>1612999
> Винда еще люто глючить стала и зависать намертво в отдельных UI после всех установок вокруг комфи. Заебался
не должно, комфи полностью портабл и не вытекает в систему
Аноним 15/05/26 Птн 17:38:52 #580 №1613049 
ПЕРЕКАТ

>>1613048 (OP)

ПЕРЕКАТ

>>1613048 (OP)

ПЕРЕКАТ

>>1613048 (OP)
comments powered by Disqus