Аноны, какая самая лучшая модель для генерации аниме тяночек под 4090(24врама)? Последний раз это делал давно на сд1.5 моделях и автоматике1111, вот понемногу осваиваю комфи но почитав вас о квенах разных дат в недоумении и попросту нету времени разбираться накачивая все молели, вот просто скажите что мне для сырка идеально будет просто для генерашек вайфу ну или сцен под ролевки с ллм желательно именно с упором в аниме т.к аниме это моя жизнь база
>>1503981 Намекаешь на беременность? Судя по размерам, вполне возможно что внутри она нафарширована кучей маленьких лисят, желающих поскорее выбраться наружу.
>>1504523 Как достичь такого крутого пиксельарта? Поделись своим воркфлоу, анонче. Какие модели используешь, какие лоры? Делаешь в лапше или рефордже? У меня максимум так выходило... Пиксели не такие аутентичные и вообще результат не нравится. А у тебя очень круто!
>>1504577 Даунскейл в 4-8-16... раз (interp_area), апскейл (ближайший сосед), ограничение палитры для взвешанных 8-64 цветов. Попроси бесплатную гопоту написать скрипт по этому запросу и объяснить, так проще будет.
>>1504565 Нанобанана про, "широкие перекрывающие друг-друга 3D-мазки кистью, пиксель стиль", "sci-fi + high fantasy architecture style", "Аниме стиль granblue fantasy, стиль неопубликованных концепт-артов при процессе разработки для лимитированных арт-буков"
>>1503642 (OP) два дня пытался заставить амудэ карту дружить с разными генераторами картинок, получилось только на fooocus и то, он захлёбывался и скидывал генерацию на проц. Получалось 5-10 минут в зависимости от модели и промпта. Просто пиздец. Может, ПРОШАРЕННЫЕ ШАРЯТ, как завести генератор на рыксах? Допустим, на моей RX5700XT.
>>1504752 да, пробовал пакет SD WebUI AMDGPU-Forge с технологией ZLUDA, как раз на него больше всего времени потратил, аж замучался. Ну, меня хватало максимум на тридцать минут компиляции, потом меня коротило, что оно будет так вечность компилироваться - останавливал процесс и пытался дальше натыкивать, даже гемини задрачивал вопросами... Не знаешь, случаем, сколько на таких картах примерно идёт компиляция? Не может же она идти час-два, да даже три...
>>1504790 Такое и руками не сложно сделать, суть в идее.
Вот бы ещё нейронки могли нормально объекты из фона вырезать оставляя прозрачность, не то что бы это сложно, но тратит много времени и абсолютно скотское бесполезное занятие.
Специально для тех кто будет кидать всякий кал с сойсмаг ебалом: это всё кривой кал с кучей оставленного по краям говна, которое проще заново переделать, чем исправлять.
А как вы тут генерируете одного и того же персонажа в разных позах? Я вот сгенерировал, и хочу его покрутить... изменить выражение лица... Но как? Я пытался через IPAdapter, но ничего не получилось внятного, максимум похожее
>>1504900 Лучше всего с этим справляется специально натренированная LoRA, в особо запущенных случаях персонажи настолько заурядные, что хватает подробного промпта
>>1504900 >А как вы тут генерируете одного и того же персонажа в разных позах? В запрещенных тредом сетях, тут все пиздоболы. В основном банана, лисодаун в сидриме.
>>1504900 >А как вы тут генерируете одного и того же персонажа в разных позах? Если без лор и облачных сетей, то можно дорисовать сбоку прямоугольное полотно, пометить его как маску для инпэйнта и дополнить промпт персонажа модификаторами типа multiple view, 2koma и так далее. Иногда нейронка соображает, что от неё хотят, и дорисовывает второй фрейм, где персонаж поставлен в другую позу, но с той же одеждой, чертами лица и так далее. Это работает из-за внутренней консистентности картинки, которую старается отрисовать нейронка.
Если тебе хочется делать это непременно на локалке, то используй Qwen Edit. Он требует более мощной видеокарты, но работает стабильнее и адекватнее. Если нужен топовый результат, доступный обывателю, то раздобудь где-нибудь доступ к Нано Банана и присылай ей реф персонажа с промптом на перерисовку.
>>1504772 Сложно сказать но пол часа уже слишком много. Как вариант - поставь на ночь, врядли поможет но вдруг. >>1504928 Уберите вонючие ноги и поверните ее жопой
Мой любимый тег оказался никому не нужным... Почему так? Я его добавлял в каждую пикчу... Выходит они хуже из за этого ибо датасета мало. Зато рапе в 25 раз популярнее
Ну вроде на базе зетки неплохо обучаются лоры, только почему-то лоры на стили гораздо лучше работают на базовой модели, чем лора на чара с теми же гиперпараметрами.
Грид: База - без лоры, персонаж, стиль 1, стиль 2 Дистилл - без лоры, персонаж, стиль 1, стиль 2
В случае лоры на чара + базовой модели просто мылит все картинки почему-то. Думал, что лора на чара поломанной получилась, но на дистилле она гораздо лучше себя показывает.
При этом у модели проблемы с анатомией, если пытаться что-то за пределами 1гёрл стендинга промптить - часто по три руки/ноги рисует. Да и вообще я прям сильные вайбы полторахи словил, когда не мог нароллить нормальный хвост/уши при виде сзади. Что ни говори, но после сдохли очень сложно новые модели воспринимать.
>>1505745 Ей же хорошо от метели, вон сугробы что 3 такие поместятся. Вот если бы ей регулярно машину откапывать или вычищать из дисков килограммы снега тогда да, как тут не погрустить. Квен знает снежного ангела? >>1505762 Стили, использовать не wai и подобные. >>1506024 Круто, оно уже может или пока только концепт-прототип?
hop on anima. в сравнении с люминой знает намного больше, более стабильна в плане анатомии и рук, быстрее, хотя всё ещё медленнее сдохли. по промпт пониманию на уровне люмины, местами чуть хуже. по стилевой традишке меньше понравилась. в остальном класс
>>1506097 Когда упоминается Люмина, имеется в виду Newbie Image? Я мимо, не углублялся так в арт модели. Как вообще newbie по сравнению с NoobAI? Мне больше для нормального стилизованного арта, а не маняме с точками ебанными вместо носа и рта.
>>1506102 Сдохля это уже откровенный пережиток. Не может ничего, кроме одного-двух персонажей, дальше дикие костыли нужны. Слабо слушается промпта, не понимает ничего, кроме тегов. Вообще, знаешь, сколько картинка художником рисуется в среднем? Где-то часов 8 возьми, ну, ладно, аниме часа за 2-4 можно нарисовать. А если качественаня иллюстрация, то часов 40-60 может уйти. А вы здесь вечно стонете, что вам 3 минуты подождать - это медленно. Неудивительно, что треды безыдейной ерундой завалены большей частью. Зачем что-то хорошо промптить и доделывать через инпейнты и прочее, когда можно кнопку генерации жать по кд, чтобы конвейер слопа делал "брррр!".
Алсо, вот у меня вопросик возник - а какие-то локальные модели сейчас нарисуют, например, нормальный самолёт? Я вот, допустим, хочу картинку анимешную, где МиГ-29 отстреливает тепловые ловушки, мне какую модель для этого надо раскочегаривать? Просто illustrious-based модели в это не могут совсем, картинок с flares_(countermeasures) на данбуру всего 20 штук, да и МиГ-29 хоть на бурах и побольше, но рисует один хуй ебанину.
>>1506097 > по промпт пониманию на уровне люмины Ты же про нета люмину, можешь чуть подробнее рассказать? Она была очень неравномерна по пониманию, например сохранила многие знания базовой модели, и могла делать какие-то общие вещи по описанию (несколько объектов с индивидуальными характеристиками), но при этом резко проседала во взаимодействиях персонажей. Стоит ли вообще качать и смотреть после прочтения строки > PonyV7 aesthetic model based: score_9, score_8, ..., score_1
>>1506296 >Сдохля это уже откровенный пережиток Смешно это слушать, уже столько моделей повыходило Qwen, Z-image и т.д., а ни одной трушно анимешной картинки качества SDXL так сделано и не было.
>>1506355 "Трушно", это твоем понимании? Сдохля простой зафайнтюнена давно под разное, поэтому там есть вариции стилей под любых виабушников и псевдоценителей. Перечисленные модели могут из коробки примерно то же самое, но похуже. Пройдет время, настакают и их под более цельный и точный стиль. Ты будешь спорить против того, что Сдохля в плане промптинга и создания какию-то сюжетов очень слаба? Основная проблема именно в этом, само качество картинки вопросов много не вызывает, причем давно.
>>1506296 Сдохля это последняя базовая модель в которой есть вообще все и нет слопа, такой датасет в современных условиях собрать уже нельзя в принципе. Все дальнейшие модели будут все больше заражены нейрослопом.
>>1506372 > могут из коробки примерно то же самое Все эти новые модели: стилистически отвратительны, не знают множество дефолтных вещей типа персонажей, концептов, артистов, часто неприятны в промптинге (расписывать полотна не ради описания а чтобы попасть в байас модели на шизопромпты), не могут в анатомию, страдают от множества прочих проблем, очень медленный инфиренс, тяжело тренятся. Каждая содержит минимум 2-3 из этого списка. Вместо страданий с ними чаще сделать грубую болванку на флюксе/квене и пройтись поверх xl. Или сделать несколько лор на них, если ты генерируешь что-то одно. Хочешь посмотреть на хорошую аниме некстген модель - найди ботов с последним наи, сразу поймешь разницу. мимо
>>1506372 >"Трушно", это твоем понимании? Трушно, это анимешные картинки в японском стиле, без влияния западного стиля. Сложно объяснить, такие картинки, которые бы лайкнули японцы. По сути любая картинка сгенерированнная в NoobAI и Illustrios по умолчанию обладает такой трушностью, если не задавать иного. >Ты будешь спорить против того, что Сдохля в плане промптинга и создания какию-то сюжетов очень слаба? Нет не буду, слаба и в сюжетах и в технических деталях >Перечисленные модели могут из коробки примерно то же самое, но похуже. Ну да, примерно, тоже самое. Qwen и Z-image даже не знают из коробки, кто такие Кагамине Рин и Касане Тео >Пройдет время, настакают и их под более цельный и точный стиль Я и не спорю, только когда пройдет время и будет разговор. А пока сдохля безальтернативна >само качество картинки вопросов много не вызывает, причем давно. Без качества картинки увы милые сюжетики, созданные умным промптом, не имеют смысла
>>1506392 Речь о моделях novelai первая версия которых когда-то легла в основу всех анимутюнов sd1.x Не о рофловом нейминге нуба чтобы попасть под ту же аббревиатуру.
>>1506392 NAI v1 это тьюн Stable Diffusion v1.4, который был слит ещё в октябре 2022. Все последующие верии NAI не попалали в паблик и существуют за пейволлом.
>>1506399 > Все последующие верии NAI не попалали в паблик А как же https://huggingface.co/NovelAI/nai-anime-v2 ? Может когда-нибудь выкинут v3, как раз когда никому не нужна. >>1506401 Да все кто более менее увлекается понимают. В целом даже можно понять недовольство тех, кому недостаточно xl. Непонятно только почему они даже не пытаются освоить приемы, которые уже годы используют на xl чтобы обойти недостатки. Или не имея интереса к анимуарту рассуждают за анимумодели, упуская важнейшие вещи для них.
>>1506407 > А как же https://huggingface.co/NovelAI/nai-anime-v2 ? Может когда-нибудь выкинут v3, как раз когда никому не нужна. Вообще забыл про это. У них похоже политика выкладывать модели в паблик только когда они не будут составлять даже минимальную конкуренцию с их текущими сервисами, поскольку в паблике есть моделей поинтересней.
Ту же NAI v1 они в 2024 выпустили официально, когда все уже на понях сидели. В общем, сомнительно ожидать, что они сами себе будут в ногу стрелять.
>>1506381 >>1506387 Это все не отменяет слабости Сдохли. Я говорю про промпт, вы говорите про стиль и датасет. Сдохля плохо промптит. Это перечеркивает визуал во многом, сводя его к 1girl и standing. Да, сейчас уже не будут корпорации выпускать модели как в 2022 просто потому, что их заебали правилами на основе откликов всяких энтузиастов и зоозащитников. Но это все еще может сделать коммьюнити. Flux Klein хорош, Zimage Base подает надежды. Про Qwen не знаю, что от там может в плане Аниме, но у него вообще с 2д не очень, насkолько я видел. Плюс, сейчас еще Анима вышла. Парк моделей расширяется, Надеюсь, Сдохля все же сдохнет. Я сам ей пользуюсь, кстати, если что.
>Хочешь посмотреть на хорошую аниме некстген модель - найди ботов с последним наи, сразу поймешь разницу
Ей сделали нормальный текстовый энкодер? Если нет, то не о чем говорить. В Сдохле и ее вариациях плох сам энкодер. Датасет можно раздувать бесконечно, но пока промптом невозможно соединить его части во что-то вменяемое, его раздувание так и будет полумерой.
>>1506349 конкретно по взаимодействию персонажей не скажу, но из того что заметил. анима лучше справляется с этим вроде как, также может 4-5 персонажей расставить по описанию, дать им действия какие-то, но за счёт того что она более стабильна, то нормальные результаты выходят чаще. с другой стороны она например не понимает персонажа выше персонажа2, хотя нета с этим справлялась. обе модели сложно миксы худов делать из-за того что веса тегов не поддерживают, но у анимы ещё какой-то загон и она понимает их только ровно в начале и после эстетик тегов и нигде больше
>>1506431 > Я говорю про промпт, вы говорите про стиль и датасет. Сдохля плохо промптит. Это перечеркивает визуал во многом, сводя его к 1girl и standing. Ты что-то путаешь. Как раз в плане позинга и взаимодействия с чаром сдохля даёт самые богатые возможности в плане управляемости. Если у чего-то есть тег на данбуре и 100+ картинок, считай что сдохля это умеет.
Проблемы на сдохле начинаются, когда тебе хочется описать сюжет, выходящий за простое описание твоей 1гёрл в рамках системы тегов. Обычно это происходит, когда тебе нужна важна возможность детально управлять окружением, а не персонажем. В этом случае уже имеет смысл рассматривать флакс/квен/z и т.п.
Лично меня от их использования новых моделей останавливает не знание чаров/стилей (оба пункта фиксятся лорами), а банальное знание анатомии. Если для сцены с crossed legs мне нужно перебирать варианты, где у чара не спавнится третья нога сбоку, или при запросе на "лисодевка, вид сзади" у неё хвост в 95% растет непонятно откуда или вообще висит в воздухе, то очень сложно серьёзно воспринимать такой чекпоинт при наличии живой сдохли.
Это я даже про NSFW-концепты не говорю, там на новых моделях вообще нечего ловить (кроме лумины может, но я не особо её смотрел).
>>1506428 С выкладыванием в1 было хорошо то, что это сразу отменило ряд проблем и даже исков относящихся к копирастии что делали на украденных моделях. Писали даже что добавили в лицензию пункт, со смыслом о легальности использования их моделей если как-то получили веса. Ну а с остальными все так, никакой конкуренции себе. Даже тройку не выкладывают потому что есть "артисты", которые получающиеся там стили еще используют. >>1506431 > Это все не отменяет слабости Сдохли. Конечно не отменяет. Просто получается что вместо одних слабостей другие. Иногда настолько серьезные что проще мириться с прошлыми. Кроме того, глупо отрицать что система тегов удобная, именно ее комбинация с натуртекстовыми вставками и структурированием - благо, а слоповые пустые полотна - зло. > Ей сделали нормальный текстовый энкодер? В каком смысле нормальный? Они трудились и последняя версия в целом дает именно то что ожидаешь. Образно говоря, все эти потуги аниме-дитов по промптингу выглядят как слоповые sd1.5 на фоне v3, во время, когда она релизнулась. Главный камень преткновения который был - микширование стилей так и не победили полностью. Но единичные стали лучше и есть несколько полезных тулзов смягчающих это. Saas маздай, но с точки зрения примера лучше варианта не придумаешь.
>>1506455 Спасибо за ответ. Другой простой вопрос - "чар1 с эмоцией1 ебетхедпатит чар2 с эмоцией2 на диване, а чар3 с эмоцией3 в дверном проеме за ними наблюдает" во всех вариациях порядка чаров может? >>1506471 Что за промпт был?
>>1506474 >Проблемы на сдохле начинаются, когда тебе хочется описать сюжет, выходящий за простое описание твоей 1гёрл в рамках системы тегов.
Я об этом и говорю. А как только все выходит за рамки 1-2 персонажей, начинается полный велосипединг и костылинг. Да, Сдохлей можно управлять по-разному, но это все не нативно и самое главное, расходует ресурсы и время. И часто это не те 2-3 минуты, которые уходят на генерацию, а всяческие настройки вермишелей и пайплайнов, которые еще и разваливаться могут по ходу дела. А все что нужно, по сути, - это унифицированный энкодер типа Квена для разных моделей. Флюкс и Квен уже могут использовать один и тот же. На Аниме вроде тоже квеновский используется. Эта связка через какое-то время потенциально сможет намного лучший результат дать, чем любые некроперестройки и раздувание датасетов семейства Сдохли.
Я представляю, для чего вообще используют современные аниме-модели, это просто кум-станция и машина по производству вайфу. Эти задачи для большинства они вполне закрывают, и это понятно. Но хотелось бы видеть от моделей больше. Создать кадр аниме, например. Без пердолинга с километрами вермишели.
>>1506512 Снизит нагрузку на Vram, например, когда не нужно будет перетыкивать туда-сюда 2-3 модели, которые нужно туда загрузить. Одна базовая, другая эдит. И создаст единые принципы промптинга. Это просто удобно. А все эти дополнительные ноги-руки у персонажей отвалятся тогда, когда условный 20b полезет в обычную видюху вместо 4-12b, это просто вопрос оптимизации, на дистанции он решится. Это куда эффективнее системы тегов. Хотя, конечно, в идеале хотелось бы видеть смешение этих архитектур.
>>1506522 > Снизит нагрузку на Vram, например, когда не нужно будет перетыкивать туда-сюда 2-3 модели, которые нужно туда загрузить. Да. Нужно научить сдохлю работать с энкодерами больших моделей чтобы тутже ею все рефайнить. > все эти дополнительные ноги-руки у персонажей отвалятся тогда, когда условный 20b полезет в обычную видюху вместо 4-12b Никуда не денутся. Для хорошей анатомии нужна соответствующая тренировка, в базовых моделях ее не особо делают из-за цензуры. А дотренивать такое в крупных потом - который уже год хрому делают? В прошлом году выходила огромная модель крупнее флюкса, но все про нее быстро забыли. Чтобы рисовать нормальные тела вместо сиамских близнецов размер не нужен, несчастный флаффирок с 0.9b справляется. > Это куда эффективнее системы тегов. Система тегов не привязана ни к модели, ни к текстовому энкодеру. Какая-то доля таких капшнов и комбинаций просто должна быть в датасете обучения чтобы модель это понимала.
>>1506509 > Я представляю, для чего вообще используют современные аниме-модели, это просто кум-станция и машина по производству вайфу. Эти задачи для большинства они вполне закрывают, и это понятно. Но хотелось бы видеть от моделей больше. Создать кадр аниме, например. Без пердолинга с километрами вермишели. Они не то чтобы закрывает потребности, просто у альтернативных вариантов свои серьёзные минусы, поэтому их сложно использовать и мало кто это делает на постоянной основе. Не спроста же итт пытаются все выходящие модели под аниму минимальными усилиями натаскать - не всем интересно третий год подряд сдохлю ковырять.
> А все что нужно, по сути, - это унифицированный энкодер типа Квена для разных моделей. Флюкс и Квен уже могут использовать один и тот же. На Аниме вроде тоже квеновский используется. Эта связка через какое-то время потенциально сможет намного лучший результат дать, чем любые некроперестройки и раздувание датасетов семейства Сдохли. Опыт показывает, что файнтьюнерам в комьюнити очень сложно любые DiT тренить. Нет ресурсов и квалификации на такое, чтобы таким ради опенсорса заниматься. Более реальным видится, что мы надолго застряли на сдохле, а дальнейшее развитие будет идти только в облачных системах, с цензурой и подписочкой.
>>1506483 Честно говоря, я так до сих пор не понял как промптить NAI, у меня есть доступ к сайту. Получается только один слоп, вот для примера один и тот же промпт: Слева - WAI, справа - NAI
>>1506855 Блять, мы одной и той же моделью уже три года пользуемся. Че плохого в новых моделях? Ну может она хуевая, но это хоть что-то новое. Че за уебищный майндсет. Сиди на сдохле, тебе никто не мешает. Мне она тоже очень нравится. Но объективно сейчас может быть гораздо лучше. Только нет нихуя.
>>1506897 Ну да. Попытки с -надцатой у меня японский голос из 11-секундной записи вполно похоже на русский получалось клонировать. Не до всех мелких тональностей, но узнаваемо.
>>1506857 Чел, это у тебя беды с майндсетом. Новая модель = не смейте обсуждать и критиковать, можно только хвалить; вынужденно безальтернативная сдохля = интенсивно обсираем в конце добавляя лудонарративного диссонанса для пикантности. Критика той системы обоснована и высказана не впервые, может тот анон выразился резко, но суть уместна. Почему у тебя это не может ужиться вместе с похвалой за сильные стороны и просто факт появления? >>1506873 Симпатично
>>1506964 Просто для понимания: в новелах эмфазис задается через {}. Почисти промпт, негатив вообще удали полностью вместе с тегами качества. Если не знаешь что конкретно - просто юзай пикрел или одноименная опция в апи, они сами добавятся. У них на сайте есть вполне доходчивые туториалы как делать. В целом, можно не заморачиваться и просто пользоваться тегами, расписывая дополнительно желаемое натуртекстом. Даже их регионалка особо не нужна если сделаешь минимальное структурирование. Алсо на первой той пикче что на wai тот еще бадихоррор. мимо
>>1506964 > fur dataset Если пишешь тегами, а не натур текстом, то не надо ставить fur dataset и использовать данбуру теги одновременно. С fur dataset желательно использовать теги с e621. > very awa Квалити теги у них по другому работают, вруби add quality tags и посмотри что там пишут. Негативы тоже надо их использовать дефолтные. > нет артист тегов У новелов очень рекомендую использовать артистов или хотя бы стили каких-то конкретных аниме (через имя аниме + anime screenshot), либо на крайний случай трюки с вайб трансфером. Так же рекомендую указывать вместе с артистом и примерный год, для тех у кого стиль менялся, это помогает. > (peasant: 1.5) Эмфазис надо выставлять через 1.5::peasant:: и т.п. Негативный эмфазис тоже работает. > smile, sad, tsundere, blush, lying, sitting Мне кажется или этот набор слабо сочетается вместе?
Ещё почитай про то, как персонажей промптить, там есть приколы про промпты под нескольких действующих лиц. (|, расположение персонажей, всякие source#, target#, mutual# теги и т.п.).
А так, если не хочется чисто естественным языком, то я бы описал промпт примерно как-то так:
нужный тебе стиль, 1girl,
foreground: A picnic blanket on a green field.
subjects:
- hatsune miku is lying on her back the blanket, leaning on the haystack behind her.
- A basket filled with cucumbers, spring onion, tomatoes and single milk bottle.
background:Hills with a castle. Blue sky with clouds. | girl, hatsune miku, flat chest, brown headscarf, medieval peasant-style brown dress, blouse, corset, blush, tsundere, holding paper airplane, lying, aqua nails
>>1507003 >>1506968 Спасибо большое за советы! Надеюсь это пригодится, но это неточно. >Алсо на первой той пикче что на wai тот еще бадихоррор. На Вай у меня всегда проблемы с анатомией, хотя по совету анонов теперь всегда генерирую в базовом разрешении. На Нубовских чекпоинтах таких проблем нет, зато есть другие
Вообще было бы здорово увидеть такие же советы для NoobAI, так как я похоже не справился и вернулся на WAI. Основная причина – это порой очень низкое качество картинок при всех заданных тэгах качества. Сейчас уже ночь, завтрак я конкретнее опишу свою проблему с примерами.
Это не связано, но также хочу переделать датасет и натренировать уже нормальную лору на советскую школьную форму. Ту Лору, что мне помогали делать прошлым летом, ну прям совсем не выдерживает критики. За эталон хочу взять форму из фильма Королевство Кривых Зеркал. Пока думаю, как лучше собрать датасет, наверное все делать через банану про, как приложенный пик. На пике по форме вроде все устраивает, но не хватает детализации.
>>1507003 Что же ты ему про самое главное не сказал, раз уж он привык к градио >>1507016 https://github.com/Metachs/sdwebui-nai-api вот это поставь, с ним можно промптить как обычно сдохлю промптишь > но не хватает детализации Не пофиксишь ты такое никогда лорой на сдохле, если прямо надо красиво, то грубо линии делаешь в фш и в инпеинте допиливаешь > заданных тэгах качества По большей части просто мем и тащат за собой не нужную хуйню > На Вай у меня всегда проблемы с анатомией С некоторыми стилями и позами любой дериватив нуба будет распердоливать двойными пупками и лонгбади, происходит в основном на этапе апскейла хайрезфиксом, и можно сгладить ручным и2и апскейлом с контролнетом
>>1507016 > низкое качество картинок Что ты понимаешь под качеством? Претти лук с глянцем, какие-то стилевые элементы, количество поломанных генераций, следование промпту, стабильность, разнообразие, взаимопроникновение тегов при попытке описать что-то сложнее, частота неявного проеба анатомии? У разных моделей разные сильные стороны, и решаются релейтед проблемы по-разному, всегда можно совместить приятное с полезным. > натренировать уже нормальную лору на советскую школьную форму Не забывай что на конечный стиль влияет не только исходная лора, но и твоя стилизация.
Решил потыкать на англюсике, у него есть как свои плюсы так и минусы, мне сравнивать особо не с чем потому что кроме вайб войса я ничего не тыкал ибо ебал аудио нейронки которые заводятся через консоль без своего интерфейса, вот его и поднял для сравнения, large q8 модель.
В квене как будто бы меньше фоновых шумов при генах лезет, всяких артефачных скрипов и шелчков, но может я мало ролил его просто. Он чуть быстрее вайб войса и он как будто бы лучше клонирует войс, на этом плюсы все. Он реально абсолютно деревянный, ну не прям но в отличии от конкурента которого я ему поставил того можно выровнять за счет знаков препинаний и он сам по дефолту как будто бы понимает что зачитывает и давит эмоции но как будто бы рандомные, что одновременно плохо и хорошо ибо можно начерепикать почти живую речь в отличии от квена.
По скорости у меня получилось чета типа 93.78 сек ген при 39 сек аутпута для квена 102 сек ген при 35 сек аутпуте для вайб войса При одниаковом промпте в 523 символа. it/s у квена в консоли не показало в отличии от ВВ, так что замер только на глазок.
Проебал где-то час разбираясь в тупейших проблемах чому оно не заводится, откатил трансформеров что на удивлении ничего не поломало в калфи (может я пока еще не знаю что что-то сломалось лол), тем что ему в нижнюю строчку надо написать референсную речь текстом чтоб он не пытался понять сам че там на референсе проговаривается, на этом моменте карта забивалась в сотку и висела тыщу лет.
>>1507049 >в нижнюю строчку надо написать референсную речь текстом Не обязательно, там есть внизу в ноде переключать true\false, его тыкаешь, и можно без транскрипции запускать. Может лучше выйти, может хуже. С японского клон делал - без транскрипции получалось однозначно хуже. >на этом моменте карта забивалась в сотку и висела тыщу лет. Тоже было, забивает всю мощность и постепенно наращивает потребление памяти. Но тут в другом причина, как мне кажется - что-то в самом тексте для озвучки генерацию настолько озадачивает, что она в цикл идет. Потому что после перезапуска на тех же настройках, но со сменой входного промпта, оно нормально генерилось. >Он реально абсолютно деревянный Инструкт-режим хорошо в эмоции может, но он не поддерживает (пока) клонирование голоса.
Я ещё потыкал, я сначала пытался вставить полторы минута спича, для клона, в итоге оказалось результат лучше на 12 секундном отрывке-референсе.
Теперь голос гораздо лучше узнаваем, но робовойсит. Роллы кстати правда могут дать хороший вариант, очень не стабильная штука.
Короче да, нужна возможность свою модель голосовую обучить и юзать её во второй моде.
>>1507049 > 39 сек аутпута для квена Это очень много, чем больше текста тем хуёвее он под конец генерит, надо дробить текст, больше пары предложений он не осиливает.
Представьте, если кто-нибудь такую купит, чтобы генерировать лисьи писи.
В Россию завезли видеокарту за миллион рублей — теперь можно заказать RTX PRO 6000. За эти деньги вы получите 96 ГБ видеопамяти GDDR7 — она на 30% обгоняет RTX 5090 в бенчмарках, это самая мощная карта в мире.
>>1507152 Проснулись@улыбнулись@потянулись. А у вас как дела? >>1507153 >>1507185 Очень даже неплохо. >>1507325 Вот этот знает толк. И вообще тут у каждого N-го есть pro6000 дома в основном как в меме
>>1507416 Это очень похоже по стюлю на пикчу из поста >>1506642. Подумал, что эт опросто продолжение постинга. В любом случае, оригинал как-то не впечатляет. Похоже на дешевый коллаж.
>>1507433 Ну, ок, видно с задачей справилась. А по стилю, это единственное, что она может? Достаточно невыразительный стиль, плоский цвет с базовыми тенями. Короче, я запутался кто на чем промптит и генерит, кто на Гугле, а кто на НАИ.
Ох как же быстро наваливают имг моделей в последнее время. Я совсем запутался! У меня 4090, че ставить из последнего, че удалять? ZIB оставлять, ZIT удалять? https://huggingface.co/circlestone-labs/Anima годнота или ну его?
>>1507454 Аниму пробуй обязательно, без пробы выводов не сделаешь. Но зачем че-то удалять? Семейство Z-image неплохо выглядит в целом, чтобы что-то оттуда удалять, да и весит мало.
>>1507463 Ого, да это же 1girl standing half body view с кривыми глазами и мазней в детализации костюма! Вот это невероятно, ты из далекого будущего капчуешь? Ну все, теперь-то все мани узнают, откуда звон исходит!
>>1507453 Ну вот разное по стилям, из того, что я в тред постил.
По стилю может практически всех художников с бур у которых минимум штук 50-70 постов было на апрель 25. Ещё они кормили туда скрины из аниме, так что часть стилей аниме знает. Ещё часть художников, которые чисто додзи делают, знает, но там не предсказуемо кого знает, кого нет.
>>1507745 Тоже орнул с "народности". Лисий народ в какой-то параллельной реальности живет, похоже. На планете Лисье Изобилие - Прайм. У нас-то как-то попроще дела обстоят с картами. Вон, в треде регулярно спрашивают как на 6-8 Гб запуститься. А то и на 2-х, лол.
>>1507752 Лисопостеры - избранные Инари, это же очевидно. Богиня процветания благословляет своих верных на материальное изобилие. Вы думали это совпадение что в лисотреде у каждого второго 4090/5090? Нет, это работает кармический закон: постишь кицунэ, Инари видит и благословляет тебя за это.
>>1507777 Для 4х хватает самого жирного ЛайнЛи, бп 1.3к ширпотреб платина дипкула - хватает, т.к. все 4 только в инференсе заняты бывают, обычно 1 + изредка вторая подключится.
>>1507777 > какой корпус Пикрил, без проблем лезут две 4-слотовых карты. > мать ASUS ROG Maximus Z790 Hero > охлад и БП под такое На ЦП вода 420, остальное воздух. БП 1200 платины хватает на две карты.
>>1507786 А, там еще 48-гиговая. Шутка про pro6000 дома оказалась не шуткой. > бп 1.3к ширпотреб платина дипкула - хватает, т.к. все 4 только в инференсе заняты бывают 400 + 2x300 + 300(?) Знатная перегрузочная способность у бп.
Грустно от лоботомита на 0.6б вместо текст энкодера в аниме. Видно, что пытается понять, но не может в сцены с сюжетом. Или может я промптирую как долбоеб.
Best quality anime artwork. A woman with very long silver hair and striking heterochromia is on a packed commuter train. She wears a sheer sundress, revealing the outline of her wet white panties as she playfully lifts the skirt with one hand while holding onto the overhead rail with the other. A slight blush colors her cheeks as she glances to the side. In the background, a young boy points at her in curiosity and his mother glares with annoyance. Low angle perspective, train ceiling visible. Public setting, subtle exhibitionism.
>>1507979 А зимаж бы смог по такому описанию чето нарисовать? Попробуй quality: квалити теги style: стиль prompt: и пиши тут промпт миксом тегов и нат языка
>>1507924 Лол. Это все неправда, настоящий хвост на месте под юбкой, а Нагаторо недовольна утверждением что шлюха не может косплеить богиню! >>1507965 Оно же практически все описанное выполнило, наоборот восхищаться надо. Если промпт нормально расписать то вполне можно добиться.
>>1507997 Не, зимаж тоже не выдал ничего хорошего, даже хуже. Но у него датасет хуже, чем у анимы. Хуй знает короче. У меня больше вопрос не к стилю, это уже можно прикрутить сверху, а к конкретной сцене.
>>1508030 >Оно же практически все описанное выполнило Ну типа, но это 40+ генераций + твики промпта. На люстре я могу сделать такую же сцену, но там придется ебаться с региональным промптингом, инпейнтом и тд.
Основная жалость в том, что это может быть действительный прыжок, но размер модели и энкодера ОЧЕНЬ маленький, что немного обидно.
>>1508033 > твики промпта Разбить на части не пробовал? Композиция, девушка, мальчик с мамкой, окружение. Энкодер офк можно было и больше взять, но пока это лучшее из доступного, включая конкурентов большего размера. где-то в углу тихо стонет newbie-image
>>1507053 >>1507074 А вы xtts2 не пробовали? Скачал тоже потыкаться, но пока только поставил и проверил работоспособность, сидеть семплеры крутить буду уже завтра, заебался, спать пора.
До этого решил потестить аудио апскейлер чтоб нейро нахрюки свои до 48кгц вытягивать, должно быть лучше чем авто ресемпл в том же давинчи, хотя кореша сказали разницы 0 по сравнению с 24кгц исходником, потратил время на хуйню.
Надо бы еще себе UVR надыбать и узнать есть ли волшебная нейронка которая по кастомным субтитрам сделанным плитками в самом редакторе а не плеере сможет каким нибудь bbox'om текст с видосов вырывать и в текстовик портировать.
Надеюсь местный мочух не будет zov и не начнет хуярить оффтоп пасты, а то аудио тред едва подает признаки жизни а может мне туда и попиздить чтоб его оживить? .
>>1507979 Интересно, почему до сих не придумали прикрутить reasoning к моделям. Точность поднялась бы в разы даже на мелких энкодерах. Наверное, все взвыли бы ждать по 10-20 минут. Вот это троллинг был бы. Зато результат.
>>1508205 Фу, какой агрессивный, обычно это коррелирует с уровнем интеллекта, чем тупее примат тем злее, так следуя твоей же логике, ты то что в треде забыл?
Немного поигрался с анимой, очень даже достойная модель, знает концепты на уровне люстры/пони, а понимание промпта на уровне флакса, но и люстро/пони теги можно тупо копировать.
На 3060 6гб видеокарте очень медленно генерит, в районе 30-60 секунд для 1 мегапикселя. Я пока решил эту проблему понизив генерацию до 0,5 мегапикселя, хотя бы приемлемые 10 секунд получаю, для экспериментов пойдет.
>>1508233 >Even with my conservative settings, there is some quality loss. It's better than other caching solutions I've tried in the past, but it's not black magic. В мусорку как и прочие ускорялки
Но подводных камней с этим хватает: 1. Рекомендованный ЛР сильно выше рабочего. В доках рекомендуется лр 2e-5, а по факту у меня при лр выше 4e-6 уже всё ломается. Я думал что, возможно, проблема с моим датасетом или ещё чем-то, но это общая проблема судя по дискуссии здесь: https://github.com/QwenLM/Qwen3-TTS/issues/39
2. В доках лежат скрипты для тьюна Qwen3-TTS-12Hz-1.7B-Base, а не Qwen3-TTS-12Hz-1.7B-CustomVoice. Проблема в том, что Base модель не натренирована изначально на поддержку instruct для голоса, хотя формально все размерности совпадают. Из-за этого невозможно регулировать интонацию у обученных на базовой модели голосов.
Я это попробовал разрулить, допилив через клода скрипты так, чтобы они поддерживали поддержку тьюна CustomVoice модели. Несмотря на то, что я в своих кепшнах не предоставлял описание интонации (у меня просто около часа речи на японском + текстовая расшифровка виспером), оно сохранило возможно задавать instruct для моего кастомного голоса (прикрепил файлы с примерами).
Но всё ещё осталась проблема, что голос недостаточно хорошо копируется по сравнению с тем же RVC, и я не понимаю, как это можно разрулить. То есть начеррипикать для условной новелки ещё можно, а вот как TTS для той же таверны я бы это подрубать не стал, т.к. голос заметно меняется от генерки к генерке. Пробовал играться с разными шедулерами, но пока какого-то успеха в этом не добился.
3. И ещё там какое-то дикое потребление VRAM, у меня при бс выше 4 валится OOM на 48GB карте. Вот здесь кто-то занимался оптимизациями и набором кастомных нод для тренировки через комфи, говорит что тренировка на 16GB карте запускается, вероятно, стоит обратить внимание: https://github.com/QwenLM/Qwen3-TTS/issues/39#issuecomment-3803842785
>>1508186 Я думаю, если критическая масса людей наберётся, мы сами туда перекатимся. В плане поддержки русика особо ничего интересного не выходило за последние пару лет, старичкам обсуждать стало нечего, вот тред и сдох.
>>1508241 Это один из популярных стилей, у художников это называется слопореализм semirealism. В нем не один миллион картинок сделан, наверное. Удивительно, что почти любая модель может слопить это по дефолту?
Я такой думаю, откуда там ботинки взялись. А потом читаю промпт который получил от ЛЛМ, и такой, ааа, понятно. Следование промпту у анимы все таки хорошее.
Quality: masterpiece, best quality, high resolution, detailed, sharp focus, professional illustration Style: anime, soft colors, cel shading, gentle lighting, muted palette, warm tones Foreground: A snowball in the snow, a pair of snow boots, a small shovel, a snow hat Subjects: - A young woman in a winter outfit is sculpting a snowman with a snow shovel, her face is calm and focused, her hair is styled in a practical way with a scarf, her hands are covered in soft, white gloves, her expression is peaceful and joyful - A small snowball is rolling on the snow, slightly frozen and covered in a thin layer of frost, the snowball is positioned near the snowman's body Background: A snowy landscape with a clear blue sky, a few small trees, a fence, and a small wooden house in the distance. The snow is softly falling, creating a peaceful and serene atmosphere Prompt: anime style, soft colors, cel shading, gentle lighting, winter clothing, snow sculpting, snowman, snowball, snowy landscape, clear blue sky, small trees, fence, wooden house, soft snowfall, peaceful atmosphere, detailed illustration, high resolution, masterpiece, best quality
Короче, я нуфаг мимокрок ллмщик, очень редко генерю картинки. Решил прочекать что у вас тут поменялось. Скачал Аниму. Попердолился немного. Вроде потенциал есть, но мне кажется, они зря сэкономили на текстовом энкодере. Есть Квены 3-6б, это было бы гораздо лучше. Но, видимо, это побудило бы их и саму модель делать больше. Иногда выдает кино, часто с огрехами на глазах/руках/ушах (это вроде классика старых моделей), иногда совсем мусор. Зависит от того как промптить и насколько сложную сцену выстраивать. С портрерами и всякими dutch angle одного персонажа в целом справляется, но стоит навалить деталей, и все начнет стремительно рушиться
Имхо потенциал есть, жду релизную версию и надеюсь, что будет какая-нибудь AnimaBig в будущем. А на чем сейчас генерить хз, видимо по-прежнему нуб и тюны?
>>1508249 Что-то она неочень довольна. >>1508322 Не морозь кошечку! И так постоянно грустная, лучше обними и приласкай. >>1508438 > сэкономили на текстовом энкодере Чисто технически, энкодер можно и заменить реинициализировав кросс-атеншн под нужную размерность, а потом быстро тренируя только его (и нормализацию) с заморозкой остального. Или вообще делать это поблочно и плавно, есть техники. Но хз стоит ли того, уровень восприятия при адекватном промптинге уже достаточный, не факт что улучшится. > с огрехами на глазах/руках/ушах Модель на низкое разрешение тренировалась, на мегапиксель совсем короткая тренировка поверх потом чисто перед релизом. Детали легко исправляются.
>>1508248 Вообщем, сырое пока все. Учитывая, что модели сколько - неделя, две? - еще допилят до вменяемого качества. Если уж не полную тренировку, то аналог лор какой-нибудь, на те же интонации.
>>1508248 Как же миленько! Обязательно выложи когда прилично получится. >>1508507 > аналог лор какой-нибудь, на те же интонации Интонации и прочее уже заложены в модель, ее ключевая штука - не только вход текста для озвучки, но и вход инстракта на тон и голос. Проблемы с потреблением памяти и прочим легко устраняются, но вот подходы к самой тренировке (аугментация) и датасет - уже сложно.
Ставишь по лапшу из StabilityMatrix @ Устанавливаешь лапшеменеджер и два импакт пака @ Ничего не работает
Как вообще пофиксить это? Даже с гита напрямую через git clone тянул репозиторий, в него эти кастомные ноды ставятся без ошибок, но полная оказия происходит когда пытаешься скачать недостающие ноды с воркфлоу других людей. Всё ломается, ошибки летят в консоль как сумасшедшие, одной ноде версия торча слишком мала, другой слишком велика, третьей вообще другое что-то не нравится...
Поделитесь своими воркфлоу по братски, аноны. Я уже не могу, хочу человечную лапшу, но джва часа крутить свои ноды и соединять их не остаётся сил после работы на заводе. Хочется чтобы был адетейлер на лицо и руки, и2и, т2и, инпеинт. Заранее спасибо.
>>1508575 Не ставишь ничего через Стабилити Матрикс. Качаешь портабл-версию и разбираешься в ней до победного. На Нвидия она уже из коробки сразу должна работать. А воркфлоу уже есть внутри Комфи в виде пресетов. Лапша ебучая, да. Но того стоит.
>>1508575 Не ставь ничего через stability. Comfy подтягивает тебе torch, скомпиленый под проц, без CUDA. А если лезть в его венву, тогда и смысла в нем нет. Они это говно уже джва года не фиксят. Крч, забей и ставь портабл. А все ошибки в консоли спрашивай у нейронки, типа gemini или грока, они объяснят, как фиксить, мне всегда помогали. Без пердолинга не будет, сразу говорю. Я тоже работяга и хочется попроще, но это не работает, увы. Фронта с кнопкой "сделать заебись" нет. По моим впечатлениям, automatic-like годится только для чего-то, типа 1girl,standing. Если делать что-то сложнее, то пердолинга становится больше, чем в comfy. К счастью, на Ютубе миллиард гайдов, разберёшься.
>>1508667 Пчел, зачем тогда тебе Комфи? Поставь какой-нибудь мертвый Слопомётик1111 и крути там свой 1girl4cum на старых моделях, тебе больше и не нужно, похоже. Сделай зум окна на ноду промпта и рядом ноду с картинкой прилепи.Пиздос. Попроси нейронку написать интерфейс для интерфейса Комфи.
>>1508667 Бля, сам всегда так хотел. И вроде со старта чекнул, что-то такое есть чуть ли не нативно, да уже и не помню как называлось, да уже и не вспоминал. Сейчас можно через subgraph более-менее эстетично делать.
Ура, удалось завести примитивную лапшу по гайду из шапки. До того что умею делать в фордже ещё далеко, уж больно удобный там инпеинт, адетейлер и контролнет. Но впереди большой путь...
Братцы, заделал сайт с тегами sdtags(.)github(.)io , пока что без контента, добавляю теги и генерю арты для наглядности работы тегов. Буду рад услышать мнения и идеи. Из функционала имеется билдер промптов, то есть можно выбирать несколько тегов и собрать из этого промпт
>>1509067 На реддите давно ещё видел темы где люди спрашивали как заставить детейлер автоматика рааботать так же хорошо, как нода Face Detailer из Impact Pack'а. Но у долбоёба с сосача уже три года в комфи нет детейлера.
>>1509267 Pixiv, twitter. Кто-то еще выкладывает на deviant art, civitai, aipictors, instagram (боже упаси) С точки зрения охвата twitter будет лучшим вариантом, но нужно сразу определиться sfw или nsfw. Если хочется и то и другое это должны быть разные профили.
>>1508686 >>1509045 Upd: это я так Librewolf (мой основной браузер) обновил. Обычно кто сидят на нем или аналогах в курсе подобных проблем и разберутся сами, но на всякий сообщаю: проблема была в браузере, а не в комфике
>>1509147 >люди спрашивали как заставить детейлер автоматика рааботать так же хорошо Скилл ишью >Face Detailer из Impact Pack Наберешь, если через 10 лет наконец начнет работать примерно так же хорошо как в adetailer
>>1509741 Стиль приятный, но видно насколько меньше деталей и объекты поломались. Ничего, свои плюсы зато есть. >>1509777 > без аблитерации могут пропадать некоторые концепты Если у модели на них нет отклика, то искажение исходников не поможет. Это не цензура ллм, где на отдельные случаи натренен рефьюз при генерации новых токенов и такое может помочь. Тут используются скрытые состояния и то, как модель интерпретирует комбинацию токенов на входе. Нет смысла брать васяновские поделки вместо оригинала с которым тренилось, они не улучшат, а просто испортят общее понимание промпта.
Потыкал аниму. Понравилась, буду ждать следующих версий. Пока ей явно не хватает обучения в больших разрешениях и на редких концептах сыпется. А вот мелкий энкодер в целом ок работает, на совсем сложном может быть даже хуже чем старый т5, но в целом нормально. Жалко, что не взяли энкодер побольше.
Стили пока знает очень средненько, но для локалок это не критично.
Тест на кубы прошла. На чем-то сложном результаты более спорные: - отказывается делать фигурку варспайт и командира на торте - на таро пришлось роллить и хитрить с промптом много, чтобы анатомия вверх ногами не была сломана - ну и длинный текст курсивом тоже для модели очень сложно
>>1509788 >Анима ебет в первую очередь люстру. Вот как можно будет с помощью анимы нарисованную тянку в сосок трахнуть - тогда можно будет согласиться. Пока же это модель для нормисов, и с некоторыми неприятными косяками. Которые, впрочем, должны фикситься дальнейшей тренировкой.
>>1509800 А есть какие нюансы по промптингу? Я пытаюсь генерировать промпты через ллм, большая часть генерацией - это разваливающееся мясо. Мне кажется что многословное описание как то во вред идет.
>>1509821 Концепты знает на уровне пони, фап контент можно сделать.
>>1509846 Да, квадраты и странные артефакты хуже чем у флукса или хромы. У тех же новелов даже на 4 было сильно лучше, на 4.5 я вообще не видел таких проблем.
>>1509920 > Я пытаюсь генерировать промпты через ллм, большая часть генерацией - это разваливающееся мясо. Странно, мне наоборот показалось, что модель куда лучше работает с промптами, если они натур текстом написаны.
Т.е. я промпт с варспайтом выше пытался делать как я делал у новелов или в клейне, со структурированным тестом, в духе subjects: ..., composition: ... - и вообще полная дичь выходила. Перешел на ллм-написанный естественный язык - и более-менее пошло работать.
>>1509967 Короче как я не дрочил сэмплинг, всё равно бестолку, цфг++ только немного помогает, единственное правильное решение это тайловый апскейл по 1024. Ахуеть, спасибо папаша, за тренировку в 512 конечно, бэк ту полтораха тактикс
>>1509920 > Концепты знает на уровне пони Для меня странно осознавать, что из-за данбуру люстра знает про ума мусуме радикально больше, чем можно вообразить.
>>1509949 Да вроде окей, но мне сравнивать не с чем особо. Нуб в целом не знает его, нета точно хуже анимы. У тебя вон первая пикча почти идентична оригиналу с буры, не? >>1509998 Без, точно правильно тег пишешь?
>>1510013 Анима как-то придирчиво к расположению тега худа. Игнорирует если не в начале, если рядом без запятой ещё что-то есть типа "in the style of @tag" и подобное. Попробуй только тег и 1girl
Запилил себе быстрое копирование тегов из данбур, черрипикнул пару картинок из бур, впринципе стили и персонажей знает. анима не очень любит высокий штиль из ллм, тогда все в мясо превращается.
>>1509981 С флуксом и хромой, кстати, помогает смержить лору под высокое разрешение хитро, подобрав коэффициенты под первые слои дабл блоков и последние слои сингл блоков, а тут пока чёрт знает.
Хз че тут про аниму пиздят, как базовая модель это литералли лучшее что я тыкал - минимум проебов, понимание физики света и анатомии. То что хуево рисует персонажа из тайтлнейм так и хуй с ним, под это уже лоры делайте, когда дадут возможность их делать.
>>1510066 Не уверен что тут веса тегов хоть что-то дают, по ощущениям нихуя не влияет, лучше будто бы точнее описать что ты хочешь видеть. Хвосты кстати тоже ахуенно рисует, даже топовые модели на сдохле вечно проебывались по масштабу и тому куда его приделывать - то за тело, то хуй пойми куда. Тут всегда ровно в позвоночник.
Первое: score_9, score_8, masterpiece, best quality, (lineart:0.95), screencap 1girl, blonde hair, topless, small breasts, leaning against a large rock in the desert, sun is shining brightly overhead, wearing sunglasses, (closeup:1.1), 35mm, (from the side:0.65) (from below:0.8)
Второе: score_9, score_8, masterpiece, best quality, (lineart:0.95), screencap 1girl, blonde short hair, topless, small breasts, wearing sunglasses. Leaning against a large industrial thing at the roof in the cyberpunk city, back is arched. Upper body shot, 50mm, closeup, (from the side:0.65) (from below:0.8). Pink neon lights shining brightly overhead, rimlight
Негатив: worst quality, bad hands, bad quality, bad anatomy, jpeg artifacts, signature, scan, watermark, old, oldest
>>1510088 Та хуй его знает, скорее текстового энкодера по идее. Тут просто делали 1.5/сдохля/пони-лайк, думал мб и веса работают. В дебри архитектур и прочей хуйни мне лень вдаваться, не работает и ладно.
>>1510083 Спасибо! В общем я примерно понял как аниму промптить. Главное в начало ебануть квалити теги, а потом уже все остальное, в том числе и высер от ллм.
>>1510083 > Хвосты кстати тоже ахуенно рисует Это ли не ахуенно? >>1510088 Масштабируются векторы соответствующего токена, в целом нет никакой разницы.
>>1510010 > У тебя вон первая пикча почти идентична оригиналу с буры, не? Ну так это с лорой все, в стоке там перемешанное, ведь на данбуру лежат и из аниме стиля и чибики навалом под одним тегом >>1510035 Может попробуешь, раз шаришь? https://litter.catbox.moe/ahmasd966u2r21tk.safetensors в целом и так велл дан и артефактов почти не заметил, но вдруг что получится, @firedotinc триггер >>1510088 Нет, они скейлятся, но не так как у сдохли просто
>>1510166 Отличный новояз, блестящий ваишейдинг, лол. По-моему, это painting, soft gradients, со сдвигом к высокому ключу по палитре. При чем тут вообще название модели? Если какая-то модель испражняется одним и тем же стилем по кд, это не делает ее обладателем этого стиля. Учи базу или останешься кринжем. Выйдет хорошая модель, а ты там ничего запромптить не сможешь из-за предрассудков и каких-то дурацких терминов.
А нахуй ваша анима нужна, если не умеет генерить в разрешении выше 1280? Уже на 1600 ломается картинка. Какой-то мусор бесполезный, ведь в лоурезах качество как у хайрез-нуба или даже хуже.
>>1510249 >в лоурезах качество как у хайрез-нуба или даже хуже. Так модель сильно недообучена, она на уровне нуба только за счёт не сжатого в шакалину ВАЕ. Конечный вариант должен выглядеть нормально без хайрез костылей.
>>1510251 > недообучена Размер слишком мелкий чтоб что-то много уметь. Чуть ли не в два раза мельче XL. Даже Флюкс в 4В сосёт, жизнь только к 6-9В начинается. А проёб с разрешением это не про недообучение, это проёб самого обучения.
>>1510249 Апскейл и анкроп вышли из треда. По последним картинкам видно, что это хорошая модель, которая умеет в разные стили и при этом достаточно послушная. А недостатки везде есть. Может, она разовьется, а может Навидия выпустит новый Космос, и сделают уже на нем годноту. А еще она недавно технологию разработала, которая в 2 раза позволяет вес моделей уменьшать с сохранением почти полной точности на FP4. Нехуй бочку катить на модель, короче. Отличная технология даже в таком виде.
А еще можно смешивать артистов, интересные результаты получаются. А так лоры ей практически не нужны, я протыкал всех своих любимых авторов - они все есть в модели и хорошо откликаются. Просто кайф
>>1510264 Там везде градиенты, на худи, 1 пик, например. А на свету нет, да, это пересвет. Я в целом про палитру говорю, а ты про свет только, похоже. Это просто жесткий keylight или rimlight, тут хз, как модель это интепретирует.
>>1510267 Ну не знаю, после Нано Бананы Про выглядит как-то вяло. Тот же ХЛ, но в профиль, уже не очень впечатляет. Надо-бы визуальное размышление, чтобы она сама свой вывод видела, чинила и подгоняла под промпт, как НБП, вот тогда будет ахуенчик по-современному, а не огрызок, лишь немного превосходящий архитектуры говна мамонта трёхлетней давности.
>>1510263 Нет, я по нубу впреду был, нуб лучше люстры. И на нуб я сотню лор натренил за прошлую зиму, мне похуй на кал с цивита. >>1510267 Так это уровень Неты. Нета, кста, не такая ломучая.
>>1510272 Сравнить это с Бананой, лол. Просто высший пилотаж. Банана - это огромный корп, который не в каждый сервак залезет, а тут микромоделька, которая в 8 Гб видюхи помещается. Понятное дело, что это совсем разные уровни. Короче, Анима уже достойное место занимает в своей весовой категории. Подвинет SDXL.
>>1510272 > после Нано Бананы Про выглядит как-то вяло Если речь про анимцо - нанобанана выглядит вяло даже на фоне хл. Васян-френдли фишки, которые полезны нормисам для создания мелькающих задников в видео и иллюстраций к нейрослопу, имеют мало толку для анимеарта. >>1510286 Это не только разные уровни, это разные по предназначению и смыслу модели. Как сравнивать эсминец и контейнеровоз.
>>1510296 > Узконаправленная Действительно, главное выделяемое направление всех картинок слишком узконаправлено. Сколько слова обидные не подбирай суть не изменится. >>1510331 Если цифры соответствуют реальности то модель выходит чудовищно неэффективной залупой.
>>1510499 Мне бы готовый воркфлоу. Файлом. Что-нибудь простенькое. Я на комфи картинки не генерил вообще, только для видео\аудио его использовал, соответственно, своей раскладки для сдхл у меня нет.
Дратути, давно не виделись инб а почему питоном пахнешь и все руки в шейдерах https://litter.catbox.moe/unntagdqxdxv83pq.zip вишмастер на месте, прямо в ренпае, брат умр Вроде всё, что вертелось в голове для демки собрал.
>>1509824 >>1509920 Вообщем, попробовал, так и не вышло у модели этот тест пройти. Зато вот cumflation неплохой получается. Может, промпт ишшью, конечно, но маловероятно.
Из остального: Пальцы довольно плохие. Анатомию проебывает в сложных позах. Мышечная структура не особо хороша, часто с ошибками - получше полторахи, но все равно так себе. Свет странноватый. Работать и работать над моделью, но потенциал хороший.
>>1509911 А то! Тестировать надо на редких и сложных концептах, желательно с несколькими персами. Вангёрл стэндинг любая модель может сделать.
>>1510893 Так и говорю - используй flat color и прочую limited palette. На втором пике как раз оно. На первом - в негатив были добавлены все возможные тэги на блики и отражения, которые я смог придумать. Как видишь, не сработало.
>>1510914 Видишь, ты даже не можешь осознать глубину пост иронии которой даже нет, чтобы это исправить достаточно пеинта, ты не то что к токсичному общению не готов, а даже к пеинту не готов.
>>1510917 Я спрашиваю одно, ты с умным еблом отвечаешь на другое зачем-то, но не понял что-то я. Понимаю, понимаю. Уже иду каждую генерацию выделять в пеинте, тупой дегенерат.
>>1510920 Ты спрашиваешь шизоидный бред, про удаление блика, который рисуют все, у меня было бы меньше вопросов к твоему ментальному состоянию, если бы ты спрашивал как сгенерировать персонажа наматывающего свой выпавший пролапс на локоть.
Ты хочешь 10 часов пердолится роля кал, вместо того чтобы закрасить это в пеинте за 5 секунд. Это и есть шиза.
Если ты не нищий телефонодаун, который не может себе позволить пекарню, то у тебя нет оправдания своей шизофрении.
>>1510929 просто так бы и написал что не смог в банальный промпитнг нах ты мне отвечать продолжаешь, шизик? я не хочу больше с тобой общаться, другие нормальные анончики помогут
Короче кажется что Анима это новая люстра. Даже в таком виде она мне нравится, но к сожалению пока использовать не могу на постоянной основе сыроватая.
>>1511113 Ничем, ей не нужен апскейл, она и так нормально руки генерит. Чёткость мелких деталей, делающая апскейл ненужным, и есть основная польза от незашакаленного ВАЕ.
Прошлый тред: https://arhivach.vc/thread/1295536/
Схожие тематические треды
• SD-тред (не аниме):
• Технотред:
• Фурри-тред: https://2ch.su/fur/res/374311.html
FAQ
https://2ch-ai.github.io/wiki/nai
Установка
• NVidia: https://teletype.in/@aranon/welcome
• AMD: https://2ch-ai.github.io/wiki/nai/install/amd
• Облака: https://2ch-ai.github.io/wiki/nai/install/clouds
Дополнительная информация
• Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces
• Модели: https://2ch-ai.github.io/wiki/nai/models
• Промпты: https://2ch-ai.github.io/wiki/nai/prompts
• Апскейл: https://2ch-ai.github.io/wiki/nai/upscale
• LoRA: https://2ch-ai.github.io/wiki/nai/lora
• ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet
Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci