24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

ИИ-видео №17 /video/

 Аноним 01/10/25 Срд 23:03:10 #1 №1372362 
17589737223240.mp4
17592555935713.mp4
17592555934671.mp4
17589807061981.mp4
Генерируем свое (и постим чужое) в Hunyuan, Wan, Veo3, Luma Dream Machine, Hailuo Minimax, Kling, Sora, Vidu, Runway, Pixverse, Pika и др. сервисах.


1. Hailuo Minimax

https://hailuoai.video/

2. Kling

https://klingai.com/

3. Sora от OpenAI

https://openai.com/sora/
https://openai.com/index/sora-2/


4. Luma Dream Machine

https://lumalabs.ai/

5. Vidu

https://www.vidu.com/create

6. Pixverse

https://app.pixverse.ai/

7. Pika

https://pika.art/try

8. Runway Gen. 4

https://runwayml.com/

9. Wan от Alibaba

https://wan.video/

10. Veo3 от Google

https://deepmind.google/models/veo/

Сайты, где можно попробовать генерации на разных моделях

https://nim.video/
https://pollo.ai/
https://www.florafauna.ai/

Коллекция ИИ-видео:

https://www.reddit.com/r/aivideo/

Локальные модели

1. Hunyuan от Tencent

https://hunyuanvideoai.com/
https://github.com/Tencent/HunyuanVideo

2. Wan от Alibaba

https://github.com/Wan-Video/Wan2.1
https://github.com/Wan-Video/Wan2.2

3. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1


Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Hunyuan Video: https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/
Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/

Гайд для использования Wan 2.2:

https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan 2.1: https://github.com/kijai/ComfyUI-WanVideoWrapper

Квантованные чекпоинты
Hunyuan Video (GGUF): https://huggingface.co/Kijai/SkyReels-V1-Hunyuan_comfy/tree/main
Wan 2.1 (GGUF): https://huggingface.co/city96/Wan2.1-I2V-14B-480P-gguf/tree/main
Wan 2.1 (NF4): https://civitai.com/models/1299436?modelVersionId=1466629

Где брать готовые LoRA
https://civitai.com/models
Hunyuan Video: https://civitai.com/search/models?baseModel=Hunyuan%20Video&sortBy=models_v9
Wan 2.1: https://civitai.com/search/models?baseModel=Wan%20Video&sortBy=models_v9

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Предыдущий тред

>>1362198 (OP)
Аноним 02/10/25 Чтв 00:24:23 #2 №1372440 
upscale00002.mp4
ComfyUI00075.mp4
Ребят, а вот эта вот недетализированная картинка - это фишка ван 2.2 5B, или фишка разрешения 480? Хотелось бы картинку получше.
Аноним 02/10/25 Чтв 00:52:09 #3 №1372463 
wan-lightning-t2v00002.mp4
wan-lightning-t2v00003.mp4
Решил потестить семплеры, на юни_пс обычно все ок, на еулере чета мылом срет с гостами, ну видрилы к посту так, для галочки, корявое говно уже удалил.
Аноним 02/10/25 Чтв 01:32:25 #4 №1372503 
Тихо фигею с комфи.
Две gguf по 15 гиг грузится нормально
Две safetensor по 13 гиг даёт вылет, если не выгружать хайнойз модель.
У них нод для сейфтензоров криво написан что ли?
Аноним 02/10/25 Чтв 02:02:02 #5 №1372533 
>>1372503

Предположу что gguf грузит спрятанная внутри комфи лама.цпп, которая хорошо умеет оффлоадить на оперативку.
Аноним 02/10/25 Чтв 03:01:07 #6 №1372582 
>>1372533
Спасибо за наводку.
Надо бы поискать альтернативные ноды, их много кто пилит.
Аноним 02/10/25 Чтв 03:29:16 #7 №1372602 
>>1372440
5b нормально работает только на высоком разрешении, в районе мегапикселя, дефолтное 704x1280.
Аноним 02/10/25 Чтв 03:31:48 #8 №1372606 
>>1372503
а каким боком safetensors больше гуфа весят?
Аноним 02/10/25 Чтв 05:25:56 #9 №1372686 
image.png
t2v.mp4
Заебись, спасибо анону, что скинул ссылку на обучение. Прям то же, что и на цивите, только бесплатно и вдвое быстрей. Попробовал с видосами, получился по сути сейм щит, что и c пикчами. Настолько лень было, что даже без капшенов, просто кучей навалил. Фото генерит так же как и другие лоры, видео лучше не стали. Как и было, T2I->I2V сильно лучше чем T2V.
Аноним 02/10/25 Чтв 06:37:52 #10 №1372693 
videooutput0000100004.mp4
videooutput0000400001.mp4
Хотел, чтобы она сделала подзывающий жест (https://en.wikipedia.org/wiki/Beckoning_sign#Japan), но чет 4 генерации не осилили, максимум удалось ладонь поднять на втором видосе. После этого занырнул в интерполирование, пробуя разные модельки. Мб завтра попробую поиграться с промптом на маленьком разрешении, чтобы таки добиться нужного
Аноним 02/10/25 Чтв 08:28:48 #11 №1372708 
testt2v00121.mp4
>>1372686
Сколько шагов тренировки ставил?
сколько батч делал?
сколько итоговое время тренировки?
Какой ранк?

Ты не понял прикол, теперь у тебя есть инструмент благодаря которому можно пилить длинные видосы сохраняя схожесть персонажа сквозь генерации, даже если в последнем кадре будет пол ебала или вообще отвернётся.

Одна проблема - у остальных персонажей будет такое же ебало в большинстве случаев. Как бы это обойти
Аноним 02/10/25 Чтв 09:37:39 #12 №1372716 
>>1372708
Да всё дефолтное, только 4к шагов, 3 часа. Это 2.1 14B, r32. I2V chain это хуйня. Можно, конечно, поиграться, может оно и лучше будет с лорой, но если бы я захотел длинное видео, то сгенерил бы промежуточные кадры и соединил через VACE, маски и context_options, чтобы влезло во врам. Если в видео датасете были выразительные примеры мимики, тогда забустит узнаваемость.
Аноним 02/10/25 Чтв 10:21:56 #13 №1372726 
>>1372602
Понял, принял. Спасибо
Аноним 02/10/25 Чтв 12:21:51 #14 №1372779 
1759396909106.mp4
А как делать танцульки со слабым железом? Это доп лора, контрол нет или v2v?
Использую sage, 4 шаговую Лору и q6_k.
Аноним 02/10/25 Чтв 13:10:45 #15 №1372811 
У меня на 16гб врама 720х1280х81 вид не лезет, если фреймов поменьше поставить все равно нет. Я точно все правильно делаю? Мельком чекнул прошлый тред, там вроде анонасы писали что 720х1280х73 должно в 16 гб лезть, или это речь про 5б? У меня 14б. Я пока что выше 640х832х81 исполнить не смог, оом давало, врам в пике до 15 с копейками прыгал, хотя большую часть генерации 12-14 забито только.
Аноним 02/10/25 Чтв 13:44:08 #16 №1372834 
инвайт-код на сору 2 ни у кого не завалялся анончики?
а то реддит уже 2 часа обновляю, заманало...
Аноним 02/10/25 Чтв 13:44:44 #17 №1372835 
>>1372811
Делай блоксвап до 40 и файл подкачки дохуя, гигов 30-60. Речь про 2.1 14B. Влезает даже 121 фрейм.
Аноним 02/10/25 Чтв 13:49:41 #18 №1372839 
image.png
Выше писал про бесплатную тренировку лор, почему может вылезать такая ошибка на сайте huggingface?
Аноним 02/10/25 Чтв 13:50:45 #19 №1372841 
>>1372811
Я предполагал, что 73 должно влезть, попробуй еще меньше.
У меня 57 что ли лезло в 12 гиговую.
Аноним 02/10/25 Чтв 14:27:44 #20 №1372891 
>>1372835
>>1372841
А не, 720х1280х69 уже лезет, только ждать долго пиздец, 300 секунд когда 640х832 ~230, надо еще поиграться с настройками.
Аноним 02/10/25 Чтв 14:28:42 #21 №1372892 
>>1372891
>640х832
*640х832х81
Аноним 02/10/25 Чтв 15:07:56 #22 №1372958 
>>1372839
мб дохуя желающих в моменте
Аноним 02/10/25 Чтв 15:31:31 #23 №1372997 
>>1372839
Токен не прописал в настройках с доступом к репозиториям твоим.
403 - ошибка доступа.
Аноним 02/10/25 Чтв 15:33:25 #24 №1373000 
>>1372997
ну так я его даже вручную создал и скопипастил, всё горит зелёным даже внизу видно
Аноним 02/10/25 Чтв 15:37:27 #25 №1373004 
>>1373000
Сгенерируй тот, который дает доступ на запись. Write или как его там.

А если ты его и сгенерил и точно правильно вставил, то хз. У меня в этом проблема была.
Аноним 02/10/25 Чтв 15:57:29 #26 №1373032 
>>1373004
Огромное спасибо, реально заработало!
Аноним 02/10/25 Чтв 16:06:43 #27 №1373039 
77.mp4
>>1372779
wan 2.2 fun control модель попробуй, есть ещё animate, но до него пока руки не дошли ниче сказать не могу
Аноним 02/10/25 Чтв 16:16:57 #28 №1373048 
>>1373032
A100-large мне выделили
Аноним 02/10/25 Чтв 16:32:59 #29 №1373090 
Анончики, может кто поделиться вф\рассказать как делать видосы по 10-15 сек которые делаются в 3 этапе генерации по одному промпту 2-3 раза по 5 сек из ласт фрейма потом склеиваются вместе не отходя от кассы? И как оно в плане квалити? Наслышан что мыльное говно, но неужели все настолько плохо даже при фп8\16 модели и при том что мне надо всего 3 этапа (15 сек) а не короткометражки целые лепить?
Аноним 02/10/25 Чтв 16:33:52 #30 №1373092 
>>1373090
Слышал что у киджая есть какая-то нода для этого но оно только для 2.1 работает, для 2.2 есть?
Аноним 02/10/25 Чтв 16:47:39 #31 №1373110 
>>1373090
>>1373092
открой циват, да посмотри в поиске для 2.2 вана. Ключевое слово loop
Аноним 02/10/25 Чтв 16:53:39 #32 №1373122 
>>1373048
тренировка завершилась, дома буду тестить
Аноним 02/10/25 Чтв 17:00:09 #33 №1373133 
>>1373092
у киджая context windows нода, это экспериментальная хуйня с таким себе качеством, работает принципиально иначе чем тупо first/last фрейм
Аноним 02/10/25 Чтв 17:14:53 #34 №1373149 
ComfyUI00096.mp4
ComfyUI00088.mp4
ComfyUI00102.mp4
Появились вопросы по ходу использования 5b модели. Делаю в 128070481, делается не оч качественно, и то пузырится, то детали проебываются, то наполовину не слушается промта, а самое главное, что генерит 780 секунд. Видеокарта 3050/8gb, оперативка 32gb. Может я что-то делаю не так?
Аноним 02/10/25 Чтв 17:15:37 #35 №1373150 
>>1372503
У меня на 5090 две модели fp16 только на MOE нормально грузят с 64 гб памяти. C обычным ksampler вылетает
comments powered by Disqus