24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

ИИ-видео №17 /video/

 Аноним 01/10/25 Срд 23:03:10 #1 №1372362 
17589737223240.mp4
17592555935713.mp4
17592555934671.mp4
17589807061981.mp4
Генерируем свое (и постим чужое) в Hunyuan, Wan, Veo3, Luma Dream Machine, Hailuo Minimax, Kling, Sora, Vidu, Runway, Pixverse, Pika и др. сервисах.


1. Hailuo Minimax

https://hailuoai.video/

2. Kling

https://klingai.com/

3. Sora от OpenAI

https://openai.com/sora/
https://openai.com/index/sora-2/


4. Luma Dream Machine

https://lumalabs.ai/

5. Vidu

https://www.vidu.com/create

6. Pixverse

https://app.pixverse.ai/

7. Pika

https://pika.art/try

8. Runway Gen. 4

https://runwayml.com/

9. Wan от Alibaba

https://wan.video/

10. Veo3 от Google

https://deepmind.google/models/veo/

Сайты, где можно попробовать генерации на разных моделях

https://nim.video/
https://pollo.ai/
https://www.florafauna.ai/

Коллекция ИИ-видео:

https://www.reddit.com/r/aivideo/

Локальные модели

1. Hunyuan от Tencent

https://hunyuanvideoai.com/
https://github.com/Tencent/HunyuanVideo

2. Wan от Alibaba

https://github.com/Wan-Video/Wan2.1
https://github.com/Wan-Video/Wan2.2

3. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1


Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Hunyuan Video: https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/
Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/

Гайд для использования Wan 2.2:

https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan 2.1: https://github.com/kijai/ComfyUI-WanVideoWrapper

Квантованные чекпоинты
Hunyuan Video (GGUF): https://huggingface.co/Kijai/SkyReels-V1-Hunyuan_comfy/tree/main
Wan 2.1 (GGUF): https://huggingface.co/city96/Wan2.1-I2V-14B-480P-gguf/tree/main
Wan 2.1 (NF4): https://civitai.com/models/1299436?modelVersionId=1466629

Где брать готовые LoRA
https://civitai.com/models
Hunyuan Video: https://civitai.com/search/models?baseModel=Hunyuan%20Video&sortBy=models_v9
Wan 2.1: https://civitai.com/search/models?baseModel=Wan%20Video&sortBy=models_v9

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Предыдущий тред

>>1362198 (OP)
Аноним 02/10/25 Чтв 00:24:23 #2 №1372440 
upscale00002.mp4
ComfyUI00075.mp4
Ребят, а вот эта вот недетализированная картинка - это фишка ван 2.2 5B, или фишка разрешения 480? Хотелось бы картинку получше.
Аноним 02/10/25 Чтв 00:52:09 #3 №1372463 
wan-lightning-t2v00002.mp4
wan-lightning-t2v00003.mp4
Решил потестить семплеры, на юни_пс обычно все ок, на еулере чета мылом срет с гостами, ну видрилы к посту так, для галочки, корявое говно уже удалил.
Аноним 02/10/25 Чтв 01:32:25 #4 №1372503 
Тихо фигею с комфи.
Две gguf по 15 гиг грузится нормально
Две safetensor по 13 гиг даёт вылет, если не выгружать хайнойз модель.
У них нод для сейфтензоров криво написан что ли?
Аноним 02/10/25 Чтв 02:02:02 #5 №1372533 
>>1372503

Предположу что gguf грузит спрятанная внутри комфи лама.цпп, которая хорошо умеет оффлоадить на оперативку.
Аноним 02/10/25 Чтв 03:01:07 #6 №1372582 
>>1372533
Спасибо за наводку.
Надо бы поискать альтернативные ноды, их много кто пилит.
Аноним 02/10/25 Чтв 03:29:16 #7 №1372602 
>>1372440
5b нормально работает только на высоком разрешении, в районе мегапикселя, дефолтное 704x1280.
Аноним 02/10/25 Чтв 03:31:48 #8 №1372606 
>>1372503
а каким боком safetensors больше гуфа весят?
Аноним 02/10/25 Чтв 05:25:56 #9 №1372686 
image.png
t2v.mp4
Заебись, спасибо анону, что скинул ссылку на обучение. Прям то же, что и на цивите, только бесплатно и вдвое быстрей. Попробовал с видосами, получился по сути сейм щит, что и c пикчами. Настолько лень было, что даже без капшенов, просто кучей навалил. Фото генерит так же как и другие лоры, видео лучше не стали. Как и было, T2I->I2V сильно лучше чем T2V.
Аноним 02/10/25 Чтв 06:37:52 #10 №1372693 
videooutput0000100004.mp4
videooutput0000400001.mp4
Хотел, чтобы она сделала подзывающий жест (https://en.wikipedia.org/wiki/Beckoning_sign#Japan), но чет 4 генерации не осилили, максимум удалось ладонь поднять на втором видосе. После этого занырнул в интерполирование, пробуя разные модельки. Мб завтра попробую поиграться с промптом на маленьком разрешении, чтобы таки добиться нужного
Аноним 02/10/25 Чтв 08:28:48 #11 №1372708 
testt2v00121.mp4
>>1372686
Сколько шагов тренировки ставил?
сколько батч делал?
сколько итоговое время тренировки?
Какой ранк?

Ты не понял прикол, теперь у тебя есть инструмент благодаря которому можно пилить длинные видосы сохраняя схожесть персонажа сквозь генерации, даже если в последнем кадре будет пол ебала или вообще отвернётся.

Одна проблема - у остальных персонажей будет такое же ебало в большинстве случаев. Как бы это обойти
Аноним 02/10/25 Чтв 09:37:39 #12 №1372716 
>>1372708
Да всё дефолтное, только 4к шагов, 3 часа. Это 2.1 14B, r32. I2V chain это хуйня. Можно, конечно, поиграться, может оно и лучше будет с лорой, но если бы я захотел длинное видео, то сгенерил бы промежуточные кадры и соединил через VACE, маски и context_options, чтобы влезло во врам. Если в видео датасете были выразительные примеры мимики, тогда забустит узнаваемость.
Аноним 02/10/25 Чтв 10:21:56 #13 №1372726 
>>1372602
Понял, принял. Спасибо
Аноним 02/10/25 Чтв 12:21:51 #14 №1372779 
1759396909106.mp4
А как делать танцульки со слабым железом? Это доп лора, контрол нет или v2v?
Использую sage, 4 шаговую Лору и q6_k.
Аноним 02/10/25 Чтв 13:10:45 #15 №1372811 
У меня на 16гб врама 720х1280х81 вид не лезет, если фреймов поменьше поставить все равно нет. Я точно все правильно делаю? Мельком чекнул прошлый тред, там вроде анонасы писали что 720х1280х73 должно в 16 гб лезть, или это речь про 5б? У меня 14б. Я пока что выше 640х832х81 исполнить не смог, оом давало, врам в пике до 15 с копейками прыгал, хотя большую часть генерации 12-14 забито только.
Аноним 02/10/25 Чтв 13:44:08 #16 №1372834 
инвайт-код на сору 2 ни у кого не завалялся анончики?
а то реддит уже 2 часа обновляю, заманало...
Аноним 02/10/25 Чтв 13:44:44 #17 №1372835 
>>1372811
Делай блоксвап до 40 и файл подкачки дохуя, гигов 30-60. Речь про 2.1 14B. Влезает даже 121 фрейм.
Аноним 02/10/25 Чтв 13:49:41 #18 №1372839 
image.png
Выше писал про бесплатную тренировку лор, почему может вылезать такая ошибка на сайте huggingface?
Аноним 02/10/25 Чтв 13:50:45 #19 №1372841 
>>1372811
Я предполагал, что 73 должно влезть, попробуй еще меньше.
У меня 57 что ли лезло в 12 гиговую.
Аноним 02/10/25 Чтв 14:27:44 #20 №1372891 
>>1372835
>>1372841
А не, 720х1280х69 уже лезет, только ждать долго пиздец, 300 секунд когда 640х832 ~230, надо еще поиграться с настройками.
Аноним 02/10/25 Чтв 14:28:42 #21 №1372892 
>>1372891
>640х832
*640х832х81
comments powered by Disqus