Прошлые домены не функционирует! Используйте адрес ARHIVACH.VC.
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Сортировка: за
Сохранен
298
5 февраля 2022
Сохранен
39
1 ноября 2015
Сохранен
327
5 сентября 2015
Сохранен
458
17 мая 2017
Сохранен
246
1 октября 2021
Сохранен
358
13 августа 2016
Сохранен
264
4 марта 2015
Сохранен
569
29 апреля 2016
Сохранен
532
4 декабря 2015
Сохранен
511
2 октября 2015
Сохранен
380
20 ноября 2015
Сохранен
494
10 декабря 2016
Сохранен
187
19 июля 2017
Сохранен
298
25 сентября 2015
Сохранен
195
11 сентября 2015
Сохранен
490
18 декабря 2015
Сохранен
590
25 декабря 2015
Сохранен
904
7 июля 2019
Сохранен
163
12 декабря 2017
Сохранен
97
9 сентября 2021
Сохранен
39
25 апреля 2016
Сохранен
516
25 декабря 2015
Сохранен
929
31 мая 2022
Сохранен
236
17 октября 2015
Сохранен
536
Голосовых нейронок тред (TTS, STS, STT) #3 /speech/ — Обсуждаем нейросети, связанные с синтезом, преобразованием и распознаванием речи. Не забываем публиковать свои шедевры в треде. Text To Speech (TTS) ???? ???? ???? Silero Российская разработка, легковесный, быстрый, относительно качественный. Поддерживает много языков, включая русский. https://github.com/snakers4/silero-models Есть 2 GUI: Для всех систем: https://huggingface.co/spaces/NeuroSenko/tts-silero Для винды, более продвинутый проект формата "всё в одном" (TTS/STS/TTS), часть функционала платная: SoundWorks, https://dmkilab.com/soundworks Официальный бот в телеге. Требуется подписка на новостной канал. На бесплатном тарифе есть лимиты на число запросов в сутки: https://t.me/silero_voice_bot Данная нейронка не обладает высокими системными требованиями. Если хотите запустить на своём компьютере, то, придётся накачать около 5 гигов + питон + гит, но всё будет установленно в одну папку поэтому будет легко удалить если надоест. Если используете несколько нейросетей - используйте Anaconda / Miniconda! Гайд: https://textbin.net/kfylbjdmz9 Нет возможности тренировки своих голосов, но возможно сделать генерацию с одним из имеющихся голосов, и потом преобразовать получившийся файл через STS (смотри ниже). Elevenlabs Онлайн-сервис синтеза и преобразования английского голоса. На бесплатном тарифе ограничения по числу символов в месяц. Сайт: https://elevenlabs.io/speech-synthesis Гайд по использованию и общие советы: https://rentry.org/AIVoiceStuff VITS-Umamusume-voice-synthesizer Только на японском, 87 голосов. ХагингФейс: https://huggingface.co/spaces/Plachta/VITS-Umamusume-voice-synthesizer Гугл-Калаб: https://colab.research.google.com/drive/1J2Vm5dczTF99ckyNLXV0K-hQTxLwEaj5?usp=sharing MoeGoe и MoeTTS Гайд на китайском: https://colab.research.google.com/drive/1HDV84t3N-yUEBXN8dDIDSv6CzEJykCLw#scrollTo=EuqAdkaS1BKl Кажется можно тренировать свои голосовые модели, но это не точно Гугл-Калаб: https://www.bilibili.com/video/BV16G4y1B7Ey/?share_source=copy_web&vd_source=630b87174c967a898cae3765fba3bfa8 Speech To Speech (STS) ???? ???? ???? Оба проекта SVC и RVC позволяют обучать модели на любой голос, в том числе свой, любимой матушки, обожаемого политика и других представителей социального дна. Для обучения своих моделей нужен датасет от 10 минут до 1 часа. Разработчики софта рекомендуют для обучения использовать видеокарту с объёмом памяти 10 GB VRAM, но возможно обучение и на видеокартах с меньшим объёмом памяти. Преобразование голоса можно осуществлять как на видеокарте, так и на процессоре с меньшей скоростью. SoftVC VITS Singing Voice Conversion Fork (SVC) Репозиторий: https://github.com/voicepaw/so-vits-svc-fork Гайд по установке и использованию: https://rentry.org/tts_so_vits_svc_fork_for_beginners Готовые модели: https://huggingface.co/models?search=so-vits-svc | https://civitai.com/models?query=so-vits-svc Для изменения голоса в песнях вам дополнительно необходимо установить софт для отделения вокала от инструменталки: https://github.com/Anjok07/ultimatevocalremovergui Не поддерживает AMD GPU на Windows. Retrieval-based-Voice-Conversion-WebUI (RVC) Репозиторий: https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI Готовые модели: https://huggingface.co/juuxn/RVCModels/tree/main Утилиты для отделения вокала от инструменталки идут в комплекте. Speech To Text (STT) ???? ???? ???? Консольная тулза от OpenAI, поддерживает множество языков, включая русский: https://github.com/openai/whisper Прочее ????️ Утилита для нарезки длинных аудиотреков (пригодится для составления датасетов): https://github.com/flutydeer/audio-slicer Чтобы создать видео из аудио, можно использовать FFMPEG, но если лень - есть GUI, SoundWorks (ссылку см. выше) - Tools \ Video \ Produce still video Ссылки на эти проекты мелькали в прошлых тредах, но не похоже на то, чтобы их активно использовали итт: https://github.com/w-okada/voice-changer/blob/master/README_en.md https://themetavoice.xyz/ https://github.com/coqui-ai/TTS Шаблон для переката: https://rentry.org/byv2s Предыдущий тред: >>314948 (OP)
13 февраля 2024