Сохранен 19
https://2ch.hk/b/res/228438617.html
Прошлые домены не функционирует! Используйте адрес ARHIVACH.VC.
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Аноним 07/09/20 Пнд 00:45:09 #1 №228438617 
neur.png
Нужна нейросеть, чтобы сравнить 2 голоса. Программировать умею, плюсы и питон знаю хорошо, есть предтоповое железо чтобы трейнить, только нужно узнать название технологий или алгоритмов, которые нужны, чтобы получить эту задачу, и я смогу сама написать это все дело. Нужны только названия.
Т.е. на вход идут 2 файла с голосом, которые говорят разные слова, на выходе получаем [0, 1), вероятность того, что говорит один и тот же человек.
Или может уже есть готовое решение? Тоже не откажусь.
sageАноним 07/09/20 Пнд 00:45:56 #2 №228438643 
>>228438617 (OP)
неп
Аноним 07/09/20 Пнд 00:48:16 #3 №228438742 
14587418488780.jpg
>>228438617 (OP)
>и я смогу сама написать
Аноним OP 07/09/20 Пнд 00:48:53 #4 №228438764 
>>228438742
Я мужик, блять. Не заметил это говно, случайно написал.
Аноним 07/09/20 Пнд 00:50:48 #5 №228438846 
>>228438764
Мужик в попу вжик.
Аноним OP 07/09/20 Пнд 00:52:05 #6 №228438904 
1.jpg
Аноним 07/09/20 Пнд 00:55:52 #7 №228439049 
>>228438617 (OP)
Голос это по сути временной ряд. Тебе нужны точно рекурентные сети(хотя и сверточные подойдут). Я бы присмотрелся к LSTM сетям. Ну а по поводу препроцессинга данных, тут уж сам решай. В конечном итоге они должны быть нормализованы между 0 и 1 и подаваться векторами. По библиотеки, рекомендую Keras, но так как ты заявляешь что программист то Tensor Flow. По сути одна это апи к другой.
Аноним 07/09/20 Пнд 00:57:21 #8 №228439103 
>>228439049
Тот
Аноним 07/09/20 Пнд 00:57:58 #9 №228439129 
>>228438617 (OP)
>Программировать умею, плюсы и питон знаю хорошо, есть предтоповое железо чтобы трейнить, только нужно узнать название технологий или алгоритмов, которые нужны, чтобы получить эту задачу, и я смогу сама написать это все дело. Нужны только названия.
Пиздец. Ладно, моё поколение программистов просто гуглит вместо того, чтобы знать. Но эти зумеры ёбаные, похоже, даже гуглить не умеют - они обо всём будут на дваче спрашивать. Я просто хуею, джентльмены.
Аноним 07/09/20 Пнд 00:58:08 #10 №228439136 
>>228439049
Забыл джобавить, что в гугле все есть и проще чем я написал. https://dataart.ru/news/klassifikafiya-zvukov-s-pomosh-yu-tensorflow/
Аноним OP 07/09/20 Пнд 00:59:15 #11 №228439184 
>>228439049
Сейчас буду читать.

Я думал разбивать на буквы (+ то, что возле них следует, ибо в "Ка" и "Ки" буква к звучит по-разному) и сравнивать их.
Аноним OP 07/09/20 Пнд 00:59:53 #12 №228439207 
>>228439136
Спасибо, я уже нагуглю, мне бы только направление узнать. :)
Аноним 07/09/20 Пнд 01:04:08 #13 №228439361 
>>228439184
Я не работал со звуком, но работал с многими другими данными. Самое важно, это подготовка данных, как я писал выше, сеть кушает вектор нормализованных значений от 0 до 1. Я так подозреваю, что тебе потребуется разложить твой звук на график зависимости звукового давления от времени (осциллограмма) или график амплитуд гармонических составляющих разных частот (спектрограмма). Потом нормализовать это дело в каждый момент времени от 0 до 1 и подавать в сетку. Всё. Ну и на выходе там выбрать функцию расчета ошибки, это читай уже про "Обучение с учителем" . Почитай еще вот это https://habr.com/ru/post/462527/
Аноним 07/09/20 Пнд 01:05:27 #14 №228439415 
>>228439207
Направление TensorFlow + LSTM.
Аноним 07/09/20 Пнд 01:06:23 #15 №228439457 
>>228439207
Ну и тебе надо много тренировочных данных, реально много.
Аноним OP 07/09/20 Пнд 01:08:59 #16 №228439554 
123333444.jpg
>>228439361
Большое спасибо, думаю тут достаточно инфы на пару дней.

Можем закрывать тред, но если кто хочет - можете тут о нейроночках говорить.

>>228439457
У меня есть ютуб, там их куча.)
Аноним 07/09/20 Пнд 01:20:35 #17 №228439977 
>>228438617 (OP)
ОП, в pr есть машоб-тред.
Аноним 07/09/20 Пнд 01:44:27 #18 №228440747 
>>228438617 (OP)
vectozavr?
Аноним 07/09/20 Пнд 02:08:08 #19 №228441487 
>>228438617 (OP)
>Или может уже есть готовое решение?
есть, ищи. такое можно и алгоритмически сделать
comments powered by Disqus

Отзывы и предложения