Нужна нейросеть, чтобы сравнить 2 голоса. Программировать умею, плюсы и питон знаю хорошо, есть предтоповое железо чтобы трейнить, только нужно узнать название технологий или алгоритмов, которые нужны, чтобы получить эту задачу, и я смогу сама написать это все дело. Нужны только названия. Т.е. на

Аноним 07/09/20 Пнд 00:45:09 #1 №228438617

Нужна нейросеть, чтобы сравнить 2 голоса. Программировать умею, плюсы и питон знаю хорошо, есть предтоповое железо чтобы трейнить, только нужно узнать название технологий или алгоритмов, которые нужны, чтобы получить эту задачу, и я смогу сама написать это все дело. Нужны только названия.
Т.е. на вход идут 2 файла с голосом, которые говорят разные слова, на выходе получаем [0, 1), вероятность того, что говорит один и тот же человек.
Или может уже есть готовое решение? Тоже не откажусь.

Аноним 07/09/20 Пнд 00:45:56 #2 №228438643

>>228438617 (OP)
неп

Аноним 07/09/20 Пнд 00:48:16 #3 №228438742

14587418488780.jpg

>>228438617 (OP)
>и я смогу сама написать

Аноним OP 07/09/20 Пнд 00:48:53 #4 №228438764

>>228438742
Я мужик, блять. Не заметил это говно, случайно написал.

Аноним 07/09/20 Пнд 00:50:48 #5 №228438846

>>228438764
Мужик в попу вжик.

Аноним OP 07/09/20 Пнд 00:52:05 #6 №228438904

1.jpg

Аноним 07/09/20 Пнд 00:55:52 #7 №228439049

>>228438617 (OP)
Голос это по сути временной ряд. Тебе нужны точно рекурентные сети(хотя и сверточные подойдут). Я бы присмотрелся к LSTM сетям. Ну а по поводу препроцессинга данных, тут уж сам решай. В конечном итоге они должны быть нормализованы между 0 и 1 и подаваться векторами. По библиотеки, рекомендую Keras, но так как ты заявляешь что программист то Tensor Flow. По сути одна это апи к другой.

Аноним 07/09/20 Пнд 00:57:21 #8 №228439103

>>228439049
Тот

Аноним 07/09/20 Пнд 00:57:58 #9 №228439129

>>228438617 (OP)
>Программировать умею, плюсы и питон знаю хорошо, есть предтоповое железо чтобы трейнить, только нужно узнать название технологий или алгоритмов, которые нужны, чтобы получить эту задачу, и я смогу сама написать это все дело. Нужны только названия.
Пиздец. Ладно, моё поколение программистов просто гуглит вместо того, чтобы знать. Но эти зумеры ёбаные, похоже, даже гуглить не умеют - они обо всём будут на дваче спрашивать. Я просто хуею, джентльмены.

Аноним 07/09/20 Пнд 00:58:08 #10 №228439136

>>228439049
Забыл джобавить, что в гугле все есть и проще чем я написал. https://dataart.ru/news/klassifikafiya-zvukov-s-pomosh-yu-tensorflow/

Аноним OP 07/09/20 Пнд 00:59:15 #11 №228439184

>>228439049
Сейчас буду читать.

Я думал разбивать на буквы (+ то, что возле них следует, ибо в "Ка" и "Ки" буква к звучит по-разному) и сравнивать их.

Аноним OP 07/09/20 Пнд 00:59:53 #12 №228439207

>>228439136
Спасибо, я уже нагуглю, мне бы только направление узнать. :)

Аноним 07/09/20 Пнд 01:04:08 #13 №228439361

>>228439184
Я не работал со звуком, но работал с многими другими данными. Самое важно, это подготовка данных, как я писал выше, сеть кушает вектор нормализованных значений от 0 до 1. Я так подозреваю, что тебе потребуется разложить твой звук на график зависимости звукового давления от времени (осциллограмма) или график амплитуд гармонических составляющих разных частот (спектрограмма). Потом нормализовать это дело в каждый момент времени от 0 до 1 и подавать в сетку. Всё. Ну и на выходе там выбрать функцию расчета ошибки, это читай уже про "Обучение с учителем" . Почитай еще вот это https://habr.com/ru/post/462527/

Аноним 07/09/20 Пнд 01:05:27 #14 №228439415

>>228439207
Направление TensorFlow + LSTM.

Аноним 07/09/20 Пнд 01:06:23 #15 №228439457

>>228439207
Ну и тебе надо много тренировочных данных, реально много.

Аноним OP 07/09/20 Пнд 01:08:59 #16 №228439554

123333444.jpg

>>228439361
Большое спасибо, думаю тут достаточно инфы на пару дней.

Можем закрывать тред, но если кто хочет - можете тут о нейроночках говорить.

>>228439457
У меня есть ютуб, там их куча.)

Аноним 07/09/20 Пнд 01:20:35 #17 №228439977

>>228438617 (OP)
ОП, в pr есть машоб-тред.

Аноним 07/09/20 Пнд 01:44:27 #18 №228440747

>>228438617 (OP)
vectozavr?

Аноним 07/09/20 Пнд 02:08:08 #19 №228441487

>>228438617 (OP)
>Или может уже есть готовое решение?
есть, ищи. такое можно и алгоритмически сделать