Железо для локальных нейросетей. Двач, есть желание потыкаться в локальные llm модели, посидел поизу

Аноним 09/02/26 Пнд 07:10:38 #1 №329562057

Железо для локальных нейросетей.
Двач, есть желание потыкаться в локальные llm модели, посидел поизучал рынок днищих ускорителей и подобрал 3 варианта: донная p102-100 за 3к, простая и удобная tesla p100 за 10-12к, потенциальный йоба, но геморройный mi50 за 10к. Собственно, первый вариант обладает 10гб быстрой памяти, потенциально мощным чипом, но нещадно зарублен по шине. Пока модель полностью влезает в память, все будет хорошо, но вот если брать 2 карты (а одну нет смысла, ибо нормальным моделям и 16 то гигов хватает впритык)... 4 линии pci-e 1.1 это как будто звучит как приговор, производительность должна упасть сильно. P100 же не имеет вообще никаких проблем, кроме существавания mi50, который за те же бабки лучше буквально по всем параметрам, но может потерциально сломать мозг в попытке заставить это нормально работать, т.к. это старое амд. Подскажите, что из этих трех кусков говна таки лучше?

Аноним 09/02/26 Пнд 07:13:00 #2 №329562097

>>329562057 (OP)
Бред всё у меня и на 1660 супер нормально генеритса

Аноним 09/02/26 Пнд 07:19:02 #3 №329562180

>>329562057 (OP)
на mi50 брака дохуя, удачи

Аноним 09/02/26 Пнд 07:50:26 #4 №329562597

>>329562180
Что имешь ввиду под браком? Что продаваны барыжат мусором нерабочим, или что у них есть беда с завода?

Аноним 09/02/26 Пнд 07:54:30 #5 №329562656

Локальные языковухи это в принципе баловство уровня чат бота из нулевых, которые не держат контекст и генерят ответы по пол часа, ну если конечно ты не соберешь монструозный пк для запуска мощных моделей, которые уже будут более близки к уровню яндекс Алисы.

Аноним 09/02/26 Пнд 08:03:46 #6 №329562777

>>329562656
Два чаю. Маньки ведутся на псиоп из Твиттера, хотя сами нихуя не пробовали запускать нихуя ни разу. Локальные 8B модели - это пиздец. Медленные, хуёвые, кривые. Да, даже после ебли с тюнингом. И да, ты верно говоришь, локальные >500B модели я хоть и не запускал, но уверен, что они тоже говёные, где-то на уровне Bard, лол.

Можно конечно это прихуярить для ОЧЕНЬ узких задач, если на куче мощных карт обучать и потом запускать на паре гигов объединённой памяти Мака, т.е. инвестировать 5-10К баксов, но всё равно это будет говном. И вряд ли в ближайшие лет пять-десять ситуация изменится, если вообще изменится. Мы сейчас на уровне дисковых телефонов. Так что если у вашей хуйни есть сенсибл дата или дата которая стоит что-то, то сочувствую.

Аноним 09/02/26 Пнд 08:06:07 #7 №329562814

>>329562777
>паре гигов
Паре терабайтов, конечно, фикс.

Аноним 09/02/26 Пнд 08:07:57 #8 №329562833

>>329562656
Чего? Локальные модели уже вполне достиглииуровне gpt4-mini, тот же gpt-oss 20B. На 2 таких картах, по моим прикидкам, можно поставить +-32к контекста, что уже лучше бесплатного chatgpt. А на более простых моделях можно еще увеличивать контекст. Ну и докупить третью карту никто не запрещает.

Аноним 09/02/26 Пнд 08:11:55 #9 №329562873

1000078266.jpg

Оп база. За локалками будущее

Аноним 09/02/26 Пнд 08:15:17 #10 №329562912

>>329562833
>копиум фантазёра
>ПО МОИМ ПРИКИДКАМ
Ну ёпт, тебе вообще тогда карты не нужны никакие. Фантазируй, что там у тебя уже на уровне Opus 9.9 всё работает, на листочке пиши промпты в тетрадочке, а потом сам себе отвечай. И представляй, что это AGI.

Потому что ИРЛ, когда ты мамкину карточку с пенсией опустошишь и на Авито купишь пару карт после майнинга в малафье и наконец-то запустишь это реально, у тебя случится приступ ИРЛ. И потом приступ психический с тряской. Потому что ты поймёшь, что мамкина пенсия улетела на хуйню.

Пиздец какой. Если ты такая маня, что тебе приходится это объяснять и ты этого сам не понимаешь и ты на Дваче ищешь подпитки копиума, то тебе нахуй в это лезть не надо тем более. Вот когда у тебя вопросов вообще не будет, когда ты сам оттюнишь с десяток локалок до полурабочего состояния ценой тонны нервов и жопного пота, то тогда можно что-то делать, тогда можно задумываться о покупке каких-то карт(нет).

Аноним OP 09/02/26 Пнд 08:16:28 #11 №329562926

Кстати, в первую очередь, мне было бы очень интересно подружить модель с sql бд, а по очевидным причинам, для этого не локальные модели абсолютно непригодны.

Аноним OP 09/02/26 Пнд 08:18:42 #12 №329562954

>>329562912
Я блядь не могу запустить никакую локалку, у меня видеокарты нет вообще, за ненадобностью. Живу не на мамкину пенсию, если не понравится, просто продам в некоторый минус карты и забуду.

Аноним 09/02/26 Пнд 08:19:02 #13 №329562958

>>329562057 (OP)
>но вот если брать 2 карты
Единицы моделей умеют шариться на несколько видеокарт. Большинство в лучшем случае может задействовать оперативку наряду с врам. Но тут ширина шины становится критичной.

Аноним 09/02/26 Пнд 08:21:52 #14 №329562997

>>329562954
Чел, ты явно вообще в теме рубишь на уровне бабульки какой-то совковой. Потому что если бы захотел что-то "попробовать", то ты бы не покупки карт там уже планировал с бюджетами и треда на Дваче создавал копиумные с фантазиями, как ты Джарвиса запускаешь и становишься сверхчеловеком, а запустил бы уже локалку на VPS и обосрался бы от уныния.

Но ты судя по всему вообще не понимаешь нихуя, только пару постов на Пикабу видал или тредов в X.

Аноним 09/02/26 Пнд 08:23:10 #15 №329563016

>>329562833
Если хочешь запускать ллм 64-128 Гб оперативки будет лучше чем видеокарта с 16. Даже если речь идёт о блеквелл с поддержкой fp4. Да на процессоре инференс будет медленный, но зато в оперативку влезет гораздо более жирная модель чем в ты сумеешь в vram видеокарты запихать. Более того даже если ты будешь запускать модели из ram видеокарту можно будет использовать для ускорения вычислений.

Аноним 09/02/26 Пнд 08:23:26 #16 №329563020

>>329562057 (OP)
Продолжай изучение, пока ты ничего не понял. Если что то, советую теслу, только она будет в районе 20к стоить тебе. А так нищукам запрещен вход в лллм. Да и смысла в этом нет, если ты не прогер.

Аноним 09/02/26 Пнд 08:28:52 #17 №329563090

>>329562926
>по очевидным причинам, для этого не локальные модели абсолютно непригодны.
Неочевидно, потому что бд это только контекст для переваривания в мясорубке модели.
Если ты не занимаешься госухой и не организация, то ваще пахую всем твои выходы за контур бабушкиной квартиры.

Аноним 09/02/26 Пнд 08:28:55 #18 №329563092

>>329562057 (OP)
Если тебе просто попердолить компьютер, то любая видеокарта пойдет, у меня хорошо работала квен на 30б параметров на 1080гтх, которой лет 10 наверное уже.
С другой стороны, если тебе прям использовать, а не играться, то все маленькие модели, которые хотя бы теоретически могут работать на домашнем железе нереально тупые.
Такие дела. Хочешь хорошую LLM - плати антропику или гуглу.

Аноним 09/02/26 Пнд 08:33:13 #19 №329563149

Что вы на эти gpu зациклились?
>tesla
Чипы apple (М-серия) с unified memory поинтереснее же будет и дешевле.

Аноним 09/02/26 Пнд 08:34:13 #20 №329563161

>>329563149
Это заблуждение. Расчеты на GPU всегда эффективнее. Миф о производительности М-серии для вычислений с ЛЛМ - маркетинг яблока, которое не смогло в собственную модель даже.

Аноним 09/02/26 Пнд 08:34:41 #21 №329563171

>>329563090
Бляяя... так скорее всего так и было. Васяна мамка устроила сисадмином в ЖЭК или типа того, а там надо пердолить всякую хуету. Ну он под чем-то стал с Gemini базарить, мол, как сделать так, что AI всю работу делала, а я сидел чиллил в тик-токе. Ну она ему и нахуярила какой-нибудь ПРОТОКОЛ-РНН в своём шизо-духе, как Gemini всегда делает. Типа тыр-пыр, ща на Авито закупаешь карты, там всё настроишь, она будет работу делать, потом короче становишься президентом мира и всё - покорять Вселенную.

Аноним 09/02/26 Пнд 08:35:08 #22 №329563178

>>329563149
Блять. Ахахахахахахааххаахахах.

Аноним 09/02/26 Пнд 08:39:41 #23 №329563246

>>329563161
Узкое горлышко это ширина шины, а не производительность.
>не смогло в собственную модель даже.
Зато на маках прекрасно запускаются чужие модели локально. И это самое доступное что сейчас есть для этого.

Аноним 09/02/26 Пнд 08:47:11 #24 №329563353

>>329563246
>Узкое горлышко это ширина шины, а не производительность.
Узкое место это ядра, перемалывающие матрицы в параллельных вычислениях.

Аноним 09/02/26 Пнд 08:48:11 #25 №329563363

>>329563092
>все маленькие модели, которые хотя бы теоретически могут работать на домашнем железе нереально тупые.

А если 3264 гига РАМ и на процессоре запускать? похуй на скорость

Аноним 09/02/26 Пнд 08:51:08 #26 №329563431

>>329563353
Хуйню несёшь. Ты вообще не в теме.

Аноним 09/02/26 Пнд 08:53:05 #27 №329563469

>>329563246
Я конечно понимаю у вас там культ и все такое. Но блять, стоит смотреть хоть иногда правде в глаза. В маках стоит самая обычная LPDDR5 память. Да и объемы за разумный прайс скажем откровенно далеко не выдающиеся. За какой нибудь мак студио с 96 гигами уже около ляма придется отдать. Ну и самое хуевое что про апгрейд можно забыть, потому что память распаяна на одной подложке с процессором. Короче мак это максимально тупое решение для нейросетей.

Аноним 09/02/26 Пнд 08:54:00 #28 №329563487

>>329563363
Лучше 128, но с 64 уже более менее становится интересно.

Аноним 09/02/26 Пнд 08:57:06 #29 №329563547

gtx 250

Аноним 09/02/26 Пнд 09:00:41 #30 №329563610

>>329562057 (OP)
Если генерить картинки, то 24гб видеопамяти хватит, если языковые, то продавай бабушкину квартиру и покупай А100 т.к. даже дипсик требует 500 гб видеопамяти. Ты должен понимать какого качества все эти дистиляты на 12гб: невероятная тупость и долгий ответ около минуты. Они хороши как образ википедии, но не более.

Аноним 09/02/26 Пнд 09:00:56 #31 №329563616

>>329563431
>Хуйню несёшь. Ты вообще не в теме.
Давай бенчи сюда выкладывай, гомосексуалист.

Аноним 09/02/26 Пнд 09:04:43 #32 №329563663

>>329563469
Всё, можешь дальше не продолжать. И так было понятно, что ты долбоёб полный, но тут ты как бы вообще раскрылся. Ты ебанатик, M3 с 512GB лям стоит. Кто, нахуй, на рынке ещё предлагает настолько много памяти? А кто вообще, кроме Apple, предлагает объединённую? А, да, бля, это же разработка Apple, ни у кого больше нахуй вообще такого нет. Короче, диннахуй, ты додик, у которого вообще никакого железа нет и ты диванный додик-кукаретик-пиздабол. Ты тупой.

>>329563246
Чел, он ёбнутый, ну тупой он, ты ему ничего не объяснишь.

Аноним 09/02/26 Пнд 09:07:31 #33 №329563716

>>329563663
Бенчмарки выкладывай, маркетолог мамкин.

Аноним 09/02/26 Пнд 09:07:53 #34 №329563724

>>329563469
Ну дак за теслу ты отдашь в 5 раз больше. Но памяти 80 гб на крупную lm тебе всё равно не хватит. Так что одной картой ты не обойдёшься. А это значит тебе нужен nvlink и серверное железо. В общем там x15 умножай. В то же время на 512 Gb unified memory в маке позволяют запустить максимальную deepseek R1 (671B).

Аноним 09/02/26 Пнд 09:14:11 #35 №329563829

>>329563724
Да хули ты ему что-то объясняешь? Он идиот.

1. У него никогда не будет денег на Mac Studio.
2. У него никогда не будет денег даже на одну 3090.
3. Он нахуй никогда не запускал даже примитивных Gemma 4B.
4. Он просто даун, который какой-нибудь ХАБР читает.

Это конча, анон. Есть такой тип пиздабольных ёбышей. Они пиздеть любят, нихуя не разбираются в чём пиздят, зато хотят быть в "тренде". Но их тренд оканчивается этим самым Хабром или пабликом "Новости Двач". Он нихуя не понимает, что реально происходит в LLM-манямире и какое железо реально закупают. Он же реально думал, что в Mac Studio за лям 96 гигов памяти. Ебало имагнул селюка этого?

Аноним 09/02/26 Пнд 09:22:44 #36 №329563990

1260642117480.jpg

>>329562057 (OP)

Собрал дома небольшой сервачок на четырёх 3090 (24 гига видео памяти каждая). Упихал туда oss-gpt:120b. Стало приемлемо.

До этого игрался на одной 3090 - Анон, там всё уныло, оно будет либо тупое как валенок, либо генерить потоки шизофазии. В лучшем случае можно использовать для скриптования или кодинга в микродозах, и то, с обязательной проверкой вручную потом. И обязательно понимать как это подтюнить, начиная от температуры заканчивая системным запросом (промптом, блядь, как же бесит это слово).

В общем, локальные нейронки это развлечение не для нищих, либо забей, либо ищи бабки.

Аноним 09/02/26 Пнд 09:23:12 #37 №329564000

>>329563663
Хуя ты порвался картинно. Любо дорого.

>>329563724
Ну, это действительно звучит разумно.

Аноним 09/02/26 Пнд 09:24:25 #38 №329564020

>>329562057 (OP)
Цель у тебя какая?
Что ты собрался с ЛЛМ делать?
Если не тренить свою под дико узкую задачу, то локальные ЛЛМ - хуита.
Подключайся к провайдеру, плати за токены, не еби мозги.

Аноним 09/02/26 Пнд 09:33:56 #39 №329564232

>>329563990
>oss-gpt:120b
Какие задачи выполняет?

3090 тебе под тюнинг моделей сгодятся в будущем. Для запуска пару маков тебе пойдут.

Аноним 09/02/26 Пнд 09:34:30 #40 №329564241

>>329564232
>тюнинг
Обучение, фикс.

Аноним OP 09/02/26 Пнд 10:39:26 #41 №329565615

>>329564020
В первую очередь подружить ее с бд

[mailto:sage] Аноним 09/02/26 Пнд 11:22:21 #42 №329566792

>>329562057 (OP)
все три говно, 3090 - начальный уровень

>>329562656
врёти

>>329562777
> Локальные 8B модели - это пиздец.
да
> 500B модели я хоть и не запускал, но уверен, что они тоже говёные
нет, локальная 1000б/555гб кими на уровне чатгопоты
> объединённой памяти Мака
параша с нулевым промпт процессингом, для норм работы нужна видюха, желательно зелёная

>>329562912
хуцпа всё правильно делаешь, продолжай

>>329563149
см.выше
или ниже:
>>329563161
this

>>329563246
для prompt processing нужна производительность, а она у мака нулевая
для token generation нужна ширина шины, она у мака на уровне говённых видюх, но выруливает засчёт намного большего объёма памяти, чем у видюхи

>>329563990
етот прав

>>329562926
>>329565615
ты же понимаешь, что LLM выдают вероятностный результат? и что вместо конкретных точных значений из бд ты внезапно можешь получить рандом?
лучше научись минимальному погромированию на педоне и пердоль свои базы без нейронок