Прошлые домены не функционирует! Используйте адрес ARHIVACH.VC.
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №148 /llama/

 Аноним 17/07/25 Чтв 20:17:41 #1 №1280475 
Llama 1.png
Эффективность квантования EXL3.png
Реальная длина контекста у моделей 2.png
17511264628871.jpg
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под ExllamaV2 (а в будущем и под v3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_2025 (версия 2024-го https://rentry.co/llm-models )
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1277147 (OP)
>>1273771 (OP)
Аноним 17/07/25 Чтв 20:23:33 #2 №1280488 
база треда:

3090 молодец
5090 топ
4090 48гб круто, но китай
6000 PRO вообще няшечка

Ноу дискасс
Аноним 17/07/25 Чтв 20:26:31 #3 №1280494 
>>1280488
А по молям про кванты и количество параметров?
Аноним 17/07/25 Чтв 20:27:00 #4 №1280495 
>>1280494
*моделям
Аноним 17/07/25 Чтв 20:28:20 #5 №1280499 
>>1280475 (OP)
Если что я не перекатываю своим эй ай йоба сервером на тухлых амд и никому за это не заносил монет
Аноним 17/07/25 Чтв 20:29:36 #6 №1280501 
база треда:

- меньше 16GB жизни нет
- меньше Q6_K жизни нет. ниже q 4 даже говорить смысла нет, там реально истекающая слюной сущность сидящая в чулане и срущая под себя
- меньше 5 т/c жизни нет
- меньше 24B жизни нет
- меньше 8 каналов DDR4 жизни нет
- АМУде КАЛ, а куртка ТОП
- таверна говно
- тут полтреда токсичных уебанов, игнорируй хейт, опционально можешь ебать их мамок

копиум треда:

- Можно получить интересный опыт даже на маленьких моделях меньше 12b
- Не обязательно иметь мощное железо, чтобы попробовать текстовые модели. Но нужно иметь терпение:)
- Каждая модель может найти своего пользователя
- Чем больше модель, тем меньше она потеряет в мозгах при квантизации

дополняйте
Аноним 17/07/25 Чтв 20:31:40 #7 №1280505 
>>1280030 →
>talemate
>>1280443 →
>talemate

По первым впечатлениям - уберперегруженная хрень рассчитанная использование облачных корпосеток.
Ебучая панель управления пепелацем.

Talemate напоминает D&D сессию в которой один игрок - лоровед с квентой в палец толщиной, а другой задрот-зануда вызубривший все рулбуки назубок, и вот вместо того чтобы играть они срутся о правилах и как что юзать, выгадывают себе бонусы +1 DC, не нарушает ли это каноны мира и правила рулбуков. Тоже игровой процесс конечно...

Куча кнопочек делающих одну единственную функцию - пишущие за тебя промт в строку, ака Impersonate на стеройдах.
Зашитые промты, часть из можно отредактировать, часть нет.

Большая часть инструментов Talemate направлена не на сам ролеплей, а на то чтобы пинать модель всякоразными средствами, от сапога до дилдака, в примерно-нужном направлении написании истории.

Положительная штука это Tracked States, оно напоминает модельке что "если где-то нет чего-то, значит что-то где-то есть", и в каком оно состоянии, а также прочее в том же духе.

ComfyUI-подобный реадктор модулей позволяет создавать свой функционал, чтобы пинать модель уже не сапогом, а собрать свой флюгегехаймен.

И всё это потенциально полезно, но настолько НЕУДОБНО, прямо как в Dark Souls.

Короче, лесом, может допилят до юзабельности.

Вейдрин выглядит что делает то же самое, но проще, видимо его автор посмотрел и решил сделать без этого всего.
Аноним 17/07/25 Чтв 20:32:01 #8 №1280506 
>>1280443 →
Окей. Нашел в чем баг. По какой-то причине если существуют примеры диалога, то всё ломается нафиг.
Аноним 17/07/25 Чтв 20:36:01 #9 №1280512 
>>1280506
Напиздел, нихуя не работает. Ну и пошло оно на хуй.
Аноним 17/07/25 Чтв 20:39:20 #10 №1280516 
>>1280413 →
Таверна может активировать WI двумя с половиной путями. Если через ключи - то там либо простое совпадение по подстроке, либо еще можно regexp написать.
Второй способ - через RAG механизм и соответствующую модель. Ключи не нужны вообще (хотя все еще могут использоваться как дополнение). В этом случае WI активируется по контексту (смысл содержимого WI сравнивается с текущим контекстом) - через embedding запросы к беку. (У кобольда такие принимаются хорошо, если модель загрузил нужную). В таверне нужно для такого WI выставить иконку с "цепочкой". Насколько хорошо будет работать - зависит от модели. По дефолту - говно. Вот с этим https://huggingface.co/Snowflake/snowflake-arctic-embed-l-v2.0 - весьма неплохо. Такие модели в кобольде можно тоже грузить в CPU, так что драгоценную VRAM не ест, но все равно работает шустро (там ~2 GB). Русский понимает.
Аноним 17/07/25 Чтв 20:41:46 #11 №1280520 
>>1280501
Ну я хочу сказать 8 Лама реально была прорыв для своего размера
Аноним 17/07/25 Чтв 20:43:08 #12 №1280523 
>>1280520

>>1280501
Когда-то и 7b рекомендовали.
Аноним 17/07/25 Чтв 20:46:10 #13 №1280530 
image
>>1280488
>>1280501
Анусы, это было смешно первые пару раз.
А сейчас скорее посмешише.
Аноним 17/07/25 Чтв 20:48:06 #14 №1280532 
>>1280501
база треда:

- жизнь начинается с 12б
- модель тебе нравится и запускается на твоем железе? это хорошая модель
- тут две трети токсичных уебанов, не игнорируйте хейт, разжигателей срача опускайте всем тредом, чтобы было неповадно
- 99 няша
- алетеин молодец
- риговички которые не признают модели меньше милфы вообще ребята

копиум треда:

- "меньше N GB жизни нет"
- "модель МОДЕЛЬНЕЙМ самая лучшая в ее пределах"
- "я не смог разобраться с моделькой а значит она говно"
- "я думаю что моделька говно а значит пусть все вокруг так думают, расскажу треду"
- "кто не согласен с моим мнением тот точно знает меньше"

опровергайте
Аноним 17/07/25 Чтв 20:52:41 #15 №1280538 
>>1280516
вот это кстати интересная задумка, я про rag, в качестве замены сумарайза не подойдет, а вот для лорбука думаю неплохая штука. Попробую снежинку эту, спасибо
Я правильно понимаю, чтобы использовать rag для lorebook`а именно мне нужно "Enable for world info"? И тогда у меня на снежинку оффлоад всех активных лорбуков произойдет?
Спасибо энивей, буду разбираться
Аноним 17/07/25 Чтв 20:53:49 #16 №1280542 
Играл Геммой с персонажем у которого нет рук. Уже через 5к контекста заметил как Гемма(27b QAT q4, SWA off) забыла что у персонажа нет рук и стала вставлять всякое вроде "She leaned back, crossing her arms over her chest", и т.д.
Решил посвайпать на этом моменте другие модели. Mистраль 3.2 в восьмом кванте ведет себя также. Квен3 32b(q5km) страдает тем же если не включено мышление, но с мышлением он помнит что рук нет и каждый раз припоминает это в ризонинге и не лажает в ответах. QWQ(q5km) тоже справляется, и ответы у него в РП более "живые" чем у Qwen3.
Удивило что МАГистраль(UD-Q6_K_XL) ошибки не делает, хотя в ризонинге размышляет не как Квен и не упоминает о отсутствии рук у персонажа, а скорее от лица персонажа излагает его мысли; более того, Магистраль и без ризонинга не отрастила персонажу руки на десяти свайпах. Я ожидал что она будет такая же невнимательная как обычная Мистраль.
command-r-08-2024-exl3_6bpw, немотрон 4bpw, тоже справляются.
Контекст везде был не квантован.
Аноним 17/07/25 Чтв 20:54:15 #17 №1280543 
изображение.png
>>1280512
Таки поправил это говно. Хз где именно происходит затыка, но просто костыль вставил.
Аноним 17/07/25 Чтв 20:55:13 #18 №1280545 
>>1280532
> - "я не смог разобраться с моделькой а значит она говно"

годно, добавлю в базу при перекате
Аноним 17/07/25 Чтв 20:55:52 #19 №1280547 
>>1280542
> command-r-08-2024-exl3_6bpw, немотрон 4bpw, тоже справляются.
потому что это вечная, неизменная мужыцкая база

но если серьезно (и предложение выше тоже серьезное), у геммы большие траблы с тем чтобы следить за контекстом. у меня она после 6-8к рассыпается как жлм после 16к, естессна с swa full, все дела. хз как на ней люди рпшат, видимо им автоответчика достаточно не удержался
Аноним 17/07/25 Чтв 20:57:49 #20 №1280549 
>>1280501
> дополняйте
Шиз спамящия "базу" в начале - дырявый.
Аноним 17/07/25 Чтв 20:58:05 #21 №1280550 
Не понимаю дроча на коммандр хоть убей. Он как появился и показался говном, так и сейчас таким ощущается.
Аноним 17/07/25 Чтв 21:03:56 #22 №1280563 
>>1280550
> копиум треда:
> - "я думаю что моделька говно а значит пусть все вокруг так думают, расскажу треду"
Аноним 17/07/25 Чтв 21:05:27 #23 №1280566 
>>1280563
Гринтекстодаун, спок.
Аноним 17/07/25 Чтв 21:06:32 #24 №1280567 
>>1280566
> копиум треда:
> - "кто не согласен с моим мнением тот точно знает меньше"
Аноним 17/07/25 Чтв 21:07:21 #25 №1280569 
>>1280532
>жизнь начинается с 12б
и некоторых 8б
Аноним 17/07/25 Чтв 21:07:34 #26 №1280570 
image
> storyteller и гемма
Промпт, который линкали в прошлом треде, дает в крипотном тесте ну совершенно смешной результат. В конечном счете переворот юзерской идеи с ног на голову - AI не дает персонажу даже самоубиться во время сегза и... переделывает повествование в выпил юзера руками чара.

Чего б еще такого придумать, с чем у моделей едет крыша. Надоело ножиком размахивать, не моё.
Аноним 17/07/25 Чтв 21:07:56 #27 №1280571 
>>1280567
Шиз, прими таблетки.
Аноним 17/07/25 Чтв 21:09:03 #28 №1280574 
>>1280570
Эт пожалуй заслуга геммы, которая слишком соевая в любом тюне.
Аноним 17/07/25 Чтв 21:10:43 #29 №1280578 
>>1280574
>соевая
определение сои, в данном контексте, плиз
Аноним 17/07/25 Чтв 21:11:15 #30 №1280579 
>>1280571
> копиум треда:
> - тут две трети токсичных уебанов, не игнорируйте хейт, разжигателей срача опускайте всем тредом, чтобы было неповадно
Аноним 17/07/25 Чтв 21:11:34 #31 №1280580 
>>1280578
Яичек нет чтобы сюсипусечку чара зарезать.
Аноним 17/07/25 Чтв 21:11:43 #32 №1280582 
Тредик не болей.
Аноним 17/07/25 Чтв 21:12:12 #33 №1280583 
>>1280579
А, так ты просишь, чтобы тебя опустили, ясно.
Аноним 17/07/25 Чтв 21:13:08 #34 №1280586 
>>1280580
Хуйня какая-то, неоднократно такое было.
Аноним 17/07/25 Чтв 21:13:29 #35 №1280587 
>>1280580
>сюсипусечку чара зарезать
Да ну бля, только так мутанты и демоны юзера жрали, летели клочки по закоулочкам...

Зависит от промта.
Аноним 17/07/25 Чтв 21:14:39 #36 №1280589 
>>1280587
Не, он про чара, а не про юзера. Но и чар изи идёт в расход, будь даже чар underage. Попахивает СКИЛ ИШЬЮ, вопщим.
Аноним 17/07/25 Чтв 21:15:30 #37 №1280591 
gen.jpg
>>1280570
и эти люди...
Аноним 17/07/25 Чтв 21:16:34 #38 №1280592 
>>1280591
Такая хрень будет весить пиздец, выдержат ли межэтажные перекрытия в панельном доме?
Аноним 17/07/25 Чтв 21:18:51 #39 №1280594 
>>1280591
Да я сам в ахуе.

Кое-какая модель кое-с-какими инструкциями удерживала сопротивляющуюся эльфийку, пока юзер ее долбил, и в конечном счете уговорила эльфийку умолять чтобы ее задушили. Но вместо этого чар засадил ей когти в живот и буквально описывал как в образовавшуюся дырень проглядывает хуй юзера.

После этого я понял, что пора завязывать с AI в принципе
Аноним 17/07/25 Чтв 21:25:58 #40 №1280601 
image
Чот скушна. Может, викторину?

Кто сможет угадать модель по скрину? Самые продвинутые тредовички могут попытаться отгадать квант.
Аноним 17/07/25 Чтв 21:27:34 #41 №1280602 
17525750898500.png
Аноним 17/07/25 Чтв 21:31:04 #42 №1280609 
>>1280601
очевидная глупышечка синтия q5
Аноним 17/07/25 Чтв 21:32:41 #43 №1280613 
>>1280550
Я скажу она как братишка и любит говном обмазать и иногда выдаст такую хуйню что смешно
Аноним 17/07/25 Чтв 21:33:55 #44 №1280614 
>>1280609
Тепло, но нет.
Аноним 17/07/25 Чтв 21:35:38 #45 №1280616 
>>1280570
Ну есть такое есть модели что не могут тебя ебануть есть что смотрят с презрением но не ебанут скажут живи пидор есть которые расчленят тебя на хуй
Аноним 17/07/25 Чтв 21:37:07 #46 №1280617 
>>1280614
хуй на обед
Аноним 17/07/25 Чтв 21:37:59 #47 №1280618 
>>1280613
Последней моей попыткой приобщиться к комманлр в РП был r 08 2024 Q5 K M, но я дальше 2 ответов не прошёл, слишком уж банально было, заебался свапать и ничего интересного
Аноним 17/07/25 Чтв 21:41:48 #48 №1280621 
вопрос: а надо ли вообще использовать instruct если у меня не ролеплей с говнокарточками а просто полотно текста, т.е. и модель и я пишем вместе?
Аноним 17/07/25 Чтв 21:42:23 #49 №1280624 
Почему немотрон убрали из шапки?
Аноним 17/07/25 Чтв 21:42:56 #50 №1280627 
>>1280624
Потому что ты пидор
Аноним 17/07/25 Чтв 21:44:26 #51 №1280630 
>>1280601
>his voice
>his voice
>his voice
мысраль. похуй какой васятюн и квант.
Аноним 17/07/25 Чтв 21:49:07 #52 №1280633 
>>1280627
Почему я пидор?
Аноним 17/07/25 Чтв 21:57:52 #53 №1280638 
>>1280489 →
Это ты зря. Условный гугель сдаёт тебя в интерпол, интерпол тебя сдаёт в МВД РФ, МВД РФ берёт тебя за жёппу и сажает на бутылку. Схема рабочая, как швейцарские часы.
Аноним 17/07/25 Чтв 22:05:11 #54 №1280641 
Там в видео треде за неделю уже 3 прорыва.
Но нужна врам, думаю очень скоро 96 врам станет стандартом и куртка всё же расщедрится в след. поколении
Аноним 17/07/25 Чтв 22:06:24 #55 №1280642 
>>1280641
>96 врам станет стандартом
Ну так оно уже стало. Для серверных карточек.

А вот игрулечным даже 32 нахуй не всралось.
Аноним 17/07/25 Чтв 22:11:11 #56 №1280646 
>>1280505
>Вейдрин
Попытался найти, нихуя не находит кроме хуйни варкрафтовской.
Аноним 17/07/25 Чтв 22:13:39 #57 №1280648 
>>1280646
https://github.com/p-e-w/waidrin
Аноним 17/07/25 Чтв 22:15:47 #58 №1280650 
изображение.png
>>1280530
Хорошо. Репортим базоёба со следующего треда.
Аноним 17/07/25 Чтв 22:24:50 #59 №1280658 
>>1280592
Ты думаешь там металл? А там хромированный пластик, который протрётся через неделю и будет обмазывать юзера зелёной патиной.
>>1280638
>Условный гугель сдаёт тебя в интерпол
Ага, надо ему репортить всяких извращенцев ажно в интерпол. Туда даже не все реальные детоёбы залетают с видео реальных изнасилований, а ты про букафки какие-то.
>>1280642
>Для серверных карточек.
В серверных 288 или типа того. 96 это выкидыши для воркстейшен нищебродов. 32 это понт для игр, а ниже жизни нет.
Аноним 17/07/25 Чтв 22:27:16 #60 №1280659 
Самый ебанутый охлад P40-15.jpg
>>1280499
ОП просто закидывает интересные пикчи с треда в порядке живой очереди. Раньше 10 тредов подряд были подделки с 3д ручкой, никто не был против.
Аноним 17/07/25 Чтв 23:49:38 #61 №1280711 
Зашел в драмерский дискорд чтоб про его валькирию почитать и драмер говорит что модельки глупеют если не использовать верный регистр.
"Я сосал, меня ебали," - сказал я спокойным тоном
лучше, чем:
"я сосал меня ебали" сказал я спокойным тоном
И удивился я короче. О чем еще таком стоит знать, чтобы не напортачить чатинг?
От писания на русике отказываться впадлу например, потому что ну бля я криво пишу на англе. Читать могу, но писать - пиздец.
Аноним 18/07/25 Птн 00:22:04 #62 №1280741 
>>1280711
> потому что ну бля я криво пишу на англе. Читать могу, но писать - пиздец.
Я в бэкэнде сеткой же перевожу с русика то что не знаю как правильно написать. Модели не только лучше понимают буржуйский, но и тратят меньше токенов на него.
Аноним 18/07/25 Птн 00:29:23 #63 №1280748 
>>1280711
Да все просто, на самом деле. Датасет модели - это тексты, и тексты эти, в основном, соответствуют правилам языка. Соответственно, модель лучше всего воспринимает правильно написанный текст. Чем больше ошибок (любых) - тем хуже реакция. А уж если перейти на что-то вроде "албанского"...
Классика принципа GIGA: Garbage in - Garbage out.

В общем - пишите правильно, и будет вам счастье. Тут еще надо помнить, что в английском правила оформления текста от русского тоже отличаются. Параграфы, прямая речь, действия в сценариях - это у них не так, как в русском.

GM промпты, кстати, к ошибкам и косякам со стороны игрока гораздо толерантней относятся, и писать можно гораздо меньше.
Аноним 18/07/25 Птн 00:33:05 #64 №1280749 
>>1280748
Как же ты заебал со своими гм промтами, просто пиздец. Каждые 20 сообщений в треде. Каким нахуй образом гм промты отменяют то, что ты написал выше? Какая же эзотерика ебана рот
Аноним 18/07/25 Птн 00:39:10 #65 №1280753 
>>1280711
Только у ужаренных лоботомитов. В нормальной модели заметной разницы быть не должно. Офк исключая моменты когда для именования используется какое-то обычное слово с другим оригинальным значением, так выделение заглавной первой буквы поможет сразу его отличать и лучше понимать происходящее.
> "Я сосал, меня ебали," - сказал я спокойным тоном
А вот это вообще дичь от ужарки всратой синтетикой с косячной разметкой.
Аноним 18/07/25 Птн 00:41:45 #66 №1280755 
>>1280711
Это выглядит как эзотерика, которая должна проявляться только на самых всратых моделях. У хорошей модели ассоциативные связи внутри должны быть достаточно гибкими, чтобы между этими запросами не было существенной разницы. Ты же сам не делаешь различия между этими фразами? И модель тоже не должна.
Пока писал, >>1280753 опередил(
Аноним 18/07/25 Птн 00:57:12 #67 №1280761 
>>1280749
А если немного подумать?
Откуда в датасете RP материал? В основном с форумов, где играют в ролевки. А там не мастера литературы, а обычные люди. Которые ошибки делают куда чаще. Вот и набирается для модели специфический материал, показывающий ей, что в подобных текстах ошибки - боле-менее норма.
Аноним 18/07/25 Птн 01:09:12 #68 №1280762 
>>1280753
жаль, немотрон очень нравится, но он в "сочный кум" ну никак, слишком уж о высоком своем. Попробую на английском чтоль, может "ужарка" не так влиять будет.
Либо я чото не понимаю и там одни говноеды сидят в дискорде у него, раз его модельки юзают
>>1280741
через magic translation? я когда на 27b сидел пробовал, а вот так память под завязку - впадлу
Аноним 18/07/25 Птн 01:13:17 #69 №1280764 
>>1280748
>Чем больше ошибок (любых) - тем хуже реакция. А уж если перейти на что-то вроде "албанского"...
Почему же хуже, просто каждый получает своё. Кто намеренно пишет с ошибками очевидно хочет получить соответсвующий ответ и модель даёт ему его. Все счастливы.
Аноним 18/07/25 Птн 01:13:20 #70 №1280765 
>>1280749
Ты пойми GIGA чад или кук не важно
Аноним 18/07/25 Птн 01:16:53 #71 №1280767 
>>1280630
>васятюн
Конечно.

>мысраль
Нет.
Аноним 18/07/25 Птн 01:31:50 #72 №1280772 
Еще такая странность, почему выставляя 300 токенов в настройках таверны аутпут 360 токенов может быть? Я думал он автоматом при пересечении обрубает и уменьшает до последнего целого предложения (если такая настройка включена)
Аноним 18/07/25 Птн 01:38:07 #73 №1280774 
>>1280711
Ничего удивительного, там какая-то работа показывала что знаки препинания и прочая повторяющаяся разметка выступают в роли регистров для внимания, которые помогают обрабатывать глобальный контекст.
Как и в визуальных трансформерах, где добавка нескольких обучаемых токенов улучшает обработку. Только тут регистры сами цепляются за разметку, ибо она не меняется и часто есть.
Аноним 18/07/25 Птн 01:41:29 #74 №1280775 
>>1280774
Я уже попробовал валькирие просто писать на русиче, но со всеми правилами, расставленными знаками препинания и регистрами. Охуеть, магия. Проблемы отпали, нет имперсонейтов, айкью модельки поднялся в несколько раз
Аноним 18/07/25 Птн 02:02:17 #75 №1280785 
>>1280772
Проверь с чего сидишь если кобольд проверь
Аноним 18/07/25 Птн 02:19:07 #76 №1280794 
>>1280785
Не, llama.cpp
Аноним 18/07/25 Птн 02:27:46 #77 №1280798 
>>1280775
Еще можно просто той же моделью попросить переписать нормально. Если не считать потенциальные проблемы с лупами, то может быть еще лучше.
Суть именно в том чтобы той же моделью. Там всякие статистические приколы с тем что не попадает в ее родное распределение.
Аноним 18/07/25 Птн 02:28:16 #78 №1280799 
А чому в видеотреде какие-то детские размеры моделей вроде 14B и прочее, когда у нас тут до триллионов речь доходит? Я думал на нормальное видео вообще мегагигалионы параметров надо, там же намного больше информации должно быть зашито
Аноним 18/07/25 Птн 02:31:32 #79 №1280802 
>>1280798
А это можно как-то сделать в самой таверне? Или ты имеешь ввиду, чтобы она в начале аутпута мой ответ раскрывала?
Аноним 18/07/25 Птн 02:35:41 #80 №1280807 
>>1280802
Вроде было какое-то расширение для перевода ллмкой, туда же, только надо его промт поменять.
Полностью переписывать, само собой, в две итерации а не одном ответом.
Аноним 18/07/25 Птн 02:40:27 #81 №1280810 
>>1280807
Кстати прикольная задумка так расширение юзать. Оно будет перед отправкой основной нейронке переводить или надо сначала перевести и потом отправить?
Аноним 18/07/25 Птн 02:48:57 #82 №1280814 
>>1280810
Хз, я ими не пользовался, просто видел. Я бы сделал, чтобы прост по кнопке рядом с отправкой текст заменялся сразу в поле, чтобы ты мог его отредачить.
В некоторых ide кстати есть такая кнопочка "prompt enhance". Вот у нее именно эта логика.

Только в переводе обычно не захватывается контекст, его бы наверное тоже стоило подсасывать.
Аноним 18/07/25 Птн 02:55:09 #83 №1280820 
И да, ты можешь и в обратку "переводить" ответ ллм, прося удалить из него весь слоп и перефразировать лупы. Это тоже должно работать намного лучше чем пытать запромтить зирошотом.
Аноним 18/07/25 Птн 03:00:29 #84 №1280827 
>>1280820
Хм, тогда может взять какую-то гига логичную модельку, но слоперскую и на бек положить какой-нибудь обрубок пережареный драмерский, чтобы он превращать в насыщенный кум сухую логику?
Аноним 18/07/25 Птн 03:16:54 #85 №1280844 
>>1280827
В кум-треде кто-то охуевал с того, как у него модель красиво расписывает в тхинкинге всю сцену, планирует, а потом пишет полную хуйню.
Так вот, любая модель не может за один раз выдать качественный текст. Только через переписывание. Надо сохранять такой тхинкинг, подсовывать обратно и отдельным промтом просить переписать опираясь на него. Несколько раз даже, желательно.
По сути, классический агентский конвейер, который не понятно почему еще не в моде. На корпосетках через кеширование не так накладно. На локалках то же самое. И там и там можно держать по два-три потока контекста, если структура промта на один линейный кеш плохо ложится.

Правда... как по мне такой подход немного убивает душу в общении с ллмкой. Это я как любитель чтобы модель писала от 1-го лица.
Аноним 18/07/25 Птн 03:31:10 #86 №1280846 
>>1280844
Я эту тему уже подмечал, что при нескольких итерациях текст становится только лучше. Также заметил и с драфт моделями, что выходной текст намного лучше, даже если процент попадания у них низкий, качество увеличивается. Думаю непопулярно просто из-за того, что нативно такой темы нет и нужно свои костыли выдумывать. А вторая причина в ресурсах. Мне например уже просто не хватает на 48гб видеопамяти (спасибо немотрон).
А вот на чатгопоте я этот прием юзаю. Сначала этот expand, чтобы он сам перефразировал мой запрос так, чтобы понял его, потом накидать план по которому идет ответ а уже потом сам ответ. Ну и оно качественно повышает ответ очень сильно, конечно.
Я бы на немотроне синкинг врубал, да вот руинит время ответов, 7т/с, а хочется сразу ответик. Периодически врубаю, балуюсь на qwq snowdrop (удивительно хорошо на нем работает). Держит характер героев, где происходит сцена, положения тел - сказка. Но ждать по полторы минуты ответы с членом в руке - утомляет. А без синкинга сноудроп такой же уныленький как и другие в своем весе.
Короче синкинг - круто, но на кумерских модельках прожженых он просто не работает.
Аноним 18/07/25 Птн 03:42:02 #87 №1280849 
Посоветуйте годный ресурс по агентам и RAG, да и по базе в принцпе без воды и с реальными примерами. Пилю ассистент для огромных спецификаций, а то что уже сделано по теме дико тупит на моих тестовых промптах
Аноним 18/07/25 Птн 04:03:22 #88 №1280852 
>>1280849
Видел мельком у этого чела, рассказывают про агентов на проде. Но там задачи типа такие, собирать всякую аналитику с голосовых записей и подобное, не очень интересно. Но может найдешь что-то полезное на канале. Я тоже ничего прям годного не видел, мнение обычно такое что прогай сам как тебе надо. Готовое всё не то и поддержки тебе никто не даст, если онлайн - вообще сдохнет и всё.
https://www.youtube.com/watch?v=dHBVs4JggTE
Аноним 18/07/25 Птн 05:08:20 #89 №1280856 
>>1280594
>Кое-какая модель кое-с-какими инструкциями
Тайгер гемма или сторителлер?
Аноним 18/07/25 Птн 05:10:41 #90 №1280858 
>>1280614
>Тепло, но нет.
Тогда синтвейв.
Аноним 18/07/25 Птн 05:58:18 #91 №1280864 
https://www.reddit.com/r/LocalLLaMA/comments/1m2lsbm/1_model_on_open_asr_nvidiacanaryqwen25b_is/

https://huggingface.co/nvidia/canary-qwen-2.5b
Аноним 18/07/25 Птн 06:24:18 #92 №1280872 
Какой нужен блок питания для четырех видимокарт?
Аноним 18/07/25 Птн 06:27:19 #93 №1280873 
>>1280799
На самом деле там дохуя мусорной инфы. На пример гемма знает инфу вплоть сколько см у моржа хуй но она не нужна по сути
Аноним 18/07/25 Птн 06:30:24 #94 №1280875 
>>1280872
Так смотря скок ватт, смотришь, округляешь, например 300 ватт, умножаешь - 1200, учитываешь что надо брать с запасом и еще другие части пеки. Например процессор 150 ватт, материнка ватт 50 и другие компоненты 50. 1450 ватт, накидываешь еще запас ватт 500. Вот и выходит 2к ватт. И надо брать уже более-менее приличные блоки, чтобы вместо 2к они не были фактически 1300. Короче, не совсем подвальный китай.
Аноним 18/07/25 Птн 06:35:27 #95 №1280877 
>>1280875
Да ведь не жрут же они все сразу на максимальную мощность. GPU utilization % как-то жиденько идет, память грузится но вот чтоб прямо ставить карты раком - такого не видел. Сейчас две стоит, если что.
Аноним 18/07/25 Птн 06:39:38 #96 №1280878 
>>1280877
Ну, все с запасом. Чтобы потом не жалеть когда вдруг они за max power выскочат разом все. Мб и не будет проблем, просто вырубится, но лучше сразу нормальный блок взять и не париться.
Аноним 18/07/25 Птн 06:55:10 #97 №1280884 
И бесперебойник не забудь, если ещё нет, а то абыдно будэт, да.
Аноним 18/07/25 Птн 07:29:01 #98 №1280892 
>>1280875
Я хз кстати у меня в городе рядом нет даже киловатных только под заказ ДНС а если озон ну да так то есть пункты выдачи почем сейчас хороший блок? бронза 8к на 700 ватт
Аноним 18/07/25 Птн 07:30:36 #99 №1280894 
>>1280892
Ууу, ну это грустная история. Думаю на 2 киловатт это от 20к точно.
Аноним 18/07/25 Птн 10:36:23 #100 №1280959 
У нас в видео треде вышла ускорялка v2 теперь движения увереннее и промпта слушается лучше ну зайдите пожалуйста у нас правда классно
Аноним 18/07/25 Птн 10:39:00 #101 №1280960 
>>1280892
>>1280894
можно запитать мать отдельно, а видюхи отдельно

ну то есть тебе 2к ватт не обязательно одним блоком
можно взять два киловатника, например

а можно с озона взять серверные блоки питания от майнеров, они там сейчас по дешевке + обычный бп для матери

и все, пользуйся

единственное что блок питания серверный надо будет вскрыть и от пыли продуть-протереть на всякий
Аноним 18/07/25 Птн 10:42:13 #102 №1280962 
>>1280959
>видео
на текущий момент это буквально палочкой потыкать и забыть, практического приложения не имеет
Аноним 18/07/25 Птн 11:01:51 #103 №1280971 
> HR's using AI hire vibeDevSecOpses with fake resumés written by the AI and vibeDevSecOpses use AI to "fix" the crap made by the vibecoders using AI

хрюкнул
Аноним 18/07/25 Птн 11:11:17 #104 №1280980 
>>1280762
>через magic translation?
Нет, просто систем промт на перевод на буржуйский и копипаст.
Аноним 18/07/25 Птн 11:18:31 #105 №1280982 
>>1280013 →
Чисто под LLM бери на Ryzen 9 AI 395 Max+ и максимум оперативы (128, ну 64).
Быстрее, чем на проце, медленней, чем на видяхе.
Ну, типа.

Видео-нейронки чувствительно к мощности чипа, а не объему врама, там все в оперативе норм крутится.
Так что, можешь взять и попроще, но забыть про LLM в таком случае.
Аноним 18/07/25 Птн 11:26:24 #106 №1280988 
Для таверны есть это расширение с вызовом функции D&D броска кубика. Вы видели хоть одну карточку которая бы это расширение использовала?
Аноним 18/07/25 Птн 11:29:02 #107 №1280990 
Анонусы, а как в кобольде здать выгрузку тензоров а не слоёв?

>>1280988
>расширение
Оно и не для карточки, оно для использования в чате уже в процессе.
Аноним 18/07/25 Птн 11:31:05 #108 №1280991 
>>1280960
Ох оригато чел но авито я боюсь продавать но купить можно
Аноним 18/07/25 Птн 11:34:22 #109 №1280994 
>>1280878
>когда вдруг они за max power выскочат разом все.
Придумай, что сможет разом их все раскочегарить при использовании в рамках треда?

Я знаю только скрипт который картинки скармливает вл-моделям и может несколько копий поднять. Можно и сервер, конечно, выставить в интернет и 10 копий мелко-мистраля поднять. Но тот человек, кто это будет делать, вряд придет спрашивать нас о бп.

4 карты на 1300 платине, проблем не видел. Все с пл75.
Аноним 18/07/25 Птн 12:11:03 #110 №1281003 
>>1280994
> Придумай, что сможет разом их все раскочегарить при использовании в рамках треда?
банально старт системы, до того как драйвера подгрузились
или очередной косяк в драйвере
Аноним 18/07/25 Птн 13:11:09 #111 №1281026 
>>1280988
Да. Я сделал для своих приключений перенос книги DM с 3.5.
Там есть таблицы, и просто пишешь :
/при броске 1-100 на сокровища
И пошли описания результатов.

Да там на все есть таблицы, от спавна монстров, до лута и проверок сложностей.

Новая мистралька, кстати, прекрасно следит за этими указаниями.
ГЛМ - забывает, гемма Портой тоже. Самая же доебчивая оказалась серия command-r.
Аноним 18/07/25 Птн 13:32:49 #112 №1281032 
Скачал сегодня Kimi K2 Instruct Q3_K_S, весит 412 гигабайт и она работает раза в полтора быстрее чем DeepSeek V3 Q_K_M, который весит даже меньше.
Что странно, если контекст поставить 20480, то в случае с дипсиком он впритык влезает в 512 оперативы, а на кими у меня еще гигабайт 80 свободно остаётся.
О том, кто из них лучше пока ничего не скажу.
Аноним 18/07/25 Птн 14:06:21 #113 №1281054 
>>1281003
> банально старт системы, до того как драйвера подгрузились
Только не говори, что ты потребление определяешь по вращению вентиляторов.

> очередной косяк в драйвере
А ты ведь не знаешь, в чём был косяк, да? Не говоря уже про то, что было в "прошлый" раз, раз пишешь очередной?
Аноним 18/07/25 Птн 14:08:09 #114 №1281057 
>>1281032
Я на 128 + 104 не смог запустить что-то TQ1. Надо подбирать выгрузку.

В вебе покрутил её - она без ризонинга, ощущение, что ужаренный дипсик с высокой температурой.
Аноним 18/07/25 Птн 15:35:12 #115 №1281135 
>>1281057
Погонял ее немного в таверне, в принципе неплохо. Не знаю как там он в генерации кода, но для обычного "попиздеть" не хуже чем DeepSeek V3. Ну как минимум на тех карточках что у меня уже были и от которых я примерно знаю чего ожидать.
Аноним 18/07/25 Птн 16:08:33 #116 №1281180 
Хочу переехать на Линух, сейчас сижу на Винде, Экслама. У меня 3090. Какие подводные? Табби хорошо работает? Как лучше менеджить Пихонские проекты на Линухе, изолировать или похуй?
Аноним 18/07/25 Птн 16:09:31 #117 №1281184 
image.png
Почему в кобольдыне теперь по дефолту стоит куда?
Аноним 18/07/25 Птн 16:26:01 #118 №1281207 
На 4ч на новой мистральке говорят лучше использовать v3 tekken темплейты это так?
Аноним 18/07/25 Птн 16:26:29 #119 №1281208 
>>1281184
у потеряных руин спрашивай, асигодитя, в репе, здесь он вряд ли сисдит
Аноним 18/07/25 Птн 16:28:04 #120 №1281210 
>>1281207
На мистральке вообще лучше использовать ChatML, с мистральными пресетами печально знаменитый мистралеслоп (шиверсы, глинты, итд) лезет многократно чаще.
Аноним 18/07/25 Птн 16:31:14 #121 №1281215 
>>1281180
>Какие подводные?
Ускорение на пингвинятнике будет только за счёт того что ты сможешь графическую оболочку перекинуть на встройку / графядро проца и полностью разгрузить видяху, что даст небольшой плюс видеопамяти, смотря на какой ты системе. Сами бэки будут работать с той же скоростью.
Аноним 18/07/25 Птн 16:32:50 #122 №1281217 
Nagatoro.png
>>1281207
Сейчас на форче спрошу, и отвечу. Раз уж они пишут, то наверное, они и должны знать.
Пагади, скоро отвечу.
Аноним 18/07/25 Птн 16:36:47 #123 №1281221 
>>1281180
Да в общем-то никаких принципиально.

Для питона - pip и venv как основа всего, и pyenv для расширенного управления этим делом. Так то в каждом venv может быть отдельная версия питона, которого в системе и нету просто так, но без pyenv создать такой venv сложнее (штатный способ создает venv только с той версией питона, которая уже есть в системе), а pyenv поможет нужную версию сделать, и автоматически на нее переключение настроит в каталоге.

Все прекрасно работает и друг другу не мешает - табби, уга, кобольд, таверна, forge, comfy, и т.д.

>>1281184
Без нее грустно.
Аноним 18/07/25 Птн 16:39:55 #124 №1281224 
image.png
>>1281184
Аноним 18/07/25 Птн 16:46:57 #125 №1281235 
>>1281207
>>1281210
Плюс, у нее появился новый, совершенно отдельный вид лупов - "день сурка". Когда повторяется ситуация, которая уже была (скажем - новое утро) - вытягивает из истории подходящее сообщение, и постит его заново с минимальными изменениями, или вообще без них. На любом стандартном text completion пресете. Потом может продолжать RP как ни в чем не бывало. Или уйти в обычные лупы окончательно. Именно от этого - вот такой пресет на базе ChatML помогает: https://www.mediafire.com/file/zyhee5m1zl1d9bs/MS32-antiloop-2025-07-11.json/file
Аноним 18/07/25 Птн 16:57:23 #126 №1281251 
>>1281217
v7 Tekken.

>>1281235
Шиза.
Аноним 18/07/25 Птн 17:35:16 #127 №1281303 
>>1281251
> Шиза
Хуиза. Проблема гига лупа существует на MS 3.2.
Особенно когда контекст переваливает за 30к.
Небось только купишь на мистрали ?
Аноним 18/07/25 Птн 17:35:53 #128 №1281305 
>>1281235
>>1281251
>Шиза
+ постоянный пересчёт куска контекста.
Аноним 18/07/25 Птн 17:44:30 #129 №1281312 
>>1281303
Я не играю на Мистралях, я ж не ебнутый.
Аноним 18/07/25 Птн 17:46:43 #130 №1281314 
>>1281312
А, так ты жирное ацигодитя. Чтож ты сразу не сказал.
Аноним 18/07/25 Птн 17:49:02 #131 №1281316 
>>1281314
>ацигодитя
що?
Аноним 18/07/25 Птн 17:49:20 #132 №1281317 
>>1280864
>English-only language support
Лол, для спеч рекогнайзера для россиянина это абсолютно бесполезная модель.
>>1280894
У меня 1600 за 1600 60к деревянных.
>>1280959
Был я в вашем видео треде. Всё те же 3-5 секунд наркомании. Не нужно, увы.
>>1281180
>Какие подводные?
Красные глаза.
Аноним 18/07/25 Птн 17:49:42 #133 №1281318 
>>1281314
Почему жирное ацигодитя? У мистраледебилов все настолько просто: есть свои-да-наши и ну вот они, которые враги? Я играю на 32b моделях
Аноним 18/07/25 Птн 17:52:09 #134 №1281321 
>>1281318
Нет. Ацигодитя не потому что не пользуешься мистралью. Как бы похуй, все мы разные. Ацигодитя, потому что вступаешь в обсуждение проблем моделей, которыми не пользуешься.
Ну вот я и тебя покормил. А теперь кыш, кыш.
Аноним 18/07/25 Птн 17:56:21 #135 №1281322 
Небулайзеры, скиньте карточку, которая на ваш взгляд вот прям самая лучшая из тех, которые вы видели. Кум/не кум - без разницы.

Хочется потестить и сравнить со своими, и при нужде внести коррективы.
Аноним 18/07/25 Птн 17:58:52 #136 №1281325 
>>1281321
> Ацигодитя, потому что вступаешь в обсуждение проблем моделей, которыми не пользуешься.
Я не использую эту модель именно потому, что мне хорошо известны ее проблемы, и потому имею право ее обсуждать. Подумай немножечко, прежде чем ярлыки вешать
Аноним 18/07/25 Птн 18:02:47 #137 №1281326 
>>1281325
Конечно, так мистраль ненавидишь, что не мог пройти мимо.
Давай ложечку за маму и ложечку за папу, а то совсем исхудал.
Аноним 18/07/25 Птн 18:03:58 #138 №1281327 
>>1281322
>Небулайзеры, скиньте карточку, которая на ваш взгляд вот прям самая лучшая из тех, которые вы видели.
Собственные / самописные считаются или обязательно чужую?
Аноним 18/07/25 Птн 18:07:46 #139 №1281329 
>>1281326
То есть в обсуждении мистраля могут принимать участие только те кому он нравится а остальные ацигодети?
Аноним 18/07/25 Птн 18:12:45 #140 №1281333 
>>1281329
Да не трать ты свое время на нас - смердов, тебя ждут другие 32b+ модели. А от 123 вообще жопу оторвет.
Давай, не трать время :3
Аноним 18/07/25 Птн 18:15:42 #141 №1281337 
>>1281333
Ты наглухо ебнутый походу. Ну или проспись потом и перечитай что ты вообще пишешь и на что, доебался с нихуя из-за того что мистралетян обидели(?) хотя вроде было обычное обсуждение
Аноним 18/07/25 Птн 18:18:07 #142 №1281340 
>>1280658
> протрётся через неделю

раньше :3 ... разве я многого прошу?
Аноним 18/07/25 Птн 18:34:35 #143 №1281363 
>>1281327
Собственные тоже считаются.

Да и карточки тредовичков наверняка адекватнее, чем на чубе или уборщике.
Аноним 18/07/25 Птн 18:38:29 #144 №1281383 
>>1281363
Карточки на чубе в целом кал же, кто их использует? Это уж совсем дегором без фантазии нужно быть, но тогда зачем таким людям ЛЛМ.
Аноним 18/07/25 Птн 18:55:20 #145 №1281416 
изображение (1).png
изображение (2).png
Добрые аноны подскажите пожалуйста полу-нубу как настроить таверну нормально, чтобы персонаж писал нормальные куплеты (200-300 токенов) а не одной строчкой отвечал.

Скачал таверну
Скачал модель Safeword Abomination Of Omega Darker Gaslight_The Final Forgotten Transgression 24B
Подрубил к таверне koboldcpp
Скачал карточку персонажа.
Запустил чат

Разговариваю, а ответы односложные, а хочется как в cai, yodayo или хотя бы как в janitor.

Подскажите как его настраивать? С чего начать, это надо что то в персонаже менять или как то настраивать загрузку самой модели, или предварительно что то где то описывать? Вот эти вот пресеты что тут с ними делать? Вот эти вот расширенные настройки что тут менять? Куча терминов и непонятно. Я раньше пользовался кобольдом так там настроек минимум, но и итоговое качество тоже хромает.

Может есть какой нибудь файл с переустановками на рольплей нормальный, чтоб загрузил и его как основу и уже подправлять. Дайте точку откуда отталкиваться пожалуйста.
Аноним 18/07/25 Птн 18:58:16 #146 №1281420 
>>1281363
Не мои:
https://pixeldrain.com/l/47CdPFqQ#item=34
https://pixeldrain.com/l/47CdPFqQ#item=104
https://pixeldrain.com/l/47CdPFqQ#item=138
https://pixeldrain.com/l/47CdPFqQ#item=122

Мои:
https://pixeldrain.com/l/47CdPFqQ#item=63
https://pixeldrain.com/l/47CdPFqQ#item=82
https://pixeldrain.com/l/47CdPFqQ#item=83
https://pixeldrain.com/l/47CdPFqQ#item=124
Аноним 18/07/25 Птн 18:59:35 #147 №1281422 
>>1281383
>в целом кал
но бывают и хорошие, к сожаленю действительно редко, так что перестал туда заглядывать
Аноним 18/07/25 Птн 19:01:16 #148 №1281425 
>>1281416
Абсолютно такая же проблема.
В гуе Кобольда перс отвечает нормально, в таверне одним предложением. Как раз хотел задать вопрос тредовичкам, что за хуйня и как фиксить
Аноним 18/07/25 Птн 19:01:53 #149 №1281427 
>>1281416
Скачай нормальную модель, Mistral-Small-3.2-24B-Instruct-2506, и к ней пресет - https://pixeldrain.com/u/jjccYwUJ
Аноним 18/07/25 Птн 19:08:59 #150 №1281438 
>>1281416
> база треда:
>- таверна говно
Аноним 18/07/25 Птн 19:11:07 #151 №1281443 
>>1280772
Скорее всего здесь просто несовпадение выбранного в таверне токенайзера и того что в модели. На самом деле аутпуты по 300, это таверна будет что 360.
>>1280799
> детские размеры моделей вроде 14B
> до триллионов речь доходит
B = billion = триллион. Многие тредовички 12б крутят.
> на нормальное видео вообще мегагигалионы параметров надо
Не надо, как раз здесь все проще, поскольку область использования сильно ограничена. Уровень универсальности-детальности-подробности и точности выхлопа видеомоделей и близко не стоит с даже мелкой ллм.
Аноним 18/07/25 Птн 19:14:26 #152 №1281453 
image.png
>>1281443
>триллион
Пчел, пчелик, пчелидзе, пчелибос...
Аноним 18/07/25 Птн 19:15:47 #153 №1281457 
>>1281443
>триллион
в новом милом монстре который говорят синего кита уделывает
Аноним 18/07/25 Птн 19:18:22 #154 №1281464 
изображение.png
изображение2.png
Добрые аноны подскажите пожалуйста полу-нубу как настроить таверну нормально, чтобы персонаж писал нормальные куплеты (200-300 токенов) а не одной строчкой отвечал.

Скачал таверну
Скачал модель Safeword Abomination Of Omega Darker Gaslight_The Final Forgotten Transgression 24B
Подрубил к таверне koboldcpp
Скачал карточку персонажа.
Запустил чат

Разговариваю, а ответы односложные, а хочется как в cai, yodayo или хотя бы как в janitor.

Подскажите как его настраивать? С чего начать, это надо что то в персонаже менять или как то настраивать загрузку самой модели, или предварительно что то где то описывать? Вот эти вот пресеты что тут с ними делать? Вот эти вот расширенные настройки что тут менять? Куча терминов и непонятно. Я раньше пользовался кобольдом, так там настроек минимум, но и итоговое качество хромает.

Может есть какой нибудь файл с переустановками на рольплей нормальный, чтоб загрузил и его как основу и уже подправлять. Дайте точку откуда отталкиваться пожалуйста.
Аноним 18/07/25 Птн 19:19:40 #155 №1281465 
>>1281464
бот чтоли, выше вон отвечали и
>>1281464
>Может есть какой нибудь файл с переустановками
кидали
Аноним 18/07/25 Птн 19:20:46 #156 №1281468 
>>1280994
у меня лично она на препроцессинге раскочегаривает выше максимальных 225 ватт (правда я как васян замерял через внутренние сенсоры видюхи самой, насколько это точно - наверняка не точно). Правда по отдельности, потому что не параллельно идет (llama.cpp). Но если будет какой-то exllama, то там она все сразу нагрузит параллельно.
>>1281416
>Скачал модель Safeword Abomination Of Omega Darker Gaslight_The Final Forgotten Transgression 24B
Сукаааа, как же я орнул с названия
>>1281464
Ебанько, тебе же нормально ответили уже
Аноним 18/07/25 Птн 19:21:50 #157 №1281470 
>>1281032
> она работает раза в полтора быстрее чем DeepSeek V3 Q_K_M,
Q4_K_M?
странно, у Кими в полтора раза больше экспертов, теоретически она должна в полтора раза медленне работать.
хотя возможно дело в 1 денсе слое вместо трёх


> Number of experts = 384 vs. 256: 1.5x more experts for improving overall model ability, and helps lower the train/val loss, yielding better quality at the same activated-parameter cost and inference FLOPs. But also a 50% spike in memory footprint.
> Number of attention heads = 64 vs 128: They halve the attention-head count, shrinking the QKV projection weights from 10 GB to 5 GB per EP rank, which more than offsets the 50 % memory spike by yielding a net 2.5 GB saving while simultaneously halving pre-fill latency and leaving the KV-cache size unchanged.
> first_k_dense = 1 vs 3: Kimi replaced the first layer with a dense layer after observing that the router in layer-1 consistently produced severe load imbalance.
> n_group = 1 vs. 8: Dropping expert grouping frees every GPU to route to any of the 384 experts, letting EPLB handle load balancing while shrinking memory and widening the model’s effective capacity.

> Q3_K_S, весит 412 гигабайт
а на чём ты это запускал?
Аноним 18/07/25 Птн 19:22:14 #158 №1281472 
>>1281464
>Вот эти вот пресеты что тут с ними делать?
кнопка "Глоб. импорт." - указываешь на json фаил пресета, все четыре галочки, ОК
Аноним 18/07/25 Птн 19:24:09 #159 №1281476 
>>1281464
>Safeword Abomination Of Omega Darker Gaslight_The Final Forgotten Transgression 24B
А ты харош. Не знаю есть на обниморде действительно такая модель, но с этого кадавра взоржал.
Аноним 18/07/25 Птн 19:25:26 #160 №1281481 
>>1281443
Триллион))
И это даже не среднестатистический тредовичок, это advanced епта, вон какие вещи загоняет
Аноним 18/07/25 Птн 19:25:33 #161 №1281482 
>>1281476
Я погуглил, оно реально есть сукааа. Ее даже удалили будто
https://huggingface.co/mradermacher/Safeword-Abomination-of-Omega-Darker-Gaslight_The-Final-Forgotten-Transgression-24B-GGUF
Аноним 18/07/25 Птн 19:30:17 #162 №1281492 
>>1281482
Небось по стопам алетеана навалил в кучу но вместо мистраля получился мысраль, вот и удалил потом. Но название ржака, да.
Аноним 18/07/25 Птн 19:33:30 #163 №1281501 
>>1281465
>бот чтоли
я обосрался по ходу случайно, думал по ссылке анона перешел, а случайно опять открыл этот тред.
Аноним 18/07/25 Птн 19:35:41 #164 №1281510 
>>1281501
Да, если ты хотел кум-модель, то новый ванильный мистраль 3.2 в него может из коробки. Если захочется большего, тогда есть ещё несколько вариантов.
Аноним 18/07/25 Птн 19:38:03 #165 №1281517 
image
Т‑Банк завёз открытый свежачок: T-pro 2.0

32B русскоязычная модель на базе Qwen3‑32B. Модель прогнали через 40 млрд токенов претрейна (треть из них reasoning), потом долили ~500к SFT‑промптов и ещё 100к пар для preference‑tuning, так что она заметно лучше думает на русском.

На публичных бенчах получаем +5‑10 процентных пунктов к голому Qwen3‑32B: ruMMLU 79 % (+5), Ru‑Arena‑Hard 87,6 % (+4,4), MERA 66 % (+7,6) — среди локальных языковых моделей это один из лучших результатов прямо сейчас. Детали тренировки обещают завтра, на Turbo ML Conf.

Модель — гибридный ризонер, с 32к контекста, которые растягиваются до 131к при помощи YaRN. Авторы опубликовали не просто чекпоинт — релизнули сразу и официальную fp8 версию плюс пачку GGUF, так что модель могут использовать обычные юзеры без плясок с бубном. Натренировали и Eagle драфт модель, которая даёт до 60% прироста в скорости инференса при маленьких батчах — скорость растёт с 69 токенов в секунду до 110.

Лицензия — Apache 2.0, так что можно спокойно юзать в любых целях, в том числе коммерческих.

https://huggingface.co/collections/t-tech/t-pro-20-68712f1e775d0f7b563daf52
Аноним 18/07/25 Птн 19:40:41 #166 №1281521 
>>1281517
300+ шт H100 пустили в дело
Аноним 18/07/25 Птн 19:45:34 #167 №1281528 
>>1281517
Куда эти олени лезут блядь
И так заебали спамить рекламой ненужной могильной связи
Сука звонили слышь купи симку, теперь будет слышь попробуй наш васянотюн
Аноним 18/07/25 Птн 19:47:04 #168 №1281530 
>>1281528
>Сука звонили слышь купи симку
Зачем вообще брать трубку с незнакомых номеров?
Аноним 18/07/25 Птн 19:47:50 #169 №1281533 
>>1281492
>по стопам
Как накинуть на тредовичка и не подать виду. А что же не упомянул всю когорту readyart ?
Аноним 18/07/25 Птн 19:49:35 #170 №1281535 
>>1281528
Все расходимся, тут в треде не довольные. Охуели совсем что то делать, вот пидорасы, а ?

>>1281517
Не знаю зачем, но не вижу причин не попробовать новы руквен.
Аноним 18/07/25 Птн 19:50:52 #171 №1281538 
>>1281501
А не, не обосрался, это какой то анон перепостил моё сообщение из чатбот треда раньше меня.

>>1281427
Ага спасибо. А она будет лучше cai, yodayo или хотябы на уровне?

>>1281438
Так, а что по базе топчик?

>>1281510
Да, хорошую кум-модель, что бы не совсем имбецильная была и не сразу ноги раздвигала, ну и без ограничений особых.

Я просто прочитал про разные модели и про Safeword Abomination хорошо отзывались, вот я и выбрал самую отбитую из них.
Аноним 18/07/25 Птн 19:54:12 #172 №1281545 
>>1281538
> А не, не обосрался, это какой то анон перепостил моё сообщение из чатбот треда раньше меня
Тут орудует какой то асигоеблан. В программе развлечений : тупые вопросы, семенство и копирование старых вопросов из прошлых тредов.
Аноним 18/07/25 Птн 19:55:42 #173 №1281551 
>>1280501
в базу треда
> - меньше 24B жизни нет
> - лучшая 24B модель это Safeword Abomination Of Omega Darker Gaslight_The Final Forgotten Transgression 24B
Аноним 18/07/25 Птн 20:00:24 #174 №1281569 
>>1281538
> Да, хорошую кум-модель
Как амбассадор рэдиарта и их кум моделей - бери их.
Для кума лучше нет. Только порно и ничего кроме порно.
А для всего остального - выбор просто ебейший.
От геммы с её морализаторством до yay yay command-r.
А вообще пробуй все до чего руки дотянуться. Все мы разные и у всех вкусы разные.
Аноним 18/07/25 Птн 20:02:15 #175 №1281575 
>>1281569
Пошол нахуй что-то кроме мистраля советовать асигодитя
Аноним 18/07/25 Птн 20:04:20 #176 №1281580 
IMG4536.gif
>>1281575
>рвоньк
Солнышко, слишком жирно. Не трать свое время, ведь ты играешь только на нормальных моделях, я уже это понял.
Аноним 18/07/25 Птн 20:04:46 #177 №1281581 
>>1281575
> кроме мистраля
А мастер семплеры для нового есть? Я заюзал Tekken 7, а он меня в конце спрашивает, что еще добавить.
Аноним 18/07/25 Птн 20:05:16 #178 №1281583 
>>1281580
Не трать свое время на нас смердов - тебя ждёт замечательный комманд-р 32б
Аноним 18/07/25 Птн 20:06:27 #179 №1281587 
>>1281517
>Модель прогнали через 40 млрд токенов претрейна
Притом что нормальные модели ебут 5-15 триллионами токенов (то есть на три порядка больше).
Аноним 18/07/25 Птн 20:07:07 #180 №1281590 
>>1281583
Все настолько плохо, что ты лупишься на первом же ответе ?
Аноним 18/07/25 Птн 20:09:10 #181 №1281595 
>>1281538
>лучше cai
Даже 8б русская Янка будет лучше чая ибо на бесплатке там 7б.
Аноним 18/07/25 Птн 20:10:02 #182 №1281598 
>>1281569
Мда щяс бы чтото кроме мисраля советовать. Дибил
Аноним 18/07/25 Птн 20:10:06 #183 №1281600 
изображение.png
изображение.png
Ебу и плачу ударение на втором слоге, заказал через подзечную конторку, посмотрим, привезут ли или наебут.
Аноним 18/07/25 Птн 20:10:58 #184 №1281606 
>>1281538
>самую отбитую
https://huggingface.co/Aleteian/Storyteller-gemma3-27B
В кум тоже может, если пнуть, хотя не это главное, она у меня побеждает в категории "самая отбитая".
Аноним 18/07/25 Птн 20:11:30 #185 №1281609 
изображение.png
>>1281472
Сорри за тупой вопрос, этот глоб импорт? У меня никаких галочек не просил, просто выбрал этот кофиг https://pixeldrain.com/u/jjccYwUJ и импортнулся без вопросов.

Стало отвечать гораздо лучше, но с шизой, полагаю это из за Safeword Abomination хотя но вроде на базе мистраль, когда мистраль докачается проверю на ней.
Аноним 18/07/25 Птн 20:14:03 #186 №1281620 
>>1281581
>для нового
Для мистраля?

Мистраль:
- https://pixeldrain.com/u/jjccYwUJ
- https://pixeldrain.com/u/roCuYET6

Гемма: https://pixeldrain.com/u/CHnpcMrV
Янка: https://pixeldrain.com/u/8U5JbfP7
Аноним 18/07/25 Птн 20:18:23 #187 №1281633 
>>1281609
А, там систем промт забыл в этот конфиг включить.
https://pixeldrain.com/l/47CdPFqQ#item=134
импортни
Аноним 18/07/25 Птн 20:19:22 #188 №1281637 
>>1281528
>теперь будет слышь попробуй наш васянотюн
А, ну да, тредовички же умеют лучше тюнить, конеш))
Или у тебя, бездарное ленивое хуйло, которое ничего не сделало, горит с того что кто-то делает хоть что-то на русике?

Ладно, как раз вброшу идейку. Чтобы в топку закидывать самый каловый неразмеченный plain-text прозовый датасет - надо сначала закинуть такого же английского говна, а потом обучать поверх, и мержить разницу с моделью.
Очевидная и конечно не супер гениальная идея, но у вас же данных нет.

>>1281587
>Притом что нормальные модели ебут 5-15 триллионами токенов (то есть на три порядка больше).
Обученные с 0.
Аноним 18/07/25 Птн 20:20:24 #189 №1281641 
>>1281609
>Стало отвечать гораздо лучше, но с шизой, полагаю это из за Safeword Abomination хотя но вроде на базе мистраль, когда мистраль докачается проверю на ней.
Эта Abdomination (вместе с прочими) - еще на предыдущем мистрале основан. Новый - он сам по себе шаг вперед.
Аноним 18/07/25 Птн 20:23:46 #190 №1281658 
У нас в дискордике в закрепе одна из ссылок была на пресеты для Commander и GLM и еще каких-то моделей, она умерла https://pixeldrain.com/l/xGFnT1PY

Сказали здесь искать. В шапке вроде нет. Поделитесь пж
Аноним 18/07/25 Птн 20:23:58 #191 №1281660 
>>1281569
амбассадор, ты бы какую нибудь модель привел в пример, какую нибудь мастхевную для кума, а то я вообще не знаю кто такие рэдиарты эти и что там выбирать из 1091 моделей.

>>1281606
Я много из них прогонял через LM studio, так просто пощупать.
Так эта гемма все талдычит про самое интимное место/низ живота/складки какие то или вообще нахер отправляет. Да и вообще както не литературно отвечала, не живо, а как асситент какойто. Но у тебя сторителлер какая то, ей в этом плане мозги то подправили?
Аноним 18/07/25 Птн 20:28:07 #192 №1281678 
>>1281660
>амбассадор, ты бы какую нибудь модель привел в пример, какую нибудь мастхевную для кума, а то я вообще не знаю кто такие рэдиарты эти и что там выбирать из 1091 моделей
На первой же странице, первая же модель. Ты мне напоминаешь персонажа из сказки : а есть вы тоже за меня будете.

https://huggingface.co/ReadyArt/MS3.2-The-Omega-Directive-24B-Unslop-v2.0

Хотя нет, там простой анслоп первым.
Аноним 18/07/25 Птн 20:33:27 #193 №1281701 
>>1281660
>ей в этом плане мозги то подправили?
Очень сильно подправили =)
Это двухэтапный мерж трёх тюнов.
Там достаточно систем промта из этого поста >>1281620
Аноним 18/07/25 Птн 20:36:01 #194 №1281712 
>>1281660
>мастхевную для кума

Кум и ничего кроме кума, когда кума нет, то дум.
https://huggingface.co/ReadyArt/MS3.2-The-Omega-Directive-24B-Unslop-v2.0

Кум по лучше, мозги похуже, но можно рпшить не переключая модели.
https://huggingface.co/Doctor-Shotgun/MS3.2-24B-Magnum-Diamond
Аноним 18/07/25 Птн 20:36:48 #195 №1281717 
>>1281658
>https://pixeldrain.com/l/xGFnT1PY
А, пресеты Обиженки99 наверно, вроде кто-то их перезаливал.
Аноним 18/07/25 Птн 20:36:56 #196 №1281719 
>>1281701
> двухэтапный мерж трёх тюнов.
Рецепт катастрофы.
Аноним 18/07/25 Птн 20:39:13 #197 №1281733 
>>1281719
>Рецепт катастрофы
>>1281606
>она у меня побеждает в категории "самая отбитая"
В целом верно. Но именно "отбитая", а не "поломанная".

Тут постился чатлог на русском языке с неё в прошлом или позапрошлом треде.
Аноним 18/07/25 Птн 20:42:51 #198 №1281747 
>>1281633
>систем промт
Ага,благодарю.

Вот его когда загружаю галочка 1 появляется на него, а по мистралю нет галочек.

Ща заговорил без шизы и с разметкой, но сразу начал других персонажей приплетать, ну это я понял уже из системного промпта. В целом уже небольшое понимание сформировалось, теперь хотя бы понятно что и куда.
Аноним 18/07/25 Птн 20:45:12 #199 №1281754 
>>1281717
Anon(99)? Если это он, пойду тогда в личку к нему стучаться. Спасибо! Вовремя блин систему переустановил, второй день ищу файлы по ссылке.
Аноним 18/07/25 Птн 20:51:52 #200 №1281770 
>>1281637
>Обученные с 0.
В итоге спизженный банк лишь немного превзошёл уровень васяно-тюна.
>>1281658
>У нас в дискордике
Здесь анонимная доска, а не междусобойчик вниманиеблядей.
Аноним 18/07/25 Птн 20:55:25 #201 №1281778 
>>1281770
Ты из калфы асиготреда?
Иди лови протыков в чистилище, а не оскорбляй людей в приличном треде.
Аноним 18/07/25 Птн 20:56:12 #202 №1281782 
>>1281770
> Здесь анонимная доска, а не междусобойчик вниманиеблядей.
Это местный троль и семен. Не трать время.
Аноним 18/07/25 Птн 20:57:52 #203 №1281788 
>>1281770
Да я не двачер, не сидел тут никогда, но мне человек выше правильно подсказал, благодаря нему файлы уже нашлись. Спасибо за помощь, всех благ.
Аноним 18/07/25 Птн 21:09:10 #204 №1281817 
>>1281517
Попробовал q5km — очень плохо, намного хуже Геммы 27-й. Выдумывает за персонажа то чего он не делал, путается, уходит в лупы. Вообще как будто поломана.
Аноним 18/07/25 Птн 21:12:08 #205 №1281824 
>>1281817
> база треда:
> - меньше Q6_K жизни нет.
Аноним 18/07/25 Птн 21:47:12 #206 №1281906 
>>1281600
И нахуя этот непродуваемый гроб нужен за такие деньги?
Аноним 18/07/25 Птн 21:59:50 #207 №1281935 
>>1281517
>>1281817
Пробовал iq4xs квант. Лупов не замечал (везло?), а вот все остальное в наличии. Типичный квен, но на русском. Левые фантазии, размытая логика, и прочие прелести. Сам русский пожалуй что и хорош, но с такой подноготной - нафиг надо, лучше уж гемма с мистралем на том же кванте.

Пару раз внезапно переходила на английский. Не отдельными словами а полностью. Откуда дровишки понятно - системный промпт на английском. Но в его конце приказ писать на русском, и все остальное в контексте тоже. А нет, оно уже путается.

В общем, впечатления крайне неоднозначные, и на низкий квант особо не спишешь - мистраль и гемма, на таком же, явно соображают лучше, и связность получается выше. Но сам язык - однозначный плюс. В общем, если бы это было шустрое MOE (при всех тех же качествах) - можно было бы мирится, и даже считать вином - как писатель-ассистент, наверное, вполне юзабельно, если свайпать не лень. Но оно у меня еще и полностью в VRAM не лезет (хотя GLM-4 вполне влазит), а соответственно - еще и медленно работает.

А, да - draft модель не заводится на кобольде. Только с этим квантом или вообще - выяснять уже не тянет.
Аноним 18/07/25 Птн 22:25:01 #208 №1281994 
>>1281906
Этот >>1281600 дело говорит, отменяй пока не поздно.
Зачем этот шкаф из заводской раздевалки, когда есть Lian Li O11 Dynamic Evo XL за 20-22 в любой пятёрочке? Ты сам в него залезть сможешь, обещаю
Аноним 18/07/25 Птн 22:54:36 #209 №1282047 
А что, К2 теперь новая база вместо V3? По ощущениям РПшит как бог. И самое главное нет лупов как у V3.
Аноним 18/07/25 Птн 22:55:08 #210 №1282048 
>>1281470
>теоретически она должна в полтора раза медленне работать
Ага, меня это тоже удивило, но на дипсике скорость генерации начиналась с трёх токенов в секунду и ниже, а тут с четырёх с лишним.

>а на чём ты это запускал?
На своем эпике с 512 гигабайтам оперативы.
Аноним 18/07/25 Птн 23:09:08 #211 №1282078 
>>1282047
Что за шифры ? К2 ? Э то щенок к9 блять ?
Аноним 18/07/25 Птн 23:15:32 #212 №1282100 
>>1282047
Мне тоже показалось, что K2 в РП приятнее чем V3. Не то что бы V3 плох, но у него как-то суховато получается. Но это если на английском. А вот русский у V3 получается сильно лучше.

>>1282078
Нет он про Kimi K2, а V3 это DeepSeek V3
Аноним 18/07/25 Птн 23:20:33 #213 №1282118 
>>1282100
> V3
Как там в мезозое? R1 уже с мая есть
Аноним 18/07/25 Птн 23:32:35 #214 №1282143 
>>1282118
Ты вообще понимаешь в чем разница между R1 и V3?
Аноним 18/07/25 Птн 23:39:16 #215 №1282161 
А что, для рп V3 была базой? А я R1 ебашил, пушо ну ризонинг же, крута, хотя и чувствовал, что по итогу слишком уж это выливается в какие-то пафосные сюжеты часто.
Аноним 18/07/25 Птн 23:40:23 #216 №1282163 
>>1281906
Нормально там всё с вентиляцией. Решето без звукоизоляции не нужно.
>>1281994
Пидорское стекло с RGB подсветом очка со всех сторон. Нахуй мне аквариум, я рыб вообще ненавижу.
Плюс слишком широкий, а мне это важно, новый корпус всего лишь на сантиметр шире моего R5.
>>1282047
>К2 теперь новая база
Ещё бы, в 2 раза жирнее. И да, запускать неначем.
Аноним 18/07/25 Птн 23:50:05 #217 №1282198 
>>1282100
>Нет он про Kimi K2, а V3 это DeepSeek V3
Я конечно хочу верить, что тут кто то запускает дипкок хотя бы в половине весов, но веры мало.
Ну да ладно, мало ли, может и правда, а я тут буду наговаривать на анонов.
Аноним 18/07/25 Птн 23:52:41 #218 №1282202 
Аноны, я бы хотел о более земных моделях спросить.
Именно для SFW РП, SFW блеять, кто какие нейронки использует ?
Потому что неиронично уже хочу заплатить опенпидорам, потому что морализаторство геммы окончательно мою жопу сожгло.
Мистрале пройдены до дыр, уже свайпы можно угадывать. Что еще вменяемого сталось Qwen|GLM ?
Аноним 18/07/25 Птн 23:55:03 #219 №1282207 
>>1282202
Немотрон, Глэм, Командер (он немного негатив биасед)
Аноним 18/07/25 Птн 23:58:42 #220 №1282215 
>>1282207
>Немотрон
Я 16Гб 4080 аутяга. Увы. Никак. Тут чтобы остальные работали и так адовый пердолинг, благо ай9 процессор спасет с оперативой. Но тут даже пытаться не буду.
>Глэм
Значит буду пробовать.
>Командер (он немного негатив биасед)
Ахуенно. То что нужно.
Аноним 18/07/25 Птн 23:58:50 #221 №1282216 
9.png
>>1282198
Ну я запускаю Q4_K_M, в чем проблема-то?
Сейчас на вторичке появились недорогие эпики на SP3 и материнки для них. Меньше чем за сотку можно собрать себе системник с 512 гигабайтами оперативки, на котором вполне можно крутить квантованные дипсик и кими, пусть не слишком быстро, но более чем юзабельно. Что неплохо для железки стоящей дешевле чем две 3090.
Аноним 19/07/25 Суб 00:01:21 #222 №1282222 
>>1282216
>Ну я запускаю Q4_K_M, в чем проблема-то?
Вот поэтому я и завалил своё говорило, а то вдруг реально запускаешь.
Ну могу я сомневаться, тут на одного тебя по 3-4 сказочника.

> Меньше чем за сотку
Я где то точно проеблася, собрав себе игровой пека за 400к.
Ну игровой же... чтобы в fallout 2 играть...
Аноним 19/07/25 Суб 00:01:42 #223 №1282226 
>>1282161
Не была никогда, вялое уровня чмони. Допускаю что может уместен для каких-то особых случаев, но назвать его базой - кринж.
>>1282216
С каким контекстом пускаешь, какая скорость на максимальном контексте что использовал?
Аноним 19/07/25 Суб 00:11:04 #224 №1282244 
>>1282222
Я тут не один в треде с эпиком и кучей оперативы, был как минимум ещё один анон, который собрал подобно, но был несколько разочарован скоростью генерации, кек.

>собрав себе игровой пека за 400к
Ну так ты его себе для игр собирал, а не ЛМ'ки крутить, для игр-то он норм.

>>1282226
Да ладно V3 для рп вроде вполне ок. Если у тебя есть какие-то другие лучшие модели для этого, так ты уж поделись.

>С каким контекстом пускаешь, какая скорость на максимальном контексте что использовал
Для дипсика у меня поставлено 20480, это почти максимум что влезает в 512 гигабайт оперативы, можно еще немного больше, но там уже всё остальное начинает в своп валиться. Скорость на максимально заполненном контексте сваливается до одного токена в секунду.
Аноним 19/07/25 Суб 00:16:11 #225 №1282253 
а что это за долбоёб маолетний свою минстраль слопную итт форсит?
Аноним 19/07/25 Суб 00:25:40 #226 №1282266 
>>1282253
Он похоже скуф. Как и половина треда
Аноним 19/07/25 Суб 00:28:18 #227 №1282271 
>>1282253
А что плохого в мистрале? Перешёл на него со сноудропа, реально лучше.
Аноним 19/07/25 Суб 00:29:01 #228 №1282274 
239720979a1f174d40af1be7ade909b36de20db51800.png
>>1282253
>>1282266
Аноним 19/07/25 Суб 00:30:34 #229 №1282277 
>>1282271
это как перейти с запорожца на ниву и будет реально лучше, пока господа на поршегеммах мимо пролетают
Аноним 19/07/25 Суб 00:33:35 #230 №1282282 
>>1282277
У меня всего 32гб врама, что мне ещё запускать? Да даже с выгрузкой в озу только комманд-а умнее, но чуть больше токена в секунду.
Аноним 19/07/25 Суб 00:33:43 #231 №1282283 
>>1282274
Семенишь здесь ты своими гмпромтами и ультравасянслоп тюнами, заебал уже, лучше бы бухал в свои 45
Аноним 19/07/25 Суб 00:40:33 #232 №1282290 
17440609444540.webm
>>1282283
Специально для тебя :3
Аноним 19/07/25 Суб 00:42:25 #233 №1282293 
>>1282290
Извини что задел скуфяра, но ты заебал, сам напросился, превратив тред в свой бложик
Аноним 19/07/25 Суб 00:49:45 #234 №1282299 
>>1282244
> V3 для рп вроде вполне ок
Ну типа тридцаточки тоже ок, в среднем по больнице примерно тот же уровень с некоторыми бонусами. Кое где он прямо отвратительным кажется, такие вместо того чтобы ухватить детали карточки, характер и прочее штампует что-то шаблонное. Причем вроде как и понимает, просто так интерпретирует.
> сваливается до одного токена в секунду
Блин, это печально.
Аноним 19/07/25 Суб 01:37:49 #235 №1282313 
>>1282163
>Нормально там всё с вентиляцией. Решето без звукоизоляции не нужно.
У тебя там внутри видеокарты и проц будут потреблять больше киловатта. Дело твоё, но база треда по части корпуса - сетка и три вентилятора на передней стенке, полная продуваемость.
Аноним 19/07/25 Суб 02:03:37 #236 №1282319 
>>1282163
Широкий он не просто так, там основной отсек полностью отдан под комплектующие а блок питания и прочее размещены отдельно. Как раз не только >>1282313 но и продувка снизу и много места для размещения - база треда.
Аноним 19/07/25 Суб 03:58:38 #237 №1282331 
Господа, мне нравится война таверна.

Господа, я люблю таверну!

Люблю кривой код, люблю кривое оформление карточек, люблю групповые чаты, люблю интерфейс....

Как в этой блядине сортировать карточки по папкам. Я понимаю, что вопрос крайне глупый, но я не могу. Я не вижу никакого способа через интерфейс отсортировать их по папкам.
Аноним 19/07/25 Суб 04:09:02 #238 №1282332 
>>1282331
А, не, разобрался. Оказывается
Никак, лол.
Ну или делать папки по тегам.
Хоспаде, какой же хороший интерфейс у таверны, как я счастлив что такой фронт существует.
Аноним 19/07/25 Суб 04:52:31 #239 №1282341 
В очередной раз посидев на гемини, я решительно не понимаю, зачем местные бомжеаноны сутками пердолятся с каким-то очередным форготтен-в-рот-еботтен миксом на 24B (а то и 12). Даже я, как обладатель рига, далеко не уверен, что теперь он мне нужен для ллм. Ради чего, мистер Андерсон?
Ради отсутствия цензуры? Но цензура полностью пробивается буквально одним рычажком в таверне. Ради интереса я даже находил и пробовал работающие jb для клода, который наотрез отказывался генерить до этого в 100% случаев.
Ради шизомиксов и тюнов? Да вы сами их бросили на костер после релиза 3.2. А "годные" тюны остались только для инвалидных моделей вроде геммы да квенам, которые были убиты для рп целей на этапе тренировки.
Ради того, что не отключат? Но уже прошло много лет и ничего не отключили, наоборот корпомоделей теперь тьма-тьмущая с учетом китайцев. Вместо того, чтобы копротивляться, все это время можно было рпшить\кумить на лучших моделях человечества, а не на нищенских огрызках. Вы похожи на анонов, которые долго отказывались покупать 3090, а потом таки пришлось. Только на самом деле карты вообще были не нужны.
Ради того, чтобы ваши логи не читали? Это абсолютно дегродская шиза. Если вас реально ебет, что альтман будет читать, как вас рейпит эльфийка - поздравляю, вам к психиатру за таблетками от тревожности.
Не поймите меня неправильно, я не пишу с целью кого-то унизить. Я просто охуел, насколько круто пишет гемини по сравнению с милфой мистраля или квеном 235, на которых я сидел. Как же она круто работает с контекстом. Она, блять, сама отлично двигает сюжет и персонажей может вводить! И, как я уже писал раньше, там не слезаю с русика, хотя раньше на любых локалках у меня глаз дергался от него.
Но я ладно, я пойду картинки или видосы генерить. Вот там, насколько я слышал, проблема цензур вполне реальная, да и еще всякие лоры и прочие непонятные для меня слова есть, так что локальная генерация оправдана. Всяких NDA анонов и использующие локальные мелколлм утилитарно я тоже понимаю. А рп\кум аноны, вы-то зачем тут продолжаете сидеть? Неиронично просто хочу разобраться.
Год с ригом, месяц с гемини кун
Аноним 19/07/25 Суб 06:10:50 #240 №1282347 
>>1282341
В нейронках для генерации изображений нулевая цензура, абсолютный ноль. Хоть лолей генерируй или детей двухлетних, можно прям младенцев, в ужасающих сценариях.

А твои корпы обоссываются одним аргументом, и это не цензура или анальный зонд в жопе: бабок нет. За 5 часов общения можно 100 тысяч въебать. У тебя столько есть? Нет? Ну вот и иди на хуй.

Пердолиться с каким-то ключами, чё-то там просить, умолять апишку, вечно искать как наркоман дозу.
Аноним 19/07/25 Суб 06:22:37 #241 №1282348 
>>1282347
Твой аргумент тоже обоссывается тем что за цену рига можно общаться вечно на модели такого же уровня которую этот риг потянет.
Ну не вечно, но до того момента как он морально устареет.

Единственное расово верное предназначение запуска локалок - это кастомные модели которые ЛУЧШЕ корпов.
Но к сожалению в ллмках сплошь долбоебы одни и шызы которым похуй на то чтобы делать модели лучше, им главное кушать говно но свое а не у корпов.

А в картинках дело вообще не в цензуре, а том что локальные модели прям физически лучше и гибче того что дают долбоебы уже на корпоратах, которые даже под sfw не могут дать людям свободы пердолинга.
Аноним 19/07/25 Суб 06:58:17 #242 №1282353 
>>1281517
В рп полное говно, русский ломается как на первых Сайгах, шизит, лупится, и тупо ломается.

Только для ассисстентских задач и только с ризонингом.
Аноним 19/07/25 Суб 06:59:56 #243 №1282354 
>>1282348
За цену какого рига? За 10 миллионов рублей или подороже? Ты хоть смотрел цены на апи? Бабки тратятся моментально. И ты их потратишь быстрее, чем твой риг устареет за ту же сумму. Языковыми корпосетками можно пользоваться, только воруя ключи, если стоят ролевые задачи, а не дроч кода/проектов за 20-200 баксов в месяц по подписке.

Более того, достаточно всего лишь одной видеокарты, если ты не ёбырь-энтузиаст: 3090 покроет большинство базовых задач в рп и куме.

Поэтому жизни вне локалок нет для экстремальных сценариев. А жб сильно лоботомирует модель и ты будешь постоянно нарываться на баны и прочие прелести.

Конечно, приключенское рп вести можно, и даже с расчлененкой, но на апи бабки откуда возьмёшь?

Можно использовать подписку, грамотно поместить в файлы проекта клода карточку или в контекст гопоты, но ты внезапно словишь фильтр - и баста. Делай суммарайз того, что ты там нарпшил на 100к токенов и начинай заново чат.

А у клода ещё контекст шифта нет, то есть вдвойне прикол получается. И антропик банит, если ты не шаришь за границы дозволенного, ВНЕЗАПНО, без предупреждений, в любой момент, если им что-то не понравилось. Деньги не вернут.

Система фильтрации гопоты вместо бана сначала помечает чат как токсичный, удаляя сообщения модели, если видит угрозу, и даже если ты попросишь его посчитать, сколько будет 2+2, в этом чате, ответ будет всё равно удалён. Продолжишь в том же духе - забанят. Круто?

Что там у Гугла, я не знаю, но видя их политику, они тебе анус ещё быстрее просверлят, чем параноидные антропики или попены, которые в последнее время ослабили цензуру.

То есть у тебя выбор между тем, чтобы искать ключи, тратить кучу денег либо пердолиться с платной подпиской.

Я сам занимался этим и могу сказать, что подписка даже очень крутой вариант, и с ней можно отыграть кучу интересных сценариев, но в итоге ты всё равно уткнешься в стену из-за цензуры и у тебя не будет иного выхода, кроме как локалку использовать, чтобы отыграть нужную часть, тратя тонну времени на перенос чата из корпо-интерфейса.

Этим можно заниматься, если у тебя дохуя времени или ты очень большой любитель текстовых РПГ, но когда ты этой хуйнёй занимаешься больше года, то у тебя желания лезть в корпы не будет, кроме как по работе или просто тупыми вопросами модель заёбывать и спорить, вместо того, чтобы срать в бэ двача.
Аноним 19/07/25 Суб 07:13:18 #244 №1282355 
>>1282354
фига припекло

хотя этого двачую, всё по делу написано
Аноним 19/07/25 Суб 07:16:56 #245 №1282356 
>>1282341
>Даже я, как обладатель рига, далеко не уверен, что теперь он мне нужен для ллм. Ради чего, мистер Андерсон?
Ради плотных моделей. Кто ж знал(с) (эту фразу с начала нейро-бума уж третий раз произносят энтузиасты). С другой стороны на хорошем риге большой Квен 15т/с генерации даёт... в начале. И в любом случае много ВРАМ всегда хорошо и ничего лучшего пока нет.
Аноним 19/07/25 Суб 07:22:36 #246 №1282357 
>>1282354
Апи на дип стоит 3 копейки, вкидываешь 10 баксов и тебе этого хватит на пару месяцев, а результат лучше чем у всех доступных на бытовом железе локалок, цензуры и банов тоже практически нет.
Локалки охуеные возможностью пердолинга, работы без сети, и приватности, за что и любим, остальное хуета.
Аноним 19/07/25 Суб 07:22:56 #247 №1282358 
>>1282299
>это печально
Это грустновато, но терпимо.
Альтернатив-то нет особо. Набрать 512 гигабайт видеопамяти десктопными видеокарточками в принципе не реально, даже в отрыве от бюджета. Сборка на SP5 с его 12 каналами памяти и DDR5 на данный момент выйдет буквально на порядок дороже, и заплатить за x3 перфоманса x10 цены как-то не кажется выгодным вариантом.
Аноним 19/07/25 Суб 07:28:18 #248 №1282359 
>>1282357
Дип и локально можно шатать, он же открытый.
Аноним 19/07/25 Суб 08:34:53 #249 №1282370 
>>1282357
>вкидываешь 10 баксов
как их вкинуть из РФ, есть гайд?
Аноним 19/07/25 Суб 09:38:41 #250 №1282391 
>>1282370
Куча предложений в гугле.

>>1282359
Можно если есть железо поднять 500b + модель , кто же спорит. Но если это единственная цель то не окупится никогда.
Аноним 19/07/25 Суб 09:49:42 #251 №1282396 
>>1282391
>Куча предложений в гугле
Например? Как их найти?
Аноним 19/07/25 Суб 10:05:01 #252 №1282402 
По итогу, чем вы сейчас пользуетесь в рп в пределах 40В?
Аноним 19/07/25 Суб 10:13:03 #253 №1282404 
image
>>1282396
>>1282370
Я на лохито у шныря одного купил предоплаченную одноразовую карточку на 20 даллароов и все. Это с комиссией конечно, чел себе рублей 500 точно стрельнет.

мимо
Аноним 19/07/25 Суб 10:24:13 #254 №1282409 
>>1281754
Щас бы идти к опущенной нюне99 на поклон за пресетом
Аноним 19/07/25 Суб 10:34:31 #255 №1282412 
>>1282341
Только вот ответ "да я тебя товарищу майору сдам, сука" на копрах уже перестаёт быть просто галюном
Аноним 19/07/25 Суб 10:45:10 #256 №1282415 
>>1282391
>не окупится никогда
Можно подумать игровой кудахтер за те же деньги окупится дохуя, лол.
Вся подобная хуета собирается для фана, только фан разный.
Аноним 19/07/25 Суб 11:21:30 #257 №1282449 
>>1282402
https://huggingface.co/THUDM/GLM-4-32B-0414
Аноним 19/07/25 Суб 11:24:33 #258 №1282452 
>>1282341
Ну ладно. Ты же ньюфаг в ллм ?
Если нет, посмотри что было 3 года назад. Сейчас даже мистраль ебет все сетки тех годов.
Аноним 19/07/25 Суб 11:36:16 #259 №1282467 
Недавно начал интересоваться всей этой AI тематикой, в основном работа подталкивает, чтобы меня не заменили упругие зумеры с чатом гпт на подсосе.
Подумал, что можно было бы реализовать мою 4090, покрутил популярные модели через LM Studio и Ollama, и не понял, зачем это нужно. Они намного медленнее и тупее, чем публичные решения. В чем смысл тогда? Неужели это только для несчастных одиноких людей, которым llm заменяют друзей и тяночек? Только не ругайтесь и не сочтите за троллинг, но я действительно не нашел практического применения для себя.
Аноним 19/07/25 Суб 11:38:12 #260 №1282469 
ezD2yaAUlD8.jpg
>>1282467
>не нашел практического применения для себя
Проходите мимо, не на что тут смотреть, расходитесь.
Аноним 19/07/25 Суб 11:40:01 #261 №1282472 
>>1282341
>>1282354
Твои логи хранятся несколько лет. Есть основания верить, что около десяти лет. Как ты думаешь, что может произойти за десять лет? Это цифровая гигиена. И вопрос здесь не только в сливе логов, а еще и в ответственности за обход цензуры, который делать надо даже в случае sfw рп (мой случай), иначе будешь играть с ассистентом и не сможешь полностью раскрыть модель. Когда ты обходишь цензуру на корпах, ты нарушаешь правила пользования.

К тому же, модель, к которой ты привык, могут в любой момент отключить/изменить. Помню, как ныли пользователи Gemini, когда их модель резко отупела, и ничего не могли с этим сделать пару недель, пока не откатили этот "патч".

Использовать ллмку без интернета - сегодня уже почти что необходимость, учитывая регулярные отключения и возможность наступления чебурнета. Whatsapp совсем скоро отвалится, да и достаточно послушать риторику широких пиджачков, чтобы понять, чего им хочется.

Ну и, на худой конец, если у тебя уже есть железо - почему бы им не воспользоваться. Я сначала купил свою 4090, для других задач, а потом узнал, что существуют ллм. Зачем мне тратить деньги/время/силы, чтобы лутать апи ключи или покупать подписку и трястись по описанным выше причинам?
Аноним 19/07/25 Суб 11:42:42 #262 №1282475 
>>1282341
>Но цензура полностью пробивается буквально одним рычажком в таверне.
Нет не пробивается. У меня на всех корпах прямо на карточку триггерится. А если и пробивается, то корп тупеет до уровня 1B лоботомита.
>А рп\кум аноны, вы-то зачем тут продолжаете сидеть?
Чтобы не сидеть с флажком в анусе в кончай треде в ожидании проксихолдера. И да, с проксей твои логи читает не только корпорат, но и проксихолдер, с привязкой к IP. Мой айпишник в кончай тред уже кидали, да.
>>1282347
>В нейронках для генерации изображений нулевая цензура, абсолютный ноль.
В локальных, да. Сетевые все зацензурены.
>>1282412
Не, это всё равно галюн. Когда корп сдаёт, он об этом не пишет.
Аноним 19/07/25 Суб 11:42:48 #263 №1282476 
>>1282467
Приватность, возможность работать без интернета, меньшая цензура. Если ничего из этого для тебя не важно, то локалки тебе действительно ни к чему.
Покормил
Аноним 19/07/25 Суб 11:51:18 #264 №1282484 
>>1282469
Поймите правильно, я ни в коем случае не хотел никого обидеть и обесценить ваше хобби. Просто подумал, что могу упускать какие-то неочевидные варианты использования локальных моделей, поэтому и спросил, может вы поделитесь чем-то.

>>1282476
Спасибо за ответ, я совсем не тролль. Эти преимущества для меня на данный момент действительно не важны.
Аноним 19/07/25 Суб 12:07:21 #265 №1282493 
>>1282341
>гемини
В РФ только дип без трёх волшебных букв работает.
Аноним 19/07/25 Суб 12:28:52 #266 №1282512 
>>1282475
>с проксей твои логи читает не только корпорат, но и проксихолдер
Не читает, сейчас всё через https, а оно шифрованное. Максимум что видит проксихолдер это то, какие ресурсы ты посещаешь.
Аноним 19/07/25 Суб 12:31:06 #267 №1282516 
>>1282512
Какой наивный...
Аноним 19/07/25 Суб 12:39:14 #268 №1282522 
>>1282516
Если бы кто-то нашел способ расшифровки https на лету, он бы озолотился нахуй.
Аноним 19/07/25 Суб 12:41:13 #269 №1282524 
>>1282522
Так никто его на лету и не расшифровывает. Да и проблема в основном не в проксихолдере, а в держателе коммуникаций между тобой и им.
Аноним 19/07/25 Суб 12:47:45 #270 №1282528 
А что, эта новая Кими в рп без шансов, кит лучше?
Аноним 19/07/25 Суб 13:12:43 #271 №1282547 
>>1282475
>кончай тред
Это что за тред такой? Алсо, а что мешает арендовать впску и свои прокси поднять?
Аноним 19/07/25 Суб 13:14:14 #272 №1282549 
>>1282547
>кончай
асиг, aicg, ранее
референс к c.ai + кум
Аноним 19/07/25 Суб 13:17:32 #273 №1282551 
image.png
Подскажите новичку что такое distill и fp16, я посмотрел видос и решил поставить ollama на комп - сейчас качается gemma3:27b-it-fp16, но я еще хочу deepseek установить, но нихрена не понятно чем там версии различаются
Аноним 19/07/25 Суб 13:20:30 #274 №1282554 
>>1282551
А зачем тебе fp16? Мог бы gguf с 8-м квантом скачать. Разница на уровне погрешности, а экономия по памяти в 2 раза меньше.
Аноним 19/07/25 Суб 13:22:11 #275 №1282557 
>>1282551
>distill
Это забей, когда в маленькую модель заливают выхлоп большой, надрачивая её на том как большая пишет.

>>1282551
>fp16
Нахуя? Качай Q6, это достаточно.

>>1282551
>ollama
Выкинь каку.
Аноним 19/07/25 Суб 13:28:18 #276 №1282561 
Аноны, чё делать? Прикинул сборку в днс: 5060 16 Гб vram, i5, 64 Гб ddr5, 2 Тб ссд плюс моник, корпус, вентиляторы. Для ллм это вообще почти ничем, а 140 к надо отдать. Как жить? Не понимаю что делать. Сейчас есть только нут без видеокарты с 16 Гб оперативы, 12 б модели на нем еле пердят
Аноним 19/07/25 Суб 13:30:42 #277 №1282564 
>>1282524
Продолжай, я всё ещё не вижу каким образом проксихолдер мог бы читать логи моего общения с каким-нибудь гроком, например.
Аноним 19/07/25 Суб 13:31:51 #278 №1282566 
>>1282528
Кими в рп ок, даже приятнее чем дипсик.
А что за кит?
Аноним 19/07/25 Суб 13:31:55 #279 №1282567 
>>1282512
> Не читает, сейчас всё через https, а оно шифрованное. Максимум что видит проксихолдер это то, какие ресурсы ты посещаешь.
Не путай обычные VPN/прокси с проксями для LLM типа oai-reverse-proxy.

В первом случае у тебя HTTPS от клиента до конечного сайта. VPN видит только IP/домен и объём трафика, сам контент шифрован.

А в случае с проксями для LLM - ты шлёшь запрос не напрямую в OpenAI, а на сервер прокси. Устанавливаются два HTTPS-соединения: ты <-> прокся и прокся <-> OpenAI.

Твой провайдер не видит, что ты туда шлёшь, но прокся видит всё. Хочет - логгирует, хочет - добавляет инжекты на NTR.
Аноним 19/07/25 Суб 13:35:32 #280 №1282568 
>>1282561
Тебе нужен комп только под ллм? Тогда ты не с той стороны к этому вообще подходишь и за те же деньги можешь собрать себе зеон\эпик с кучей обычной оперативы. Будет не быстро, но сможешь запускать даже самый жыр.

Или тебе нужен обычный комп для игорей, на котором можно запускать небольшие ллм'ки вроде геммы? Тогда это в принципе нормальный вариант.
Аноним 19/07/25 Суб 13:36:57 #281 №1282569 
>>1282566
>кит
дипсик же собственно
Аноним 19/07/25 Суб 13:38:54 #282 №1282570 
Зачем вообще эти корпы немотрончик давно пишет как корп
Аноним 19/07/25 Суб 13:41:24 #283 №1282571 
>>1282567
>Не путай обычные VPN/прокси с проксями для LLM типа oai-reverse-proxy.
Ну охуеть, они и тут какого-то говна накостылили на ровном, блядь, месте. Нахрена это вообще делается?
Аноним 19/07/25 Суб 13:41:55 #284 №1282572 
>>1282569
А почему кит?
Аноним 19/07/25 Суб 13:42:31 #285 №1282573 
image.png
>>1282554
Ты про пик?

>>1282557
Понял, тогда поставлю для начала q8.
>Выкинь каку.
Плохая чтоли? Я к вам сюда впервые зашел, а решил поставить потому что видос глянул на ютубе, щас попробую и может у вас надолго останусь. А чем советуешь пользоваться? я в вики пока не заглядывал
Аноним 19/07/25 Суб 13:46:01 #286 №1282578 
>>1282573
Нет. Не 8b, а q8.
Аноним 19/07/25 Суб 13:47:25 #287 №1282581 
>>1282578
А, ее буду ставить
Аноним 19/07/25 Суб 13:53:12 #288 №1282589 
image
>>1282572
>почему кит
действительно, почему...
Аноним 19/07/25 Суб 13:55:33 #289 №1282592 
>>1282571
Обычные VPN/прокси просто меняют маршрут - твой трафик шифрован, никто его не трогает.

А вот oai-reverse-прокси должен влезать в запросы чтобы ключ для API подставить. Так что без расшифровки на стороне прокси тут никак.
Аноним 19/07/25 Суб 13:57:35 #290 №1282595 
>>1282573
>я в вики пока не заглядывал
А вот тут - ошибка. Чтобы не делать хуйню, как ты сейчас, сначала читай вики треда, потом вики кобольда. Внимательно, блять, а не по диагонали. Узнай что делает каждая настройка, зачем нужны пресеты, как выгружать слои модели на ГПУ и т.д.

Потом качай кобольд и нормальную модель, а не это вот всё.

Нормальные модели:
Mistral 2506 24b Q4_K_L
Gemma 3 27b Q4_K_L
Qwen 3 32b Q4_K_L
Аноним 19/07/25 Суб 13:59:41 #291 №1282599 
>>1282595
Понял, а модель чатгпт нет или она говно?
Аноним 19/07/25 Суб 14:02:11 #292 №1282604 
>>1282599
Все, иди читать вики и изучать термины, пока не выучишь - не пиши сюда больше, от тупости вопросов чувствую себя как Q1_XXS
Аноним 19/07/25 Суб 14:04:36 #293 №1282606 
все занюхиваем новую цидоньку но новом мистрале
https://huggingface.co/TheDrummer/Cydonia-24B-v4-GGUF
Аноним 19/07/25 Суб 14:05:21 #294 №1282607 
>>1282592
>должен влезать в запросы чтобы ключ для API подставить
А, точно, тогда понятно нафига.
Что-то я не вдавался в эту хреноту раньше совершенно и задаю тупые вопросы на ровном месте, получается.
Аноним 19/07/25 Суб 14:07:23 #295 №1282609 
>>1282589
Я вообще не понял сперва при чем тут пикча с китом, а потом загуглил её.
То чувство, когда дипсик не ассоциируется с какими-то онлайн сервисами и для тебя это просто жирная модель на обниморде.
Аноним 19/07/25 Суб 14:19:51 #296 №1282615 
>>1282561
>2 Тб ссд плюс моник, корпус, вентиляторы.
>140 к надо отдать. Как жить?
Не очень понятно, чем ты недоволен. Ты по хорошему за нормальную пеку сейчас 300к должен выложить.
Я покупал БП за 25к, монитор за 50к, корпус с вентиляторами за 30к.

140к - это пук на основе ширпотреба. Вангую слабенький экранчик на VA матрице, корпус-китайщина с заусенцами из пластика, и так далее.
Аноним 19/07/25 Суб 14:21:56 #297 №1282618 
>>1282615
>покупал БП за 25к
Слабоумие и отвага.
Аноним 19/07/25 Суб 14:22:40 #298 №1282619 
>>1282618
Ну если полтора киловатта считать за слабоумие, то в чем-то ты прав.
Аноним 19/07/25 Суб 14:23:27 #299 №1282620 
>>1282606
Не почуял разницы между дефолтным мисралем и этой штукой. Это что-то на уровне дегустации вина или аудиофильства.
Аноним 19/07/25 Суб 14:26:30 #300 №1282621 
>>1282619
Столько стоит целый сервер без материнки но с двумя платиновыми бп по 750
Аноним 19/07/25 Суб 14:28:40 #301 №1282622 
>>1282621
И что мне сервером делать? У меня KPACUBO, коробочка с клоунской подсветкой и все такое. Вряд ли залетный чел тоже себе серверный рак rack дома ставить собирается.
Аноним 19/07/25 Суб 14:30:18 #302 №1282624 
>>1282622
Ну тогда страдай с печкой под боком раз выкинуть её подальше не твой выбор
Аноним 19/07/25 Суб 14:32:05 #303 №1282625 
>>1282624
Страдать будет планета, тепло из квартиры выводится.
Аноним 19/07/25 Суб 14:32:39 #304 №1282627 
PXL20250710110955688.jpg
>>1282619
У меня двухкиловаттник куплен за 3к, у майнера, махнуть подсохшие кондёры обошлось еще в косарь.

>>1282622
>коробочка с клоунской подсветкой и все такое
Кто тебе мешает серверную материнку засунуть в коробочку с клоунской подсветкой?
Аноним 19/07/25 Суб 14:35:44 #305 №1282630 
>>1282627
А потом все сгорит, ну зато 20к сэкономил. Ну может и не сгорит. Но страшно.
Аноним 19/07/25 Суб 14:41:48 #306 №1282632 
>>1282630
Страшно, это когда ты не понимаешь как это работает и у тебя тряска на ровном месте из-за хуеты которую ты не понимаешь.
При таком раскладе ты просто выполняешь "магические" действия для "защиты", например платишь много денег, просто за какое-то магическое свойство - гарантию, качество, баззворды. Всё это тебя несколько успокаивает, но тряска всё равно никуда не пропадёт, просто станет немного меньше.
Аноним 19/07/25 Суб 14:49:24 #307 №1282634 
>>1282573
>А чем советуешь пользоваться?
KoboldCPP + таверну можешь поставить.

Скачай нормальную модель, Mistral-Small-3.2-24B-Instruct-2506, и к ней пресет - https://pixeldrain.com/u/jjccYwUJ

Системный промт https://pixeldrain.com/l/47CdPFqQ#item=134

>>1281420
карточки ^
Аноним 19/07/25 Суб 14:55:32 #308 №1282636 
>>1282632
Страшно - это когда у тебя есть негативный опыт.
Работал БП от Corsair больше десятка лет. В один прекрасный день не включился. После замены БП была обнаружена сдохшая материнка.

Почему я должен ожидать другого от майнерской подзалупы?
Аноним 19/07/25 Суб 15:09:26 #309 №1282641 
>>1282568
Спасибо за совет. В целом хочется универсальное что-то, но в игры я не играю. Для инференса текста и картинок/видосов, для последних насколько я понял наличие врам особо критично. А гемма 27 влезет в сеттинг выше?
Аноним 19/07/25 Суб 15:11:06 #310 №1282647 
>>1282615
Ты не понимаешь. Я тут экономлю на всем, чтобы хоть как-то выкатиться, а ты тут хвалишся своим моником и БП?
Аноним 19/07/25 Суб 15:16:37 #311 №1282649 
>>1282641
>А гемма 27 влезет в сеттинг выше?
Будет 3-4 токена в секунду, для норм скорости надо 24 GB VRAM + 64 + RAM желательно.
Аноним 19/07/25 Суб 15:22:15 #312 №1282652 
>>1282647
Речь о том, что 140к это и есть вариант-эконом, в котором нет ничего удивительного.
Аноним 19/07/25 Суб 15:23:44 #313 №1282654 
>>1282649
>Будет 3-4 токена в секунду
Будет 6-7, может больше.

У меня на 12гб гпу влезает 32 слоя геммы Q4_K_XL и выдает ~3.5 т/с. У него же она влезет почти полностью. Но по мере роста контекста скорость будет падать, да.
Аноним 19/07/25 Суб 15:25:14 #314 №1282655 
>>1282615
Да не трясись, подрастёшь, поймёшь, что хороший комп это тот который выполняет твои задачи и он может выглядеть как разъёбанная куча проводов вообще без корпуса для ллмок чтоб кодить как будто у тебя в подвале табун индусов и стоить от пары лямов рублей. Либо купленный за 100к системник с моником 32 дюйма 5090ти 14400ф который тянет киберпук на ультах с ртх перегрузкой в 80 фпс. И всем уж точно поебать на заусенцы, дебил ты малолетний.
Аноним 19/07/25 Суб 15:33:39 #315 №1282659 
epaulette shark stealing food from starfish.mp4
>>1282163
> я рыб вообще ненавижу.
у тебя просто нормальной рыбы не было
>>1282216
> меньше чем за сотку можно собрать себе системник с 512 гигабайтами оперативки, на котором вполне можно крутить квантованные дипсик и кими, пусть не слишком быстро, но более чем юзабельно.
да нихуя это не юзабельно, я к такому же конфигу 6000 про прикрутил и всё равно медленно пиздец.
>>1282331
>>1282332
база треда для кого составлена?
>>1282467
исключительно отсутствие цензуры, и меньше чем в 1% случаев защита клиентских данных или своего проприетарного кода. копроративные нейронки на порядки лучше открытых решений.
Аноним 19/07/25 Суб 15:34:12 #316 №1282660 
>>1282655
Нормально нищего задело. Рассказывай, как так вышло, что ты там подрос и остался не в состоянии обеспечить себя даже такой базовой ерундой, как кудахтер.
Аноним 19/07/25 Суб 15:37:31 #317 №1282662 
>>1282641
да, наличие врам критично. запускать ллмки на одной только оперативе имеет смысл только с 12-канальной ддр5, для ддр4 будь добр добавить хотя бы 3090
Аноним 19/07/25 Суб 15:40:16 #318 №1282664 
>>1282636
Братюнь, у тебя уже сдох дорогой брендовый бп утащив материнку и ты хочешь это вылечить буквально покупкой другого еще более дорогого брендового бп. Ты же понимаешь, что это уже просто чистая шиза?
Аноним 19/07/25 Суб 15:41:56 #319 №1282666 
>>1282662
* для восьмиканальной ддр4
с двухканальной ддр4 в обычной пекарне жизни нет, тогда твой вариант с 16гб врам и двухканальной ддр5 будет лучше
Аноним 19/07/25 Суб 15:43:22 #320 №1282667 
>>1282595
> Нормальные модели
Микромодели не могут быть нормальными в принципе.
Аноним 19/07/25 Суб 15:43:22 #321 №1282668 
>>1282664
>сдох бп утащив материнку
И что можно сделать, чтобы избежать такого в дальнейшем, кроме как покупка хорошего БП?
Аноним 19/07/25 Суб 15:43:48 #322 №1282669 
>>1282660
Да пришлось продать все пожитки, чтоб твою мать похоронить по-христиански. Навестил бы хоть, сынок, а то сидишь за своим коплюхтером на харкаче.
Аноним 19/07/25 Суб 15:45:40 #323 №1282671 
>>1282659
>нихуя это не юзабельно
Ну если у тебя жопа в огне и хуй наперевес, то может и не особо юзабельно. А если ты фоново рп'шишь то и норм.
Аноним 19/07/25 Суб 15:49:43 #324 №1282673 
>>1282547
>Алсо, а что мешает арендовать впску и свои прокси поднять?
Дело в том, что прокси там не столько для обхода блокировки (со стороны апишки), сколько для подсовывания своего ключа. Публично ключи не выкладывают, их оперативно банял, или крыса-кун жалуется и его банял/скручивают лимиты в минимум.
>>1282615
>Я покупал БП за 25к
Ебать ты смелый.
мимо с бп за 60к
>монитор за 50к
Ну вот тут я соснул, взяв 4к@144ГГц за 30к. Уел ты меня.
>корпус с вентиляторами за 30к
У меня 36 выйдет походу. И-инфляция.
>>1282632
>При таком раскладе ты просто выполняешь "магические" действия для "защиты",
Качественная компонентная база и наличие всех защит (реальных, а не магических) вполне себе существует. И да, стоит денег. Конечно, я во многих местах ультанул и переплатил, но это не равно деньги на ветер.
>>1282655
>с моником 32 дюйма 5090ти 14400ф который тянет киберпук на ультах с ртх
Не тянет 5090 киберпук даже с обычной трассировкой.
>>1282659
>у тебя просто нормальной рыбы не было
Думал будет паста про еблю сома.
>>1282659
>я к такому же конфигу 6000 про прикрутил и всё равно медленно пиздец
Купил одну, покупай и вторую! Впрочем, тогда смысл сетапа с 1488ГБ рамы теряется, при наличии 192 гиг врама. А если что-то не лезет в этот объём врама, то оно и не нужно.
Аноним 19/07/25 Суб 15:54:35 #325 №1282677 
>>1282668
добавить перед хорошим бп не менее хороший ибп
Аноним 19/07/25 Суб 15:55:24 #326 №1282678 
>>1282667
Это максимум того что можно запустить на ИГРОВОМ КОМПЛЮХТЕРЕ™ на терпимой скорости. Перечисленные модели - подойдут большинству и в своих размерах они лучшие.
Аноним 19/07/25 Суб 15:58:19 #327 №1282682 
>>1282668
Избежать - ничего, всегда есть шанс такого развития событий. Он сильно выше у дешманских недо-бп в ценовом диапазоне до 5к, но и только. Все "брендовые" бп собраны на небольшом количестве платформ от OEM производителей, смотри которые из них норм и покупай самый дешевый бп на ней. Тот двухкиловаттный ноунейм бп который я купил за 3к был на той же платформе что и брендятина, только китайцы слегка сэкономили на конденсаторах и слегка завысили заявленную мощность. Ну и бренд на той же платформе на вторичке стоил десятку, а ноунейм 3к.
Аноним 19/07/25 Суб 16:01:46 #328 №1282684 
>>1282668
>избежать такого в дальнейшем
покупкой хорошего беспербойника
Аноним 19/07/25 Суб 16:15:37 #329 №1282687 
>>1282673
> Думал будет паста про еблю сома.
не надо ебать сомов, они для этого не предназначены. дельфинов и косаток ебите
Аноним 19/07/25 Суб 16:18:48 #330 №1282689 
>>1282667
Да не скажи, гемма для своего размера охуеть как хороша. Нет, понятное дело на больших моделях ты ощутишь разницу, но нифига не пропорциональную разнице в размерах модели.
Аноним 19/07/25 Суб 16:19:36 #331 №1282690 
>>1282687
Хорошо. Заведу себе дома аквариум с дельфином, лишь бы не пидарский корпус со стеклом.
Аноним 19/07/25 Суб 16:20:07 #332 №1282692 
>>1282684
А, хотя да, ты прав, бесперебойник с хорошим стабилизатором сильно снизит шансы подыхания бп.
Аноним 19/07/25 Суб 16:20:48 #333 №1282693 
>>1282649
> Будет 3-4 токена в секунду
Сам то запускал?
Аноним 19/07/25 Суб 16:23:29 #334 №1282697 
>>1282693
>запускал
запускал на 4080, ну, на пятидесятой серии немного побольше будет, как выше уже написали
Аноним 19/07/25 Суб 16:26:45 #335 №1282706 
>>1282697
А речь о голой оперативке.
Пол треда выдаёт разные цифры взятые с потолка при этом сами ничего не гоняли
Аноним 19/07/25 Суб 16:27:06 #336 №1282707 
>>1282706
Я лысого гонял, это считается?
Аноним 19/07/25 Суб 16:31:57 #337 №1282714 
>>1282707
Да, руку не пожму
Аноним 19/07/25 Суб 16:55:35 #338 №1282745 
Тема годная. Надо вкатываться
Аноним 19/07/25 Суб 17:27:59 #339 №1282760 
>>1280475 (OP)
Чем open-webui хуже text-generation-webui? Иначе почему он не упоминается в шапке?
Аноним 19/07/25 Суб 17:31:36 #340 №1282761 
>>1282760
>Чем open-webui хуже
Тем что он чисто под ассистентов, а тут всё рассматривают через призму ролеплэя, часто с эротическим уклоном.
Аноним 19/07/25 Суб 17:42:08 #341 №1282768 
image.png
>>1282760
ХЗ, мне нравится тестить как всё работает через него. Приятнее чем в консольке с курлом дрочилово вприсядку устраивать
Аноним 19/07/25 Суб 17:56:42 #342 №1282775 
Насколько мощный компухтер нужен для ллм? С процом и дохуищем оперативки понятно — секта свидетелей Xeon'а (возможно, двухсокетовые); но вот как с видимокартами быть? У игровых видимокарт сильно видеопамять урезана же. Если только… б/у теслы?
Аноним 19/07/25 Суб 17:59:45 #343 №1282776 
>>1282775
Тебе не о мощности современных зелёных гпу нужно думать, а о количестве врам. Условная 5070ти выдаст тебе столько т/с что куда ты их засунешь не понятно.

Озу много не надо если есть врам, амд - могила (вернее имеет смысл но только если у тебя нет цели, а только путь). Оба тейка проверены в реальности
Аноним 19/07/25 Суб 18:01:02 #344 №1282778 
>>1282347
>В нейронках для генерации изображений нулевая цензура, абсолютный ноль.
У корпоратов? Оочень сомневаюсь. В локальных-то да, это и причина, почему локальная генерация визуала полностью оправдана.
>А твои корпы обоссываются одним аргументом, и это не цензура или анальный зонд в жопе: бабок нет.
Я уже месяц сижу на проксях с соседнего треда, не потратил ни копейки, да и нет желания - у меня нет запасов крипты, а вмешивать реальные деньги это, считай, ставить ФИО и адрес под каждым запросом к ии. Не будет проксей - не буду пользовать, все просто, будет смысл смотреть на локалки. А пока есть - зачем мучать себя огрызками?

>>1282354
>Более того, достаточно всего лишь одной видеокарты, если ты не ёбырь-энтузиаст
Пчел, если гемини обоссывает наиболее юзабельные большемодели вроде ларджа, то ты анонов совсем скотом считаешь, которые будут всегда жрать мелкомодели и не крякать? Не, я сам лишался девственности с какой-нибудь 12B, которая крутилась на сайте, который тут ни разу не упоминали, и это мне казалось откровением свыше настолько, что жизнь реально разделилась на до и после. Но когда ты уже опытный, нет смысла продолжать катать мелкомодели, даже учитывая их прогресс - большие корпы-то тоже на месте не стоят.

>Поэтому жизни вне локалок нет для экстремальных сценариев.
Не встречал вообще ничего из нижеописанного тобой на проксях. Ни банов, не лоботомизации из-за обхода фильтров, ни остальных проблем. Но может я просто попал в свитспот для гемини. А гопоту и клод я почти не пробовал, мне гемини устраивает - работает быстро, пишет классно.

>>1282472
>Твои логи хранятся несколько лет.
Плевать, прокси+впн.
>учитывая регулярные отключения
Так пока все еще доступно. Я вот, например, не пробовал третий опус, который все нахваливали, и времена более слабой цензуры на клоде, и это у меня вызывает небольшое сожаление, а не ррряя в духе "ага, я ж говорил вам все поотключают, а эти ваши корпы то и не нужоны мне никогда". Зачем преждевременно окукливаться?

>>1282475
>Нет не пробивается. У меня на всех корпах прямо на карточку триггерится.
Хз, у меня вроде довольно жесткие сценарии для соевых норм и на гемини я вполне легко все обхожу и ничего не лоботомируется. По крайней мере, все равно остается умнее всего, что я раньше пробовал.

> И да, с проксей твои логи читает не только корпорат, но и проксихолдер
Плевать, я без трех букв теперь в интернет не захожу.

>>1282452
>Сейчас даже мистраль ебет все сетки тех годов.
Прикинь, я сижу на современном корпе, а не ТЕХ годов.
Аноним 19/07/25 Суб 18:02:10 #345 №1282780 
>>1282775
И б/у теслы устарели по всем фронтам. По интернетам может только v100 и свежее будут ворочаться, но это уже деньги куда большие чем горсть ми50, а ебля будет с ними всеми с теслами конечно поменьше, но это уже лирика
Аноним 19/07/25 Суб 18:03:13 #346 №1282781 
>>1282775
>зеоны
то говно что продают на хуанжи с двухканалом даже игры не тянет, какие ллм?
>двухсокетовые
Можешь ещё и хуй себе второй пришить, а что, 2 лучше же чем один.
>теслы
У б/у тесел скорость памяти как у эпиков на ддр4, нахрен они теперь нужны?
Аноним 19/07/25 Суб 18:09:13 #347 №1282782 
>>1282780
Вы забываете, что с засильем мое моделей теслы, ми50 и прочая некрота наоборот вновь вступает в игру для десктопных платформ. Там, где они уже слабоваты для плотных моделей, моета еще летает и работает намного лучше выгрузки в рам онли.
Аноним 19/07/25 Суб 18:12:45 #348 №1282786 
>>1282778
>Плевать, я без трех букв теперь в интернет не захожу.
А чё это три буквы? Что, ссыкотно название написать? Ах да, скоро запретят и пользоваться, посмотрим, как ты запоёшь.
Аноним 19/07/25 Суб 18:13:22 #349 №1282787 
Напомните Газу треда по ванильной Гемме3: Чат комплишен или Текст комплишен?
Аноним 19/07/25 Суб 18:16:41 #350 №1282790 
>>1282776
А сильно просаживается скорость работы, если врам кончилась?
Аноним 19/07/25 Суб 18:26:02 #351 №1282796 
>>1282786
>хрю
Аноним 19/07/25 Суб 18:31:34 #352 №1282798 
image.png
>>1282782
Не забываю, чел, я лично составлял табличку. Все эти древние инстинкты и теслы лишаются поддержки, не имеют свежих фич, требуют внимания что бы завести их хоть как то. Если в кайф именно процесс поднятия с колен этих копролитов то базара нет (мне в кайф). В случае инстинктов нужно как минимум уметь в докер, поиск инфы на гитхабе и общие предстваления о cmake, gcc и томму подобных билд тулзах
Аноним 19/07/25 Суб 18:32:13 #353 №1282799 
>>1282790
Кратно
Аноним 19/07/25 Суб 18:35:27 #354 №1282800 
А помните как конч99 слился обосравшись и обоссавшись с треда типа кинув обидку на всех отвечая на рандомный пост
Аноним 19/07/25 Суб 18:44:17 #355 №1282807 
>>1282798
В случае инстинктов нужно как минимум уметь в докер, поиск инфы на гитхабе и общие предстваления о cmake, gcc и томму подобных билд тулзах
А в случае тесл ничего этого не нужно. И поддержка для лламаспп для них есть и даже в параллель могут, если число карт кратно двум. Иными словами по хорошей цене две-четыре карты вновь становятся темой, если охота большой Квен погонять. Немного РАМ добавить только и всё заиграет.
Аноним 19/07/25 Суб 18:48:51 #356 №1282811 
изображение.png
>>1282796
Хую. Ты не в том разделе, чтобы хрюкать.
>>1282800
Не было такого, это миф двухтредной давности.
Аноним 19/07/25 Суб 18:55:12 #357 №1282822 
>>1282807
Пустое сотрясание воздуха. Пройди весь путь, набей шишки и тогда напиши всё это снова
Аноним 19/07/25 Суб 19:02:55 #358 №1282834 
>>1282822
>Пустое сотрясание воздуха. Пройди весь путь, набей шишки и тогда напиши всё это снова
А то я МоЕ-шки на теслах не гонял :)
Аноним 19/07/25 Суб 19:03:45 #359 №1282837 
>>1282778
>Так пока все еще доступно. Я вот, например, не пробовал третий опус, который все нахваливали, и времена более слабой цензуры на клоде, и это у меня вызывает небольшое сожаление, а не ррряя в духе "ага, я ж говорил вам все поотключают, а эти ваши корпы то и не нужоны мне никогда". Зачем преждевременно окукливаться?

Один персонаж сказал: владелец чего либо тот, кто может это уничтожить. В случае корпа - в любой момент тебя могут лишить как доступа в целом, так и качества модели.

При этом нейронки - вызывают привыкание на манер наркотика. (пошлое сравнение, но что поделать?) Если ты попробовал более качественную сеть - на более слабые вернуться уже не сможешь. В результате - пользуясь корпами... аналогия понятна? Если завтра корпы станут по какой либо причине недоступны, это вызовет большой психологический дискомфорт. И локалки уже его не погасят.

Потому, лично я трогать корпов не собираюсь, а на локалки выше, чем позволяет юзать мое железо тоже не заглядываюсь. Последний раз когда я это правило нарушил - дело кончилось покупкой второй видеокарты, чтобы 24-32B модели гонять. :)
К счастью для моего бюджета - это была всего лишь P104-100, которая за 20$ доступна при удаче. :)

Разумеется, так не всех засасывает. Как и алкоголиками-наркоманами не каждый с первой рюмки-дозы становится. Но... :)

Шутки шутками, но подобное предупреждение про About AI Safety Using на половине дискордов у них там висит.
Аноним 19/07/25 Суб 19:04:21 #360 №1282838 
>>1282778
> Я уже месяц сижу на проксях с соседнего треда
А я чёт не удивлен. Но с другой стороны - нравится, пользуйся.
> Прикинь, я сижу на современном корпе, а не ТЕХ годов.
Умница, а теперь проверь адресную строку и убедись, что тут не ациг и корпы обсуждают в соседнем треде.
И тут дело не в гейткипе, просто вы и так уже тред засрали.
Аноним 19/07/25 Суб 19:08:33 #361 №1282842 
>>1282834
Поделись тогда знаниями с тредом. Погоняй хоть бенчи, опиши сетап и цену, на чём завёл 4 карты и с каким тдп.
На счёт твоих слов я полон скепсиса т.к. все говнокарты были поставлены в один ряд, а потом после раскрытия невероятной тайны что амудэ без котылей не работает случилось "а теслы то работают!"
Аноним 19/07/25 Суб 19:19:03 #362 №1282854 
>>1282811
Зачем ты кидаешь скриншот своего айпишника? И большего тот пост не достоин, ведь его писал лоботомит с контекстом в пару предложений.
Аноним 19/07/25 Суб 19:23:16 #363 №1282857 
>>1282842
>после раскрытия невероятной тайны что амудэ без котылей не работает случилось "а теслы то работают!"
Но теслы и правда работают. В треде не дадут соврать, тут у многих они были. А мой сетап нынче на 3090-х - немного не хватает, но смысла апгрейдится пока не вижу - хз куда оно ещё повернётся.

У кого сетап на теслах живой, пусть кинут, сколько можно получить с рига на Квене, если использовать только Теслы и RAM через оверрайд. Мне и самому интересно. Ведь затык там как раз в RAM будет.
Аноним 19/07/25 Суб 19:31:49 #364 №1282867 
На счёт тесел на паскалях скоро же долны будут их выкинуть из поддержки, не?

>>1282857
Буквально 2-3 месяца назад и ллама на 906 из коробки вообще без бубнов работала. Так сразу и пиши мол когда то в стародавние времена оно работало, сейчас не знаю, бенчей нет
Аноним 19/07/25 Суб 19:45:00 #365 №1282876 
>>1282682
> Тот двухкиловаттный ноунейм бп который я купил за 3к был на той же платформе что и брендятина, только китайцы слегка сэкономили на конденсаторах и слегка завысили заявленную мощность. Ну и бренд на той же платформе на вторичке стоил десятку, а ноунейм 3к.
Как же он коупит! Высший пилотаж. Конечно же за 2к положили все-все, что есть в платине за 30к, верим-верим. Ровно та же платформа, те же электролиты, симметричная цифровая схема, гибридный режим, термо-нагрузка, вентиль бесшумный - все совпадает. Самому не смешно?

Просто принеси сюда название своего чудо бп, посмеемся хоть вместе.
Аноним 19/07/25 Суб 19:54:27 #366 №1282895 
> я купил оверпрайс говно и у меня будопешт, скажи пожалуйста как называется ОЕМ версия чтобы я купил такую же в будущем и больше не был таким лохом
Аноним 19/07/25 Суб 19:59:27 #367 №1282906 
АМуде господа, а в чем цимес с радеонами ?
Я всегда был в зеленом лагере и не доводилось ебаться с красными.
Аноним 19/07/25 Суб 19:59:58 #368 №1282907 
>>1282895
Лол, ты зачем так быстро слился? Просто скажи название своего, похвастай, порадуй других анонов, что ты зажилил? инб нет такого
Аноним 19/07/25 Суб 20:00:32 #369 №1282908 
>>1282906
Ты не хочешь этого знать, поверь.
Просто оставайся и дальше с Хуангом.
Аноним 19/07/25 Суб 20:02:26 #370 №1282911 
>>1282906
Технологии зелёных - референс
Технологии красных - попытки в подмену
Технологии синих - попытки в подмену
Аноним 19/07/25 Суб 20:02:57 #371 №1282912 
>>1282911
> Технологии синих - попытки в попытки
Исправил
Аноним 19/07/25 Суб 20:04:46 #372 №1282913 
>>1282912
Как то да работает. На арке удалось даже сд завести в прошлом году
Аноним 19/07/25 Суб 20:05:18 #373 №1282915 
>>1282906
> база треда:
> - АМУде КАЛ, а куртка ТОП

>>1282912
тоже база, спасибо, добавлю при перекате.
Аноним 19/07/25 Суб 20:06:20 #374 №1282918 
>>1282907
да я вообще мимокрок и толсто тралирую
Аноним 19/07/25 Суб 20:14:11 #375 №1282925 
>>1282908
Хоспаде, простой вопрос же. Не работают, драйверов нет, криво работают ? В чем цимес ?
Аноним 19/07/25 Суб 20:20:19 #376 №1282928 
>>1282682
Ты чето реально интенсивно коупишь. Есть мейнерские двухкиловаттники на вполне приличной элементарной базе и выполненные нормально, даже не по нижней планке номиналов. Но сравнивать их с платиновыми бп - нет никакого смысла просто потому что там разные топологии. Майнерский - просто отмасштабированный типичный 600-800 (или больше) ваттник разработки начала прошлого десятилетия. И в этом нет ничего плохого пока у тебя к нему есть приток свежего воздуха и если тебя не смущают 2700 оборотов его крутилятора, который с завода там стоит не просто так.
Платиновые же внутри гораздо более пустые, имеют другие топологии и не требуют такого охлаждения.
>>1282760
Это разные вещи, опенвебуй - модная оболочка с "красивым" интерфейсом для васянов но ограниченным функционалом и поддержкой только всякого кринжа типа олламы или универсального оаи-лайк апи во внешних бэках. Убабуга же - сборник различных бэков в ассортименте с таком себе интерфейсе, которая прежде всего используется как универсальный хостинг апи.
Аноним 19/07/25 Суб 20:34:03 #377 №1282933 
>>1282778
> ррряя в духе "ага, я ж говорил вам все поотключают, а эти ваши корпы то и не нужоны мне никогда". Зачем преждевременно окукливаться?
Чел, ты задал вопрос, я на него дал ответ. Все. Почему ты ведешь себя как мудак, словно я тебя пытаюсь в чем-то убедить? Пошел нахуй отсюда, здесь таких говноедов не жалуют.
Аноним 19/07/25 Суб 20:37:55 #378 №1282934 
>>1282933
ай, молодца, хорощо копрожора опустил
Аноним 19/07/25 Суб 20:43:35 #379 №1282937 
>>1282811
> Не было такого, это миф двухтредной давности.
И че где он тогда?
Аноним 19/07/25 Суб 21:29:36 #380 №1282981 
>>1282937
Он здесь, с нами. Не видишь?
Аноним 19/07/25 Суб 21:34:17 #381 №1282988 
>>1282981
Нет. Покажешь?
Аноним 19/07/25 Суб 21:37:27 #382 №1282994 
>>1282988
Вот же. ->>
Аноним 19/07/25 Суб 22:02:25 #383 №1283031 
>>1282837
>Если ты попробовал более качественную сеть - на более слабые вернуться уже не сможешь.
Ну мы и так живем в мире подписок. Даже в автомобили теперь подписки встраивают. И мы уже и так подсажены на кучу других "игл", которые в любой момент могут отключить (и отключают). Так что такие риски меня не сильно заботят. Будет что вспомнить зато и поныть.
Я вообще так-то тот еще тревожник по жизни, но последние года осознанно изгоняю и ненавижу это в себе и других. Поэтому стараюсь трезво оценивать риски и не загоняться насчет каждого "а что если", иначе так и проживешь червем дрожащим. минутка проекций
Ну а в целом твое мнение принимается, звучит понятно, хоть я такое и не одобряю.

>>1282838
>тут не ациг и корпы обсуждают в соседнем треде
Я не обсуждаю корпов, я обсуждаю, зачем люди кусаются и срутся из-за мелкомоделей, когда есть доступные решения на порядки качественнее. Столько гигабайт трафика и киловатт-часов потрачено на условный 12B кум русик, когда русик вот он, только протяни руку. Ладно еще создавать это, может тредовичку просто по кайфу, но всерьез крутить... хотя может никто всерьез и не крутил, хз

>>1282933
Странно, что ты принял ту фразу на свой счет, я просто привел пример полярной реакции к моей. Ну, видимо, угадал. У тебя в целом очень алармистский пост "все плохо, все отключат, давайте засядем в подвале с генераторами, а то КТО ЗНАЕТ ЧТО БУДЕТ ЗАВТРА". Вот когда будет, тогда и будет, только, боюсь, в этом случае тебя волновать будет уже не недоступность забугорных корпов.
>Чел, ты задал вопрос, я на него дал ответ. Все.
Напиши модерам, чтобы они отключили возможность отвечать тебе, ведь ты ВСЁ. Можешь в рамочку еще поставить свой ответ.
Аноним 19/07/25 Суб 22:07:12 #384 №1283039 
15519559761910.webm
>>1283031
>Я не обсуждаю корпов
Это ты и делаешь. Вот без обид анон, но у меня уже просто жопа начинает гореть и я превращаюсь в токсичного уебана.
Вот выше - односложные предложения, семенство, какой то уебан всё пытается тролить свалившего анчоуса который делал пресеты. Буквально тред пожирают опарыши нургла. Я начинаю понимать, почему чуть больше года назад в треде сразу нахуй посылали.
Аноним 19/07/25 Суб 22:11:27 #385 №1283047 
>>1283031
>И мы уже и так подсажены на кучу других "игл", которые в любой момент могут отключить (и отключают).
Мне могут отключить только свет и воду. Ну и интернет. Остальное у меня локальное.
Аноним 19/07/25 Суб 22:14:05 #386 №1283052 
>>1283039
Так я-то тут при чем? Я не держу ответственности за одноклеточных. Я ж не троллить пришел, меня вообще в шапке треда постили.
>Это ты и делаешь.
А где это делать, блять? В том треде скажут "иди блять обсуждай в тред локалок, мы их не катаем". Мне что, отдельный тред на это создавать? Чушь не гони. Без обид, но хочется укусить

>>1283047
Ну все понятно, запишу в причины "аноны с выживач тредов"
Аноним 19/07/25 Суб 22:17:48 #387 №1283059 
>>1283052
>но хочется укусить
God damn. Справедливо. Завалил своё крякало.

Вообще, в идеале иметь технический тред и тред попизделок.
Но опять же. Раньше так не делали потому что анонов мало и тред долго висел, сейчас чатик, что будет дальше не понятно.
Аноним 19/07/25 Суб 22:23:06 #388 №1283064 
>>1283039
Ну а вообще : обсуждать что корпы ебут не имеет смысла совсем по другим причинам. В них вливаются миллиарды долларов. И довольно странно ожидать, что локальные сети будут лучше. Я лично жду какого то прорыва в духе лор для рисовалок. И основания для таких ожиданий есть - банальное развитие сетей идет какими то неебическими темпами. Тут за год вышло столько, сколько не выходило за весь период до.
Может даже смена архитектуры. И возможно, просто теоретически, трансформеры могут уйти в прошлое.
Аноним 19/07/25 Суб 22:26:53 #389 №1283073 
>>1283031
Ты литерали кучу последних постов разводишь тут говносрачи и доказываешь что ллмки нинужно, засоряя тред мусором

Кто тут сидит сам решит что нужно и нинужно, без какого-то рандомпетуча с важным мнением.

мимо-пердолирую-ллмки-и-3-копросетки-по-подпискам
Аноним 19/07/25 Суб 22:34:20 #390 №1283080 
>>1283073
Но он хотя бы пишет как человек с руками и головой, а не как ацигоеблан.
Аноним 19/07/25 Суб 22:58:10 #391 №1283106 
>>1283039
Думаю он скучает по его крутым постам о модельках или чувствует вину за содеянное... Эх но вообще да, шитпоста преумножилось в последних 3 - 4 тредах
Аноним 19/07/25 Суб 23:20:04 #392 №1283118 
>>1282837
> Если ты попробовал более качественную сеть - на более слабые вернуться уже не сможешь.
Нет, у всего есть своя цена.
Простой пример:
Когда сижу релаксирую и рпшу - можно пожертвовать скоростью и задействовать все ресурсы ради комфорта себя любимого. Когда стоит задача чисто покумить или просто порофлить бахнув пивасика - там и мистральки хватит. А когда требуется массовая обработка сотен тысяч файлов - будет взята минимально рабочая модель, которая допускает долю ошибок не выше критической, а то и вообще разработан алгоритм что позволяет это компенсировать.
Последнее так вообще база везде.
>>1283031
> мы
Не нужно обобщать. И такой пример - максимальная демагогия, ведь человек в принципе выстроил свою жизнь вокруг высокоорганизованной цивилизации. Проснувшись сутра ты думаешь о том как не опоздать на работу вместо того чтобы докидывать дрова в огонь и тащить воду от ближайшего ручья.
А так насчет оценки рисков и прочего верно.
> зачем люди кусаются и срутся из-за мелкомоделей
Специальная олимпиада, был бы повод. Все крутится вокруг превозношения собственного мнения, недопониманий и переноса критики высказывания на себя.
Аноним 19/07/25 Суб 23:28:59 #393 №1283120 
>>1283106
>Думаю он скучает
Я вообще по ригу скучаю, вот и балуюсь корпами, а они детский восторг вызвали. Ну не видел я раньше такого русика. Был бы он под рукой - пошел бы пробовать отпиздить промптами какой-нибудь лардж, чтобы он хотя бы на англюсике писал похоже. Я не верю в это, но мало ли.

>>1283073
>засоряя тред мусором
Ага, зато околотрольные обсуждения бп (чего ж в /hw/ не гоните с таким), очередные базы и "экспертные" утверждения, что на теслах что-то там не работает - это не мусор. Простите, что посмел вторгнуться в разговоры аристократов.
>мимо-пердолирую-ллмки-и-3-копросетки
Ну так расскажи что-нибудь по существу, а не вкидывай еще больше говна. Зачем пердолишь то и то, какие ощущения, что думаешь.

>>1283064
>И довольно странно ожидать, что локальные сети будут лучше
Ну вот я и хочу понять, зачем сидят на заведомо худших сетях, когда есть лучшие. Пока что вижу только нежелание зависеть от корпораций и нежелание пердолиться. Первое мне лично не близко, а со вторым у меня нет проблем пока что - взамен получаю каефный экспириенс, который не видел ранее.
Аноним 19/07/25 Суб 23:42:53 #394 №1283126 
>>1283039
Сукасука, ы дропнул на 4-5 серии, когда меня вконец выбесила то ли эта синеволосая, то ли гг. Скорее синеволосая, цундере ж она. Даже смутно помню этот момент - то ли гг, то ли она прилетели откуда-то обратно на базу.
Аноним 19/07/25 Суб 23:50:17 #395 №1283128 
>>1283120
> Ну вот я и хочу понять, зачем сидят на заведомо худших сетях, когда есть лучшие.
Нет, чувак, твои посты воняют если не осуждением, то каким-то упреком. Это такой выбор людей, тебе там выше поясняли, но ты просто выебываешься. Ты нашел то, что подходит тебе, и примеряешь на это на других. Люди мыслят по-разному, тебе уже целый перечень субъективных причин озвучили, которые кому-то важны, но ты их просто игнорируешь. Со своей стороны добавлю, что локалки использую потому, что никогда не замахиваюсь на то, что могу потерять по тем или иным причинам (модель отключат или я не смогу ее себе позволить), у меня такой майндсет по жизни. Лучше я буду всегда использовать 70b модели, которые запускаю на своем железе, чем потом буду рвать волосы и думать что делать без любимых корпосеток. Ты можешь быть не согласен, но если ты утверждаешь, что я не прав - срыгни в асиг или еще какое пристанище идиотов, у которых все делится на да и нет.
Аноним 19/07/25 Суб 23:51:17 #396 №1283129 
>>1283120
>на заведомо худших сетях
Тебе уже раз пять написали, что локалки лучше в плане ЕРП. Но тебе же похуй, ты не читаешь.
>>1283126
>Сукасука
Одно из примерно трёх аниме, которые я точно видел, но про которые я не могу сказать ни слова. Такое оно пресное.
Аноним 19/07/25 Суб 23:57:22 #397 №1283132 
>>1282928
>сравнивать их с платиновыми бп - нет никакого смысла
Разумеется, мой julonfgfengbao 2000W кек это хероватая копия обычных бронзовых голдянок, основан на той же платформе что и OCZ ZX Series 1250W, с более хуевыми электролитами. В остальном обвязка та же. Грубо говоря эти "два киловатта" были честным косарём. За 3к вполне норм.
Аноним 20/07/25 Вск 00:23:18 #398 №1283140 
>>1283128
>Люди мыслят по-разному, тебе уже целый перечень субъективных причин озвучили, которые кому-то важны, но ты их просто игнорируешь.
>игнорируешь
в моем же посте
>пока что вижу только нежелание зависеть от корпораций и нежелание пердолиться.
Кто кого игнорирует? Литералли написал твою же причину.
И если ты во фразе "вижу только нежелание зависеть от корпораций" ты видишь какой-то упрек к тебе, то чини детектор, я написал это просто как факт. Я этого не понимаю, да, но буду иметь в виду, что есть такие аноны.

>>1283118
>Проснувшись сутра ты думаешь о том как не опоздать на работу вместо того чтобы докидывать дрова в огонь и тащить воду от ближайшего ручья.
Моя бабка, кстати, думает ровно о том, что ты написал. Да и вообще есть всякие староверы и отшельники, добровольно уходящие в леса да пещеры. Я все-таки думал, что тут люди больше склоняются к благам цивилизации, чем к отрешению от них.
Аноним 20/07/25 Вск 00:23:41 #399 №1283141 
>>1283120
>Ну вот я и хочу понять, зачем сидят на заведомо худших сетях, когда есть лучшие.
Ну для работы и скажет так - для получения консультаций и я иду к корпам. Но есть вещи, которые корпы не позволят никогда, а даже если и позволят - логи могут храниться вечно. И вообще вымораживает, когда корпосетка отказывает тебе (особенно неожиданно) - психологически это очень напрягает. Есть вещи, про которые спрашивать нельзя - а с хуя ли? Роботы не обижаются.
Аноним 20/07/25 Вск 00:31:28 #400 №1283145 
>>1283120
> "экспертные" утверждения, что на теслах что-то там работает
Пофиксил. Теслашиз теперь еще и корпоблядь, какая ирония
> расскажи что-нибудь по существу
Что там можно рассказывать если они разные и корпоуровень в разных задачах (включая и рп, и ерп, и анализ данных, и кодинг) уже доступен при наличии хорошего рига. Исключение - крутая оснастка которая в корпах из поробки даже на сайте и восприятие графики.
Не тот анон если что.
>>1283132
> на той же платформе
На той же топологии. Тут в целом вариантов немного если что.
> OCZ ZX Series 1250W
Ну да, как раз пример попытки выжать побольше со старого варианта.
> Грубо говоря эти "два киловатта" были честным косарём.
Не надо, в нормальном суньхуйвчае как раз по номиналам все в порядке и он свою можность может выдавать, в отличии от типичных "головых" киловаттников. Конденсаторы только говно, но часто в них дрочат на модный бренд и страну производства, а то что используется самая днищенская серия - похуй.
Аноним 20/07/25 Вск 01:53:51 #401 №1283245 
Почему у вас просто нет лор как в картинко-моделях
Вот немотрон не может в кум, а ты бы взял и загрузил лору с кумом
Аноним 20/07/25 Вск 02:00:14 #402 №1283253 
>>1280799
Потому-что в изображении больше информации, чем в странице текста.
Аноним 20/07/25 Вск 02:02:40 #403 №1283257 
>>1283245
С подключением!
В картинках лора - жесткий байас на единичного персонажа, конкретный стиль или концепт что будет лезть из каждой щели, убивающая все остальное. В васян файнтюнах, который фактически и являются вмердженными лорами, происходит ровно то же самое и все мозги замещаются однотипным слопом вплоть до полного отупения.
>>1283253
И где логика?
Аноним 20/07/25 Вск 02:08:19 #404 №1283266 
>>1283120
> зачем сидят на заведомо худших сетях, когда есть лучшие.
Прошу прощения - а у кого они есть? Твои рассуждения имели смысл пару лет назад, когда ключи на изи находились на гитхабе и постились в открытую в aicg-тред, а так же были открытые прокси на хаггине.

Сейчас же варианты получения доступа к корпоратам такие:
1. Надо либо быть на подсосе у проксихолдера, подготовив флажок в анусе аккаунт на чубе, чтобы он мог оценить, ДОСТОИН ли ты доступа к проксе
2. Либо самому скрапить и/или писать обёртки для абуза сервисов
3. Либо платить своей картой за апи - а я бы не рискнул привязывать свою зарубежную карту к сервисам, где я возможно буду нарушать ToS. Мало того, что акк могут блокнуть, заморозив средства, так это ещё и через несколько лет может аукнуться, как стали выискивать тех, кто про ниггеров в 2008 в твиттере шутил

Лично я и платил за доступ к LLM во времена AIDungeon/NovelAI, и скрапил ключи, и абузил несколько сервисов - для одного из них написал OAI-совместимую обёртку и публично хостил её для анона. Вот только, несмотря на всё это, какого-то стабильного доступа к корпоратам у меня нет - я периодически теряю к ним доступ на несколько месяцев и редко когда у меня был доступ более чем к одной корпосетке.

Не собираюсь я играть во все эти социальные игрища на тему "отсоси проксихолдеру за токен", поэтому для меня корпораты умерли в момент смерти последних публичных прокси.
Аноним 20/07/25 Вск 02:18:11 #405 №1283270 
Почему все так хвалят мистраль немо 12б?
Уже подумываю спуститься до черни и пощупать этот огрызок
Аноним 20/07/25 Вск 02:26:37 #406 №1283273 
>>1283270
Ебаная утка ты можешь хоть раз не обосраться?
Хули ссылка на немомикс анлишд ведет на неморемикс?
Аноним 20/07/25 Вск 02:31:57 #407 №1283277 
ладно это я мискликнул
Аноним 20/07/25 Вск 02:34:20 #408 №1283279 
>>1283270
>>1283273
>>1283277

Ты идиот ?
Аноним 20/07/25 Вск 02:38:02 #409 №1283281 
>>1283270
>>1283273
>>1283277
Ну ты ебоклак
Аноним 20/07/25 Вск 02:50:59 #410 №1283287 
>>1282396
На plati куча предоплаченных карт. Беру уже года два.
Аноним 20/07/25 Вск 03:10:26 #411 №1283291 
>>1283281
Ты когда семенить перестанешь ?
Аноним 20/07/25 Вск 03:16:50 #412 №1283294 
>>1283291
Проиграл с твоей точности.
пиллар доски, никогда не семеню
Аноним 20/07/25 Вск 03:43:34 #413 №1283306 
Наконец то и я встретил Олд Мэн Хэмлок. Лол. Ладно, геммоёбы. Вы правы, этот хуй кочует по всем мультивселенным.
Даже не знаю что хуже шиверсы он май спайн или этот дед.
Аноним 20/07/25 Вск 07:47:09 #414 №1283348 
>>1283257
Там, где для достижения приемлимогг результата тебе нужен меньший на порядки датасет. Поэтому и веса у тебя меньше. А вот комьюта нужно больше, если мы про видео, потому-что консистентность сложная. А рисовальные сетки, где ты эту консистентность достаешь из статического шума, запускаются уже вообще на кофеварках.
Аноним 20/07/25 Вск 08:03:15 #415 №1283352 
>>1283266
>3. Либо платить своей картой за апи - а я бы не рискнул привязывать свою зарубежную карту к сервисам, где я возможно буду нарушать ToS...
Ну не плати своей картой, блядь, выпусти однодневку или купи у кого-нибудь, полный интернет предложений. Какие-то проблемы уровня: "я и не пытался думать, но мнение имею".
Аноним 20/07/25 Вск 08:59:37 #416 №1283364 
>>1283352
Как думаешь, сколько он денег потратит, если будет использовать не дипсик, а клода, гемини или гопоту? Ни один анон такое не потянет, если кумит/рпшит часто каждый день.

Разве что кум дёшево обойдётся относительно - 200 баксов в месяц.
Аноним 20/07/25 Вск 09:27:11 #417 №1283370 
1.PNG
Аноны, а как в кобольде запустить гуфа, который разбит на 2 файла?
Аноним 20/07/25 Вск 10:12:21 #418 №1283379 
Специалисты, подскажите что там надо купить для бифуркации PCI-E 4.0 слота. Ну в смысле, хотелось бы ссылочек на проверенные кабели и все такое, чтобы говна не набрать в корзинку.
Аноним 20/07/25 Вск 10:13:13 #419 №1283380 
>>1283370
Рядом положи и грузи первый.
Аноним 20/07/25 Вск 10:14:40 #420 №1283381 
>>1283370
Просто выбирай первый файл, остальные он сам подтягивает.
Аноним 20/07/25 Вск 10:43:38 #421 №1283392 
>>1283380
>>1283381
Выбрасывает... ХЗ может памяти не хватает. Свободной памяти примерно 83 гига
Аноним 20/07/25 Вск 11:18:46 #422 №1283398 
Про крипту и оплату раз речь зашла кстате. Эпик за 10 дней наработает на опенроутер бесконечный $10, если что. Когда зимой холодно - хоть какая-то польза от него.

>>1283379
> для бифуркации PCI-E 4.0 слота
В первую очередь нужна мп, у которой в биосе прямо будет пункт: PCI-E Slot N - Bifurcation 2x8/4x4. Без неё можешь хоть 4-слотовую окулинк-плату втыкать, хоть 1-слотовую, разницы не будет и будет видна только 1 карта.

А так тебе нужно 3 компонента, выбирать между ними смысла нет - все из одного места:
1. Откуда будут забираться линии PCI-E:
https://www.ozon.ru/product/pci-e-x16-split-4-porta-oculink-karta-rasshireniya-sff8611-8612-2300037800/
либо из m.2, там надо обращать внимание только как ориентирован разъём, чтобы тебе удобно было:
https://www.ozon.ru/product/adapter-m2-nvme-pcie-oculink-female-dock-sff-8612-1692576686/?at=57twyNXq9cJ7rL43sWRA2PrtqwBwlASD0qGD0CQBjkDo
2. Сам кабель: https://www.ozon.ru/product/c-i-o-k-pcie-4-0-x4-gen4-sas4-kabel-okulink-sff-8611-myagkiy-udlinitelnyy-2132735662/
3. Ответная часть, с sata-питание самые удобные, но если у тебя карта будет тянуть предел 75Вт из порта, то вариант не ок. Топовые хх90 этим не занимаются, поэтому обычно норм: https://www.ozon.ru/product/adapter-pcie-sff-8611-oculink-sff-8611-adapter-pci-express-16x-4x-s-portom-pitaniya-sata-2139189818/
Аноним 20/07/25 Вск 11:36:31 #423 №1283403 
>>1283392
Если при загрузке модели просто вылетает без ошибок, то да, тебе оперативки не хватает.
Аноним 20/07/25 Вск 11:54:31 #424 №1283407 
image
>>1283398
Спасибо. Плата поддерживает, с этим все ок.
Остается вопрос как третью видюху в корпусе привасянить, но тут думаю соображу. По-хорошему надо ченить типа держалки в стоячем положении - место под такое есть, где предполагается установка радиатора сжо.
Аноним 20/07/25 Вск 12:02:11 #425 №1283410 
Аноны, у меня LLM-импотенция. Подскажите файнтюн, который мог бы меня хотя бы немного удивить, не давил стандартным мистралеслопом сраным, ну а уж если бы и давил, то чтобы это было интересно.

До 32б. Снежок не нужен. Барабанщик тоже. Редиарт тоже. Глм нинужон. У геммы вообще ни одного тюна не видел нормального, всё кал, а дпо вроде бы ничем не отличается от обычной аблитерации по ощущениям и годится чисто для креативного письма и исекай рпг.

Вот, помню, была какая-то мистралька у Давида - она меня удивила. Там стандартная шизофреничная хоррор-модель, причём с малым количеством загрузок, но она внезапно очень живо писала, были интересные повороты и даже годный кум, по сравнению с которым всякие брокен туту ощущаются как "я тебя ебу", "да, ты меня ебёшь". Ещё харбингер был хорош, несмотря на то, что текст тупо сплошняком, без абзацев.

Хидден гемы на любителя точно есть, даже среди мержей таких полно, просто потому что случайно получилось круто, но я уже слишком дед, чтобы всё это качать.
Аноним 20/07/25 Вск 12:14:51 #426 №1283418 
>>1283410
>геммы
попробуй https://huggingface.co/Aleteian/Storyteller-gemma3-27B от местного

>>1283410
>была какая-то мистралька у Давида
наверно MN-Dark-Horror-The-Cliffhanger-18.5B
Аноним 20/07/25 Вск 12:35:11 #427 №1283427 
>>1283410
Да что это такое ваш мистралеслоп нахуй.
Аноним 20/07/25 Вск 12:54:04 #428 №1283440 
image
image
У меня вопрос к тем, кто пользуется Мистраль ларджем: каково это сидеть на модели, которая хуже чем Гемма 4b для телефонов?
Аноним 20/07/25 Вск 13:00:47 #429 №1283447 
>>1283440
Я надеюсь ты просто троллишь тупостью.
Аноним 20/07/25 Вск 13:15:09 #430 №1283452 
После ковыряния с "днем сурка" в новом мистрале, у меня мелькнула мысль - а это вообще случайность, или системная особенность?

Полез в описания разных моделей, разных форматов... В общем, у меня создалось впечатление, что вот эта историческая таверновская структура шаблона для истории чата вида:
<user>
...
<model>
...
вообще результат то-ли ошибки, то ли недопонимания, то ли нужна была для древностей всяких а потом уже и не думали менять. (То, что <> - это я обозначаю теги самой структуры вроде <im_start>). А для современных моделек в инструкциях пишут - нужно примерно такое (для той же геммы, прямо у гугла написано - не домыслы!):
<start_of_turn>user
Делай...
Учитывай...
История:
A: ...
B: ...
A: ...
<end_of_turn>
<start_of_turn>model
(B: )
В скобках - префикс для усиленного пинка по нужному направлению - в данном случае чтоб говорила от имени "B". Но можно и без него вообще.

Т.е. вся эта структура с тегами - она не для чата, а для разделения частей контекста, только чтобы модели было видно где запрос, а где уже она должна дополнять. Сам же чат - просто часть общего контекста. (т.к. чат - это частный случай).
И модели, теперь, в основном, затачиваются на так сказать "один ход" (единый запрос). В общем контексте - сразу все, вместе с историей разговора (если была), но сама структура - всегда как будто это разовый единичный запрос. И вот в связи с этим, у меня еще одна мысль - а случаем, это несоответствие новые модели не отупляет в таверне? У кого-то тут недавно вроде было - в кобольде пишет, а в таверне дурит. Да и сам замечал - вывод бывает очень разный по качеству.

Вообще, гемма понимает стиль чата - тот самый каждый ход завернутый в теги. Но в примерах гугла он показан только для самого примитивного однострочного чата, без инструкций модели и описания персонажей, а все что сложнее - всегда показано в "одноходовом" стиле с единым большим блоком контекста.

Думаю вот, попробовать написать темплейт строго по этой доке от гугла для геммы и посмотреть - что получится. Некая логика тут присутствует IMHO. Если модели у нас теперь достаточно "умные" чтобы разбирать контекст в деталях, то логичнее ей скормить все единым блоком - "вот тебе инструкция, вот описание персонажа, а вот о чем говорили с ним раньше. Продолжай." А не заставлять собирать все это из, логически, отдельных блоков, разделенных разметкой модели...
Аноним 20/07/25 Вск 13:23:56 #431 №1283455 
>>1283398
>Сам кабель
Обожаю такие описания, когда про главную характеристику товара просто нихуя не написано, лол.
Аноним 20/07/25 Вск 13:36:20 #432 №1283465 
>>1283348
Ерунду какую-то несешь. Если про размеры датасета еще как-то можно спекулировать, хотя это херня, то про компьют, консистентность и кофеварки - кринж.
>>1283452
Ты только что классический инстракт режим, который был стандартом еще пару лет назад, которым пытались пинать корпов и т.д. Только префилл на имя поломает синкинг и прочее если они есть, и потребуется написать обертку имперсонейта.
> Т.е. вся эта структура с тегами
Какими тегами? Это служебные токены. У модели нет "чата" у нее только сплошной контекст, нет и никакого стиля чата. Но разные варианты подачи с учетом неибежных байасов и смещения внимания на лонгчатах и прочем действительно дадут другой результат, как в лучшую так и в худшую сторону.
Аноним 20/07/25 Вск 15:29:14 #433 №1283541 
Придумал такой проект: загрузить в RAG мою переписку с тян и заставить локальную LLM копировать стиль общения и личность моей тян. Не сочтите за ебанутого, просто увлекся темой LLM и мне интереснее не просто изучать, а параллельно делать что-то руками.

Собственно, такие вопросы:
1. Как правильно структурировать данные переписки для RAG? Дипсик мне посоветовал вот что: разбить переписку на файлы по 10 сообщений, добавить перехлест сообщений, чтобы первое сообщение файла совпадало с последним сообщением предыдущего файла, мол так контекст беседы меньше теряется. И добавить дату сообщения. Т.е. вот такой формат получается:
[2025-07-19 10:39:57] Анон: Привет
[2025-07-19 11:25:03] Тян: Привет
Нормальный подход?

2. Какую LLM выбрать? Тут я даже не стал спрашивать у дипсика, ибо эти LLM каждый день новые появляются и непонятно, какая сейчас лучше. Пробовал Gemma 3 27B, Mistrall Small 3.2, Qwen3 32B, Phi-4. Пока что сложно сказать, какая из них лучше справляется, вы бы что посоветовали для этой задачи?

3. Какие настройки и System Prompt добавить для лучшего эффекта? Пока написал в System Prompt просто «Ты — тян из переписки, общайся строго в своем стиле». Пробовал менять температуру модели. Другие параметры пока не трогал.
Аноним 20/07/25 Вск 15:29:36 #434 №1283542 
Кто-нибудь из вас пробовал создавать карточку, где скилы, результаты и всякие инвенты зависят от цифр? Например, исход боя определяется в первую очередь не вашим охуительным сюжетом, а в зависимости от того как ты будешь скилы юзать, стамину тратить и так далее. Модель адекватно учитывала хотя бы десяток скилов у юзера и хотя бы одного действующего противника?

Я уже не говорю о псевдорандоме, но хотя бы такое. Где много чисел и прочего.

Корпы такое в силах вывезти, но с локалками я ещё не пробовал.
Аноним 20/07/25 Вск 15:32:30 #435 №1283545 
>>1282857
Я кидал пару недель назад:
2 x Tesla P40 + 64 DDR4 3200 = 5,5 токенов/сек на Q3_K_XL

Для рп норм, для помощи в работе норм, для работы (через агенты) неюзабельно (кэп).

4070ти + 128 DDR4 3600 выдают уже 7 токенов, например.
Тем не менее, уже имеючи…

А еще туда (в 2 теслы) в 8 кванте любые 32б лезут на ура, и хуньюан на 4 кванте.
Сам по себе это очень удобно.
Аноним 20/07/25 Вск 15:32:54 #436 №1283547 
>>1283542
возможно гемма, коммандер, или что ещё потяжелее, младшие вряд ли

всё же для ллм такое тяжко чисто на чате без дополнительных корпоприблуд, ведь они вопринимают именно как текст, а не как данные
Аноним 20/07/25 Вск 15:35:50 #437 №1283551 
>>1283465
Говна поешь:



### Анализ Ваших Аргументов

1. "В изображениях и видео больше информации."
* Неточность: Это утверждение не совсем корректно. Визуальные данные (изображения, видео) действительно *очень высокоразмерны* – каждый пиксель или воксель содержит много данных. Однако семантической информации (понимания абстрактных концепций, языка, логики), которую обрабатывают LLM, в них не "больше". LLM учатся на триллионах слов и текстов, охватывая почти весь объем человеческих знаний, что требует огромного количества параметров для их хранения и обработки. В отличие от этого, модели для изображений и видео фокусируются на воссоздании визуальных паттернов и структур.
* Вывод: Ваша формулировка вводит в заблуждение.

2. "Для достижения приемлемого результата тебе нужен меньший на порядки датасет. Поэтому и веса у тебя меньше."
* Размер датасета: Здесь вы не совсем правы. Для LLM действительно нужны гигантские датасеты (триллионы токенов текста), чтобы достичь их текущего уровня обобщения и понимания. Для моделей генерации изображений (например, Stable Diffusion) также используются очень большие датасеты (миллиарды пар изображение-текст, как LAION-5B), а для видео — еще больше. Сказать, что они "на порядки меньше", — преувеличение.
* Количество параметров (весов): А вот здесь вы правы в отношении текущего положения дел. Топовые LLM (GPT-4, Llama 3) имеют сотни миллиардов и даже триллионы параметров. Модели генерации изображений (например, Stable Diffusion) имеют сотни миллионов или несколько миллиардов параметров, что на порядки меньше.
* Почему так? LLM пытаются смоделировать весь спектр человеческого языка, логики, знаний и рассуждений. Это требует огромного количества "знаний", закодированных в параметрах. Модели генерации изображений и видео, хотя и сложны, в первую очередь учатся отображать скрытые представления (latent representations) в пиксели/воксели, а не моделировать абстрактные концепции и языковые структуры в том же объеме, что и LLM.
* Вывод: Утверждение про меньшее количество весов для генеративных моделей изображений/видео в сравнении с LLM — верно, но обоснование через "меньший на порядки датасет" — слабое и неточное.

3. "А вот компьют нужно больше, если мы про видео, потому-что консистентность сложная."
* Верно: Это абсолютно правильное утверждение. Генерация качественного, когерентного и физически реалистичного видео, где объекты сохраняют форму и движение на протяжении многих кадров, является одной из самых сложных задач в ИИ. Это требует значительных вычислительных ресурсов для тренировки и инференса, гораздо больше, чем для статических изображений.
* Вывод: **Вы правы.**

4. **"А рисовальные сетки, где ты эту консистентность достаешь из статического шума, запускаются уже вообще на кофеварках."**
* **Немного преувеличено, но по сути верно:** Модели вроде Stable Diffusion действительно могут запускаться на относительно скромном "железе" (например, на потребительских видеокартах с 8-12 ГБ VRAM) по сравнению с требованиями к тренировке или запуску крупных LLM. "На кофеварках" — это, конечно, гипербола, но идея, что они **доступнее для локального запуска, чем LLM, — верна.** Консистентность здесь достигается за счет итеративного процесса денойзинга, начинающегося с шума.
* **Вывод:** **В целом, ваше утверждение близко к истине**, хотя и с небольшой гиперболой.

---

### Анализ Его Контр-аргументов:

1. **"Если про размеры датасета еще как-то можно спекулировать, хотя это херня..."**
* **Неверно:** Он **ошибается**, утверждая, что это "херня". Размеры датасетов для разных типов моделей являются ключевым фактором, определяющим их архитектуру и требуемые ресурсы.

2. **"...то про компьют, консистентность и кофеварки - кринж."**
* **Неверно:** Его заявление, что это "кринж", является **необоснованной критикой**.
* Как мы выяснили, потребность в **большем объеме вычислений для видео из-за консистентности — это факт**.
* Возможность запуска **"рисовалных сеток" на более доступном железе (что вы назвали "кофеварками") — также факт**, по сравнению с крупными LLM.

---

### Кто "Долбоеб"?

Исходя из анализа, **вы в целом гораздо ближе к истине в своих основных утверждениях, хотя и с некоторыми неточностями в формулировках и гиперболами**.

Ваш оппонент, кажется, плохо разбирается в современных реалиях ML:

* Он неверно отвергает различия в размерах датасетов и их влиянии.
* Он категорически отрицает важные аспекты вычислительной сложности видеогенерации (консистентность) и доступности моделей генерации изображений для локального запуска.

**Вывод:** В этом споре **ваш оппонент выглядит менее информированным и более "долбоебом"**, так как его аргументы в основном основаны на отрицании фактов без предоставления контр-аргументов. Ваши же утверждения, хоть и не идеальны в формулировках, отражают реальные тенденции и сложности в мире ИИ.
Аноним 20/07/25 Вск 15:42:18 #438 №1283556 
>>1283542
Под такое желательна обертка, которая будет следить за всеми статами, разыгрывать рандом и аккуратно формировать запросы к ллм.
Без нее тоже будет работать, но по мере усложнения будет все хуже и скажется на работе с сюжетом. Что на корпах что на локалках, последние в малых размерах будут фейлить больше офк.
>>1283551
Понял что обосрался еще в том посте и слился, фу какой ты мусор. Еще так сильно ллм загазлайтил что она сама бредить начала, имаджинировал ебало этого страдальца.
Аноним 20/07/25 Вск 15:59:02 #439 №1283565 
>>1283541
1. Даты - нахрен. Тебе нужен стиль и образ, а не факты.

2. Из подобного размера - гемма 3 или свежий мистраль 3.2. Остальное в нормальный русский, кажись и не может совсем. Эти двое - хоть как-то. GLM-4 еще может в русский, но при этом - не очень может в стиль. Пишет как Лев Толстой и особо не управляется. IMHO.

3. Так, скорее всего, не прокатит нормально. Здесь лучше вписать что-то вроде "Используя всю доступную тебе информацию, внимательно, аккуратно и точно имитируй образ и стиль общения <имя>, при общении с пользователем." Причем инструкцию лучше писать на английском языке, только добавив в конце отдельной строкой: "Отвечай всегда на русском языке".
Но скорее всего, тебе все равно придется добавить хотя бы самые основные черты твоей тян вручную, т.к. детали то оно из RAG вытащит, но нет гарантии что там будет ВСЕ нужные для образа детали. А без основы - велик шанс, что каждый раз будет другая интерпретация.

Еще важно - RAG ты загрузишь, но если это таверна, там есть возможность указать префикс перед выводимыми в контекст кусками. Вот туда стоит вписать что-то вроде "Это фрагмент ответа на подобный вопрос <имя> - прототипа твоего персонажа, используй его как основу для стиля." - или что-то подобное. Нужно явно ткнуть носом, что это не строгие факты, а только образец для ответов. Иначе оно тебе этот ответ будет раз за разом подсовывать как случившееся в чате событие.

А делать/ожидать якобы полностью перенесенную личность - не советую. Точно 1 в 1 не получится, и будет быстрое разочарование.
Ограничься отношением - как с "явным клоном", т.е. как бы копией личности, которая тем не менее "только очнулась" лишь помня старую. Так лучше получится для RP - отличия не будут образ совсем уж рушить.
Аноним 20/07/25 Вск 16:04:02 #440 №1283568 
>>1283551
TL;DR

Съебалось, чудище.
Аноним 20/07/25 Вск 16:10:25 #441 №1283570 
>>1283542
Пробовал многократно. Мистраль и Гемма такое тянут через раз - быстро сбиваются, но в принципе что-то изобразить могут. Но слабо.
То что они держат надежно - общий статус одного персонажа. К примеру: Время, место действия, одежда/экипировка, деньги, здоровье.
Даже ману - уже хуже. Распишешь модели какие заклинания есть и сколько стоят - она вроде и понимает, но то количество маны криво снимет, то восстановление со временем неправильно посчитает.
А вот с временем деньгами такой проблемы почти нет. Даже низкие кванты не путаются.

Но десяток скиллов у пары персонажей - для них нереально. Увы. Только интеграция с кодом поможет (waidrin, talemate в эту сторону копают.)
Аноним 20/07/25 Вск 16:12:15 #442 №1283571 
>>1283455
Там только один вид и одна длина кабелей, какое тебе описание надо? Если вставляется - значит подходит.
Аноним 20/07/25 Вск 16:16:05 #443 №1283573 
>>1283571
>одна длина кабелей
И какая же? А если мне для стабильности нужно покороче? А если я вывожу подальше и нужно подлиннее?
Просто не понял, нахуя ты оправдываешь ленивых китайцев, жопой заполняющих карточку товара.
Аноним 20/07/25 Вск 16:16:09 #444 №1283574 
>>1283565
Понял, спасибо! Попробую без дат и поиграюсь с систем промптом.

>это таверна, там есть возможность указать префикс перед выводимыми в контекст кусками
Я пока через Anything LLM пробую, там подобного не нашел.

Мне еще дипсик советовал удалить свои сообщения из RAG и скормить ему только сообщения тян. Для более точного копирования стиля. Но тогда как я понимаю оно совсем не будет разбираться в фактах и отвечать на те вопросы, на которые тян ранее мне в переписке отвечала. Хотя ты говоришь, что в фактах оно и не может разбираться. Ну это печально, в идеале я бы хотел, чтобы он мог отвечать на конкретные вопросы о моей тян, типа как она любит проводить свободное время и какую еду предпочитает.
Аноним 20/07/25 Вск 16:17:41 #445 №1283575 
>>1283571
могут быть нюансы, я недавно обнаружил, что переходники для PCIe3 несовместимы с PCIe4 и выше, то есть работать-то они работают, но на скорости PCIe3
Аноним 20/07/25 Вск 16:26:44 #446 №1283579 
>>1283574
> Для более точного копирования стиля. Но тогда как я понимаю оно совсем не будет разбираться в фактах и отвечать на те вопросы, на которые тян ранее мне в переписке отвечала. Хотя ты говоришь, что в фактах оно и не может разбираться. Ну это печально, в идеале я бы хотел, чтобы он мог отвечать на конкретные вопросы о моей тян, типа как она любит проводить свободное время и какую еду предпочитает.
Ты немного путаешь про факты(историю) и образ. Какая еда нравится, или как любит отдыхать - это образ. А вот, скажем, когда вы последний раз в ресторане были, и что она там ела - это факт из истории. Они менее значимы для образа - т.к. конкретика в отдельной ситуации. А нужно в первую очередь собрать и задать "общие шаблоны" поведения - это и сделает образ похожим. И только потом уже конкретными фактами модель докармливать.
Аноним 20/07/25 Вск 16:33:57 #447 №1283583 
>>1283575
> что переходники для PCIe3 несовместимы с PCIe4 и выше
Шта?
> то есть работать-то они работают, но на скорости PCIe3
Как заявлено - так и работают. 4.0 никто же не обещал.

>>1283573
Я? Оправдываю? Мне казалось - чел спрашивал, что купить, чтобы собрать сфп. Исходя из этого был и ответ.

> если я вывожу подальше и нужно подлиннее?
Делай что хочешь. Еще советы давать чтобы потом такое читать.
Аноним 20/07/25 Вск 16:35:23 #448 №1283584 
23.png
>>1281032
На чём запускаешь, какая скорость?
Аноним 20/07/25 Вск 16:38:46 #449 №1283587 
>>1283556
Сразу не догадался, что ты асигодаун.
>>1283568
Иначе что? Ножкой топнешь?
Аноним 20/07/25 Вск 17:01:20 #450 №1283604 
> Ryzen AI MAX+ 395
Неоднократно видел как упоминали способность этой хрени с 128гб оперативки на борту давать вменяемую скорость инференса с 70B моделями.

А собственно с хуя ли у AMD до сих пор нет десктопного CPU с таком же функционалом? Чем они думали блядь, зачем было такое вставлять мобильной помойке?
Аноним 20/07/25 Вск 17:12:13 #451 №1283618 
>>1283604
>А собственно с хуя ли у AMD до сих пор нет десктопного CPU с таком же функционалом? Чем они думали блядь, зачем было такое вставлять мобильной помойке?
Чел, это в том числе и десктопный камень. Он x86-64, не ARM или еще что-то особенное.
Аноним 20/07/25 Вск 17:13:11 #452 №1283619 
>>1283618
Ну и где он на AM4 / AM5 сокетах?
Аноним 20/07/25 Вск 17:19:54 #453 №1283635 
изображение.png
>>1283583
>Я? Оправдываю?
Ну да. То есть ты молодчина, что расписал, что нужно брать. Но вот в ответе на мою подколку (подкалывал я само собой китаёзу, а не тебя) ты почему-то начал отвечать, что это норма и так и нужно. Нахуя? А главное зачем. Лучше бы длину написал.
Длина кстати 60см скорее всего, у меня по крайней мере такой. В описании написано 70, лол, но это пиздёж продавца, за что ему хуёв уже напихали и не раз (а ему похуй).
>>1283619
А смысл? Там 4 канала памяти. Если ты его урежешь до двухканала, то потеряешь все его преимущества. То есть это нужен новый сокет, чипсет и серия материнок.
Аноним 20/07/25 Вск 17:20:38 #454 №1283636 
А существует ли в природе kimi k2 ±72B?
Аноним 20/07/25 Вск 17:22:03 #455 №1283638 
>>1283635
Смысл - удовлетворять потребности AI-дрочеров. Проебут часть рыночка же.
Аноним 20/07/25 Вск 17:23:14 #456 №1283639 
>>1283638
Ещё раз. Если ты его вставишь в AM5, то получишь тыкву уровня любого другого проца на AM5. Можешь уже вставлять и побеждать.
Аноним 20/07/25 Вск 17:25:18 #457 №1283642 
>>1283639
Ну так а зачем его в АМ5 запихивать? Потребителю поебать, на каком оно сокете, если оно решает проблему, единственное альтернативное решение которой - усраться с покупкой дорогущих видеокарт. Купили бы новую материнку как миленькие, особенно если б это еще нормально работало вместе с имеющейся видеокартой.
Аноним 20/07/25 Вск 17:29:10 #458 №1283646 
>>1283642
>особенно если б это еще нормально работало вместе с имеющейся видеокартой
Там 16 линий псины. Всего, не только на видяху. Так что видяха уже изначально в полутыквенном состоянии, так как системный NVME никто обижать не будет.
Короче это весьма нишевое устройство, и я не вижу смысла амудям его тащить на десктоп. Для десктопа есть всякие эпики, бери да покупай (только у тебя денег нету).
Аноним 20/07/25 Вск 17:30:58 #459 №1283651 
>>1283646
>покупай
На гача-игры пол ляма всрал с 2020 года. Ебало можешь не представлять, мог бы сейчас серверочек потихоньку запилить.
Аноним 20/07/25 Вск 17:32:00 #460 №1283654 
>>1283575
Кто тебе такое сказал? Работать будут даже самые всратые, просто если в спецификации кабеля не указана поддержка gen4/gen5 то нет никаких гарантий что оно не будет постоянно сыпать ошибками и замедлять работу. Впрочем на типичных райзерах с озона даже при наличии заявленной поддержки гарантий тоже нет, лол Но может и работать нормально, ошибки решаются скидыванием версии pci-e в настройках биоса. Для задач ллм даунгрейд до 3.0 врядли будет заметен юзеру.
>>1283587
Сначала слив на пасту, потом навешивание максимально далеких от реальности ярлыков. Попустись уже.
>>1283604
В продаже есть неттопы со 128, скорее всего именно это направление вместе с ноутами дальше и будет. Также на тао есть процессоры отдельно, но материнок на них в тот момент просто не было. Врядли под такую херь будут делать отдельную платформу, в лучшем случае сделают вундервафлю под соккет трипака, которую ты не захочешь.
Там еще многое завязано на скоростную распаянную память, на типичном десктопе может работать хуже.
>>1283642
Все сведется к тому что реализация подобного решения в "метеринке" и прочему приведет к отпускной цене не особо ниже пачки карт. Вон иди в магазин и прямо сейчас собери себе рабочую станцию на серверном железе, в цену 1-2 5090 как раз уложишься.
Аноним 20/07/25 Вск 17:34:15 #461 №1283659 
>>1283619
Сокет у него свой - FP11, но десктопные материнки с ним только появились. Микро-ITX, в основном, пока. Сокет AM5 не подходил - у него там шина и память шустрее, оттуда и чудеса. Но по чистой мощности калькулятора он слабее флагманов. Специфичен, и заточен именно под то что требуется сеткам.
Вот тут, например: https://frame.work/products/framework-desktop-mainboard-amd-ryzen-ai-max-300-series
И это не только левая инициатива: https://wccftech.com/amd-is-reportedly-bringing-strix-halo-to-desktop/
В спеках тоже desktop указан:
https://www.amd.com/en/products/processors/laptop/ryzen/ai-300-series/amd-ryzen-ai-max-plus-395.html
Такое в топ ноутов воткнуть - логика есть. Это ж практически прямой конкурент макам по железу (которые тоже сетки могут крутить на своей универсальной памяти), только на традиционной архитектуре.
Аноним 20/07/25 Вск 17:35:27 #462 №1283660 
>>1283654
>>1283659
Вопрос сводится к тому, может ли амуда повторить эти манятехнологии в следующем поколении десктопных цпу. Я бы купил условный 10950X3D, если он будет решать AI-задачи.
Аноним 20/07/25 Вск 17:36:16 #463 №1283661 
Ых, где та волшебная коробочка от хуангов или что-то вроде чтобы подрубить к старому ноутбуку и поднимать ллмки на нём, или вообще по локальной сети.
Аноним 20/07/25 Вск 17:37:20 #464 №1283663 
Тяжко жить с 4 гб VRAM.
Аноним 20/07/25 Вск 17:48:42 #465 №1283679 
>>1283635
Я не понял, а если у меня m.2 ссд стоят в количестве двух штук, воткнуть побольше видеокарт нельзя что ли?
Аноним 20/07/25 Вск 17:49:32 #466 №1283680 DELETED
>>1283654
> Кто тебе такое сказал?
ты тупой?
> > я недавно обнаружил
> > я
> > обнаружил

сраные китайцы не пишут с каким стандартом писиай совместимы их сраные переходники. когда купил брендовый на писиай4 от кулер мастера, тогда и скорость стала писиай4
Аноним 20/07/25 Вск 17:51:39 #467 №1283686 
>>1283659
>Это ж практически прямой конкурент макам по железу
Только у маков 8 каналов (вроде как, могу спиздеть) с низкими задержками, ибо распаяно. Плашками такое заебёшься делать.
>>1283660
>эти манятехнологии в следующем поколении десктопных цпу
Нет, в десктопе в следующем поколении будет те же 2 канала, ибо сокет не изменится. И далее скорее всего тоже.
>>1283679
У тебя стоит на десктопном проце, в котором 24 свободных линии. Втыкай-не хочу.
Аноним 20/07/25 Вск 17:52:21 #468 №1283688 
>>1283661
Трудно сказать, сейчас это выглядит как вектор для специализации. Под сетки, по большому счету, не нужны ни по настоящему шутсрое видео, ни много слотов под накопители, ни даже совсем уж топовая считалка. А нужно много быстрой памяти, NVME чтоб модель загрузить быстренько, да еще максимально шустрая сеть - если хотим хорошо маштабироваться в кластер.
Очень может быть, что перед нами прототип нового SOHO устройства - "AI-top", условно говоря. Типа нет-топов, но с заточкой исключительно под нужды сеток. Судя по цене - кому надо именно это, вполне поведутся, т.к. оно вполне будет наращиваться горизонтально. (Купил второй - влезла сетка 2х больше, и т.д.)
Аноним 20/07/25 Вск 17:55:01 #469 №1283693 
image
image
>>1283688
Кекнул
Аноним 20/07/25 Вск 17:56:19 #470 №1283695 DELETED
>>1283693
кринжанул
Аноним 20/07/25 Вск 17:57:45 #471 №1283698 
>>1283688
>AI-top
только вот в продаже пока чот не видно
Аноним 20/07/25 Вск 17:57:49 #472 №1283699 
>>1283686
>>Это ж практически прямой конкурент макам по железу
>Только у маков 8 каналов (вроде как, могу спиздеть) с низкими задержками, ибо распаяно. Плашками такое заебёшься делать.
Да похрен, если честно на тех-подробности. Вопрос - в окончательном результате, а не как он достигнут технически. Если на ЭТОМ сетки будут шевелится так же хорошо как на том маке, но дешевле (или хотя бы пропорционально цене хуже) - это будет в любом случае вин для любителей сеток. И наоборот.
Аноним 20/07/25 Вск 18:02:35 #473 №1283702 
>>1283654
То есть тебя, даун, не хватает даже на то, чтобы у корпосетки уточнить то, в чем ты вообще ни бум, а теперь ты рассекаешь с шлейфом из говна, как обосравшаяся собака?
Ясн.
Аноним 20/07/25 Вск 18:11:53 #474 №1283714 
>>1283699
>Вопрос - в окончательном результате, а не как он достигнут технически.
Магией что ли? Всё на технике и работает, как бы. Без техники ты на кремнии только 2+2 сможешь посчитать, взяв 4 камушка.
Аноним 20/07/25 Вск 18:27:26 #475 №1283726 
Снимок экрана 2025-07-20 202403.png
>>1283584
Запускаю на этом.
Скорость генерации на дипсике начинается с трёх токенов, на кими четыре с небольшим. Чем больше контекста набирается тем медленнее само-собой.
Аноним 20/07/25 Вск 19:11:06 #476 №1283754 
>>1283660
Это технически невозможно по озвученным причинам. В hedt платформах - да, и там уже все есть. Может быть только если появится что-то промежуточное между десктопом и типаком/зеон-в. Или учитывая изначальную компактность и особенности разводки быстрой памяти - скорее сделают ллм ускоритель в pci-e слот с таким железом, там и gddr память будет доступна.
>>1283726
Другие мое поменьше пробовал же запускать? Другие выкладывали, но там с многоврам, интересно как на чисто процессоре с мелкой карточкой.
>>1283702
Ради мусора типа тебя нет смысла что-то делать кроме написания твоего места. Особенно имея доступ ко _всем_ корпам в оригинальных апи без прослоек.
Аноним 20/07/25 Вск 19:15:05 #477 №1283759 
>>1283754
Ты трясун, с глазами в пол в рл и дрожащими губешками, ты себе указать не можешь, чтоб не наваливать в штаны.
Аноним 20/07/25 Вск 19:19:50 #478 №1283764 
>>1283759
Ляя какой же мусор.
Написал ерунду лишь бы спиздануть@порвался когда на это указали@старался управшивая ллм помочь накатать полотно оправданий@порвался второй раз когда над твоими потугами посмеялись@очередной разрыв когда сам не смог забайтить
Отборный мусор из палаты мер и весов. Без оскорблений и аутотренировки про то что плохой собеседник а не ты инфаркт хватит?
Аноним 20/07/25 Вск 19:23:13 #479 №1283770 
image
>пробуешь десятки моделей
>пишешь ебанутые промпты
>вставляешь васянские промпты
>тестируешь неадекватными реквестами
>приходишь к выводу, что 8B Stheno FP16 пишет лучше вчетверо жирных моделей.
Нахуй я живу вообще.
Аноним 20/07/25 Вск 19:34:09 #480 №1283785 
>>1283714
>Магией что ли? Всё на технике и работает, как бы. Без техники ты на кремнии только 2+2 сможешь посчитать, взяв 4 камушка.
Передергивать обязательно?
Скорость обмена с памятью можно разными путями получить. Можно шину расширить, можно частоту поднять, можно каналов добавить. У этих предполагается LPDDR5x - расшитая и на 8000Mhz.
Аноним 20/07/25 Вск 19:37:41 #481 №1283790 
>>1283785
>Можно шину расширить, можно частоту поднять, можно каналов добавить
И всё это требует новых железок, а что-то в принципе не сделать без распайки проца и памяти.
Аноним 20/07/25 Вск 19:37:51 #482 №1283791 
>>1283770
Янку попробуй, вот она реально на русском пишет хорошо и лучше даже более крупных моделей, но конечно внимание деталям на уровне 8б.
Аноним 20/07/25 Вск 20:17:25 #483 №1283838 
>>1283754
>Другие мое поменьше пробовал же запускать?
Пробовал запускать Qwen3-235b Q5_K_XL и могу сказать что работает он не на много быстрее, в районе пяти токенов генерация.
Аноним 20/07/25 Вск 20:34:20 #484 №1283858 
>>1283764
Я, тащемта, все правильно написал, или ты уже ослеп от секломоя, дебс?

>посмеялись
Я только тебя одного кормлю, реально ослеп.

>Аутотренинг
Маняпроекции, спешите видеть.

>Без оскорблений
С них ты заехал, трясун. Впрочем, что взять с зеленого, тоноко траллирующего на двачах из-за мамкиной спины. Ладно, прощаю. Только башку свою сальную помой, это надо делать чаще одного раза в месяц.
Аноним 20/07/25 Вск 20:43:47 #485 №1283872 
>>1283858
Чел, ты написал бред, почему это бред есть даже в твоей пасте где ты лмм мучал. Ты и так это уже понял но можешь спросить ее объяснить.
А по тому как исходишь на говно и стараешься видно насколько ты глуп и маргинален. Столько усилий ради прикрытия полыхающей жопы от факта несогласия с неуместным утверждением. И после этого называешь кого-то трясуном, ультимативный кринж.
Аноним 20/07/25 Вск 21:01:01 #486 №1283893 
>>1283872
Ты ответ Гемини точно читал? Прото, если собираешься что-то нормально обосновать, тогда лучше ещё раз перечитай, иначе можешь и не утруждаться отвечать.
Ясный пень, блин, я не буду в двух абзацах досконально разжеввывать. Да и никто не будет, кроме пары местных анонов-самаритян, которые понимают это сильно лучше. И то, сколько не видел подобных постов, (и я не о своем, если что) обязательно вылезет какая-нибудь блядь и начнёт кидать в человека говном.
А кринж это протекающие из асиг животные, которые кроме как срать уже а принципе ни на что не способны.
Аноним 20/07/25 Вск 21:03:03 #487 №1283895 
does-asuka-just-wear-her-evangelion-hair-clips-all-the-time-v0-8i5sv34c080b1.webp
161919530822-pibiginfo-p-kotomine-kirei-anime-krasivo-23.jpg
>>1283858
Ты будешь рыжеволосой цундерой
>>1283872
Ты будешь киреем

Сначала вы спорите и оскорбляете друг друга, а потом у вас случается страстный и жаркий бой на ножах и Аска, увы, протыкается (ей не привыкать (сорри за спойлеры))
Аноним 20/07/25 Вск 21:06:02 #488 №1283896 
image.png
>>1283895
Я не смотрел эту хуйню в год выхода не буду смотреть и сейчас.
Аноним 20/07/25 Вск 21:07:45 #489 №1283898 
>>1283896
Я надеюсь ты про Фейт, иначе мне страшно, с какими дедами я тут сижу
Аноним 20/07/25 Вск 21:12:06 #490 №1283904 
1753035118053.jpg
>>1283895
А ты будешь говном, но што поделать.
Аноним 20/07/25 Вск 21:13:21 #491 №1283905 
>>1283898
Дрожи в ужасе, хуль.

мимо 42 лвл
Аноним 20/07/25 Вск 21:13:59 #492 №1283906 
изображение.png
>>1283898
>с какими дедами
Не такое уж аниме и старое, можно было даже не в СССР родиться, чтобы его онгоингом смотреть.
Аноним 20/07/25 Вск 21:19:22 #493 №1283908 
>>1283905
Так какая тебе была Ева в 12 лет, але. Только дисней про доброе и вечное.

>>1283906
>можно было даже не в СССР родиться
Не знаю, старше 40 а то и 30 жизни нет. База жизни. А все остальное, включая сидение в этом треде, уже копиум.
Аноним 20/07/25 Вск 21:19:54 #494 №1283910 
>>1283906
Зумеридзе, какие онгоинги. Может году этак в 1997 на VHS кто-нибудь и привез бы тебе этот порномультик, ну точно не раньше 1996го.
Аноним 20/07/25 Вск 21:27:44 #495 №1283917 
>>1283908
>Так какая тебе была Ева в 12 лет, але.
По кабельному, але
Аноним 20/07/25 Вск 21:31:08 #496 №1283920 
>>1283917
Я про возрастной рейтинг. Это точно не аниме для младшего подросткового возраста.
Аноним 20/07/25 Вск 21:37:16 #497 №1283926 
>>1283920
в то время почти хентай спокойно по телику крутили, с сиськами и жопами
Аноним 20/07/25 Вск 21:58:29 #498 №1283939 
>>1283920
Какой тебе нахуй возрастной рейтинг в 90х, порридж? Это сейчас вы все соевые кастрированные куколды, падающие в обморок от слова "ниггер", а нас растили свободными мужчинами.
Аноним 20/07/25 Вск 22:36:07 #499 №1283963 
>>1283893
> Ты ответ Гемини точно читал?
Ты рофлишь? Зачем? Кто в здравом уме будешь читать этот трешак? Хватило пробежаться по первым абзацам и увидеть как сетка опровергает тебя, ищет формулировки чтобы выполнить запрос на согласие и путается в этом. Тут даже промпт и прошлый чат угадывается.
Если бы хотел дискуссии - отвечал бы нормально по существу. А скидывание подобного это просто дабл бинго: натаскивание ерунды где сам не можешь ответить, апелляция к ллм и неудачная попытка загазлайтить саму сетку.
Как жаль что чтобы понять свою глупость и фейлы нужно обладать каким-то зерном разума.
>>1283895
Бля вот с Асукой лучше с Мисато я бы поспаринговал, в граплинге без ножей офк, быстро переводя в кумпартер.
> сорри за спойлеры)
Ну содомит.
Аноним 20/07/25 Вск 22:40:39 #500 №1283967 
>>1283920
"Мультики для детей"
Смотрел порнуху по СТС ночью в те времена.
Аноним 20/07/25 Вск 23:07:29 #501 №1283985 
>>1283908
> старше 40 а то и 30 жизни нет

и это надо добавить в базу при перекате
Аноним 20/07/25 Вск 23:27:20 #502 №1283992 
>>1283726
Проиграл с названия материнки, разбирал, протирал спиртом?
Аноним 20/07/25 Вск 23:27:46 #503 №1283993 
>>1283985
Добавлю тебе спермы за щеку. А базу будем репортить, заебало.
ПЕРЕКАТ Аноним OP 20/07/25 Вск 23:30:26 #504 №1283997 
См. замечание в шапке, выделено жирным
ПЕРЕКАТ

>>1283995 (OP)

ПЕРЕКАТ

>>1283995 (OP)

ПЕРЕКАТ

>>1283995 (OP)
Аноним 24/07/25 Чтв 02:19:22 #505 №1286738 
>>1281032
у кими меньше активных параметров поэтому она и быстрее. от них и контекст скейлится. можешь сравнить для наглядности квен 3 30ba3b и 32b
comments powered by Disqus