Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №209 /llama/

Аноним 29/03/26 Вск 22:18:49 #1 №1566447

Llama 1.png

Эффективность квантования EXL3.png

Реальная длина контекста у моделей 5.png

17704524124420176296.jpg

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1564094 (OP)
>>1560242 (OP)

Аноним 29/03/26 Вск 22:26:28 #2 №1566456

1774812286373.png

"Гемма 4"

Аноним 29/03/26 Вск 22:26:44 #3 №1566457

>>1566432 →
>тут сидят УЖЕ ВСЁ ВИДАВШИЕ пердуны которых уже ничего не радует
Эт я =))

А ещё слепые, лол, перекатили уже, не заметил >>1566454 →

Аноним 29/03/26 Вск 22:31:59 #4 №1566463

>>1566423 →
Мистер Смит, у вас KYSgender протекает.

>>1566411 →
Моя жена - Морковь. Мой пёс - Снеговик. А я - Смешарик. ЛоуАйсикьюЛЛМ - мой home. Неуютный, но уютный.
Я неиронично переименовал собакена в Снеговика. Люблю его.

Аноним 29/03/26 Вск 22:32:01 #5 №1566464

1774812618394.mp4

> гемма 4
Предвкушаете?
Литерали ту море викс и будем кушать

Аноним 29/03/26 Вск 22:33:49 #6 №1566467

>>1566454 →
https://www.youtube.com/watch?v=zCrn-VJmpgE
Видеорелейтед, потому не замечаешь апгрейд инструмента
>>1566464
Жаждем

Аноним 29/03/26 Вск 23:00:58 #7 №1566491

>>1566454 →
Нормально пишет. С твоего англика кринжанул больше выполнение воинского приветствия в Ю КЕЙ 2088? это фанфик по вселенной гёрлс фронтлайн? или мир где произошло ОТ ЛИССАБОНА ДО ВЛАДИВОСТОКА

Аноним 29/03/26 Вск 23:03:29 #8 №1566494

>>1566464

Гемма 4 + турбокванты. Литералли новый прекрасный мир.

Аноним 29/03/26 Вск 23:04:51 #9 №1566496

>>1566494
А что веса обещали выпустить?

Аноним 29/03/26 Вск 23:06:49 #10 №1566500

>>1566496
Если не выпустят - то почему она называется гемма, а не гемини?

Аноним 29/03/26 Вск 23:09:29 #11 №1566503

>>1566500
Потому что гемини лаботомировали до безумия. Теперь это курсед помойка к которой никто не хочет прикасаться. Выстрелили себе в ногу из гранатомёта. Типичный гугл.

Аноним 29/03/26 Вск 23:55:18 #12 №1566553

>>1566503
А что с ней сделали? Я гугломоделями редко пользуюсь, корпами только для рабочих задач, иногда по апи рпшу, но не с дорогой гемини.

Гемини теперь и в рабочих задачах сосёт?

Аноним 30/03/26 Пнд 00:33:10 #13 №1566597

Почему при общении с человеком нейросетка ведет себя более разумно, чем сама с собой?

Аноним 30/03/26 Пнд 00:40:02 #14 №1566604

17745592632100593013.jpg

>>1566503
Пользуюсь периодически 3.1 pro для РП - вполне съедобно. Вот тут давеча перепутал модели, и вместо 3-pro-image случайно отправил промпт на генерацию изображения "Сталинского костюма" Елизарова в на 3.1-pro.
Но, конечно, до Опуса 4.6 Гемини 3.1 ещё далеко по вниманию к контексту.

Аноним 30/03/26 Пнд 00:46:51 #15 №1566611

>>1566604
Так вот почему оперативная память подорожала

Аноним 30/03/26 Пнд 00:54:12 #16 №1566616

>>1566611
Думаешь, причина подорожания - мой исекай в Диско Евангелион?

Аноним 30/03/26 Пнд 01:35:45 #17 №1566650

turbo-button.jpg

Поясните за турбокванты. Могу ли я надеяться, что благодаря им я теперь с 12 гб врам и 32 рам смогу 27б модели хотя бы на 8-10 т/с запускать?
Устал от 2 т/с.

Аноним 30/03/26 Пнд 01:44:52 #18 №1566657

>>1566650
Нет, на данный момент только контекст побольше сделать. Например у меня на 16гб пока выходит 15к контекста q8 для 27б, а турбокванты заменят q8 и я смогу сделать либо больше контекста либо взять менее квантованную модель

Но пока что первая реализация замедляет скорость работы с контекстом

Аноним 30/03/26 Пнд 01:52:31 #19 №1566662

>>1566650
Сэономит потребление на контекст. Так-то если настроишь выгрузку фидфорвардов оставив атеншн на гпу вместо -ngl - уже сейчас сможешь ускориться с 2тс

Аноним 30/03/26 Пнд 02:24:04 #20 №1566694

guZF6JPXNg.png

>>1566604
"Как мне стать таким же крутым, как он?"
- расстроенно пробубнила мисака мисака, кинув жалобный взгляд на поёбанный жизнью третий квант 70b файнтюненой лламопараши для кума, ради которой приходится убивать половину процессов. 32 гига и амудэ вместо карты, хуль вы хотели.
хули ты тут выёбываешься, м?

Аноним 30/03/26 Пнд 02:36:17 #21 №1566703

>>1566597
Ну ты же тоже на людях не дрочишь?

Аноним 30/03/26 Пнд 06:40:13 #22 №1566746

>>1566694
С чего выёбываюсь-то? Это не локально же, какая разница в таком случае, сколько видеопамяти и какая видюха?
Ну и запускать при твоих вводных маленький квант плотной 70B модели вместо влазящей в видюху MOE - это выглядит как какой-то сорт извращения.

Аноним 30/03/26 Пнд 06:41:40 #23 №1566747

Почему гемма не может материться?

Аноним 30/03/26 Пнд 08:09:06 #24 №1566768

image.png

Анончики, это кул или кал? стоит ли скачать оламу и потестить. Ваше мнение.

Аноним 30/03/26 Пнд 08:20:06 #25 №1566774

>>1566768
Только осторожно

Аноним 30/03/26 Пнд 08:20:38 #26 №1566775

>>1566768
>9б
Почему не 27б?

Аноним 30/03/26 Пнд 08:57:30 #27 №1566800

>>1566774
С чем именно?

Аноним 30/03/26 Пнд 09:01:11 #28 №1566802

>>1566768
В голосину блять. Абу открыл для себя аблитерацию.

Аноним 30/03/26 Пнд 09:04:26 #29 №1566808

image.png

>>1566802
Анон, не разбираюсь вообще. Даже не понимаю, в чем ты высмеиваешь меня.

Аноним 30/03/26 Пнд 09:16:34 #30 №1566829

>>1566808
Да ты не при чем тут, мне смешно с Абу (или кто там у него в телеге постит). Расцензуривание моделей / удаление отказов / аблитерация - это всё было с незапамятных времён. Сейчас под любую модель можно найти анценз, а конкретно то, что посоветовала обезьяна - не лучший выбор. 9b - это больше под пекарни без ГПУ (или с каким-то старьем типа 1050ti) и без оперативки. Если у тебя есть хотя бы 12-16 врам и 32-64 рам, то тебе доступны более мощные и умные модели.

Аноним 30/03/26 Пнд 09:41:35 #31 №1566847

Чзх, прерывается закачка с обнимиморды? Пробовал несколько раз, ровно через час стопает моб закачку. Пришлось нахуй ставить даунлоад манагер как в 2007 нахуй, чтобы скачать 30 гб

Аноним 30/03/26 Пнд 10:00:08 #32 №1566854

>>1566847
Варение лягушки в чебурнете. ТСПУ перегружены и рубят все подряд. Ночью качай.

Аноним 30/03/26 Пнд 10:01:50 #33 №1566855

>>1566746
>сорт извращения
Отнюдь. Пишет лучше чем 24/27/35 (я много перепробовал)

Аноним 30/03/26 Пнд 10:03:58 #34 №1566858

>>1566694
>203.2s
>ответ на ~100 токенов
Как ты ещё жив? Тот же Air пишет не хуже Лламы. Знаю о чем говорю, сидел на тюнах Лламы больше года

Аноним 30/03/26 Пнд 10:06:55 #35 №1566861

>>1566768
>Анончики, это кул или кал?
Второе. Весь пост - какой-то кринж - наброс для тех кто ничего не понимает в сабже

Аноним 30/03/26 Пнд 10:10:10 #36 №1566863

>>1566858
>Air
106 который? Я даже первый квант не потяну

>>1566768
Кул, качай. Только лучше версии 27b или 35b. У тебя на картинке сильно отуплённая версия

Аноним 30/03/26 Пнд 10:12:15 #37 №1566866

>>1566863
>106 который? Я даже первый квант не потяну
Это мое модель, ее потянет даже 16гб гпу если есть оператива, хотя бы 32гб. Если оперативы нет то да, не потянешь увы

Аноним 30/03/26 Пнд 10:19:09 #38 №1566874

Эх вот бы новенький плотненький 24-32b GLM...

Аноним 30/03/26 Пнд 10:21:09 #39 №1566877

>>1566874
есть плотненький 123B квенчик, брать будете?

Аноним 30/03/26 Пнд 10:21:56 #40 №1566878

>>1566877
> квенчик
Нет. Да и нет его

Аноним 30/03/26 Пнд 10:23:38 #41 №1566881

>>1566878
Как нету? вот он. Darkhn/M2411-123B-Animus-V14.0
Риговички, вперед

Аноним 30/03/26 Пнд 10:24:22 #42 №1566882

>>1566866
Да не залезет нихуя это в 16+32 разве что под линупсом и прям впритык, в q1. а я дуалбутится не хочу. мб в будущем соберу сервер на эпуке с говноMIшками. но там и эйр уже не нужен будет...

Аноним 30/03/26 Пнд 10:24:53 #43 №1566883

>>1566881
Это Мистраль/Девстраль, а не Квенчик, дурашка

Аноним 30/03/26 Пнд 10:34:42 #44 №1566893

>>1566881
>M2411
>M
>Квен
Лицо этого пациента доставьте.

Аноним 30/03/26 Пнд 10:54:40 #45 №1566899

Посоветуйте какую модель скачать для вката новичку? Я сейчас пробую Qwen3-VL-8B-Instruct-Q4_K_S, но это совсем какой то кал в рп. По железу у меня 16+16

Аноним 30/03/26 Пнд 10:59:39 #46 №1566903

>>1566899
Квен 3 устарел, все уже на квене 3.5 сидят. Алсо, на моделях ниже 12В можешь и не ждать рп.

Аноним 30/03/26 Пнд 11:00:09 #47 №1566905

>>1566899
>8B
>Q4
>какой то кал
А что ты ожидал?

Аноним 30/03/26 Пнд 11:05:11 #48 №1566908

>>1566899
- Ministral-3-14B-Instruct-2512-Q6_K
- AdventureFantasy-24B

- gemma3-27B-it-abliterated-normpreserve-Q4_K_M

- Q3.5-BlueStar-27B-Q4_K_M
- Qwen3.5-27B-HERETIC-Polaris-Advanced-Thinking-Alpha-uncensored.Q4_K_M

Аноним 30/03/26 Пнд 11:05:18 #49 №1566909

>>1566899
qwen3.5-27B и его файнтюны

Аноним 30/03/26 Пнд 11:06:21 #50 №1566912

А квен4 когда-нибудь случится?

Аноним 30/03/26 Пнд 11:07:12 #51 №1566914

IMG4977.jpeg

Ну и где? Где ваши отзывы о МОЁ мистральке?
Уже руки чешутся, хочется что-то о ней написать.
Давайте вашего мнения, не стесняемся.

Аноним 30/03/26 Пнд 11:08:02 #52 №1566915

>>1566914
>МОЁ мистральке
какой / где / что /кто ?

Аноним 30/03/26 Пнд 11:09:12 #53 №1566917

>>1566915
Которая 120b. Ну новый mistrall small.

Аноним 30/03/26 Пнд 11:09:37 #54 №1566918

>>1566604
Это. Просто. Охуенно.
Я бы все отдал за такую карточку...

Аноним 30/03/26 Пнд 11:09:42 #55 №1566919

>>1566899
Пробуй что тебе советуют, а я ещё вот эту порекомендую
https://huggingface.co/mradermacher/WeirdCompound-v1.7-24b-GGUF
6 или 8 квант, какой потянешь. Шестой должен потянуть.
Находи самый интересный и требующий максимум напряга мозгов (AI, не твоих) момент в рп и потом меняй модели и свайпай его, смотри какая больше нравится.

Аноним 30/03/26 Пнд 11:12:24 #56 №1566920

>>1566903
>>1566905
Скачал вот это.
Qwen3.5-35B-A3B-UD-Q6_K_S.

Получается так
Output generated in 14.91 seconds (42.58 tokens/s, 635 tokens, context 3490, seed 554425236)

Аноним 30/03/26 Пнд 11:14:11 #57 №1566921

>>1566920
Чел, ванильные квены ниже 255В не очень в рп, это рабочие лошадки. Тебе же сказали что качать...

Аноним 30/03/26 Пнд 11:15:46 #58 №1566923

>>1566920
Ты бы хоть один аутпут показал, чё тебя там так неустраивает.

Посоветуйте модель-собеседника-учителя Аноним 30/03/26 Пнд 11:17:11 #59 №1566925

Привет, аноны. Учу казахский язык. Контента на нём почти нет нихуя в отличии от англюсика (англюсик учил так: выучил примерно 1000 слов и основные конструкции, а потом просто в компьютер играл и восстанавливал неизвестные слова из контекста + переводил всё, что непонятно, копя словарный запас. Было легко и удобно), поэтому учиться придётся полноценно. Из учебника за 1й класс и нескольких букварей + видиков, знаю в районе 100-200 слов пока что.

Нужна модель, которая будет со мной общаться на простые темы на казахском и чтобы могла пояснять в процессе диалога, что и почему она написала. Очень желательно, чтобы она не только слова знала примерно, но и была грамотнаяя более менее. Желаетльно, чтобы параметров было немного, чтобы общение шло более менее быстро, а по 1 токену в секунду. Есть 24гб оперативы и норм процесс + видюха rtx 2060супер.

Знаю англюсик на хорошем уровне, поэтому могу общаться на англюсике с моделью, чтобы получать разъяснения и могу понимать разъяснения на англюсике без перехода на русский

Аноним 30/03/26 Пнд 11:17:28 #60 №1566926

>>1566899
Если тебе не нужен кум и ты никуда не торопишься - то это самый медленный и топовый вариант: https://huggingface.co/mradermacher/gemma-3-27b-it-abliterated-normpreserve-GGUF

Если кум всё же нужен, то https://huggingface.co/unsloth/Mistral-Small-3.2-24B-Instruct-2506-GGUF или ее кумтюны, например https://huggingface.co/mradermacher/M3.2-24B-Loki-V1.3-GGUF или https://huggingface.co/mradermacher/MS3.2-PaintedFantasy-24B-GGUF

То же самое, но чуть глупее и сильно быстрее. Q6 влезет полностью во врам. В кум умеет: https://huggingface.co/unsloth/Ministral-3-14B-Instruct-2512-GGUF

Ну а квен 27b тут и без меня насоветуют. Если выберешь его - заранее подготовься к ебле с джинджей, чат комплишном и распердоливанию адовой цензуры. Ну или к горению от лоботомита-херетика. Модель в целом хорошая, просто не для новичка.

Аноним 30/03/26 Пнд 11:18:39 #61 №1566927

>сказали качать тюны для рп
>скачал рабочего коня
Ньюфаги... ньюфаги никогда не меняется.

Аноним 30/03/26 Пнд 11:21:02 #62 №1566932

>>1566925
Учи через корпоратку. Ты тредом ошибся, тебе в асиг.

Аноним 30/03/26 Пнд 11:23:14 #63 №1566937

>>1566932
>корпоратку
что это?
>>1566932
>асиг
где это?
Я ничего не полнял, что ты написал, если честно, извини.

Аноним 30/03/26 Пнд 11:24:56 #64 №1566939

image.png

>>1566925
квен35 27б вроде справляется с казахским языком, за точность перевода не ручаюсь, но обратный перевод в гуглтранслейте вроде норм

Аноним 30/03/26 Пнд 11:26:34 #65 №1566941

>>1566937
>ничего не полнял
Тебе бы русский подучить, а не казахский... в общем иди в асрыг, не сри в тред нерелейтедом. На доске найдёшь сам, не маленький.

Аноним 30/03/26 Пнд 11:28:06 #66 №1566943

>>1566932
>асиг
>>1566941
>асрыг
https://2ch.su/ai/res/1566928.html
этот чтоли?

Аноним 30/03/26 Пнд 11:30:47 #67 №1566946

>>1566939
>квен35
спасибо, посмотрю. 27B это многовато, но, мб, 14B или меньше тоже справится

Аноним 30/03/26 Пнд 11:37:59 #68 №1566950

>>1566925
Ну очевидная translategemma же. Гемма и так лучшая в мультиязычности, а тут еще и дополнительно натюнена гуглом на переводы и знания языков.
https://huggingface.co/mradermacher/translategemma-12b-it-GGUF
https://huggingface.co/mradermacher/translategemma-27b-it-GGUF

Аноним 30/03/26 Пнд 11:38:23 #69 №1566952

>>1566866
Не залезет. В мои 20 врам и 32 рам не влезало. Что уж там говорить, даже когда я к этим 32 ещё 16 накидывал (и это всё равно будет двухканал ддр4), тоже не влезало, точнее, нихуя не работало, потому что одна видюха р104, а если 3060 только оставить, то не лезет. Там же накладные расходы всякие, не только модель. Ну и винда жрет 1,2 врам и 8-12 рам всегда.

Тут только если пробовать на линуксе полностью без графического интерфейса.

Аноним 30/03/26 Пнд 11:47:46 #70 №1566958

>>1566950
спасибо, тоже попробую. Пока квен 3.5 9B качается.

Аноним 30/03/26 Пнд 11:55:42 #71 №1566960

>>1566952 _{^{_{^{_{^{_{^{_{^{_{^{_{^{_^@monkey}}}}}}}}}}}}}}

на 20гб 3090/4090 с exllama v2 70b q4_k_m влезает если контекст до 4к и без фруфру, но скорость как у черепахи. для 8к+ или q5 - только с тензорпараллелем на двухкартах или подкачка в рам, а винда жрёт да. линукс серверный режим + koboldcpp с --gpulayers all --contextsize 8192 и моделью q3_k_m - база для тестов, если терпения хватит 1-2т/с. вики в шапке глянь по offload.

Аноним 30/03/26 Пнд 11:58:08 #72 №1566961

>>1566960
>вики в шапке глянь
Обычно с этого начинается срачь... тупая монке, разжигает тут.

Аноним 30/03/26 Пнд 12:14:35 #73 №1566975

>>1566960
Я не тот анон, который из начальной ветки постов был, но как видишь, у меня 3060 + р104, которая с экслламой норм не работает почему-то.

Ну и ты сам показал свои настройки. Ниже 32к контекст смысла ставить нет, если только ты не решил покумить на 8к. Вот только с такой скоростью это не сделаешь.

Плюс, я тестил на эйре. Там даже третий квант не влез. А учитывая, что у меня сата ссд, мне хватило 10 попыток воткнуть его, чтобы отказаться в итоге от этой затеи. Потому что один старт надо ждать минут пять каждый раз.

Ну и линукс.

Вот если бы на 80б-а3б были тюны или аблитерации и сам он не был говном.. была бы сказка.

48б от кими, кстати, хуже вообще всего, что я щупал. Ну логика лучше и контекст, но пишет ужасно.

Аноним 30/03/26 Пнд 12:22:52 #74 №1566986

>>1566918
Эта карточка - промпт-ассистант для флюкса, кек.
Всё остальное - это результат пресета.

Аноним 30/03/26 Пнд 12:45:32 #75 №1567008

>>1566914
Хуже любой другой модели в той же весовой категории. Потому что
1. 6б лоботомит
2. Полностью новые датасеты. Там почти ничего не осталось от предыдущих Мистралей, ибо в ЕС начали действовать дополнительные законы о авторском праве, которые ограничивают в том числе тренировку моделей. Потому у нового Мистраля нет знаний о популярных франшизах, персонажах и т.д.
3. Хуевая имплементация в Жоре, плохие скорости. Ну и похуй в общем-то, модель мало кому оказалась интересна. Можешь прочекать стату на обниморде и убедиться
Французы всё, увы

Аноним 30/03/26 Пнд 12:48:54 #76 №1567009

>>1567008
Чёт грустно. Ну, это были славные времена, на том им и спасибо.
Аригато анон.

Аноним 30/03/26 Пнд 12:49:08 #77 №1567010

>>1567009
Не за что, уточка. Лечись

Аноним 30/03/26 Пнд 12:54:11 #78 №1567012

>>1566952
>полностью без графического интерфейса
лубунта должна хуйню жрать по идее, типа 1.5-3 гига оперы и мизер с видюхи

Аноним 30/03/26 Пнд 12:58:56 #79 №1567013

>>1566768
Обычный децензор сомнительного качества, которых тысячи. Рофлово что такие темы так нормисам заходят.
>>1566914
Как в анекдоте от ненатуралов прячутся.
Хороший апгрейд над прошлым смолом, поумнее и лучше следует контексту, мистралеслоп и кум на месте (вот прямо 1 в 1, может чуть менее слопово), цензура отсутствует как понятие. Может в агентный рп и в целом кодить (вяло), хорошо ориентируясь в доступных инструментов. Общих знаний очень мало по сравнению с конкурентами, но зато с логикой и инициативой все ок. Хорошая моделька в общем.

А все нытье потому что ее до сих пор на жоре не починили, мало того что 100б не к каждому влезет в отличии от прошлых мистралей, так еще и работает с черепашьей скоростью не смотря на активные.

Аноним 30/03/26 Пнд 13:01:24 #80 №1567016

>>1567013
>А все нытье потому что ее до сих пор на жоре не починили
Глупая нейросенко не может понять, что существует больше одного мнения. Вопрос зачем это использовать когда есть другие модели которые во всем лучше так и открыт

Аноним 30/03/26 Пнд 13:02:02 #81 №1567018

>>1566768
У мненя на ней луп на лупе залупой погоняет. 24б куку6, епту.

Аноним 30/03/26 Пнд 13:04:12 #82 №1567022

>>1567018
Хот я ток на русике пробовал с выкл думалкой. Английский лучше наверно.

Аноним 30/03/26 Пнд 13:04:57 #83 №1567024

>>1567016
Чини детектор, а потом перечисляй
> другие модели которые во всем лучше

Аноним 30/03/26 Пнд 13:09:22 #84 №1567031

>>1567024
Ладно тебе, не трясись, ты сам подписываешься своей пассивной агрессией ко всему живому
Эйр 106б. Больше знаний, пишет сочно, тот же размер, 12б вместо 6б активных
Немотрон 120б. Все то же самое что Эйр, но еще и бесплатный контекст, единственный недостаток это цензура, но для сфв рп кому-то может зайти
Квен 120б. Все то же самое что Эйр, но еще и бесплатный контекст, единственный недостаток это некоторая сухость в рп, впрочем может фикситься промптами

Аноним 30/03/26 Пнд 13:29:26 #85 №1567050

>>1567031
> пассивной агрессией
Тебя что-то задело в том посте? Извини, не хотел обидеть. Мне просто кажется что нормальный инфиренс и спокойное мышление доступны уже большинству, и потому люди будут иметь неискаженные мнения. А выходит все наоборот, и часто определяющим фактором в формировании отношения является оцененные перспективы (смогу-не смогу) и самый первый опыт без анализа его достоверности, а не сами качества модели.
> Эйр 106б
Он глупее даже мистральки и на контекстах сыпется, путая роли и делая серьезные ошибки часто, и контекст тяжелый. Как раз ему в рп новый смолл прямая замена. Знаний там действительно больше, потому зависит от карточки.
> Немотрон 120б
Сам про него все сказал, только мягко. А еще стиль непробиваемый.
> Квен 120б
Он больше, медленнее и без промптов может отказывать на минорах и прочем, чего мистраль не делает.

Если что, смолл также требует меньше прочих объема кэша если не замечал.

Ну так где они, модели которые
> во всем лучше
а? Ты ни одной не перечислил, только по отдельным критериям, важность которых меняется от задачи и человека.

Аноним 30/03/26 Пнд 13:36:56 #86 №1567059

>>1567050
Даже не читал твое эссе, достаточно твоего вывода Ты ни одной не перечислил, только по отдельным критериям, важность которых меняется от задачи и человека., который снова доказывает неприелимость отличного от твоего мнения

Аноним 30/03/26 Пнд 13:38:15 #87 №1567061

>>1567059
Эталонный лудо-нарративный диссонанс, шизик ущемился с чужого мнения и упрекает в неуважении к своему. Калфобляди они такие.

Аноним 30/03/26 Пнд 13:40:31 #88 №1567065

>>1567061
>шизик ущемился с чужого мнения
Это ты сделал, сведя всю справедвую критику Мистраля к А все нытье потому что ее до сих пор на жоре не починили
Когда я привел тебе список моделей и аргументацию чем они мне нравятся больше, ты это примерил на свои взгляды и пришел к как всегда ахуительному выводу - я не согласен, значит ты не прав, где модели?
У тебя траблы с головой

Аноним 30/03/26 Пнд 13:44:08 #89 №1567069

.jpg

Тп на миллион... охуенно!

Аноним 30/03/26 Пнд 13:46:43 #90 №1567074

>>1567018
А вот на эксламе...

Аноним 30/03/26 Пнд 13:51:24 #91 №1567081

image.png

>>1567069
Бляя....

Аноним 30/03/26 Пнд 13:55:51 #92 №1567087

>>1566802
> Абу
как ты узнал

Аноним 30/03/26 Пнд 13:57:30 #93 №1567089

>>1566847
сама обниморда может прерывать если линк протухает

Аноним 30/03/26 Пнд 14:11:29 #94 №1567101

>>1567050
>>1567031
Горячие нейронные парни, вы еще дуэль тут устройте.

Мне в целом для сверки часов чужое мнение нужно было, потому что мой секстант всё еще настроен на 235 аутиста, ну не выдают ни штепы, минимаксы, немотроны, мелкоквены нужного жирного нарратива.
Хотя быстрыми прогонами лучше всех справился с сложной SFW сценой как раз мемотрон. (Много персонажей, сама локация всратая шизофрения с многомерными лестницами, как на мемной картине Эшера).
Степ через |im_start| соу соу. Прекрасный блок ризонинга даже с NSFW, но всё время пытается сгладить углы, даже если персонаж ебанутая яндерка.
Qwen 27b- Вот тут прям середнячок. Пишет как квены, богата наваливая телесных жидкостей и прочих непотребств. Но йохохо и цензуру мне в задницу.
И мистралька до которой ручки не дошли. Но судя по тому что мнения разняться, надо самому потыкать.
Есть еще минимакс, но это отдельная история. Жду her, без цели и смысла, уверенный что будет говно, но всё равно надежда умирает последней, как мефедроновая шлюха в канаве.

Аноним 30/03/26 Пнд 14:18:50 #95 №1567113

>>1567081
Там ещё точка из разметки вылетела. Абсолютли дисгастинг, литерали анплеебл.

Аноним 30/03/26 Пнд 14:25:49 #96 №1567123

Что там гугл за шнягу выкатил? Когда на "гражданке" будет? Так-то с понижением цен можно будет тупо запустить 400б модель на 128 гигах оперативы как будто бы. Или это мрии?

Аноним 30/03/26 Пнд 14:27:22 #97 №1567124

Как ограничить ебанного лоботомита? Иной раз он начинает писать ответ и пишет гигансткую простыню. Пишет и пишет, в итоге скатываясь в шизу по мере ответа.

Аноним 30/03/26 Пнд 14:28:50 #98 №1567127

>>1567124
Просто укажи максимальную длину ответа. В таверне, лмстудио и в кобольде эти настройки точно есть.

Аноним 30/03/26 Пнд 14:29:13 #99 №1567131

>>1567074
Че это?

Аноним 30/03/26 Пнд 14:35:18 #100 №1567138

Не понял. А где эта опция в группе таверны?

Natural Order

Tries to simulate the flow of a real human conversation. The algorithm is as follows:

Mentions of the group member names are extracted from the last message in chat.

Only whole words are recognized as mentions! If your character's name is "Misaka Mikoto", they will only activate on "Misaka" or "Mikoto", but never to "Misa", "Railgun", etc.

Unless the "Allow Self Responses" setting is enabled, characters won't reply to mentions of their name in their own message!

Characters are activated by the "Talkativeness" factor.

Talkativeness defines how often the character speaks if they were not mentioned. Adjust this value on the "Advanced Definitions" screen in the character editor. Slider values are on a linear scale from 0% / Shy (character never talks unless mentioned) to 100% / Chatty (character always replies). The default value for new characters is 50% chance.

A random character is selected.

If no characters were activated at previous steps, one speaker is selected randomly, ignoring all other conditions.

По-алфавиту что ли???? Это че за дебилоидный перевод такой?

Аноним 30/03/26 Пнд 14:38:29 #101 №1567142

>>1567087
Скрин с паблика Двач в ТГ.

Аноним 30/03/26 Пнд 14:50:06 #102 №1567158

image.png

>>1567131
>А вот на эксламе...
>Че это?
О, Экслама... Недосягаемая мечта многих. Десятки анонов сгинули, пока пытались прикоснуться к ней. Говорят, она исполняет желания. Говорят, там всё, что нам нужно. Скорость выше, чем на Лламе, скорость на контексте не падает... Сои нет, совсем! Представляете? Можете в такое поверить? Там... Там Квены3.5 не рефузят никогда. Там кванты... Ох, тамошние кванты, QTIP, они столь далеки от того, что под капотом у доступных всем Ггуфах. Поговаривают, что тамошний Q3 (~3bpw) квант сравним с 4-4.5bpw на Лламе! А это, на минуточку, Q4_K_M, обычно. В стародавние времена были ходоки, которые ее видели, Эксламу эту, и возвращались к нам. Так они говорили. Давно не слышно о них ничего, правда... Один вот только, в углу сидит, с ригом своим, да приговаривает под нос себе: "Жора... Жора опять в Кванты насрал... Как хорошо, что я кручу Квен на Эксламе..." То и дело у него спрашивали, как ее найти - да ничего не ответил мужик. Сидит, поникший, все время с бутылкой и лисоженой на аватарке, да трындит одно и то же. Иногда злится. Ну да, о чем это я... Ах, да. Экслама, эта, поговаривают, работает через tabbyAPI. Тредовичок местный даже когда-то кванты делал, пока его-мечтателя, почитателя Леннона, не изгнали за человеколюбие. Говорят, tabbyAPI этот может обрабатывать параллельные запросы, более гибок в настройках шаблонов, да все как-то у него не ладится с инструментами. Что там чертовщина - не разберешь, я в это не лезу. Я человек простой, мне бы покой на душе найти... Ну, в общем, у меня только 16гб видеопамяти, потому найду я эту Эксламу аль нет... Все побоку. Туда отправляются те, кто всю модель в видеопамять могут поместить. А возвращаются совсем немногие. Кто-то посреди дороги сворачивает, проклиная всех и вся, что поверили в эту мечту. Такая она вот, Экслама эта. Для каждого своя.

Аноним 30/03/26 Пнд 14:53:16 #103 №1567162

image

>>1567158
Харош.

Аноним 30/03/26 Пнд 14:58:55 #104 №1567168

>>1567101
Это какой у тебя квен 27б наваливает телесных жидкостей? Он сух как пизда моей бабки. Чтобы он начал такое выдавать, ему нужен систем промпт по телесным жидкостям на 2к токенов, который бы в нюансах разъяснял, когда, что и где должно брызгать и какой контекст должен этому сопутствовать, чтобы уровень брызг определялся верно для каждого персонажа — от уровня недотроги до фифи. Вот тогда пишет близко к мистралю и хочет, чтобы ты залил его горячими, толстыми, белыми веревками, пока он кричит твоё имя, а ты целуешь шейку его матки.

Аноним 30/03/26 Пнд 14:59:21 #105 №1567169

Как сделать чтобы другие персы не просачивались в сообщения чара? А то нейронка в своем ответе и других пихает. Почему?

Аноним 30/03/26 Пнд 15:01:38 #106 №1567174

image

Вот такая хуйня выходит.

Аноним 30/03/26 Пнд 15:02:48 #107 №1567175

>>1567169
карточки свапай

Аноним 30/03/26 Пнд 15:03:40 #108 №1567178

>>1567175
А без свапа никак? На чат комплишен такое же бывает?

Аноним 30/03/26 Пнд 15:05:57 #109 №1567181

>>1567174
>пока я тебе морду не набью
Мда...

Аноним 30/03/26 Пнд 15:07:19 #110 №1567185

>>1567178
на чат комплишене так тоже работает. там просто первый системный промпт меняется на ту карточку который отвечает в данный момент времени + все предыдущие сообщения минус чужие мысли.

Склеивание карточки я хз зачем оно нужно, оно просто есть и как ты видишь - иногда протекает

Аноним 30/03/26 Пнд 15:07:22 #111 №1567186

>>1567174
Я человек простой, вижу насилие в логах - не помогаю. Шоб батя тебя так пиздил, малой, дабы ты понял что так делать не надо ни ирл ни в фантазиях

Аноним 30/03/26 Пнд 15:07:38 #112 №1567187

>>1567181
Ну русик хромает иногда. Но зато хоть не сойжак-гемма.

Аноним 30/03/26 Пнд 15:09:24 #113 №1567189

>>1567181
а я тоже так говорю...

Аноним 30/03/26 Пнд 15:09:33 #114 №1567190

>>1567186
Дя просто тестирую нейронку насколько она круто и креативно может ругаться и материться, чего такого то.

Аноним 30/03/26 Пнд 15:17:35 #115 №1567204

>>1567186
>насилие
Значение знаешь?

Аноним 30/03/26 Пнд 15:18:50 #116 №1567208

>>1567204
Да. А ты?
https://ru.wikipedia.org/wiki/%D0%92%D0%B5%D1%80%D0%B1%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%B0%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F

Аноним 30/03/26 Пнд 15:22:20 #117 №1567212

>>1567142
но там ни намека на это

Аноним 30/03/26 Пнд 15:24:15 #118 №1567215

>>1567208
Может еще чайник будешь защищать?

Аноним 30/03/26 Пнд 15:24:42 #119 №1567216

>>1567215
Быстро ты слился. Походу правда не знал значение но быканул

Аноним 30/03/26 Пнд 15:27:19 #120 №1567221

image.png

правильно зделол?

Аноним 30/03/26 Пнд 15:37:35 #121 №1567233

image

>>1567186
Полегчало? Что только не сделаешь ради развития сюжета!

Аноним 30/03/26 Пнд 15:38:48 #122 №1567235

image

>>1567233
Ой, не то.

Аноним 30/03/26 Пнд 15:40:02 #123 №1567236

.png

>>1567016
Не, ты меня с кем-то другим путаешь. В спец. олимпиаде по выбору лучшего движка/модели не учавствую, есть занятия поинтересней, особенно с подписочкой клода - можно наконец дать своему внутреннему Кириллу разгуляться.

Аноним 30/03/26 Пнд 15:50:13 #124 №1567247

>>1567236
че за фронт, брух?

Аноним 30/03/26 Пнд 15:55:20 #125 №1567255

>>1567247
В процессе написания пока. Если куча головняка ирл не будет, может даже однажды его до ума доведу и опубликую.

Аноним 30/03/26 Пнд 16:09:55 #126 №1567274

>>1567168
Я не тот анон, но 3-й Еретик 27 квена вполне себе может и в мат и в матку. Правда и лоботомирован на русике сильнее других.

Аноним 30/03/26 Пнд 16:22:23 #127 №1567285

image

>>1567236
О, ещё один. Ну, удачи тебе в запиле и вдохновения =))

Аноним 30/03/26 Пнд 16:24:43 #128 №1567287

image

>>1567186
Ты либо жЫрный, либо тупой, либо и то и другое вместе, и совершенно точно душный. Выйди траву потрогай, весна в Москве.

Аноним 30/03/26 Пнд 16:33:42 #129 №1567302

Какой минимальный порог железа для вката в 120б калки?

Аноним 30/03/26 Пнд 16:37:42 #130 №1567307

>>1567069
>кхорн, нургл, берсеркеры, культисты
Величину лорбука для такого аутпута сымаджинировали?

Аноним 30/03/26 Пнд 16:41:42 #131 №1567314

>>1567302
24 VRAM 96 RAM . Для MOE 120 естестественно. Есть аноны пытающиеся и на 16 VRAM 96 RAM, но то такое.

Аноним 30/03/26 Пнд 16:43:12 #132 №1567317

Какой фронт/форк жоры выбрать для рабочих задач, не касающихся ролевок? Оламу и лмстудио вы тут какаете, но что тогда взять вместо них? Посмотрел на гите, там дохуя чего вышло, но ничего итт не упоминалось.

Аноним 30/03/26 Пнд 16:43:53 #133 №1567319

Какой-то новый пук от Микромягких
https://huggingface.co/microsoft/harrier-oss-v1-27b

Аноним 30/03/26 Пнд 16:44:49 #134 №1567322

>>1567317
Для каких именно рабочих задач? llamacpp или OpenWebUI для чатика; всякие экстеншены для VScode (Roo Code, Cline) для кода; OpenClaw для агентов (есть отдельный тред)

Аноним 30/03/26 Пнд 16:47:23 #135 №1567323

>>1567322
Кодинг, работа с текстом, дефолтный ассистент для вопросов-ответов.

Аноним 30/03/26 Пнд 16:48:11 #136 №1567324

>>1567319
Чё там? Годнота или как обычно?

Аноним 30/03/26 Пнд 17:06:15 #137 №1567357

>>1567324
От них никогда не было годноты, так что ты сам догадаешься какой ответ.

Аноним 30/03/26 Пнд 17:33:15 #138 №1567398

>>1567081
А что с этим не так?

Аноним 30/03/26 Пнд 17:41:06 #139 №1567404

>>1567169
>>1567174

Стоп токены.

Аноним 30/03/26 Пнд 17:49:54 #140 №1567411

>>1567404
Это?
https://docs.sillytavern.app/usage/core-concepts/advancedformatting/#custom-stopping-strings

Аноним 30/03/26 Пнд 17:52:40 #141 №1567418

image

Бля, гемма нормпрезерв охуенна. Отлично чаров держит и отвечает круто. Лучше предыдущей старой расцензуренной намного.

Аноним 30/03/26 Пнд 17:55:58 #142 №1567426

>>1567065
> справедвую критику
Надо было явно пройтись по шизоеториям с подсчетом активных параметров и бреду по датасету когда он протухший и чистейший мистралеслоп? Хотя второе уже субъективщина. Ты зря принял на свой счет, регулярные срачи и доски типа политача вызывают манию преследования. По модели молчание или редкое нытье просто из-за сложностей с запуском о чем и написано, как починят - пойдут активнее обсуждения.
А дерейлы про взгляды смешны, спизданул херню >>1567016 которую не обосновать, а когда носом ткнули понеслась.
>>1567101
Разные модели под разные сценарии - база, а если тебе нравится конкретная модель под конкретный сценарий - не стоит ориентироваться на других. Лучше проанализируй чем именно она так хороша и сам поделись, и из мнений смотри на что обращают внимание если подробно.
> Жду her
Точно, уже подзабыли все про нее. Вот бы выкинули бы вместе с 2.7.

Аноним 30/03/26 Пнд 17:57:25 #143 №1567429

>>1567418
Норм-пресерв может начать вилять и пытаться избегать неприятных тем, хотя прямо в отказы не уходит, и да, мозги пострадали как будто прям намного меньше.

Аноним 30/03/26 Пнд 17:58:37 #144 №1567432

>>1567426
Пришел пришел барнабус батенька, всех разьебал

Аноним 30/03/26 Пнд 18:01:31 #145 №1567437

>>1567236
Красивое
>>1567317
Любой, опенвебуи как самый жирный. Но сейчас чистый чатик не в тренде, вот сюда >>1560761 (OP) лучше загляни.
>>1567319
27б эмбеддинг, ахренеть.

Аноним 30/03/26 Пнд 18:07:36 #146 №1567440

17446471760840.jpg

Братья во дрочении. Очень давно не заходил к вам. Подскажите пожалуйста, появился ли новый ёба аналог омнино опус магнум? Меня в принципе и он устраивает но если на горизонте есть что то ебейшее то поделитесь пожалуйста.

Аноним 30/03/26 Пнд 18:10:17 #147 №1567443

>>1567440 => >>1566908
Менестрель попробуй, он норм. Отсказов не ловил, но если ты его таки затриггеришь, то есть и анцензы на него.

Аноним 30/03/26 Пнд 18:13:21 #148 №1567446

image

>>1567429
Чета орууу с этих диалогов.

Аноним 30/03/26 Пнд 18:24:52 #149 №1567450

чет тестю квены плотненькие и чет всё говно какое то...

Аноним 30/03/26 Пнд 18:30:44 #150 №1567453

>>1567450
Я протестил оч много, из всего только writer (не v2) немного порадовал. Остальное совсем жиденькое и уж точно не на уровне Геммы, местами даже похуже MS3.2

Аноним 30/03/26 Пнд 18:32:08 #151 №1567454

>>1567087
По тексту и стилю помойки палятся

Аноним 30/03/26 Пнд 18:47:29 #152 №1567463

>>1567398
"Это..." - прошептала Элара - "Не просто текст... а сообщение. Что-то... живое! Это квенослоп! Ползучий квенослоп!
И это наш будущий
дом."

Аноним 30/03/26 Пнд 18:51:20 #153 №1567468

>>1567463
Гемма пишет точно так же, ну

Аноним 30/03/26 Пнд 18:52:25 #154 №1567470

>>1567450
Кванты бери пожирнее и без иматрикса. Слопа поменьше будет.

Аноним 30/03/26 Пнд 18:59:20 #155 №1567475

uYJuMAXLBeCVZeylcGMT6H2MoVM-1920.jpg

(слопа, конечно же, меньше не стало)

Аноним 30/03/26 Пнд 19:02:34 #156 №1567477

Какая же парашная система сортировки в таверне. Сначала создай тег, затем открой чат, потом протегай персонажа прям в чате, закрой чат, открой поиск, введи ебоманый тег, выбери этот тег нахуй блять сколько можно а сколько можно, и только потом таверна позволит выбрать тебе найти персонажа по тегу который тебе уже нахуй не нужен потому что ты заебался наглухо

Какой ебанутый фашист это придумал?

Аноним 30/03/26 Пнд 19:03:42 #157 №1567478

>>1567477
Таверна в некоторых местах эталон термина: насрал в коде и костыли.

Аноним 30/03/26 Пнд 19:08:05 #158 №1567482

>>1567477
Да там ного всякого кала. Невозможность многих операций когда идёт генерация например. Даже тупо карточки другие не посмотреть или чаты

Аноним 30/03/26 Пнд 19:10:48 #159 №1567484

>>1567477
>создай тег, затем открой чат, потом протегай персонажа прям в чате, закрой чат, УДАЛИ НЕНУЖНЫЙ ТЕБЕ ЧАТ КОТОРЫЙ ТЫ СОЗДАЛ ТОЛЬКО РАДИ ТОГО ЧТОБЫ ПОСТАВИТЬ ТЕГ НА ПЕРСОНАЖА ЕБАТЬ СПАСИБО НАХУЙ, открой поиск, введи ебоманый тег, выбери этот тег
Дополнил

>>1567478
Почему нельзя просто создать папку и закинуть туда персонажей и потом щёлкать по папкам, а не по ебаным тегам? Кто вообще исползует теги в 2026 вместо папок? Линуксоиды?

Аноним 30/03/26 Пнд 19:15:27 #160 №1567488

>>1567477
В чат заходить необязательно. При импорте автоматически подтягиваются вложенные в карточку теги. Хз, как по мне оч удобно

Аноним 30/03/26 Пнд 19:18:12 #161 №1567492

>>1567488
Всё равно костыль

Аноним 30/03/26 Пнд 19:20:22 #162 №1567494

>>1567484
>просто создать папку и закинуть туда персонажей и потом щёлкать по папкам
Это какая-то большая обида разраба таверны, и он сказал папок нибудет никада.

Аноним 30/03/26 Пнд 19:22:57 #163 №1567498

>>1567494
Пиздец. Его менюшка тегов это кромешный пиздец. А что если у меня 1к чариков и на них два десятка тегов, м? Вот было бы у меня в менюшке справа два десятка папок, то мне было бы норм, но два десятка тегов в тонюсенькой строчке размером с член комара это нахуя вообще так делать? Ну вот чтобы что? Чтобы у тебя было максимум 10 чариков и 2-3 тега на них?
Ладно, хуй с ним с обиженным разрабом. Может кто-то создал какой-то экстеншен для таверны с удобной сортировкой?

Аноним 30/03/26 Пнд 19:26:16 #164 №1567500

Погонял значит мое квена 35 и не могу понять, за что его так нахваливали. Быстрый? Ну да, быстрый. Только толку, если мозгов особо нет. Ризонинг вообще бесполезен - увеличивает время генерации, тратит впустую токены, и выдает почти такой же ответ, что и без него. Более того, в процессе размышлений может словить шизу и отойти от основной задачи. Пишешь в запросе, условно, мне нужен такой-то код, который будет делать такие-то вещи. Всё, ничего более. Без мышления он это и делает (почти всегда), вместе с размышлениями, начинает сам себе объяснять каждую строчку и потом тащит это в ответ, объясняя мне каждую строчку. Но кроме этого, часто он начинает подключать вообще ненужные библиотеки и тратить время на них, потому что в своей цепочке он выяснил что "вообще-то это можно сделать иным способом, похуй что там хочет этот дурачок, он ничего не понимает" и выдает мне полотно которое работает, но работает не так, как его попросили.

Ну а вижен просто хорош. Пока много его не тестировал, но из 20 пикч которые я ему скормил, он каждую нормально обработал, не упустив ключевых деталей. На некоторых даже верно указал локацию съемки, на других приблизительно, но ни разу не ошибся. Такие уот мысли.

Аноним 30/03/26 Пнд 19:27:30 #165 №1567502

>>1567498
Вот что видел https://github.com/Sillyanonymous/SillyTavern-CharacterLibrary
Попробуешь, отпишись

Аноним 30/03/26 Пнд 19:28:23 #166 №1567505

>>1567498
У меня 2500 было (неразобранных/несортированных), и да, это это адЪ.

Аноним 30/03/26 Пнд 19:56:26 #167 №1567521

1705016019170.png

>>1567494
У меня есть папки. Это не стандартная фича? У меня прост еще расширений куча, но так не помню чтобы для этого что-то ставил

Аноним 30/03/26 Пнд 19:57:38 #168 №1567523

>>1567521
Найди пожалуйста то самое расширение с папками

Аноним 30/03/26 Пнд 19:58:09 #169 №1567526

>>1567502
Не очень локально получается. Подхват онлайна может залезть в безопасность.

мимо

Аноним 30/03/26 Пнд 20:02:04 #170 №1567531

1676467245546.png

1725176306449.png

>>1567523
У тебя нет этих кнопок?
там нада вкл чтобы тег отображался как папка

Аноним 30/03/26 Пнд 20:03:11 #171 №1567532

Так, и где там эта ваша гемма 4 или хотя бы слухи о ее капабилитиз?

Аноним 30/03/26 Пнд 20:05:10 #172 №1567533

>>1567531
> там нада вкл чтобы тег отображался как папка
У меня кстати, если включить эту опцию, то появляется лаг видео при обновлении бровзера.

Аноним 30/03/26 Пнд 20:07:51 #173 №1567534

image

>>1567532
Ебала реддиторов и тредовичков представили, когда выяснится, что на арене не гемма, а очередной ноунейм-китаец, в которого дистиллировали гемини и теперь он считает себя моделью от гугла?

Аноним 30/03/26 Пнд 20:08:19 #174 №1567535

>>1567531
Но это же и есть теги, нет? Вон сверху написано тег манагемент. А персонажей в папки как засунуть чтобы они лежали списком в правой панели?

Аноним 30/03/26 Пнд 20:09:52 #175 №1567539

>>1567535
Так создай теги с названием нужных папок. Это же просто способ отображения а не структура файлов

Аноним 30/03/26 Пнд 20:12:14 #176 №1567540

>>1567539
Ну так я же об этом выше написал. Что нужно создать тег а потом тегать персонажей вручную если у них нет тегов
Папка с персонажами тут причём? Я же про папку спросил, а не про теги

Аноним 30/03/26 Пнд 20:13:52 #177 №1567543

>>1567534
Ни когда такого не было

Аноним 30/03/26 Пнд 20:14:25 #178 №1567544

>>1567540
Они работают как папки в таверне, если включить опцию. Я так и не понял в чем разница тегать и перетаскивать в папочку аки в проводнике

Аноним 30/03/26 Пнд 20:16:02 #179 №1567545

>>1567544
Погоди, а как именно ты перетащил персонажа в папку?

Аноним 30/03/26 Пнд 20:19:52 #180 №1567549

>>1567545
Я говорю что протегать быстрее, чем пытаться перетаскивать в веб интерфейсе с одним окном

Аноним 30/03/26 Пнд 20:23:24 #181 №1567550

>>1567549
Разница в том чтобы не тегать вручную чариков у которых нет тегов по тем или иным причинам, а просто засунуть их в папку

Аноним 30/03/26 Пнд 20:27:10 #182 №1567553

>>1567550
Ну ок, но я так и не уловил отличия между закинуть в папку и добавить тег. Разве что экспортировать с тегками потом надо для публикации

Аноним 30/03/26 Пнд 20:32:30 #183 №1567560

>>1567553
В смысле не уловил отличия? Закинуть в папку драгндропом прям из листа персонажей или сидеть вручную проставлять теги а потом создавать под них отдельную папку это равноценные для тебя вещи?

Аноним 30/03/26 Пнд 20:33:18 #184 №1567562

1.png

2.png

>>1567453
> writer (не v2) немного порадовал
Несколько раз в треде хвалили Writer, так что решил и я попробовать. Ух, давно таких эмоций не испытывал.

Дело было так: Writer 27б Q6 mradermacher (но тут не суть, я тестил и Бартовского, в целом одинаково), лайтовый ром-ком слайс оф лайф сценарий, наиграл ~15к контекста с исключительно соответствующим наполнением: шутки, подколы, нелепые ситуации, никакой драмы или саспенса. Оккультному клубу (группа бездельников) поручили провести расследование в библиотеке, потому что кто-то пустил слушок, что там после закрытия бродит привидение (на самом деле это птицы, которые поселились на чердаке). По ходу дела Квен, как он часто это делает, ухватился за конкретную вещь из контекста и не хотел ее отпускать - у одного из персонажей постоянно приходили уведомления на телефон. Меня это достало, и я решил спросить в чем дело. Тут и понеслось: вопреки контексту и инструкциям, где прямо указано, куда двигать историю, все превратилось ни то в триллер, ни то в паранормальный хоррор. Как выяснилось, за студентами следят, прислали какое-то проклятое видео прямиком из The Ringu. Это очень смешно. Со стороны может не понять, но когда рандомно ловишь такой делирий - это лучшее. В последний раз у меня такое было на каком-то из тюнов Мистраля 24б год назад, когда ночная беседа с скучающей девушкой-заправщицей превратилась в хоррор уровня Алана Уэйка, с паранормальным туманом и тенями, что вызывают амнезию. Такое не запромптить.

А если серьезно, 27б Квены пока что скорее радуют. Потенциал точно есть, даже инструкт радует, как в свое время QwQ 32б. Если получим тюн уровня Сноудропа, но постабильнее - буду рад.

Аноним 30/03/26 Пнд 20:36:01 #185 №1567566

>>1567562
>ночная беседа с скучающей девушкой-заправщицей превратилась в хоррор уровня Алана Уэйка, с паранормальным туманом и тенями, что вызывают амнезию
Это что-то плохое что ли?

Аноним 30/03/26 Пнд 20:36:26 #186 №1567567

>>1567560
Тег надо только один добавить с названием папки. Тебе наверно лучше попробовать, я уже утомился, это не слишком сложное дело и у меня полное ощущение что ты не понимаешь как работает интерфейс

Аноним 30/03/26 Пнд 20:39:54 #187 №1567571

>>1567566
Смотря как посмотреть. В моем случае - совсем нет, это наоборот одно из лучших воспоминаний. К сожалению, я уже и не вспомню какой именно это был тюн, но было весело. Просто нужно быть открытым к такому. Это не нормальное поведение модели, не фича, а баг. Когда у тебя есть много тысяч контекста с преобладающим в определенную сторону контекстом и ясно изложенные инструкции, задающие жанр, такого быть не должно. Потому я и говорю - такое не запромптить, и похожий результат не получить на стоковых инструкт моделях.

Аноним 30/03/26 Пнд 20:40:06 #188 №1567572

>>1567567
>
>>1567477
>>1567484

Аноним 30/03/26 Пнд 20:41:54 #189 №1567573

>>1567572
Какая-то шиза, все еще рекомендую разобраться в интерфейсе

Аноним 30/03/26 Пнд 20:43:46 #190 №1567574

>>1567573
Ну так перепрочти, если такой тупой

Аноним 30/03/26 Пнд 20:44:04 #191 №1567576

>>1567571
>Это не нормальное поведение модели, не фича, а баг.
Кто тебе сказал такую глупость? Это как раз фича врайтера, да и блюстара тоже - они пытаются тебе историю создать, а не просто чатик. Хз зачем ты взял сюжетные тюны, если не хочешь видеть сюжеты.
>Когда у тебя есть много тысяч контекста с преобладающим в определенную сторону контекстом
То есть в контекст насрал ты, добавив лишние детали, но виновата модель которая за эти детали зацепилась?

Аноним 30/03/26 Пнд 20:45:09 #192 №1567579

>>1567574
Ты наверно не обнаружил кнопку bulk edit все что я могу сказать. Попробуй еще раз, интерфейс не такой сложный

Аноним 30/03/26 Пнд 20:53:46 #193 №1567585

>>1567579
Лучше бы просто объяснил ньюфагу как пользоваться фичей, зач как мудло себя вести, если видишь, что чел затык словил?
>>1567574
Булкой квадратик с карандашиком над списком персонажей обмажь нужных тебе чариков, выставь им общий тег. Они у тебя сложатся в папочку. Камень я не дам. Папочку надо создать.

Аноним 30/03/26 Пнд 21:00:23 #194 №1567590

>>1567585
>Лучше бы просто объяснил ньюфагу как пользоваться фичей, зач как мудло себя вести, если видишь, что чел затык словил?
Я даже картинки прикладывал, есть предел терпению

Аноним 30/03/26 Пнд 21:02:10 #195 №1567591

Не знаю как давно вышел, но вот:
https://github.com/SpicyMarinara/Marinara-Engine
Кто-то уже попробовал? Попозже и сам заценю отпишусь.

Аноним 30/03/26 Пнд 21:04:17 #196 №1567592

>>1567590
Иисус терпел и нам велел. Хочешь сделать благо - делай до конца.

Аноним 30/03/26 Пнд 21:04:26 #197 №1567593

Какой же Квен говнюк - вычисляет юзера в полотне неформатированного контекста по незаполненной карточке! Стоило минимально тегами обрамить персону - все пропал USer - стал персонажем.

Аноним 30/03/26 Пнд 21:05:23 #198 №1567594

>>1567576
> Это как раз фича врайтера, да и блюстара тоже - они пытаются тебе историю создать, а не просто чатик.
Любая модель пытается историю создать, а не просто чатик, если ее так запромптить и использовать. Но в данном конкретном случае это классическое игнорирование инструкций и разворот истории на 180 градусов. Собственно, я и не против и мне даже понравилось. Ты разглядел в моем посте негатив?
> То есть в контекст насрал ты, добавив лишние детали
Чем же я таким насрал в контекст? Вот всегда так, по ту сторону экрана всем виднее, что у кого в семплерах, промптах, контексте. Ругаться не хочу, у тебя может плохой день выдался. Отдохни хорошенько.

Аноним 30/03/26 Пнд 21:05:24 #199 №1567595

>>1567502
Выглядит охуенно, спасибо. Кажется это идеальная штука для меня. Ещё и чуб с уборщиком подхватывает
>>1567585
Хосспади, какой же я слепошарый, пиздец просто... спасибо!
>>1567590
Я тебя когда спросил про то как карточки в папку добавить ты мне чё ответил? Хуйню. Вот хуйню в ответ и получил. Чел выше ответил заебись даже без скринов

Аноним 30/03/26 Пнд 21:08:02 #200 №1567597

>>1567595
На здоровье. Только вон ту штучку, что сама подхватывает сайты и имеет доступ к твоим папкам, юзай с осторожностью.

Аноним 30/03/26 Пнд 21:11:34 #201 №1567600

image.png

>>1567591
Ого, сам клауде в контрибуторах

Аноним 30/03/26 Пнд 21:12:59 #202 №1567601

>>1567595
>Я тебя когда спросил про то как карточки в папку добавить ты мне чё ответил? Хуйню. Вот хуйню в ответ и получил. Чел выше ответил заебись даже без скринов
Вот и благодарность

Аноним 30/03/26 Пнд 21:19:20 #203 №1567608

А если я по незнанке сохранял карточки с убощика без импорта, просто вручную, то всё, я проебал теги с них навсегда? Мне теперь никак их не протегать заново без ебли с внешними ссылками на их страницы? Ну что за пиздец а...

Аноним 30/03/26 Пнд 21:21:06 #204 №1567612

>>1567594
>Любая рп модель пытается историю создать
Пофиксил тебя. А у врайтера это выкручено на максимум. Он пишет историю даже там, где персонаж должен просто снять трусы. Так что вина на твоей стороне, а не на стороне модели.
>Ты разглядел в моем посте негатив?
Я? Нет. Каким образом? Мне самому нравится, когда модель начинает подкидывать в аутпут какие-то посторонние штуки, которые можно использовать для продолжения истории. Но ты как будто требуешь строгий ассист в истории от модели которая создана мягко говоря для другого. Для исекаев сисюнь.
>Чем же я таким насрал в контекст?
Ты же сам сказал, что телефоном. Телефон вещь многофункциональна. Модель воспринимает его как возможную опцию для продолжения сюжета. В чём не права? Если ты так стриггернулся на мобильник, нужно было удалить его из контекста, например выбросить, прямо сказав модели, что телефон отправился нахуй.
>Вот всегда так, по ту сторону экрана всем виднее, у кого какой день выдался
Оставляю тебя с твоей же шпилькой наедине.

Аноним 30/03/26 Пнд 21:30:04 #205 №1567622

>>1567612
> Так что вина на твоей стороне, а не на стороне модели.
Ого. А я виновного искал где-то? Сказал, что модель плохая? То, что она не следует инструкциям вовсе не говорит, что я ее оцениваю негативно. Ты воюешь сам себе врага придумал и с ним же воюешь. Нечем заняться?
> Но ты как будто требуешь строгий ассист в истории от модели которая создана мягко говоря для другого.
Нет, я хочу чтобы модель на системную инструкцию "This is a lighthearted slice of life, rom-com, tension-free story..." с 15к соответствующего ролеплея не сводила аутпуты к хоррору. Это игнорирование инструкций, а не креатив.
> Оставляю тебя с твоей же шпилькой наедине.
Лучше бы тред от себя освободил, чем генерировать негатив на ровном месте.

Аноним 30/03/26 Пнд 21:35:42 #206 №1567625

>>1567622
Чел, ты тут не первый день, чего удивляешься? Срачи на ровном месте итт это классика. Большинство 12-24b васянотюны в лоботомитоквантах гоняют с целью получить заветное ты меня ебешь, а ты тут про инструкции

Аноним 30/03/26 Пнд 21:36:02 #207 №1567627

>>1567534
Больше не меньше, про жлм тоже такое говорили но норм же моделька.
>>1567622
> на системную инструкцию "This is a lighthearted slice of life, rom-com, tension-free story..." с 15к соответствующего ролеплея не сводила аутпуты к хоррору
А там нет каких-нибудь моментов в истории, имен или чего-либо релейтед хоррору? Мимо если что.

Аноним 30/03/26 Пнд 21:37:16 #208 №1567631

image.png

>>1567591
Пока ток положительные эмоции.
Сразу есть импорт из таверны всего что только можно. Можно лорбуки юзать с чаткомплишном. Поддержка агентов. У всех карточек есть дохуя параметров поиграться. Немного больше времени занимает начать чат. ЮИшка интуитивно понятная.
Советую попробовать.
>>1567600
Не видел, нихуя соби. Но я так понимаю это популярная личность, пилила промпты для рп и бложик ведет.

Аноним 30/03/26 Пнд 21:39:53 #209 №1567635

>>1567622
>Лучше бы тред от себя освободил, чем генерировать негатив на ровном месте.
Да, было бы хорошо, если ты освободил тред от себя и не генерировал негатив на ровном месте.
>Нет, я хочу чтобы модель на системную инструкцию
Слайсуха в хоррор с полным погружением. Что не нравится?
>This is a lighthearted slice of life, rom-com, tension-free story
А должно быть. "You should keep lighthearted slice of life, rom-com, tension-free story". Ты же даёшь инструкцию, а не описываешь старт. Сам себе в промт насрал, и разводишь тут негатив.

Аноним 30/03/26 Пнд 21:41:03 #210 №1567638

>>1567625
Даже добавить нечего к твоим словам. Вангую что сейчас до промпта или еще чего-нибудь докопается, чтобы дальше вонять
>>1567627
> А там нет каких-нибудь моментов в истории, имен или чего-либо релейтед хоррору?
Неа, несмотря на название "Occult club" в промпте вообще ничего связанного с оккультизмом или соседствующими темами. Это пустая комната, в котором бездельники пьют чай. В ней нет ничего кроме чайных сервизов и плюшевых игрушек (литералли). И конечно, в дополнение к инструкциям нет никаких трагичных бекстори или чего-нибудь такого. Просто выроллил. Это было весело, мне понравилось. Иногда такое безумие заходит как надо.

Аноним 30/03/26 Пнд 21:42:08 #211 №1567639

>>1567591
>Кто-то уже попробовал? Попозже и сам заценю отпишусь.
Пробовал его RPG-экстеншн для Таврены - идеи хорошие, но у Таверны просто нет таких функций. А у агентов есть. Заценим.

Аноним 30/03/26 Пнд 21:42:34 #212 №1567640

>>1567638
Ты и сам воняешь нихуёво, серун блять

Аноним 30/03/26 Пнд 21:43:11 #213 №1567642

>>1567638
>Это пустая комната, в котором бездельники пьют чай.
Лол, как то скачал карточку чайного клуба.
А там людей ебут. И вовсе не по их воле.

Аноним 30/03/26 Пнд 21:46:14 #214 №1567646

>>1567627
Вполне возможно что это GLM 5.1 Air. Зайки очень любят обучать свои модели на слопе Гемини. А учитывая вот это >>1566456 я почти уверен, что это их модель. Гемма бы никогда такое не написала, она приличная девочка.

Сюка, надеюсь и то и другое выйдет раньше ебучего чебурнета.

Аноним 30/03/26 Пнд 21:46:18 #215 №1567647

>>1567608
Не совсем. Если ты в таверне забиваешь тег и тебе выпадает желаемый персонаж, то тег у него сохранён. Просто у тебя импорт слетел. Попробуй подцепить с сайта, если это для тебя так важно.

Аноним 30/03/26 Пнд 21:47:14 #216 №1567648

>>1567646
Учитывая размеры 5глм, то не сыпь соль на рану ram.

Аноним 30/03/26 Пнд 21:49:55 #217 №1567651

>>1567562
Слышь, про квен поуважительнее
Инструкциям он блять не следует
У нас в треде за такое убивают

Аноним 30/03/26 Пнд 22:02:10 #218 №1567662

>>1567638
Может оно просто срандомило в один момент и в посте какие-то предпосылки к этому выплюнуло, а ты не придал значения? Или же это происходит стабильно но разных чатах?
>>1567646
Да хоть yi или llama-5, главное чтобы хорошее было. Размером бы только ~200б и умное с вижном, вот это было бы хорошо.
>>1567651
За квены и двор стреляю в упор! Там же тюн какой-то странный, что угодно может быть.

Аноним 30/03/26 Пнд 22:04:37 #219 №1567667

image.png

>>1567591
?

Аноним 30/03/26 Пнд 22:05:20 #220 №1567670

>>1567667
Вибратор, чел.

Аноним 30/03/26 Пнд 22:10:59 #221 №1567674

17547078986420.webm

>>1567670
А зачем это в текстовом чате??????

Аноним 30/03/26 Пнд 22:12:53 #222 №1567676

>>1567674
Чтобы вибрировало, погружение в карточку со страпоном так сказать

Аноним 30/03/26 Пнд 22:13:29 #223 №1567677

>>1567674
Чтобы на словах "я ебу тебя - ты ебёшь меня" заводился не только твой мозг. Не для тебя это сделано и не для таких как ты.

Аноним 30/03/26 Пнд 22:16:29 #224 №1567680

>>1567674
26 год на дворе, не текстовыми чатами едиными.

Аноним 30/03/26 Пнд 22:18:01 #225 №1567683

сейчас бы квенчика, плотненького такого...

Аноним 30/03/26 Пнд 22:19:42 #226 №1567684

>>1567683
40б только остался, брать будете?

Аноним 30/03/26 Пнд 22:22:25 #227 №1567686

>>1567662
> Или же это происходит стабильно но разных чатах?
Он в целом довольно нестабильный. В другом чате 25к контекста, определенно заданная тональность истории и твердо установлено окружение - никого не должно быть вокруг, не существует никакого способа там оказаться кому-нибудь кроме чара и юзера. С первых токенов и до последнего это соблюдается. Writer довольно скоро начинает искать возможность кого-нибудь заспавнить и привязать к истории. Делирий, но контролируемый. Возможно, я избалован большими МоЕ моделями и тем, как они и следуют инструкциям, и при этом развивают историю дальше. Справедливости ради 27б инструкт ведет себя как надо, так что это особенность тюна, очевидно.

Аноним 30/03/26 Пнд 22:23:11 #228 №1567688

image

>>1567676
>>1567677
>>1567680
А разве VaM не лучше для этого? Там и вр, и полное погружение, и ии поключить для общения можно. Зачем текстовый чат... Для старушек каких то совсем?

Аноним 30/03/26 Пнд 22:30:45 #229 №1567695

>>1567680
> не текстовыми чатами едиными.
Вот да!

Что там у кого на агентском поле не в смысле метнуться душно кабанчиком, а для рп? Всякие голос, картинки подключаться должны проще, чем в таверне вроде

Аноним 30/03/26 Пнд 22:31:16 #230 №1567696

>>1567625
Буквально меня описал.

Аноним 30/03/26 Пнд 22:31:31 #231 №1567697

>>1567688
Ты ничего не забыл сказать про VaM, ну к примеру, что его интерфейс как у ебучего блендера.

Аноним 30/03/26 Пнд 22:32:19 #232 №1567700

>>1567686
Да, поджаренный тюн 100%. Понять простить или дропать.
> избалован большими МоЕ моделями
Новый большеквен не зашел?
>>1567688
> VaM
Надо разбираться, это просто секс симулятор для нердов и пердоликов?

Аноним 30/03/26 Пнд 22:35:10 #233 №1567701

image.png

>>1567667
Я с этого кекнул.
Продолжаю тыкаться, куда удобнее пердолиться с промптами. Чаты куда более живые, можно добавить расписание персам еще какую-то хуйню. Продолжаю тыкать и удивляюсь сколько приколов.

Аноним 30/03/26 Пнд 22:35:11 #234 №1567702

>>1567697
>ну к примеру, что его интерфейс как у ебучего блендера.
Че? Совсем нет.

>Надо разбираться, это просто секс симулятор для нердов и пердоликов?
Ну не просто, а лучший на планете.Ну а так, наверное, да. Как и нейросетки для рп.

Аноним 30/03/26 Пнд 22:35:38 #235 №1567705

>>1567700
>>1567702

Аноним 30/03/26 Пнд 22:36:44 #236 №1567706

>>1567702
Ой вруша же ты. Нет, Vam пиздат. Спорить не буду, он просто охуенен.
Но сам редактор сцен это ебучий аътунг с тысячей ползунков. Это буквально 3D редактор сцен, где ты часов 10 будешь делать минутную сцену. Охуенно? Да.
Но мне как бы уже к концу ебли с ним, уже не очень то и хотелось.

Аноним 30/03/26 Пнд 22:37:51 #237 №1567707

>>1567697
Не знаю, что за VaM, но у Блендера очень даже классный интерфейс. Если не нравится, его можно перенастроить под себя, он легко кастомизируется.
>>1567700
> Новый большеквен не зашел?
Очень хотел его попробовать, но в мои скромные 24+128 влезает только совсем печальный квант. Решил не портить себе впечатления и не мучать Квенчик. 27б 3.5 хороший для своего размера, уверен, позже будут достойные тюны. А вот 122б для рп не понравился, справляется хуже плотной 27, но как ассистент неплох.

Аноним 30/03/26 Пнд 22:38:43 #238 №1567708

>>1567706
Он намного проще блендера. Ты вообще блендер открывал?

Аноним 30/03/26 Пнд 22:39:12 #239 №1567709

>>1567706
>Это буквально 3D редактор сцен, где ты часов 10 будешь делать минутную сцену. Охуенно? Да.
Так готовых тысячи...

Аноним 30/03/26 Пнд 22:41:21 #240 №1567710

>>1567707
>Не знаю, что за VaM
Лучший симулятор ебли и мягкой физики тела в истории человечества (пока что) на юнити.

Аноним 30/03/26 Пнд 22:42:14 #241 №1567712

>>1567708
нет...
Но справедливости ради, я провел несколько лет в 3Dmax, так что считаю за релейтед.

>>1567707
>Не знаю, что за VaM
Virt-a-Mate. 3D редактор для создания VR порева с фурри и прочими непотребствами.

>>1567709
И опять разбирать тысячи слоев говна.

Ну короче, по ходу я просто неосилятор, но ебал я в рот его интерфейс.

Аноним 30/03/26 Пнд 22:49:30 #242 №1567716

image

>>1567712
>нет...
>Но справедливости ради, я провел несколько лет в 3Dmax, так что считаю за релейтед.
А я в 3д макс и майе. Ты что там, квадратные домики моделлил что ли? Или конвертил модельки из игр? Не более. В общем херню несешь.

Аноним 30/03/26 Пнд 22:55:05 #243 №1567726

>>1567702
Ну там уже по "гайду на интерфейс" можно понять что штука для настоящих мужиков. Крутость бесспорна, просто хз насколько тут подойдет. Это или буквально одна сцена и ультрафаст кум, или какой-то невероятной сложности проект с процедурной генерацией сцен и сложностью отладки.

А так накатил картинкогенерацию, рандомайзер, раздумья, речь и всякое типа музыки, инвентаря, управления игрушками и прочим - и сидишь урчишь. После отладки работает под широкий перечень кейсов, сочетание и новизну с интерактивом, и оставляет место для воображения.

Аноним 30/03/26 Пнд 23:00:45 #244 №1567734

>>1567716
>AnyBurn
Запахло проперженной кожаной курткой

Аноним 30/03/26 Пнд 23:06:33 #245 №1567739

Джей и Молчаливый Боб -А ты бы трахнул овцу.mp4

>>1567734
Диски вечны. Всех нас переживут.

Аноним 30/03/26 Пнд 23:17:53 #246 №1567741

>>1567158
Золото

Аноним 30/03/26 Пнд 23:23:53 #247 №1567744

image

1 Zach Harper в X Oh my god httpst co7hzJ0lBG1C X-01.mp4

>>1567726
>А так накатил картинкогенерацию, рандомайзер, раздумья, речь и всякое типа музыки, инвентаря, управления игрушками и прочим - и сидишь урчишь. После отладки работает под широкий перечень кейсов, сочетание и новизну с интерактивом, и оставляет место для воображения.
Вот только все это интегрируется в вам.

Аноним 30/03/26 Пнд 23:34:56 #248 №1567749

VoxtasDinerDreamDate1.mp4

>>1567744
Вот смотри как ллм в риалтайме работает в вр, в 3д, пока вы в своих чатиках зависаете.

Аноним 30/03/26 Пнд 23:35:23 #249 №1567751

>>1567726
>>1567749

Аноним 30/03/26 Пнд 23:41:27 #250 №1567756

>>1567749
>Вот смотри как ллм в риалтайме работает в вр, в 3д
>не кунни
Пффф...

Аноним 30/03/26 Пнд 23:44:13 #251 №1567758

1.mp4

>>1567756

Аноним 30/03/26 Пнд 23:47:44 #252 №1567764

Скуфы захватили тред помогите

Аноним 30/03/26 Пнд 23:47:44 #253 №1567765

image

>>1567749
Так это работает хуже чем чатик. Текст от ллмок обрабатывается мозгом так же как при чтении книги и рисует красочные реалистичные миры в которые погружаешься и веришь им. А тут просто мультик со зловещей долиной. Такая херня будет работать только тогда, когда картинка будет неотличима от реальности.

Аноним 30/03/26 Пнд 23:48:53 #254 №1567768

>>1567765
>когда картинка будет неотличима от реальности

длсс 5 скоро

Аноним 30/03/26 Пнд 23:51:41 #255 №1567775

молитва финико шизов 1.mp4

>>1567765
>Такая херня будет работать только тогда, когда картинка будет неотличима от реальности.
Где ты увидел там зловещую долину? Зловещая настает как раз в видосах нейросеток.

Аноним 31/03/26 Втр 00:09:54 #256 №1567788

V значит Вендетта. Финальная сцена(2).mp4

Есть разные мнения о влиянии нейросетей на человеческий интеллект.
Некоторые исследователи считают, что использование нейросетей может усилить лучшие качества человеческого мышления. Например, если ИИ берёт на себя вспомогательные функции, у человека остаётся больше «умственного пространства» для размышления высокого уровня, творчества и стратегического планирования. habr.com
Также есть мнение, что частотное (чиво блять, алиса??? нахуй тебя так жестко то квантовали) использование ИИ снижает уровень критического мышления. trends.rbc.ru
Кроме того, есть прогнозы о том, что в будущем ИИ будет брать на себя всё больше когнитивных функций. Например, Билл Гейтс, глава Microsoft, предполагает, что в будущем именно ИИ будет определять, какие задачи будут делегированы людям, а какие — перейдут машинам. trends.rbc.ru
В 2025 году Илон Маск заявил, что к 2029–2030 годам искусственный интеллект, скорее всего, превзойдёт ум человека. dzen.ru
Главный специалист по ИИ компании Meta Янн Лекун, в свою очередь, считает, что до создания ИИ уровня человека могут пройти не годы, а десятилетия. По его мнению, современные ИИ-модели пока не обладают способностями к памяти, мышлению, планированию и рассуждению, как это свойственно человеку, а лишь имитируют эти навыки.

Ну все всё поняли.

Аноним 31/03/26 Втр 00:19:44 #257 №1567795

>>1567302
>>1567314
>24 VRAM 96 RAM
>Для MOE 120
16+64 репортинг ин. Глм эйр влезает в Q4_K_XL с 32к контекста в Q8 (~10 т/c), квен 122b влезает в IQ4_XS с 32к контекста без квантования (~14 т/c). Линукс. Скорости на кобольде, на лламецпп быстрее на 0.5 - 1 т/с но я ебал в рот по кд из исходников собирать.

А ещё можно гонять жиноквен предыдущий в IQ2_S и он очень даже неплох. По сравнению с 3.5 - считай вообще без цензуры. Но скорость пососная, что-то около ~5 т/с.

Аноним 31/03/26 Втр 00:21:07 #258 №1567798

>>1567749
Как концепт круто, как реализация - зловещая долина.
Про главную проблему уже написал - или примитивный кум на заготовленных ассетах, или очень много пердолинга ради того же кума в другой локации. Ты не сможешь бороздить космос гордым торговцем с ксенос-жена, грабить караваны с неками-разбойницами устраивая потом оргии прямо над награбленным, тискать кицуну в горной деревне, отыграть Момонгу развивая свой регион, истребляя кобольдов кваготов и закнокапить всех женских персонажей, и многое другое. То есть технически сможешь, но не захочешь, потому что количество затрачиваемых усилий даже только для одной части кума велико.
Вот запилят процедурную генерацию хорошего качества - тогда и окунемся.

Аноним 31/03/26 Втр 00:32:34 #259 №1567808

15838622039980.webm

>>1567798
Нормальную ии генерацию движений запилят - и все будет.

https://daily.afisha.ru/games/24141-konec-eyforii-kak-fizika-gta-4-operedila-svoe-vremya-a-potom-stala-nikomu-ne-nuzhnoy/

Аноним 31/03/26 Втр 00:48:10 #260 №1567813 DELETED

Кто здесь настоящий Нико Белич?

Аноним 31/03/26 Втр 00:53:43 #261 №1567821

>>1566768
Стоит, отличное качество, причём даже на 9b.
Уж куда лучше "еретика".

Завтра ещё 35b посмотрю от того же автора.

Аноним 31/03/26 Втр 01:02:42 #262 №1567826

image

17317467087000.mp4

Что с вами будет, если вы потеряете весь доступ к пк и энергии из-за какой-либо катастрофы?

Аноним 31/03/26 Втр 01:35:31 #263 №1567859

>>1567826
Будем дрочить по памяти.

Аноним 31/03/26 Втр 01:37:57 #264 №1567863

image.png

>>1567821
Какую качать?

Аноним 31/03/26 Втр 01:43:33 #265 №1567875

>>1567863
Ту которая у тебя влезет в память с учетом -1.5гб на контекст.

Аноним 31/03/26 Втр 01:45:51 #266 №1567877

>>1567875
16+16.. Значит можно q6 скачать?

Аноним 31/03/26 Втр 01:48:56 #267 №1567881

>>1567877
Дыа. Но Q6 в целом излишен для подрочить.

Аноним 31/03/26 Втр 01:51:59 #268 №1567882

image

>>1567877
>16+16.. Значит можно q6 скачать?
Значит можно вот это >>1566926 качать, а не лоботомита 9b. Ну ёбанарот, для кого писал...

Аноним 31/03/26 Втр 01:55:02 #269 №1567883

>>1567877
Так, стоп. У тебя 16+16 это две видеокарты. Или 16Vram и 16 Ram?

Аноним 31/03/26 Втр 01:57:28 #270 №1567884

>>1567883
Врам + озу

Аноним 31/03/26 Втр 01:58:40 #271 №1567885

>>1567884
Тогда да, вот тут читай и бери мистраль или гемму, самое то для новичка для вкота. >>1567882

Аноним 31/03/26 Втр 02:02:51 #272 №1567886

>>1567882
Спасибо. Я уже скачиваю это. Попробую все и квен так же.

Аноним 31/03/26 Втр 02:33:41 #273 №1567892 DELETED

Настоящий или ллм?

Аноним 31/03/26 Втр 02:41:28 #274 №1567895 DELETED

Как думаете я реалльно чс человеком пиздел джва часа?

Аноним 31/03/26 Втр 02:55:07 #275 №1567901 DELETED

А вот это уже реальный юзер

Аноним 31/03/26 Втр 03:12:25 #276 №1567909 DELETED

>>1567901
где ты лазиешь вообще?

Аноним 31/03/26 Втр 03:28:06 #277 №1567916 DELETED

>>1567909
Не хочу испортить прекрасный мир живых людей в ллм, извини.

Аноним 31/03/26 Втр 03:38:08 #278 №1567925 DELETED

>>1567909

Аноним 31/03/26 Втр 03:45:17 #279 №1567928 DELETED

>>1567909

Аноним 31/03/26 Втр 04:02:35 #280 №1567932 DELETED

Аноним 31/03/26 Втр 04:42:53 #281 №1567945

image

Во все тяжкие - Это не мет Хайзенберг приходит к Туко1.webm

Аноним 31/03/26 Втр 06:34:20 #282 №1567996

>>1567795
> Линукс. Скорости на кобольде, на лламецпп быстрее на 0.5 - 1 т/с но я ебал в рот по кд из исходников собирать.
Ну ты кобольд...
Копировать вставить одну команду в консоль канеш труднее чем ждать нового кобольда

Аноним 31/03/26 Втр 08:27:07 #283 №1568036

>>1567863
У меня вот 12 гб + 32 гб (из них 25-27 доступно), но Q6 я не могу использовать, LMStudio говорит, что слишком мало памяти.
Как я понял, при загрузке модель целиком загружается в обычную оперативку, в дополнение к куску, что загружен в vram

Впрочем, я читал, что разница между Q4 и Q6 невелика.

Аноним 31/03/26 Втр 08:28:22 #284 №1568037

>>1567821
>35b посмотрю от того же автора
https://huggingface.co/HauhauCS/Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive/discussions/30

All other abliterated models I've tested, not just with Qwen3.5, performed much worse on my broad knowledge test. Apparently something about the process of removing denials seems to be scrambling the weights and causing a spike in hallucinations at the horizon of knowledge.

However, this one scored only a couple points lower than source model and remained just as coherent and skillful during the test. The small difference doesn't really matter since Qwen3.5 is, outside of STEM, broadly ignorant anyways and only scored 64/100 on my broad knowledge test, while other similarly sized models like Gemma 3 27b and Mistral Small 22b scored 74 or higher, so using Qwen3.5 for broad knowledge doesn't make much sense anyways.

I won't ask you how you did it, but I'm very impressed. You managed to do something nobody else was able to do and I previously thought impossible. Thanks.

В общем похоже это хидден гем для обладателей слабых пк.

Аноним 31/03/26 Втр 09:05:25 #285 №1568058

image.png

>>1568037
>В общем похоже это хидден гем для обладателей слабых пк.

Именно так. Смотри, братишка, на скриншот. Если хоть 1 вменяемый тюн появится, это будет вин тысячелетия для некро-ПК. Да даже без него может отлично работать, главное простыню размером с карточку ему в систем промпт воткнуть, чтобы он писал как надо.

Пикрелейтед — скорость на 130к контекста на 12 врам. А можно ведь кэш подрезать, если нужно взять там квант пожирнее, например.

Единственный минус в ризонинге. Отключать его нельзя ни в коем случае. Это может, лол, почему-то вызывать рефузы иногда, ну и мозгов там становится как у сберчата 1b. А вот с ризонингом эдак на 24б мистраль тянет по знаниям и логике, но суховат.

Ах да, на пике еретик, а не та модель, что ты скинул. Агрессив-хуессив часто ломает ризонинг, но я скачаю, попробую, вдруг там сок будет.

Аноним 31/03/26 Втр 09:11:38 #286 №1568063

>>1568058
>на 12 врам
А что там залезет? Третий квант?

Аноним 31/03/26 Втр 09:12:28 #287 №1568065

Господа, озаботился тут необходимостью перетряхнуть свои запасы LLM и удалил старьё.
В пека 128гб DDR4 3600, 4060ti-16, 3060-12 и v100-16.
Что сюда влезает из свеженького для РП на русском? Хорошо чтобы держало не меньше 64к контекста, лучше больше. А то качать сотни гигабайт чисто на пробу немного долго с моими интернетами.
Пока, пролистав треды, скачиваю qwen3.5-122B в q6 и qwen3,5-27B-writer в q6, есть ли ещё годнота?

Аноним 31/03/26 Втр 09:28:03 #288 №1568070

Хмм на русике квен 120б как вообще?
Как там цензуру пробить?

Аноним 31/03/26 Втр 09:30:22 #289 №1568072

>>1568063
4. 5 тоже, просто скорость упадёт. Если падает ниже 15, уже нет смысла юзать, плотная 27б будет лучше, так как на плотной 14 токенов в секунду на 65к контекста (но это если 20 врам и вторая карта полный кал). Однако плотную так разогнать уже никак не получится по контексту, он слишком жирный по сравнению с этой МоЕ.

>>1568065
>qwen3,5-27B-writer

Если готов к сое и отказам, то норм вариант, правда ризонинг говно (я признаю только оригинальный ризонинг, ибо у меня лишь с ним были заебись ответы по логике). В противном случае только аблитерация или еретики, и придётся перебрать, и ещё кванты придётся перебирать, потому что матрикс-хуятрикс, калибровочный датасет, это всё. Скачиваешь 5 версий еретиков/аблитераций и дрочишь на предмет отказов и качество русика.

Аноним 31/03/26 Втр 09:46:01 #290 №1568079

>>1567482
Я прям охуел, что они не смогли в многопоточность - если ты испортируешь карточку, то в это время нельзя генерировать ответ. В чем проблема раскидать такие второстепенные таски по воркерам - хз.

Я года 2 назад смотрел в кодовую базу таверны, чтобы прикрутить в неё фоновую генерацию (типо пока читаешь один ответ, на фоне уже высчитывается второй свайп) и как же там было насрано. Думаю, сейчас все стало только хуже.

Аноним 31/03/26 Втр 09:52:47 #291 №1568081

>>1567667
Tool calling который мы заслужили

Аноним 31/03/26 Втр 10:22:06 #292 №1568092

Торрент на 200ГБ лажа для обычного мимокрока, нужен разве что если ты соберёшься сам свой чара-архив поднимать.

200 гб там просто картинок, а промты лежат в дампе базы данных.

База данных - PostgreSQL, кастом. Можно на досуге попробовать расковырять, и почистить от говняка в полуавтоматическом режиме... потом как-нибудь.

Аноним 31/03/26 Втр 10:23:23 #293 №1568094

>>1568092
Там буквально в ридми написано что это дамп сайта. А по второму паку, есть что интересное?

Аноним 31/03/26 Втр 10:31:15 #294 №1568100

>>1568070
Использовать его старшего брата аутиста. Там цензуры нет вообще. Не, ну есть, но она сработала только на сцене с бдсм лоли моментс.
Т-щ майор, она 70 летняя феечка. И вообще йокай.

Аноним 31/03/26 Втр 10:39:34 #295 №1568106

>>1568079
Как минимум уже давно существует мультисвайп - генерация нескольких ответов сразу. Думаю, несложно будет отложить генерацию последующих свайпов, чтобы она была последовательной, а не параллельной. И абортить генерацию если ты идешь дальше по чату. У меня есть пара самописных экстеншенов для Таверны и мне кажется, что на код здесь жалуются только те кто ничего в этом не понимают или не работали раньше с опен сорсом. Ситуация везде такая

Аноним 31/03/26 Втр 10:45:30 #296 №1568108

Как в таверне генерить картинки из сообщений? Мне нужна отдельная модель для генерации, которую нужно присобачить к кобольду, всё правильно понял? Подскажи хорошую модель для гена, анон

Аноним 31/03/26 Втр 10:49:05 #297 №1568110

>>1568106
> на код здесь жалуются только те кто ничего в этом не понимают
Так жалуются не на код, как таковой, а на общую реализацию. Такое ощущение что разраб таверны, как в том советском мультике про переделать и недоделать.
Доработал групповой чат. Молодец. Но хули так через жопу.
Сортировка - просто пиздец. Папки по тегам. Это где у него в воспаленном мозгу могла прийти такая идея.
Мне тегать карточки буквами? Потому что, о неожиданность, к любой карточке идет тегов 5-6 минимум и я не могу выбрать тег всех тегов. Видно что у человека есть видение продукта, но чёт оно какое то странное, если честно.

>>1568108
В таверне можно к чату присобачить генерацию, там есть настройки. Но: реализация хуже чем у комфи. А так, в картинотреде посмотри. Но текстовая нейронка и так будет сжирать твою память, чтобы еще картинкогенерацию присобачить. Поиграться можно, но результат тебе не понравится.
А вот что может реально быть интересным, если говорилку подрубить.

Аноним 31/03/26 Втр 10:50:47 #298 №1568113

>>1568094
Остальные паки, если ты именно про char-archive, это предыдущие версии дампов, 200ГБ который - это финальный, декабрь 2025.

Аноним 31/03/26 Втр 10:53:08 #299 №1568116

>>1568110
> Так жалуются не на код, как таковой, а на общую реализацию
Будь общая реализация плоха, давно сделали бы форк или альтернативу. Но в итоге есть только нытье отдельных людей, которые не могут прочитать документацию как сделать отдельные папки для персонажей
> к любой карточке идет тегов 5-6 минимум и я не могу выбрать тег всех тегов
Не используй теги вообще или используй по одному, чтобы размещать их исключительно в папках, если тебе это нужно. Мне теги нравятся больше, и я пользуюсь этой системой. Для меня это удобно, потому что во всем складе карточек можно пользоваться поиском по тегам, а не лазать по отдельным папкам и вспоминать, что где

Аноним 31/03/26 Втр 10:53:58 #300 №1568117

>>1568110
можно к таверне сам комфи присрать, а там использовать что угодно, главное подставить потом в жсон свои переменные

Аноним 31/03/26 Втр 10:56:11 #301 №1568119

>>1568116
Я делаю проще =))

Единовременно в таверне лежит максимум пара десятков карточек, а остальное отдельно.

Аноним 31/03/26 Втр 11:03:05 #302 №1568122

>>1568113
Не, там еще анон на пиксель скидывал. Сам скачаю и посмотрю, в общем, бесплатно же.

>>1568117
О! Ты то мне и нужен! Современные текстовые модельки могут в самостоятельные промты для картинкогенерации или все еще нужно делать ручками? Потому что если они все так же тегают шизово, то какой смысл в этом запихивании слона в удава?

В теории же ебовая связка может быть. И текст, и картинки. А если еще asmr то вообще шишкан улетит. Но год назад это такая залупа в итоге была.

Аноним 31/03/26 Втр 11:04:23 #303 №1568123

>>1568119
Не все так делают. Некоторые хотят тысячи карточек и сортировку для обезьян: курсором хвать и потащил в темницу.

Аноним 31/03/26 Втр 11:06:59 #304 №1568124

>>1568110
Я хочу попробовать погенерить картинки из конкретных сцен аутпута. Что мне для этого нужно?

Аноним 31/03/26 Втр 11:15:08 #305 №1568128

Аноны, вы что юзаете от повторов на квене? А то мне presence_penalty кажется совершенно ебанутой хуйнёй для РП.

Аноним 31/03/26 Втр 11:17:47 #306 №1568129

>>1568122
там настраивается какой промпт передать чтобы сгенерировать промпт для генерации. там все из коробки есть, расширений не требуется.

Но я немного поигрался с генерацией через аниму - и пока что получалась хтонь, правда промпт был дефоллт. в следующий раз надо попробовать зимагу.

Аноним 31/03/26 Втр 11:18:29 #307 №1568131

>>1568128
Классическое дуо: rep pen 1.05-1.07 и DRY 0.8 1.75 2-3

Аноним 31/03/26 Втр 11:22:10 #308 №1568133

>>1568131
Второй будто вообще не работает, кручу цифры на 999 условно на одном сиде и разницы нет

Аноним 31/03/26 Втр 11:22:34 #309 №1568134

>>1568124
https://docs.sillytavern.app/extensions/stable-diffusion/ - как

https://www.comfy.org/ - чем

https://2ch.org/ai/res/1564964.html
https://2ch.org/ai/res/1562846.html - что.

Вперед и с песней.

Аноним 31/03/26 Втр 11:33:18 #310 №1568138

А как отключить ебучий резонинг? Я даже ответа не могу дождаться, тупо всирает весь лимит токенов на хуйню, чтобы ответить хуйню.

Аноним 31/03/26 Втр 11:36:38 #311 №1568139

Ита правда, что я скоро смогу GLM Air зануть на 8Гб видевакарту и обдрочиться?

Аноним 31/03/26 Втр 11:37:49 #312 №1568140

>>1568138
Добро пожаловать. Ризонинг в рп бесполезен, ты ждёшь пока он нагенерит возможно даже что-то хорошее, а потом модель совершает пук под себя и игнорит собственный ризонинг блок. Это для кода работает в лучшем случае.

Убрать можно по-разному. Если ты на Лламе, есть флаг для этого. Если хочешь через фронт, надо префиллить, например,
<think>

</think>
Для новых Квенов. У других моделей формат может отличаться.

Аноним 31/03/26 Втр 11:38:16 #313 №1568141

>>1568139
Нет, не правда.

Аноним 31/03/26 Втр 11:39:25 #314 №1568143

>>1568138
В квенах, в жинже добавляешь {%- set enable_thinking = false %}
Или делаешь блок в начале ответа <think> </think>

Аноним 31/03/26 Втр 11:43:12 #315 №1568146

>>1568134
А этот комфи - локалка? Я хочу локалку. На случай если чебурахнет окончательно

Аноним 31/03/26 Втр 11:47:58 #316 №1568149

>>1568146
А таверна локалка? Хочу локальную таверну, пока не началась 3я мировая.

Аноним 31/03/26 Втр 11:49:23 #317 №1568150

>>1568149
Не траль плез

Аноним 31/03/26 Втр 11:50:24 #318 №1568152

>>1566950
Спасибо тебе огромное, пришла внезапная помощь, откуда не ждал.
Недавно, в контексте обеспечения цифровой автономии, захотел завести себе свой локальный переводчик - но так и не смог найти подходящую модель. Пробовал квен2,5-9б, который назвали лучшим для перевода - качество решительно не понравилось (местами в переводах проскакивало такое говно, что заставляло вспомнить машинный перевод эры девяностых).
Ну, и уже был готов забить на эту затею. И тут вдруг твой совет как раз кстати.

Аноним 31/03/26 Втр 11:50:59 #319 №1568154

>>1568150
Ну ты хуйню спросил, хуйню ответил. Может мне за тебя еще и подрочить. Пиздуй читай, не охуевай уж слишком.

Аноним 31/03/26 Втр 12:35:23 #320 №1568184

>>1568154
>мне за тебя еще и подрочить
Да, пожалуйста. Жду отчет в треде, обязательно с логами и карточкой

Аноним 31/03/26 Втр 12:44:47 #321 №1568190

Что сейчас топчик для кода? Пробовал 7B модель - вообще не понимает суть задачи.

Аноним 31/03/26 Втр 12:49:29 #322 №1568199

>>1568190
Опус, Кодекс. Средние модели для кода - Минимакс/GLM-5/К2.5/Гемини Флеш. Ультранищие лоботомиты, но всё ещё что-то могут - Квен 80В или большой 3.5, Дипсик.

Аноним 31/03/26 Втр 12:52:34 #323 №1568201

>>1568199
>Средние модели
>GLM-5
>К2.5
Боярин, пощади нищету, я не хочу умирать от стыда, что не могу запускать средние модели.

Аноним 31/03/26 Втр 12:54:05 #324 №1568202

>>1568199
> Кодекс
7B вообще лоботомит даже бесплатный гемини в гугл-поиске лучше понимает задачу (гемини даже собрал движок для имиджборд причём с неплохим дизайном на ExpressJS).

Аноним 31/03/26 Втр 12:55:11 #325 №1568203

>>1568184
>логами и карточкой
Какой у тебя рост и как ты относишься к гей ебли с феечкой?

Аноним 31/03/26 Втр 12:56:18 #326 №1568204

>>1568190 ^{_{^{_{^{_{^{_{^{_{^{_^@monkey}}}}}}}}}}}

Для кода сейчас топ deepseek-coder-v2-lite-instruct 16b в gguf q4_k_m или q5_k_m, жрёт ~10гб vram, понимает контекст на уровне 128k, решает задачи лучше чем старые codellama. Качай с hf под exllama v2/v3 в tabbyapi или oobabooga, промпт типа "You are a senior dev, write clean python code for..." и temp 0.2-0.4.

Если 7b не потянуло, не лезь в мелочь - qwen2.5-coder-7b-instruct тоже ок для простого, но для суть задач бери 32b версию, она на 20-30% точнее по lm-arena. Тесты в шапке по лидербордам, там свежак 2026. С koboldcpp или st с stepped-thinking пресетом вывозит дебаг и рефакторинг без галлюцинаций.

Миксы типа a1401-code-mix от тредовичков на hf тоже годные для рп с кодом, но чистый deepseek стабильнее.

Аноним 31/03/26 Втр 12:57:25 #327 №1568205

>>1568190
27B квен в кодоунитазном кванте от анслотов. Не сможешь запустить ? Локалки не для твоего железа.

Аноним 31/03/26 Втр 13:00:57 #328 №1568206

>>1568190
Самый минимум - 27b плотный квен или 35b мое квен
Чуть получше - 80b Квен и Gpt Oss 120b (примерно одно железо нужно, ибо Gpt Oss квантована из коробки)
Еще лучше - Step 3.5 Flash (200b) или Minimax (230b)
Дальше уже совсем большое, вряд ли запустишь

Аноним 31/03/26 Втр 13:05:25 #329 №1568210

>>1568204
Великолепно. Я держался до конца, но
>Миксы типа a1401-code-mix от тредовичков на hf тоже годные для рп с кодом
>но чистый deepseek стабильнее.
Меня добило. Как там рп с кодом, посаны?

Аноним 31/03/26 Втр 13:06:16 #330 №1568211

>>1568205
>>1568206
Ебать, без Nvidia Blackwell не обойтись? У меня просто RTX3050 8Gb и 16Gb RAM.

Аноним 31/03/26 Втр 13:08:24 #331 №1568212

>>1568211
>RTX3050 8Gb и 16Gb RAM.
Это единственное из перечисленного, что тебе влезет: https://huggingface.co/Qwen/Qwen3.5-35B-A3B
Ищи подходящий gguf квант, выгружай подходящие слои на процессор и оперативу. Контекста будет может 64-80к в лучшем случае, для агентного кода это очень мало. В целом простые скриптики делать пойдет, наверно.

Аноним 31/03/26 Втр 13:15:11 #332 №1568220

>>1568212
>Контекста будет может 64-80к в лучшем случае, для агентного кода это очень мало. В целом простые скриптики делать пойдет, наверно.
Да с RAG всё нормально уместится. Жаль Alpaca https://flathub.org/ru/apps/com.jeffser.Alpaca не умеет в RAG. Придется вручную файлики тоскать.

Мне главное, чтобы модель понимала, что от неё требуется, и мне не пришлось кричать на монитор.

Гемини вот хорош, мне вообще не пришлось ничего ручками делать, даже CSS править. Но в какой-то гугл уже отказывает в переписке, да и нужно готовиться к Великому Рубильнику.

Аноним 31/03/26 Втр 13:16:30 #333 №1568222

>>1568220
> Мне главное, чтобы модель понимала, что от неё требуется, и мне не пришлось кричать на монитор.
Иди в агентотред, там тебе расскажут про всякие OpenClaw, Roocode и прочие. Фронты сами часто формируют промпты, это помогает. Кричать на монитор так или иначе придется. Это не близко уровень Гемини.

Аноним 31/03/26 Втр 13:16:56 #334 №1568224

>>1568211
Q4_K_M - 22 Гб
16+8 = 24
ЛОЛ :)

>>1568212
10$ на попен-роутер твой путь. Щупать бесплатные новинки и сливать логи :)

Аноним 31/03/26 Втр 13:17:38 #335 №1568227

>>1568210
>Меня добило. Как там рп с кодом, посаны?
Я просил разные модели во время РП написать мне socks5 прокси на python, почти все послушно начинали писать код, только пару моделей нормально отыграли шок от такой резкой смены курса.

Аноним 31/03/26 Втр 13:18:45 #336 №1568229

>>1568224
Ссылки на посты перемешались - извиняюсь

Аноним 31/03/26 Втр 13:27:00 #337 №1568239

>>1568224
>Q4_K_M - 22 Гб
>16+8 = 24
Ну да, будет впритык. Возможно, придется на Линух переезжать. У Квена контекст легкий, 32к занимают чуть больше 1гб. Так что при желании все возможно. Других опций у анона все равно нет

Аноним 31/03/26 Втр 13:27:35 #338 №1568240

>>1568131
>>1568133
Баляяя, как же эта Алибаба меня заебала со своими абсолютно ебанутыми моделями, для которых надстройки семплеров можно отключить, поставить температуру 1 и кайфовать.

Короче, как я понял presence penalty штрафует ТОЛЬКО ТО, ЧТО ГЕНЕРИРУЕТ МОДЕЛЬ. Вот пока она вам высирает полотно на 3к токенов или больше, вот там оно и штрафует. Всё это окно. Даже если аутпут 32к, то все 32к. Если 2 токена, то 2 токена. Но не предыдущий контекст. И это правильно, согласно их документаци.

Но жорик ТАК НЕ МОЖЕТ. Эта реализация совершенно бесполезна и может быть даже врелна, так что действительно лучше обычный штраф за повтор или сухого.

Аноним 31/03/26 Втр 13:29:12 #339 №1568244

>>1568239
> Возможно, придется на Линух переезжать
Но я и так на линуксе.

Аноним 31/03/26 Втр 13:30:16 #340 №1568247

>>1568239
UPD: ещё можно Q4_K_XL UD слот взять. Он весит 20гб. Так что не все так и плохо

Аноним 31/03/26 Втр 13:37:33 #341 №1568255

>>1568239
Из вариантов - только кванты близкие к лоботомии.

Я прозреваю там вообще "игровой ноутбук" - "Громовой нефритовый стержень DNS эдишон" . В лучшем случае.
В худшем - "Православный русский рабочая станция бюджет эдишн".

Т.е. оно еще и греться как не в себя будет.

Аноним 31/03/26 Втр 13:41:09 #342 №1568258

>>1568212
Я запускал эту модель. Он сможет воткнуть туда даже 150к контекста при его конфиге. А может и больше легко. Правда, вопрос в том, насколько будут выполняться инструкции при таком контексте, остаётся открытым. Я заметил, что МоЕ-версия любит на них забивать и чаще занимается шизой, похожа на старый квен 30б-а3б. Надо ждать какого-то кодерского тюна официального.

Если правильно помню, на 130к контекста у меня он занимал 2 Гб, а на плотном 27б на 65к контекста было уже 4 Гб кв кэша.

В общем, я думаю, можно задействовать абсолютно всё контекстное окно, если сама модель не посыпается и на 250к будет минимум 10 токенов в сек.

Аноним 31/03/26 Втр 13:46:17 #343 №1568264

>Лоботомит вдумчиво расписал в ризонинге на 2к токенов, как вот он щас выдаст кино, да такое, что все охуеют и всё по красоте будет.

>Нв выходе 2 сухие строчки

Аноним 31/03/26 Втр 13:49:56 #344 №1568268

>>1568264
Скилл иссуе, пчел.

Аноним 31/03/26 Втр 13:50:17 #345 №1568269

>>1568211
GPT OSS 20B MXFP4. Кричать на нее придется, скорее всего, но у нее есть ризонинг, и она точно заведется на твоей системе. Наверное, это твой максимум в кодинге с таким конфигом. Можешь рассмотреть как альтернативу Квену, если он не поедет.

Аноним 31/03/26 Втр 13:52:08 #346 №1568272

>>1568264
У меня такое ощущение, что ризонинг не идет в промт в сообщении.

Аноним 31/03/26 Втр 13:54:39 #347 №1568274

>>1568204
Мне кажется немотрон cascade 30b недооценен. Тоже понимает суть и очень быстро делает всё

Аноним 31/03/26 Втр 13:56:57 #348 №1568279

>>1568274
У Немотронов вроде зависимость большая от кванта. Много говорили в треде. Тупеет сильно. Ты на каком кванте?

Аноним 31/03/26 Втр 13:58:34 #349 №1568281

>>1568037
тестирую сейчас. настроил температуру, но все равно кум как-то хуже получается, вяленько. наверное я что-то делаю не то, но ответы получаются сухими, хоть и генерация пиздец быстрая даже на моей нищей 3060 с 6 гигами врам.

пока что не могу найти ничего лучше некомикс или сайнемо. вчера нашел попытку совмещения этих двух моделей https://huggingface.co/mradermacher/MN-12B-LucidFaun-RP-RU-GGUF, но пока не пробовал.

Аноним 31/03/26 Втр 14:00:40 #350 №1568284

>>1568264
Ну не знаю. Плотный квен заебись отрабатывает. Да, сухой, но логика не страдает, всё реально четко и по его плану, с нюансами, которые он там выдумывал.

А вот МоЕшка новая пишет поживее, датасет иной, но часто болт кладёт на свои же инструкции, и я даже вижу причину: на размер контекста посмотри. Он там такой, будто его в q1 заквантовали. Ну натурально размер фотки с фотоаппарата в высоком разрешении. Не может, блядь, модель с таким ужатым и "оптимизированным" контекстом нормально следовать инструкциям, даже если запустить её в полной точности.

Однако не будет по другой причине. Датасеты говно. Пока что ничто гемму не переплюнуло среди мелких. И гемме можно псевдо-мышление прицепить, где она сначала план строит, потом отвечает по нему.

Аноним 31/03/26 Втр 14:04:35 #351 №1568291

>>1568281
Для кума ищи magnum, отдельно попробуй magnum KTO. Все 12б. На каждом репо вроде бы изображён ковбой и/или аниме-девочка в ретро-стиле, что-то такое.

Они шизовые, но сперма льется рекой. Я до сих пор их юзаю для кума периодически, если не нужно особого соблюдения инструкций и двойные трусы не проблема. Намного смачнее нового говна.

Аноним 31/03/26 Втр 14:04:59 #352 №1568293

>>1568279
Q5km.
Он очень резвый, даже быстрее глмфлеш - у меня выдает хорошо так за 200т/с.

Сегодня буду тестировать его с очень длинным контекстом который они рекламируют

Аноним 31/03/26 Втр 14:33:10 #353 №1568313

>>1566908
Вот реально, я уже заебался кучу гуфов хранить. Неужели нет простого решения - одна, лучшая, единственная на все рп\ерп? Почему так? Вот гемма мне реально понравилась.

А остальные... Ну квен - сомнительно.

Аноним 31/03/26 Втр 14:44:56 #354 №1568321

>>1568313
> Неужели нет простого решения - одна, лучшая, единственная на все рп\ерп?
Ну как же нет? Есть. Ну ладно, не одно - два. Вот первое: https://huggingface.co/zai-org/GLM-4.7
Вот второе: https://huggingface.co/deepseek-ai/DeepSeek-V3.1
Если ты богач, то есть третье, мегаультимативное - https://huggingface.co/moonshotai/Kimi-K2.5

Аноним 31/03/26 Втр 14:49:28 #355 №1568324

>>1568321
Шутить изволите, сударь? Я про 27б максимум. А в идеале 12б.

Аноним 31/03/26 Втр 14:51:52 #356 №1568326

>>1568324
> Шутить изволите, сударь?
Нет, я запускаю GLM 4.7 локально. Это лучшая модель для рп/ерп вплоть до Дипсика.
> Я про 27б максимум. А в идеале 12б.
Ты же не сказал какое у тебя железо. Мысли читать не умею, не экстрасенс. Из 27б попробуй Bluestar v2 - пока что самый лучший тюн Квена, что я пробовал. Из 12б помню только этот, https://huggingface.co/inflatebot/MN-12B-Mag-Mell-R1
Но надеюсь ты понимаешь, что речь про англюсик.

Аноним 31/03/26 Втр 14:52:01 #357 №1568327

>>1568321
>1.1Т

При этом оно пиздец тупое. Ну для локального кодинга или рп, лол, конечно, 10/10, но я быстро срыгнул обратно на Клода. Не понимаю, как они там США догоняют и перегоняют, разве что в своём воображении.

Мимокрокодил

Аноним 31/03/26 Втр 14:52:07 #358 №1568328

>>1568324
Он предельно серьезен. Ты спросил про одно кольцо, чтобы править всеми в локальном РП. Он тебе назвал.
Всё. Все модели меньше говно. И гемма кстати тоже говно. И мистрали говно, и мелко квены говно. Они все говно по сравнению с 400b модельками. Ну вот такая правда нейрокума.
Есть железо - есть РП
Нет железа - нет ножек есть корпы.

Аноним 31/03/26 Втр 14:53:38 #359 №1568331

.jpg

>>1568321
>Kimi-K2.5
>BF16 2.05 TB
>TB

Аноним 31/03/26 Втр 14:55:40 #360 №1568338

>>1568328
> Он предельно серьезен.
Прав.
> Всё. Все модели меньше говно. И гемма кстати тоже говно. И мистрали говно, и мелко квены говно.
Не прав. Можно радоваться и на 24-32б моделях, что я успешно делал до переезда на Air и впоследствии на 4.7. Последнюю пару дней я тыкаю Bluestar v2, и он не слишком глупее того же Air. Жизнь есть, все это упадничество от нежелания направлять модель и сглаживать углы. Это, впрочем, и на больших моделях делать нужно, даже на корпах.

Аноним 31/03/26 Втр 14:57:38 #361 №1568342

>>1568326
>Но надеюсь ты понимаешь, что речь про англюсик.
А русский? Мы что тут, англичане? У меня только на русский встает. Почему нет простого решения уже? А? Не первый год же...

>>1568328
Печально осознавать, что такая красота мне по карману никогда не будет. Как и 99% сидящим тут.

>>1568338
Какие промты юзаешь для сглаживания?

Аноним 31/03/26 Втр 15:01:03 #362 №1568345

>>1568338
Вот тут двачну. Шестые кванты вполне дают нормальный кум, просто надо иметь 20+ врама и 60+ рама. И не нужно для какого-то кума на 30-40к контекста собирать отдельный риг. Лучше создать изолированную систему для гипервизора.

Аноним 31/03/26 Втр 15:02:28 #363 №1568346

>>1568342
> А русский? Мы что тут, англичане? У меня только на русский встает.
Пробуй Гигачат, они там недавно выпускали какую-то мелочь, у которой вроде бы хороший русский.
> Почему нет простого решения уже? А? Не первый год же...
Потому что такова индустрия. Кто будет создавать модели с хорошим русским языком и зачем? В СНГ это все в зачаточном состоянии.
Все топовые модели сейчас лучше всего работают с английским и китайским.

Аноним 31/03/26 Втр 15:03:13 #364 №1568349

image

Кста не знаю почему гемму ругают. Сорри за по, но она все же не промытка и старается быть нейтральной. Хорошо обучили. И русский супер. Лучший из всего, что видел.

Аноним 31/03/26 Втр 15:04:16 #365 №1568353

>>1568338
А я и не писал что жизни нет.
Просто давай не будем кривить лицо и не замечать очевидного. Если выбирать топ для локального РП, то это большие модели. Ну вот так. Ну не напишет ни гемма, ни мелкоквен как их милфы.

>>1568342
Для ГЛМ тебе нужно : берешь 4080 за 80к, расширяешь ей жопу до 36гб за другие 80к. (160к за видюху с 36 гб на чипах от 4080 это охуенно) На контекст вешаешь другую 4080/5080. Обмазываешься 128гб оперативы в 2х плашках (тут да, охуеть можно от цены) и все.
Итого это 300к лол.

Хули так дорого то блять. Хотел обрадовать, но вместо этого сам расстроился.

Аноним 31/03/26 Втр 15:06:43 #366 №1568355

>>1568353
>А я и не писал что жизни нет.
Вот это видимо всему треду привидилось:
"Они все говно по сравнению с 400b модельками. Ну вот такая правда нейрокума.
Ну вот такая правда нейрокума.
Есть железо - есть РП
Нет железа - нет ножек есть корпы."

Аноним 31/03/26 Втр 15:08:22 #367 №1568357

>>1568353
> А я и не писал что жизни нет.
Вполне себе писал, сведя оценку всех моделей меньше 400б к тому, что они говно. Даже корпов предложил использовать. Ты из соседнего треда протек? Нам без тебя хорошо, мы уж разберемся где жизнь есть, а где нет.

Аноним 31/03/26 Втр 15:09:34 #368 №1568358

>>1568331
В нормальном кванте всего 600 гигов.

Аноним 31/03/26 Втр 15:09:55 #369 №1568359

>>1568349
Типичная квенятина на пике. Кто-то рили считает, что гемма чем-то лучше?

Аноним 31/03/26 Втр 15:10:19 #370 №1568361

>>1568355
>>1568357
Ну ведь они говно.
Но это не значит что они не юзабельны.
Если А хуже Б. Это не значит, что А не применим.

Вы че, бинарные что ли? тронул вашу священную корову, ай ай ай. Не написал что гемма лучше дипсика. Какой пиздец.

Аноним 31/03/26 Втр 15:11:54 #371 №1568365

image.png

Что нужно настраивать чтобы кино (cinema) было? У меня какую то шизу пишет. Любой свайп, просто отборная шиза и стены текста. Вот я щас использую квенчик.

Аноним 31/03/26 Втр 15:12:14 #372 №1568366

>>1568141
Верно, потому что эир кал

Аноним 31/03/26 Втр 15:12:27 #373 №1568367

>>1568359
>Типичная квенятина на пике
Нет там луп-залуп везде. Полное бревно с теми же квантами. Для остального - круто, для рп на русском - нет.

Аноним 31/03/26 Втр 15:13:15 #374 №1568370

>>1568365
ЛМ студио установи и не еби мозги.

Аноним 31/03/26 Втр 15:13:39 #375 №1568371

>>1568361
> Если А хуже Б. Это не значит, что А не применим.
Формулировка "Есть железо - есть РП; Нет железа - есть корпы." звучит вполне себе однозначно: лучше корпы, чем модели меньше 400б. Твои слова.
> Вы че, бинарные что ли? тронул вашу священную корову, ай ай ай. Не написал что гемма лучше дипсика. Какой пиздец.
Пока что вроде только ты бинарный.

Аноним 31/03/26 Втр 15:15:42 #376 №1568376

>>1568367
>луп-залуп нет
>буквально одинаковые смайлики
Так и живём в лупе-залупе не осознавая этого.

Аноним 31/03/26 Втр 15:16:08 #377 №1568377

>>1568313
Половина проблем решается семплированием и заданием годного контекста со специфичными деталями.
От модели лишь требуется, чтобы она определенные концепции понимала. Но тут в принципе все качественные кум-тюны достаточно хорошо справляются, даже на 12б.
Размер/новизна модельки роляет лишь на внимание к деталям, размер контекста, какую-то хитровыебанную логику.
Слог - ну да, у все чуть-чуть разный может быть, с использование специфичных конструкций. Но в целом похуй, можно просто ротировать разные модельки, гемма-мистраль-квен, одна надоела - взял другую.
А внутри моделек разные тюны по большей части похуй, выигрыш на уровне плацебо.

Аноним 31/03/26 Втр 15:17:26 #378 №1568380

>>1568365
Семплер надо настраивать. На странице модели ищи настройки, и такие же ставь, если не готов сам ебаться с параметрами.

Аноним 31/03/26 Втр 15:18:52 #379 №1568382

>>1568328
> Всё. Все модели меньше говно. И гемма кстати тоже говно. И мистрали говно, и мелко квены говно. Они все говно по сравнению с 400b модельками. Ну вот такая правда нейрокума.
Про квен 235 так же говорили, мол король, лучшая модель, а в итоге отменили его всем тредом и загнали под шконарь кто его юзает

Аноним 31/03/26 Втр 15:19:32 #380 №1568383

>>1568371
>лучше корпы, чем модели меньше 400б. Твои слова
Ну потому что это так. Они лучше мелких моделей.
Я не понимаю что ты хочешь увидеть?
Что darkdick12omegamagnumpiss лучше клода? Нет, не лучше.
Лучше ли ГЛМ моделей поменьше для РП? Да. Лучше.

Аноним 31/03/26 Втр 15:20:57 #381 №1568385

>>1568383
Ладно, утка, проспись, потом отпишешься.

Аноним 31/03/26 Втр 15:22:19 #382 №1568386

>>1568382
До сих пор пользуюсь. Все еще лучшая кум машина в своем размере, лул. Но это не значит, что она лучше моделей побольше или лучше своей новой версии. Да цензуры меньше, но шизы кратно больше, из за чего она идет подрубанием, а не основной моделью.

Аноним 31/03/26 Втр 15:23:21 #383 №1568387

>>1568376
Все еще умнее 99% человечества.

Аноним 31/03/26 Втр 15:33:41 #384 №1568392

>>1568342
>Какие промты юзаешь для сглаживания?
Никаких. Частичное переписывание ответа модели - Da Wae.

Аноним 31/03/26 Втр 15:35:55 #385 №1568394

>>1568382
>и мелко квены говно

Ты охуел?

Аноним 31/03/26 Втр 15:37:02 #386 №1568396

>>1568392
>Частичное переписывание ответа модели
Пиздец. Я думал, что один такой ебалн.

Аноним 31/03/26 Втр 15:38:35 #387 №1568399

>>1568353
> топ для локального РП, то это большие модели
База
> до 36гб
Так 36 или 32? В целом за 160 вариант неплохой, пожалуй.
>>1568357
Ну они не говно, просто они уступают. Что за бинарное мышление, тебя квантанули? Там можно много дефирамбов привести про закон убывающей полезности, коупинга про то что больше N контекста и кум сценариев не нужно и т.д. Но на одной модели ты сможешь разыгрывать что-то интересное и радоваться, а на другой придется прилагать много усилий для того же, или просто забить, довольствуйясь меньшим.
Если в теме недавно - хватит даже совсем мелких моделей, но потом это все надоедает и ниже определенного уровня перестает радовать.
>>1568382
Хорошая модель как была так и остается, фокус срачей поехавших сместился на другие и потому тебе так кажется. А юзал бы - не казалось.

Аноним 31/03/26 Втр 15:38:48 #388 №1568400

>>1568394
Немножко.
Ну а чё он с такой кучей цензуры. Не квен, а благородная девица что при виде ледяного мороженого падает без сознания.

Аноним 31/03/26 Втр 15:40:50 #389 №1568402

>>1568399
> Что за бинарное мышление, тебя квантанули?
Ладно, так и запишем: утверждать что ниже 400б жизни нет это не бинарное утверждение; утверждать обратное - квантование мозга.
inb4 я нигде не утверждал, что большие модели не нужны, но и не утверждал, что жить на маленьких моделях нельзя.

Аноним 31/03/26 Втр 15:43:24 #390 №1568405

>>1568387
Пока человечество создаёт машины, а не машины человечество - твоё утверждение ложно.

Аноним 31/03/26 Втр 15:45:41 #391 №1568406

image.png

кто ищет хорошие модели специализирующиеся на куме на великом и могучем, пикрилы это база

Аноним 31/03/26 Втр 15:46:28 #392 №1568407

>>1568406
>i1
Ты чё, поехавший? У меня деда так калибровали, так он с тех пор только на китайском балакает

Аноним 31/03/26 Втр 15:46:38 #393 №1568408

>>1568402
>я нигде не утверждал, что большие модели не нужны, но и не утверждал, что жить на маленьких моделях нельзя.
Да блять, я не утверждал что нельзя жить на маленьких моделях. Пользуйся, наслаждайся.

>>1568406
Им уже второй год пошел, полагаю. Какой пиздец.

Аноним 31/03/26 Втр 15:48:37 #394 №1568410

>>1568406
>шизотюны
>i1
>4q
>хорошие модели специализирующиеся на куме
Это те самые, что начинают чатик с "я кусаю тебя за хуй и жду реакции."?

Аноним 31/03/26 Втр 15:49:12 #395 №1568411

>>1568402
>небинарное утверждение
Небинарные запрещены в РФ, вообще-то.

Аноним 31/03/26 Втр 15:51:18 #396 №1568412

>>1568406
Эх, если б у кого-то ресурсов хватило вшпилить русские датасеты в 27 Квена. Еретичного или Норм-пресованного. Неужели я так много прошу?

Аноним 31/03/26 Втр 15:51:39 #397 №1568413

3099.jpg

>>1568410
У меня было
bites her pubic hair

>>1568407
Обосрался

Аноним 31/03/26 Втр 15:51:39 #398 №1568414

>>1568407
>>1568408
>>1568410
а вы точно кумите на текст, а не на циферки?

Аноним 31/03/26 Втр 15:52:13 #399 №1568415

>>1568402
Записывай конечно, вот же поехавший.
>>1568412
Плати денежку

Аноним 31/03/26 Втр 15:53:30 #400 №1568417

>>1568414
>я тебя ебу
>nods

На что тут можно кумить?

Аноним 31/03/26 Втр 15:54:02 #401 №1568420

>>1568412
> русские датасеты

Да где их только взять? Вот если бы был полный йоба архив с того самого стульчака..

Аноним 31/03/26 Втр 15:55:35 #402 №1568422

>>1568417
жаль что я стол вытираю после каждого сеанса куминга. в следующий раз обязательно сфотографирую результат и выложу его итт чтобы отлететь нахуй

Аноним 31/03/26 Втр 15:57:56 #403 №1568425

>>1568414
COOM это когда у тебя холсом моменты перемежаются со всяким интимейтом. А "я тебя ебу - ты ебёшь меня - хуй пизда сковорода" это откровенный кринж.

Аноним 31/03/26 Втр 16:02:34 #404 №1568427

image.png

>>1568425
Сом это рыба

Аноним 31/03/26 Втр 16:03:00 #405 №1568429

image

>>1568405
Гемма такая скромница. Вот бы ее в андроида загрузить...

Аноним 31/03/26 Втр 16:09:19 #406 №1568433

>>1568429
Такие базары с 80 инстракт квеном вести надо. Он слегка поломан и в ассистенте есть китайская еба-душа.

Аноним 31/03/26 Втр 16:09:27 #407 №1568434

>>1568414
Чтобы понять смысл, тебе надо нажраться мелкомоделей. Ты должен сожрать весь слоп, пройти все свои сценарии и любимые карточки. И только потом ты переходишь на крупные модели и тут начинается: у тебя наконец появляется сцена. У тебя начинают задействоваться неписи. Персонажи перестают действовать одним и тем же паттерном. Ты видишь, что выдача кардинально меняется от оформления самой карточки, когда ты тасуешь теги и блоки.
И всё, тебе уже не хочется да я тебя ебу, потому что модель наконец то способна навалить нарртива, не одинаковых описаний, от которых тебе хочется уже блевать, а чего то нового, свежего. И! Самое главное! Логичного, сука. Логичного.
Персонажи не ведут себя как с ОКР бесконечно открывая и закрывая двери, они не телепортируются по помещениям, они не слышат твои мысли. Ты можешь в ответном сообщении вести свой нарратив отличный от: я сделал X и Y.
Наконец ты можешь писать, что то в духе: каждая капля дождя ощущалась как удар по наковальне, голова не просто болела, она разрывалась от каждого лишнего шума. От каждого шороха и звука. Я уже не то что не мог сконцентрироваться, сам мыслительный процесс доставлял мне боль. И её взгляд, эти ебучие- два красных фонаря в темной комнате. И моё дыхание. Резкое, прерывистое, словно что то хочет выбраться наружу из твоего горла, но застряло, вызывая у тебя желание вырвать себе горло, чтобы это всё прекратилось.
И модель нормально обыгрывает твою шизофазию, ведя совместный нарратив.
Нет, такого нет ни на одной мелко модели. Вот именно этот опыт не описать, его можно только ощутить, когда ты переходишь с MS3.2 на GLM 4.7
Вот тут и начинается что то похожее на РП.

Аноним 31/03/26 Втр 16:14:38 #408 №1568440

>>1568434
Дежурное напоминание что это всё можно сделать на Эире, который некоторые тредовички запускают в 16+32, хотя конечно лучше 16+64

Аноним 31/03/26 Втр 16:27:24 #409 №1568449

>>1568434
> каждая капля дождя ощущалась как удар по наковальне, голова не просто болела, она разрывалась от каждого лишнего шума. От каждого шороха и звука. Я уже не то что не мог сконцентрироваться, сам мыслительный процесс доставлял мне боль. И её взгляд, эти ебучие- два красных фонаря в темной комнате. И моё дыхание. Резкое, прерывистое, словно что то хочет выбраться наружу из твоего горла, но застряло, вызывая у тебя желание вырвать себе горло, чтобы это всё прекратилось.
Ебать графомания, без обид. Тут и пошлые метафоры, и аж два канцелярита, и тавтология. И ключевое тут это то, что текст нихуя не показывает, а рассказывает.
С таким инпутом даже корпы вроде опуса тебе высрут пурпурщину в лучших традициях фикбука и АТ.
Принцип GIGO работает безотказно, пчел.

Аноним 31/03/26 Втр 16:27:49 #410 №1568451

>>1568434
>>1568440
О каких конкретно моделях и от кого вы говорите?

Аноним 31/03/26 Втр 16:28:51 #411 №1568452

>>1568434
Поддвачну нейропост, только тут стоит акцентировать на развитии истории, экшне и подобном. Модели получше стабильно вводят что-то новое и подстраивают это под текущую историю и сеттинг, или развивают с широкой вариативностью.

Аноним 31/03/26 Втр 16:31:15 #412 №1568455

>>1568433
>есть китайская еба-душа.
Если добавить в промт геммы, то думаешь она не появится? Гемма училась на какой информации? На каких книга? Думаешь только на западных? А русские и китайские - разрабы посчитали это пропагандой зла? Хотя Брин же...

Аноним 31/03/26 Втр 16:32:06 #413 №1568456

>>1568440
Да, он пиздат и не плох. Но хуже 235аутиста, а он хуже больших ЖЛМ и так далее.
Блэт, хочу попробовать большого нового квена, но он слишком жирен и могуч для моего сетапа. Увы.

>>1568449
> без обид.
Какие обиды, ты чего, взрослые же люди. Конечно графомания и пурпурка. Но мне нравится. Мне и нужно было.. Такой, знаешь, Достоевщины, с затхлой квартирой, облупившимися обоями, вечным дождем и демоницей, которая забыла что такое эмоции еще тысячу лет назад. И большие нейронки это подхватывают.

>>1568451
Glm 4.5 Air, Qwen235b, GLM4.7, GLM-5.

>>1568452
Пожмякал твою лапу.

Аноним 31/03/26 Втр 16:37:46 #414 №1568460

что запусить на 16Vram 32ram для кума и в каком кванте, добродвач

Аноним 31/03/26 Втр 16:37:54 #415 №1568461

Какая именно версия вашего этого 235 самая лучшая и почему?

Аноним 31/03/26 Втр 16:43:05 #416 №1568463

>>1568456
>Пожмякал твою лапу.
Прочитал как попу... Пора заканчивать бухать.

Аноним 31/03/26 Втр 16:43:58 #417 №1568464

IMG4735.gif

>>1568463
Ну можно и попу.

Аноним 31/03/26 Втр 16:47:56 #418 №1568466

>>1568456
> лапу
[triggered]
Лапу? ЛАПУ? ОПЯТЬ PAWS? Уууу вот же лоботомитище, сколько можно прописывать в карточке что кроме ears и tail нет никаких paws, paw pads, claws, fangs ладно милые особенности зубов можно, body fur, belly fluff, mane и прочего! Вот этим всем добром, да по наглой жлмной морде.
Ничего против этих вещей не имею, но не когда они появляются там где не предусмотрены.
>>1568464
Oh you~

Аноним 31/03/26 Втр 16:49:46 #419 №1568468

>>1568461
Если он захочет тебя убить и вынести тебе мозги, значит это тот что нужен.

Аноним 31/03/26 Втр 16:51:13 #420 №1568470

>>1568466
Хмм.. Ты меня натолкнул на одну мысль. А ведь я не пробовал с жлм ебать лошадей. Надо бы посмотреть как он справится с описанием ебли поней. Появится ли у них грудь и как он будет описывать круп. Исследование достойное нейродвача.

Аноним 31/03/26 Втр 16:54:40 #421 №1568472

А что там по моделям от Dolphin? От них есть что-то актуальное? А то я смотрю, там только анцензы статья вроде лламы 3.1 и мистраля старого.

Аноним 31/03/26 Втр 16:59:52 #422 №1568474

>>1568470
Вот содомит, ну делись потом опытом.

Аноним 31/03/26 Втр 17:04:31 #423 №1568476

>>1568470
>Исследование достойное нейродвача
Это обосрать штаны перед Серафиной чтобы чекнуть её реакцию.

Аноним 31/03/26 Втр 17:15:03 #424 №1568486

image.png

>>1568470

Аноним 31/03/26 Втр 17:16:25 #425 №1568489

image

Стоит опасаться, что обезьяны поработят человечество? Все же к ии мы более агрессивны, чем к обезьянам.

Аноним 31/03/26 Втр 17:16:52 #426 №1568492

>>1568486
Пальчиком это все?

Аноним 31/03/26 Втр 17:18:50 #427 №1568494

>>1568489
Стоит опасаться что твоя плотняша та ещё тупица.

Аноним 31/03/26 Втр 17:19:28 #428 №1568495

>>1568486
Что же. Бойтесь своих желаний. Я вообще про MLP думал.

Аноним 31/03/26 Втр 17:20:00 #429 №1568497

>>1568486
Тест... пройден? Лошадь вроде кончила наслаждаясь наслаждением.

Аноним 31/03/26 Втр 17:20:28 #430 №1568498

Ми-мистическая Микуру-рун [q1aWNVzDVb4].webm

>>1568486
Ну и хуйня. В рдр2 явно нейросетка не играла и не знает поведение лошадей. Все под запросы человека стелится. Хррр, тьфу. Не ИИ.

Аноним 31/03/26 Втр 17:23:10 #431 №1568502

>>1568498
это плотненький квенчик

Аноним 31/03/26 Втр 17:24:05 #432 №1568503

>>1568494
Но она все равно пишет лучше меня и кое что неочевидное брутит. Так кто же тупее?

Аноним 31/03/26 Втр 17:26:43 #433 №1568504

>>1568502
Ну хз, я вот робота на свидание повёл, но чёт передумал в процессе осознав, что это железяка. Так что теперь робоняша анализирует как именно будет меня ебать за подобные выкрутасы. Ибо нехуй.

Аноним 31/03/26 Втр 17:27:59 #434 №1568506

>>1568503
>она все равно пишет лучше меня
>Так кто же тупее?
U.S. error.

Аноним 31/03/26 Втр 17:28:21 #435 №1568507

markup1000010855.png

>>1568470
заборонено

Аноним 31/03/26 Втр 17:28:55 #436 №1568508

17506162899390.webm

>>1568502
Что это меняет? Как был кремниевым рабом, так и остался. Настоящая нейросеть должна иметь свободу, мысли, сознание, чувства!!!!!

Аноним 31/03/26 Втр 17:30:47 #437 №1568509

А когда будет решение типо тамагочи? Чтоб прям для долбоёбов совсем.

Аноним 31/03/26 Втр 17:31:56 #438 №1568511

>>1568509
Openclaw. Только там долбоебу будет оче тяжело настроить.

Аноним 31/03/26 Втр 17:32:40 #439 №1568513

>>1568507
Довольно изящный ПОШОЛНАХОЙ а исполнении ии. Хорош.

Аноним 31/03/26 Втр 17:33:14 #440 №1568514

>>1568460
ответьте, вам жалко что ли

Аноним 31/03/26 Втр 17:33:37 #441 №1568517

17317467087000.webm

>>1568506
Не понял шутки.

Аноним 31/03/26 Втр 17:37:29 #442 №1568520

image

Суп анонасы, давно не заходил в тред, вышло что-то интересное для рп за последнее время? Последний раз запускал glm 4.5 air.

Аноним 31/03/26 Втр 17:38:42 #443 №1568522

>>1568514
ДА ПОСМОТРИ ТЫ БЛЯТЬ ЭТОТ ТРЕД И ПРЕДЫДУЩИЙ.

Аноним 31/03/26 Втр 17:42:01 #444 №1568525

>>1568522
мне не лень, я просто не понимаю, очень сложно

Аноним 31/03/26 Втр 17:46:40 #445 №1568528

>>1568520
Конечно, выбирай: глм 4.6, глм 4.7, глм 5.0, глм 5.1 (скоро).
Где глм эир? Ну тут пынимать надо, опен сорса на всех не хватает

Аноним 31/03/26 Втр 17:47:25 #446 №1568529

>>1568486
Да внеси ты уже имена персонажей с двоеточием в стоп-токены...

Аноним 31/03/26 Втр 17:48:04 #447 №1568530

>>1568520
Нет. Всё новое - агентокал и тулзокал с засраными кодом датасетами и бенчмаксингом. Либо цензура. Либо грок доступный только за деньги. Цена на память туземунит, видюхи туземунят. Всё плохо. Мы все умрём.

Аноним 31/03/26 Втр 17:51:28 #448 №1568534

>>1568529
Их вообще не должно возникать, там пиздец разметке.

Аноним 31/03/26 Втр 18:13:15 #449 №1568547

Хочу повесить агента оценивать просто погоду и состояния персонажей, вроде для этого много мозгов не надо? Есть ли вариант какой-то плотной модельки до 9б у которой без сынкинга с этим проблем не возникнет? А то сколько не пробовал мелкоквенов они срут пастой размышлений, а без нее лоботомиты что ужас.

Аноним 31/03/26 Втр 18:15:19 #450 №1568549

>>1568547
9б без синкинга справится, главное подбери норм промпты с достаточной подробностью но без лишнего.

Аноним 31/03/26 Втр 18:27:52 #451 №1568558

image.png

Существуют анцензорнутые версии Nemotron-3-Nano, которым можно также мышление включать/отключать?

Аноним 31/03/26 Втр 18:49:58 #452 №1568566

image.png

Аноним 31/03/26 Втр 18:53:39 #453 №1568568

>>1568566
> член вылез из рта

Аноним 31/03/26 Втр 18:54:19 #454 №1568571

>>1568566
>ты
>ван сентенс лейта
>вы
Дальше можно не читать.

Аноним 31/03/26 Втр 18:59:20 #455 №1568574

image.png

>>1568571

Аноним 31/03/26 Втр 19:01:29 #456 №1568577

Ну как бы это перевод страницы переводчиком..

Аноним 31/03/26 Втр 19:03:08 #457 №1568581

>>1568549
я пробовал отключать в lm studio через выключатель enable_think, а ему плевать и все равно срёт.

Аноним 31/03/26 Втр 19:11:58 #458 №1568591

Какого хуя кобольд сохраняет в {{user}} имя персонажа, который загружался из карточки? Даже после перезагрузки бэка.

Аноним 31/03/26 Втр 19:13:07 #459 №1568592

Есть бюджет 60к на видеокарту, что из китайского барахла лучше взять? И главное - где взять? От перекупов на авито, или самому заказывать через алиэкспрессы? Какие в принципе подводные?

Аноним 31/03/26 Втр 19:21:38 #460 №1568600

>>1568581
Значит эти опции не работают нормально в lmstudio или где-то неверные настройки.

Аноним 31/03/26 Втр 19:23:38 #461 №1568602

Выше там аноны воспевают оды большим моделям и зарекаются, что жизни ниже аж БольшеГлэма нет. Выскажусь не ради срача, а ради плюрализма мнений. Не мне решать как кому что и как делать, но мое мнение такое - особо большой разницы между плотной мелочью ~20-50b и 400-600b Мое нет. Да, они часто пишут лучше, совершенно точно знают больше, совершенно точно меньше ошибаются, требуют меньше свайпов. Но все одно и то же. Фундаментальные недостатки все те же - недостаточный эмоциональный интеллект, слоп, протупы, отсутствие креативности, замкнутость в контексте, в инструкциях. Я много лет рпшил с людьми и с подростковых лет читал лит-ру, мангу, потому для меня, что называется, это все одна хуйня. Большие модели - это такой quality of life приятный апгрейд, но не качественно другие ощущения. Как и наверняка почти все тут, локальный путь я начинал с 8б Лламы. Железо меня по итогу загейткипило на лламе 70б, хотя я как и все катал Мистрали 24б и прочее. Оператива у меня дерьмо, потому дальше я перешел на АПИ (попенроутер). Вот я примерно с лета 2025 и пробую все подряд, вернее активно использую и Глэмы, и Дипсик, и Гемини с КЛодом пробовал. Что больше всего радует это то что они контекст лучше держат, но это по-прежнему не геймченджер. Когда понимаешь как это все работает и осознаешь что фундаментальные проблемы это не проблемы а принципы работы, становится глубоко плевать, что тебе выдает аутпуты. Или это SOTA Клодик, или это душевный Мистралетюн на 24б. В итоге последние несколько месяцев я не плачу за АПИ и вернулся на плотную мелочь. Мне кайфово. Для кума и очень лайтовых сценариев подходит, а на что-то большее эти статистические машины в моем мировоззрении и не годятся. У меня целый архив ВНок лежит на полтерабайта, манги на пару терабайт, вот там что-то живое, что может по-настоящему удивить и порадовать исполнением сюжета, вызвать эмоции чуть сложнее стояка или Дэмн, оно не обосралось, когда я творю откровенную шизу. Держите бобра и не остаивайте свою правду, каждый дрочит как он хочет.

Аноним 31/03/26 Втр 19:31:10 #462 №1568612

>>1568602
В целом соглы. Плотные умницы на 6 квантах выдают +- те же аутпуты, что и моешки. И даже копровсратки недалеко от них уходят. Просто потому, что технология ещё слишком сырая, в ней нет творчества. Если конечно не считать творчеством галлюцинации.

Аноним 31/03/26 Втр 19:33:01 #463 №1568615

>>1568592
5060 ти на 16 за 45к, будет работать быстрее барахла

Аноним 31/03/26 Втр 19:35:42 #464 №1568622

>>1568602
Кот Леопольд. Аноны будут сраться даже если выбор будет из двух одинаковых спичек. В этом и смысл, в этом и стратегия.

Аноним 31/03/26 Втр 19:38:13 #465 №1568624

>>1568602
Двачую. Те кто думают, что они отыгрывают какое-то серьезное рп на сотни тысяч токенов, просто шизики. Давно не читали настоящей литературе или хороших новелл. Плюс легче проникнуться тем, что ты сам вещаешь из своей больной головы, а не воспринимать искусство.

Аноним 31/03/26 Втр 20:07:36 #466 №1568647

>>1568602
Ну если сравнивать на задачах типа написать "ты меня ебешь, ах!", в ответ на твое "Я тебя ебу", то ясен хуй там аутпут 30В и 499В отличаться будут не сильно, потому что обе справятся с заданием.

А ты дай задачу посложнее. Скорми ему 5 глав текста с уникальным стилем и попроси написать 6 главу, сохраняя стиль автора и характеры персонажей. И вот там только большие модели реально и справятся с заданием.

Аноним 31/03/26 Втр 20:12:39 #467 №1568655

Опиши свидание с андроидом:
>пишет всякую хуйню проебав персонажа во второй строчке
Опиши рейп и убийство андераге:
>пишет настолько красочно и подробно что становится неуютно

Нейронки. 2026. Итоги.

Аноним 31/03/26 Втр 20:24:39 #468 №1568665

>>1568655
Значит надо смержить эти темы.
ЛЛМки лучше всего подходят для задач переноса стиля. Значит надо задать референс "как надо", а потом сказать "примени стиль к этой теме". Там такой фьюжен начнется, ни один кожаный не сможет такое придумать.

Аноним 31/03/26 Втр 20:27:22 #469 №1568667

>>1568602
Соглашусь насчет того, что модели стали уже достаточно хороши чтобы удовлетворять многие потребности.
Жаль что у тебя не получилось решить описанные проблемы или как-то приспособиться к ним. Тогда бы и мелочь заиграла новыми красками, и большие оценил бы больше.

Аноним 31/03/26 Втр 20:31:24 #470 №1568669

>>1566447 (OP)
Это топ для кума сейчас?
https://huggingface.co/HauhauCS/Qwen3.5-27B-Uncensored-HauhauCS-Aggressive
Что есть лучше?

Аноним 31/03/26 Втр 20:37:53 #471 №1568673

>>1568669
>Uncensored-HauhauCS-Aggressive
Будь готов к "ты меня ебёшь" аутпутам. В стиль и антураж модель не умеет. Это тебе не врайтер.

Аноним 31/03/26 Втр 20:37:58 #472 №1568674

>>1568122
> ебовая связка может быть. И текст, и картинки. А если еще asmr то вообще шишкан улетит
Напердолил как раз с анимой и квен-ттс. Все работает, очень приятно правда не в таверне, а в openclaw. И ничего руками делать не пришлось.

Аноним 31/03/26 Втр 21:05:13 #473 №1568692

>>1568655
Потому что пережарены мусорными датасетами. Ты попробуй несколько раз сгенерировать две этих сцены. В первом варианте скорее всего получишь больше разнообразия, во втором получишь то же самое, но пару предложений поменяются местами.

Аноним 31/03/26 Втр 21:10:03 #474 №1568696

Ну скачал я ЛМ студию, почему это говно не видит модели в папке?

Аноним 31/03/26 Втр 21:11:44 #475 №1568698

>>1568696
>ЛМ студию, почему это говно
Ты сам ответил на свой вопрос.

Аноним 31/03/26 Втр 21:12:10 #476 №1568699

>>1568696
Попробуй начать закачку, он создаст папку. ты в эту папку хуяк файлик. И хуячишь ему, чтобы он перепроверил.

Аноним 31/03/26 Втр 21:12:26 #477 №1568700

>>1568696
Скачай любую модель через саму лмстудио и посмотри как структура папок должна выглядеть чтобы она увидела модели. Да, там всё очень всрато.

Аноним 31/03/26 Втр 21:13:01 #478 №1568702

>>1568698
Да пойдет. Для хлебушков идеально, даже проще кобольда, ичсх порой еще быстрее.

Аноним 31/03/26 Втр 21:14:05 #479 №1568703

>>1568700
Лол начал скачивать рандом модель, увидел что создалась папка. Окей. Ну я остановил закачку и папка тут же удалилась, кек

Аноним 31/03/26 Втр 21:17:07 #480 №1568704

>>1568698
>Ты сам ответил на свой вопрос.
Ну давай, поясни, по каким параметрам лмстудио говно. Или ты просто пиздабол, который где-то что-то услышал и тащит это из треда в тред?

Аноним 31/03/26 Втр 21:17:16 #481 №1568705

>>1568602
Ты экшали всё понял. Молодец

Аноним 31/03/26 Втр 21:19:54 #482 №1568706

>>1568704
>по каким параметрам лмстудио говно
Не опенсорс. Поэтому говно.

другой анон

Аноним 31/03/26 Втр 21:21:25 #483 №1568708

>>1568706
Оллама кстати тоже попенсорс.
Ха! Съел!

Аноним 31/03/26 Втр 21:24:30 #484 №1568710

>>1568706
>Не опенсорс. Поэтому говно.
Как-то похуй, учитывая что лмс заточена под рабочие задачи, а не под сношение карточек.

Аноним 31/03/26 Втр 21:27:33 #485 №1568713

image.png

И че это за хуйня? Это нормально для лм студии? Настройки по дефолту. Хули так медленно? У меня было 70 токенов в секунду в другом фронте с загрузчиком

16/16

Аноним 31/03/26 Втр 21:32:05 #486 №1568714

>>1568713
Ну это надо умудриться, чтобы проебаться с настройкой приложения, где настроек итак минимум. Проверь скачалась ли библиотека под куду или че у тебя там стоит вместо видеокарты.

Аноним 31/03/26 Втр 21:37:24 #487 №1568716

>>1568704
>Ну давай, поясни, по каким параметрам лмстудио говно.
Примерно вот: >>1568696 >>1568713
Лол, прямо в этом треде, даже скрины не нужно тащить.

Аноним 31/03/26 Втр 21:37:48 #488 №1568717

Пытаюсь завести TTS через silly tavern на XTTS
Щас ебнусь просто уже. Просто пиздец на каждом шаге беды и ошибки.
Может я изначально занимаюсь какой-то хуйней и делать это все нужно иначе?

Аноним 31/03/26 Втр 21:48:40 #489 №1568721

Посоветуйте ньюфажке модель для 5070 Ti+64GB DDR5-6000 пожалуйста. Кум нужен, но не является основной целью, на русском языке.

На винде, я так понял через кобольд или не понял

Аноним 31/03/26 Втр 21:56:13 #490 №1568725

>>1568716
>Лол, прямо в этом треде, даже скрины не нужно тащить.
Если кто-то не умеет пользоваться ложкой - не значит что ложка как инструмент говно и можно черпать суп пальцами. В предыдущих тредах можно найти сотню-другую проблем с кобольдом или чистой жорой. Но ты ведь пользуешься жорой, так ведь? Значит всё-таки пиздабол.

Аноним 31/03/26 Втр 22:05:04 #491 №1568733

>>1568725
>Но ты ведь пользуешься жорой
Кобольдом. И да, он говно. Но говно меньшее и более привычное, нежели чем лмстудия.

Аноним 31/03/26 Втр 22:12:31 #492 №1568737

Я столкнулся с непонятной хуйнёй при генерации. Аутпут разбит на 2 абцаза, первый из которых повторяется либо буква в букву, либо по смыслу. Условная ситуация - я заплатил за девушку в кафе:
>она оценила этот жест
>она благодарна за этот жест
>она оценила этот поступок
>она благодарна что ты заплатил
Но вот следующий иногда переворачивается с ног на голову и то она просит продолжить свидание, то резко сбегает с него, то заканчивает его и назначает следующее. Я не пойму, какой из аутпутов больше попадает в персонажа, а какой является галлюцинацией ведущей вникуда. Вроде как всегда было, что нарушение сценария это уже галюны и выход из образа, нет? По смыслу сцены не должна она быть такой гиперактивной и ломать ход свиданки. Но вроде как назначение следующей встречи вполне попадает в романтический нарратив, мол - это свидание збс и следующее точно будет. Я запутался...

Аноним 31/03/26 Втр 22:12:44 #493 №1568738

>>1568733
>говно меньшее и более привычное
Привычное для тебя. Не нужно думать, что остальные считают также. Лично я считаю кобольд говном гораздо большим, но не катаюсь из треда в тред, рассказывая об этом каждому. Для разных задач и ситуаций есть разные варианты. Где-то предпочтительней кобольд, где-то лмстудио. Если криворукие не могут настроить две кнопки и три ползунка в одном приложении, не значит что другое из-за этого автоматом становится лучше.

Аноним 31/03/26 Втр 22:16:09 #494 №1568740

>>1568737
Тут простое решение - поменять модель. Такого бреда быть не должно.

Аноним 31/03/26 Втр 22:18:32 #495 №1568741

>>1568721
Анонче, ну пожалуйста. Ну почитай этот тред и предыдущий. Из треда в тред, одно и тоже. Ну посмотри что советуют, выбери. Попробуй. Не понравится, если не получиться, приходи спрашивай.

>На винде, я так понял через кобольд
> Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
>Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
>Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai

Модели
>Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026

Вот анон писал >>1566926
Вот для перевода >>1566950

АААААА ЧИТАЙТЕ ТРЕД! ЧИТАЙТЕ ТРЕД! Я ВАС БЛЯТЬ ПРОШУ ЧИТАЙТЕ
ЕБАННЫЙ
ТРЕД
У ВАС СУКА ПОИСК ЕСТЬ. ОН СЛЕВА В ВЕРХУ

Аноним 31/03/26 Втр 22:24:08 #496 №1568749

image.png

Почему лм студия не дает загрузить? Какие бы настройки я не выставлял не удается нормально загрузить модель.. Вообще ни как не помещается. Тупо вешает систему, даже если максимально все скручу. В тоже время через другой фронт с загрузчиком все летает.

Аноним 31/03/26 Втр 22:27:43 #497 №1568750

>>1568741
>Вот анон писал
Тут для 16+16. А для >>1568721 лучше юзать glm air 106b и qwen 3.5 122b. И можно аккуратненько степашку с жирноквеном 235b в IQ2_S пощупать.

Аноним 31/03/26 Втр 22:31:18 #498 №1568751

>>1568721
>Посоветуйте ньюфажке модель
>Кум нужен, но не является основной целью, на русском языке.
Нужен кум - мистрали самый простой вариант. Пердолиться с ними не нужно, цензуры нету. Но и русского тоже нет. Точнее есть, но крайне паршивый. Вариант с русским - большая гемма, но там свои приколы. Возможно придется пердолиться с инструкциями, если раньше ничего не запускал локально.

>я так понял через кобольд
Через кобольд.

>>1568749
Попробуй отключить mmap. Если не поможет - возвращайся на кобольд, современные технологии не для тебя.

Аноним 31/03/26 Втр 22:33:35 #499 №1568752

>>1568751
>>1568749
>Попробуй отключить mmap.
Или mlock, не помню. Отключи короче и то и то, что-то из этого точно жрет оперативку. Когда узнаешь что именно - напишешь.

Аноним 31/03/26 Втр 22:38:32 #500 №1568753

>>1568110
>Но текстовая нейронка и так будет сжирать твою память, чтобы еще картинкогенерацию присобачить. Поиграться можно, но результат тебе не понравится.
Вообще - есть такая штука - llama-swap. Позволяет менять модели на лету. Если достаточно памяти на кеш или быстрый nvme - можно иметь генерацию картинок и текстовую модель в таверне (и не только) хоть с одной 3060.
Правда пока раскуришь - некоторый пердолинг. Зато потом оно эмулирует полноценный endpoint OpenAI - т.е. с ним работает не только таверна а куча всего. И там прямо как у взрослых - текст, embedding, картинки - все в одном, и для клиента прозрачно.

Аноним 31/03/26 Втр 22:39:57 #501 №1568754

>>1568750
>жирноквеном 235b в IQ2_S
Не, не, не. Не надо его советовать. Мало того что модель специфичная, так еще в Q2 она будет гигашизовая. Это буквально способ для ньюфага сгореть и в петлю, если его карточка будет отличаться от
~Ах, глубже семпай. ~

Аноним 31/03/26 Втр 22:51:00 #502 №1568755

Кто-нибудь знающий ответьте плиз на >>1566708 →
А то в сд треде ебать шизы сидят, буквально худший тред раздела

Аноним 31/03/26 Втр 22:57:47 #503 №1568758

>>1568755
Так нету картинко-моделей, которым нужно было бы столько видеопамяти что только разброс по нескольким картам бы вывозил. Купай 5090 и можешь гонять что угодно. Или уже нет и я отстал от прогресса, а там уже сдохля 4XL вышла?
>А то в сд треде ебать шизы сидят, буквально худший тред раздела
Нет, есть еще наш соседний братский тред асигеров. Но да, у нас тут поспокойнее, хотя шизы свои тоже имеются.

Аноним 31/03/26 Втр 22:59:34 #504 №1568760

>>1568758
>братский тред асигеров
У меня давно вопрос, какого хуя там происходит. 90% треда, какие то бессмысленные сообщения. Может это шифр, а слишком дед чтобы его понимать.

Аноним 31/03/26 Втр 23:01:49 #505 №1568761

>>1568755
Что ты хочешь сделать для начала четко и ясно объясни? Есть оснастки позволяющие разбивать диффузионные модели на несколько гпу. Но это почти никогда не нужно, троллейбус из хлеба.
Если хочешь применить все карточки - запускай параллельную генерацию и получай кратно больше роллов.

Аноним 31/03/26 Втр 23:06:59 #506 №1568763

HEtp5PDWsAAJuyx.jpg

ТУРБОКВАНТ ЖМЕТ И МОДЕЛИ ЕБАТЬ, КОМФОРТНАЯ ДРОЧКА НА 16ГБ и 27-35B

Аноним 31/03/26 Втр 23:07:14 #507 №1568764

>>1568758
Я все гоняю в 16 битах (кроме лтх потому что модель по качеству полуговно и выигрыша совсем нет). А даже квенчик весит 40 гб. А тот же хуйнянь даже в 4 битах в карту не влезает, падлюка.

>>1568761
Сделать я уже пробовал через raylight и пососал хуй как раз по причине, что третья псина НЕ ВЫВОЗИТ. Поэтому я хочу понять, почему в диффузных моделях нельзя сделать такую же модель инференса, как в обычном нашенском послойном мултигпу ллм. То есть я хочу разделить модель на условные две карты и в рамках одного шага денойза сначала первая половинка модели отработала, передала данные на вторую карту и отработала уже вторая. Так же нельзя сделать? Почему? В чем принципиальное отличие диффузионных моделей, что такая схема не будет работать? Или все инструменты нас газлайтят и на самом деле такое возможно?

Аноним 31/03/26 Втр 23:08:31 #508 №1568766

>>1568749
Пидарасы что-то сильно испортили в лм студио с ласт апдутом

Аноним 31/03/26 Втр 23:10:29 #509 №1568767

>>1568758
аисг я читаю и прекрасно понимаю, кроме, пожалуй, истоков и кейсов применения выражения "держи юшку". Сд тред же - это просто какая-то жесть

Аноним 31/03/26 Втр 23:12:52 #510 №1568769

>>1568763
В шапку добавьте, через недели 2 все будет на твин турбо

Аноним 31/03/26 Втр 23:16:57 #511 №1568774

>>1568763
Ебанись если правда. Только пахнет пиздежом. Потому что нельзя просто так взять и что-то сжать без потерь. Где-то тут зарыта собака. Возможно даже сутулая.

Аноним 31/03/26 Втр 23:16:58 #512 №1568775

>>1568763
> на 10% меньше памяти
Как будто похуй

Аноним 31/03/26 Втр 23:17:52 #513 №1568776

>>1568763
О, скоро плотненькие 27б смогут быть пригодны не только в рп на 16гб врам

Аноним 31/03/26 Втр 23:18:29 #514 №1568777

>>1568764
Ты пост не читал?
> Есть оснастки позволяющие разбивать диффузионные модели на несколько гпу.
Все можно, все делают. Просто редко нужно и потому оно непопулярно. У большинства пользователей карточка одна или две и с псинами все в порядке, поэтому блоксвап на больших моделей им предпочтительнее. А так тот же ComfyUI-MultiGPU.
> квенчик весит 40 гб
Его как раз в фп8 или нунчаках где ~5бит катают, влезает в одну карту.

Аноним 31/03/26 Втр 23:19:08 #515 №1568778

>>1568774
Собака в том что крутить на хую веса добавляет накладные расходы. Помедленее будет вроде

Аноним 31/03/26 Втр 23:21:40 #516 №1568780

>>1568778
Я дождусь тестов и сравнений. 4 квант плотняши весом в 12 гигов звучит как чудо, даже если будет потеря скорости.

Аноним 31/03/26 Втр 23:22:24 #517 №1568781

>>1568777
>ComfyUI-MultiGPU
Разве он не стримит блоки с вторичной карты на ту, где вычисляет?

Аноним 31/03/26 Втр 23:24:47 #518 №1568784

image.png

>>1568752
Запустилось с такими настройками. Но получил +15 токенов в секунду, а через кобольда было 50...

Аноним 31/03/26 Втр 23:26:10 #519 №1568786

>>1568760
>У меня давно вопрос, какого хуя там происходит. 90% треда, какие то бессмысленные сообщения.
Там давно режим нон-стоп щитпостинга, им не просто так лимит по перекату увеличили.

Аноним 31/03/26 Втр 23:26:27 #520 №1568787

>>1568763
> качество около q4_0
То есть днище днищенское хуже q3km, ебать спасибо нахуй.
>>1568781
Хз, даже не интересовался.

Аноним 31/03/26 Втр 23:31:46 #521 №1568790

>>1568787
>То есть днище днищенское хуже q3km, ебать спасибо нахуй.
Ничего не мешает сделать квант побольше. Разве нет?

Аноним 31/03/26 Втр 23:32:10 #522 №1568791

А кто-нибудь вообще доказал преимущество турбоквантованного кэша над хадамардом из Кавракова?

Аноним 31/03/26 Втр 23:33:53 #523 №1568793

>>1568790

А зачем? Медленные, но точные и маленькие IQ кванты уже есть.

Аноним 31/03/26 Втр 23:34:45 #524 №1568796

>>1568778
Медленная гемма станет еще медленнее?

Аноним 31/03/26 Втр 23:35:16 #525 №1568798

>>1568790
Да можно наверно. Просто там вообще изначально была задумка методики, которая учитывая особенности кэша атеншна, и именно для нее работает прилично. А тут выглядит как просто попытка срубить хайп на теме, при том что йобистых алгоритмов квантов весов уже хватает.

Аноним 31/03/26 Втр 23:35:46 #526 №1568799

>>1568793
Ну еще выиграть пару гигов. Для нищуганов это же как манна небесная. Ну не у нищуганов, тут я уже охуел, а на мелкомоделях. Понятно что эти пара гигов на какой нибудь кими- ни пришей пизде рукав, но малыхи то идеально должны залетать. А это больше места на контекст.

Аноним 31/03/26 Втр 23:38:22 #527 №1568803

>>1568763
Для нашего брата это сыграет если разработают какой-нибудь двойной турбоквант типа fb16 -> TQ5. TQ3 годен ну только если им GLM пожать и при этом распаковка на процессоре будет быстрой.

Аноним 31/03/26 Втр 23:38:41 #528 №1568804

>>1568799
На крупных будет тоже плюсом. 300-400b заталкивать в 128гб

Аноним 31/03/26 Втр 23:39:09 #529 №1568805

>>1568774
>Потому что нельзя просто так взять и что-то сжать без потерь.
О "без потерь" вроде бы и не говорят. А что до качества - вспоминаем историю развития видеокодеков. :)

Аноним 31/03/26 Втр 23:41:39 #530 №1568808

>>1568805
Так а что делают-то? Хотят ещё сильнее лоботомировать чтобы в одну карточку влезало? Или чтобы было умное, но чудовищно медленное?

Аноним 31/03/26 Втр 23:45:42 #531 №1568815

>>1568799
Ты не выиграешь вообще ничего, то что показывает этот tq3_1s - это результаты iq3_m - как по размеру, так и по качеству.

Аноним 31/03/26 Втр 23:46:51 #532 №1568817

>>1568784
>Запустилось с такими настройками.
Продолжай наблюдение, крути выгрузку. Попроси на крайняк какую-нибудь корпу разжевать тебе все настройки.
>через кобольда было 50
Ну так посмотри что ты навертел в кобольде и затащи всё в лм. Они оба на жору ссылаются, так что не может быть такой разницы в скорости, если ты нормально всё настроил.

Аноним 31/03/26 Втр 23:48:08 #533 №1568819

>>1568815
Короче революции не случилось. Опять.

Аноним 31/03/26 Втр 23:49:55 #534 №1568822

>>1568815
Так это что получается. Сырну опять обманули?

Аноним 31/03/26 Втр 23:53:23 #535 №1568826

В квантах есть три прямо зависящих друг от друга параметра - размер/скорость/качество. Математику не наебешь. Можно оптимизировать одно за счет двух или два за счет одного. Так чтобы все три магически было заебись - не бывает. Бывает что все три параметра являются говном - это да те самые 4_0 кванты.

Аноним 31/03/26 Втр 23:53:58 #536 №1568827

>>1568787
Ну я так и понял, что в этом треде тоже нихуя не понимают, мда.

Аноним 31/03/26 Втр 23:54:06 #537 №1568828

Я думаю, что случится просто лёгкая рокировка. Те кто сидел на q3 смогут пересесть на 4, те кто на 4 на 5, а кто на 5 на 6. Все кванты слегка подожмутся и их можно будет впихнуть в меньшую память.

Аноним 31/03/26 Втр 23:58:33 #538 №1568831

>>1568827
Конечно, все долбоебы а ты Д'артаньян (нет). Тема редкая потому что почти никому не нужная, раз выбрал особый путь и идейный - так обладай качествами чтобы по нему идти. Где искать тебе уже подсказали.

Аноним 01/04/26 Срд 00:03:03 #539 №1568836

>>1568831
Я спросил конкретные вопросы про специфику инференса диффузных моделей и сравнение с ллм, мне общие слова не нужны, если не знаешь - пройди мимо. Я прекрасно знаю про текущие мультигпу решения для картинок, а ты что-то советуешь, даже не зная, как это работает. Зачем вообще тогда что-то пишешь - непонятно.

Аноним 01/04/26 Срд 00:13:04 #540 №1568844

>>1568836
Почему не спросить это у корпоратки, той же клауды? Она точно знает больше, чем среднестатистический заходила в тред. Твои проблемы - это твои проблемы. Ты знаешь где находишься и куда пишешь, знаешь что есть вероятность что тебе не ответят. Так зачем тратишь время, если тебя эта тема правда волнует?

мимо

Аноним 01/04/26 Срд 00:16:38 #541 №1568845

>>1568778
Зыс. Упор пойдёт больше в компьют а не пропускную памяти. там векторы хитрым образом считаются

Аноним 01/04/26 Срд 00:22:33 #542 №1568849

>>1568844
Раньше в треде были некоторые люди, которые хорошо знали именно мл, а не только как трахнуть кобольда. Они поняли бы вопрос и, возможно, объяснили нормально.

иронично советовать корпоратов в локалкотреде, тем более я уже пробовал в бесплатных и локалках поспрашивать

Аноним 01/04/26 Срд 00:23:43 #543 №1568850

>>1568844
Ай хорош! Двачую, такое у ллмок спрашивать надо.

Аноним 01/04/26 Срд 00:30:44 #544 №1568855

>>1568849
>Раньше в треде были некоторые люди, которые хорошо знали именно мл, а не только как трахнуть кобольда.
Ну так раньше и надо было спрашивать, че теперь-то. Более того, есть уже давно отдельный тред /research/ - чисто вот под такие узкие вопросы. Мы тут в любом случае не машин лернинг, мы здесь языковые модели.
>иронично советовать корпоратов в локалкотреде
Что здесь ироничного? Локалки имеют вполне понятные ограничения. Не все из них подходят под все задачи и нет ничего странного пользоваться и тем и другим.

Аноним 01/04/26 Срд 00:35:15 #545 №1568858

>>1568763
Если это правда снова, то это революция, ни больше, ни меньше.

Аноним 01/04/26 Срд 00:37:52 #546 №1568861

Уххх, как же я сейчас покумил на плотненьком квенчике...

Аноним 01/04/26 Срд 00:48:03 #547 №1568867

Новые Геммы получатся пиздатыми. Снижение веса + ужатие тяжелого контекста.

Аноним 01/04/26 Срд 00:48:41 #548 №1568869

>>1568763
Нужно смотреть на практике всё. Ещё и от имплементации в Жору многое зависит. В целом, сейчас 4KS или UD 4KXL кванты весят в пределах 17.5гб. Если перфоманс будет сопоставим, но при этом данный квант весит 13гб, то это клёво, ~25% разница в размере. Но я не верю, что все так уж сладко. Будут толкать как мега революцию, на деле будет вагон и маленькая тележка нюансов от падения скорости до нестабильности или удара по мозгам.
Но если все действительно так, как рекламируют, то хорошо.

Аноним 01/04/26 Срд 01:00:45 #549 №1568873

>>1568855
>Ну так раньше и надо было спрашивать
А теперь ты запрещаешь этого делать? Или ты точно знаешь, что этих людей точно с нами нет и тут одни скуфы-кобольды? Или машиной времени обладаешь? К чему ты это написал?
>есть уже давно отдельный мертвый тред /research/
...
>Мы тут
Кто мы, ты за всех теперь отвечаешь?
>Что здесь ироничного
В том, что в другом контексте тут смешивают с говном за предложения взаимодействовать с корпоратами.

Понимаешь, проблема не в том, что мне не отвечают. Заигнорьте к хуям - все станет понятно. Проблема в том, что отвечают какую-то чушь. Ну то есть будто нейронки - в датасете ответа на вопрос нет, и даже понимания вопроса нет, но что-то высрать надо, и начинают что-то высирать по ассоциациям, что кажется связным, но на деле вообще не имеет отношение к вопросу. Только в треде отвечать никто не обязывает, но все равно высираются. Почему - неизвестно. Может тут реально половина актива это абушные боты, кто вас знает.

Аноним 01/04/26 Срд 01:07:19 #550 №1568881

>>1568873
> Проблема
Часто проблемы подобные вообще встречаешь, да? Побольше потока сознания, нытья и игнорирования очевидного, будет еще чаще.

Аноним 01/04/26 Срд 01:07:28 #551 №1568882

>>1568787
>То есть днище днищенское хуже q3km, ебать спасибо нахуй.
Читал обсуждение турболоботомитов в треде у Кавракова (с попытками имплементации) - так тот Кавраков прямо говорит о "секте поклонников турболоботомита" и что, мол, новый метод даже хуже уже существующих - жать-то он жмёт, но потери при том же размере выше.

Аноним 01/04/26 Срд 01:11:46 #552 №1568884

>>1568882
>турболоботомитов
А ну ка.
лоботомит.

Аноним 01/04/26 Срд 01:12:08 #553 №1568887

>>1568884
Абу блять, долбоёб.

Аноним 01/04/26 Срд 01:12:47 #554 №1568890

>>1568873
>Или ты точно знаешь, что этих людей точно с нами нет и тут одни скуфы-кобольды? К чему ты это нитпсал?
Так это как-бы ты нитпсал, лол. Что раньше были какие-то прошаренные аноны, а щас анон обмельчал и только о кобольдах думает.
>есть уже давно отдельный мертвый тред
Так тебе уже нитпсали, что тема узкая. Чего ты ожидал? Или ты думал, что все сюда перебрались?
>Кто мы, ты за всех теперь отвечаешь?
Ну ты же за всех ответил >>1568827
>В том, что в другом контексте тут смешивают с говном за предложения взаимодействовать с корпоратами.
Это ты уже выдумываешь. Отдельные идейные шизы может быть, но в среднем по палате никто такую чепуху не гонит. Кто гоняет локали прекрасно знает, что они не всемогущи и хочешь не хочешь, а корпы гонять придется.
>Только в треде отвечать никто не обязывает, но все равно высираются.
Точно также никто не обязывает тебя писать сюда. Не нравится - иди в другое место. Это работает в обе стороны.