Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №113 /llama/

Аноним 12/03/25 Срд 19:44:33 #1 №1094772

Llama 1.png

Альфа от контекста.png

KL-divergence statistics for Mistral-7B.jpg

Компьютер голубого.jpg

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст, и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/llm-models
• Неактуальный список моделей устаревший с середины прошлого года: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Moraliane и https://huggingface.co/Aleteian
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/local-llm-guide/how-to-use-a-self-hosted-model
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1083681 (OP)
>>1071720 (OP)

Аноним 12/03/25 Срд 19:45:21 #2 №1094775

>>1094770 →
>Неужели ебучая llama.cpp нужна?
Да, компиляй.

Аноним 12/03/25 Срд 19:46:36 #3 №1094778

https://huggingface.co/lunahr/gemma-3-1b-it-abliterated

наверно скоро и остальные подъедут

Аноним 12/03/25 Срд 19:57:30 #4 №1094803

>>1094711 →
разобрался. блять, это, возможно, просто ХУДШИЙ опыт установки подобного софта в жизни

если вдруг кто-то тоже решит установить open-webui без докера, как самодостаточное приложение:
0. устанавливаем python
1. создаем в удобном месте папку open-webui, без кириллицы в пути
2. открываем cmd/powershell, переходим в эту папку при помощи команды cd
3. создаем виртуальную среду python при помощи python -m venv .venv
4. переводим сессию терминала на эту виртуальную среду при помощи .\.venv\Scripts\activate.bat
ее нужно будет активировать каждый раз заново (автоматизируется батником)
5. устанавливаем open-webui при помощи pip install open-webui
6. чтобы миновать авторизацию (БЛЯТЬ, ОНИ ДОБАВИЛИ АВТОРИЗАЦИЮ ПО ДЕФОЛТУ В ЛОКАЛЬНЫЙ ФРОНТЕНД, ВЫ ПОНИМАЕТЕ? ЕЕ НЕ ПРОПУСТИТЬ), нужно задавать переменную среды WEBUI_AUTH=false. вы ПОНИМАЕТЕ?
я это делаю в батнике. батники любезно предоставляю вам, не представляю правда, нахуй, кому они могут понадобиться. поместить их нужно в папку open-webui

батник для запуска:
@echo off
echo Applying virtual environment...
call .\.venv\Scripts\activate.bat

echo Setting WEBUI_AUTH=false...
SET WEBUI_AUTH=false

echo Starting Open WebUI...
open-webui serve

pause

батник для обновления:
@echo off
echo Applying virtual environment...
call .\.venv\Scripts\activate.bat

echo Updating Open WebUI...
pip install open-webui --upgrade

pause

готово. у меня бекенд быстрее поднимается и загружает 24гб модель, чем просыпается этот фронтенд, который весит ТРИ С ПОЛОВИНОЙ ГИГА
я не знаю, зачем я это установил...

Аноним 12/03/25 Срд 19:57:54 #5 №1094804

>>1094775

Не надо ничего компиллировать, все скомпилено уже.
https://github.com/ggml-org/llama.cpp/releases/tag/b4877

Аноним 12/03/25 Срд 19:59:12 #6 №1094806

>>1094803

Чел, эта хуйня одним файлом устанавливается.

Аноним 12/03/25 Срд 19:59:44 #7 №1094808

>>1094803
>просто ХУДШИЙ опыт установки
>буквально стандартные пункты установки любого питононейроговна
Ебать ты нежный. Вот когда оптимизатор для стейбла вручную компиляли студией (в дополнении ко всем остальным пунктам и даже больше), это да, пиздос. А у тебя на изях всё.

Аноним 12/03/25 Срд 20:01:10 #8 №1094810

>>1094806
докером?))
я не готов держать у себя на компе виртуальную машину только для того, чтобы иногда поднять чат
которая еще и кушает рам как не в себя, когда работает. все, кто много работали с докером, в курсе. мне его на работе хватает, спасибо, не голодный

а суть моей запарной установки в декаплинге, это полностью самодостаточная папка, которую можно переименовать, переместить или отправить на другой компьютер. никакие данные не будут утеряны, все будет заводиться с одного клика

Аноним 12/03/25 Срд 20:01:50 #9 №1094812

>>1094810
>папка, которую можно переименовать, переместить
Ну попробуй, лол.

Аноним 12/03/25 Срд 20:03:59 #10 №1094816

>>1094812
при переносе в конфиге виртуальной среды нужно будет заменить аж три пути... прости. если это проблема, устанавливай докер, корми его своей рамой, а я пасану

Аноним 12/03/25 Срд 20:09:44 #11 №1094822

>>1094803
Обязательная регистрация и последующая авторизация в локальном фронтенде - это сильно.

Аноним 12/03/25 Срд 20:10:38 #12 №1094825

жаль.
у кобольда нет таких проблем

Аноним 12/03/25 Срд 20:11:44 #13 №1094830

>>1094825

У убы тоже.

Аноним 12/03/25 Срд 20:14:05 #14 №1094836

>>1094825
>>1094830
у llama-cpp тоже

Аноним 12/03/25 Срд 20:15:26 #15 №1094840

>>1094816
Ну вообще-то text-generation-webui-main.zip распаковывается
и устанавливается гораздо проще, чем ты описал. Другое дело, что эта установка не факт, что будет работать.

Аноним 12/03/25 Срд 20:17:06 #16 №1094842

>>1094840
Это другой фронтенд. Он про open-webui писал.

Аноним 12/03/25 Срд 20:21:30 #17 №1094849

1647313816729.png

Потестил Олимпик Кодера, очень даже годно. Кодит на уровне QwQ, при этом без размышлений.

Аноним 12/03/25 Срд 20:32:28 #18 №1094862

>>1094803
Эээ, ну типа тут просто клонировал, создал венв, поставил реквайрменты. Что сложного то?
>>1094808
> оптимизатор для стейбла
Либы хуанга не хочешь? А так прав
>>1094810
> это полностью самодостаточная папка, которую можно переименовать, переместить или отправить на другой компьютер
А для чего? Оно протухнет раньше чем понадобится переносить, в чем смысл "бекапить" публичные регулярно обновляемые пакеты?

Аноним 12/03/25 Срд 20:34:02 #19 №1094867

1608599924968.jpg

Анончики, сколько врам на картинке?

Аноним 12/03/25 Срд 20:36:52 #20 №1094873

изображение.png

>>1094816
>нужно будет заменить аж три пути
Пиздос.
>устанавливай докер
Вопрос в том, нахуя мне опенуи, когда есть базированные кобольд с таверной.
>>1094862
>Либы хуанга не хочешь?
Да да, их ставить, куду там, нсист какой-то, всё это добро.
>>1094867
Так блэт, это разве не 5090?

Аноним 12/03/25 Срд 20:40:06 #21 №1094878

Я как осел из Шрека :

Ну что, там кобальт уже обновили ?
А сейчас ?
Уже ?
Может сейчас ?

Геммочку хочу

Аноним 12/03/25 Срд 20:42:17 #22 №1094885

изображение.png

>>1094878
Лост руин уже не торт.

Аноним 12/03/25 Срд 20:44:31 #23 №1094889

>>1094885
Нет, только не это. Я не хочу страдать как >>1094803

Аноним 12/03/25 Срд 20:46:30 #24 №1094890

image

>>1094878
Я еще обнову ChatterUI жду. 4b для телефона будет просто имбищей - по бенчам она на уровне второй геммы 9b.

Аноним 12/03/25 Срд 20:48:49 #25 №1094897

>>1094889
Тогда компиляй батник для запуска >>1094804

Аноним 12/03/25 Срд 20:49:52 #26 №1094899

ну когда там уже третья геммочка на второй лламе...

Аноним 12/03/25 Срд 20:49:59 #27 №1094901

>>1094890
> image
Выглядит как пиздёж. В реальности между Флешем и Про просто пропасть. А по скорам якобы они близко. В кодинге Флеш вообще калище невозможное, хуже квен кодера. А у них он почти как Про по скору.

Аноним 12/03/25 Срд 20:51:39 #28 №1094905

>>1094873
> их ставить
Ставить когда все работает, но нынче Хуанг берет пример с Лизы и в лучших традициях нужно лезть куда поглубже.
> Так блэт, это разве не 5090?
Да, и не только это

Аноним 12/03/25 Срд 20:53:42 #29 №1094908

>>1094897
Нахер. Я буду ждать кобальта.
Пока есть квен, который с ризонингом дико доставляет.
Оказывается думай, охренеть как полезно в РП. Ибо сразу можно понять, где у тебя что то пойдет не так.
Просто вин.

Аноним 12/03/25 Срд 20:57:25 #30 №1094909

>>1094905
>Да, и не только это
Моё почтение. Кидай тесты как будет готово.

Аноним 12/03/25 Срд 21:03:05 #31 №1094914

>>1094867
96

Аноним 12/03/25 Срд 21:03:45 #32 №1094918

image

>>1094867
Главное Лапа, а куда Текsas дел?

Аноним 12/03/25 Срд 21:37:22 #33 №1094963

ахуй.png

бляяя, какое же говно этот openwebui, я просто не могу представить как и почему он настолько популярен и любим
люди просто дрочат на то, что он подражает интерфейсу OpenAI или почему?
я просто в ахуе сижу, вы бы видели этот UX, твою ж мать

смотрите пикрил. чтобы изменить значение, нужно навести на Default справа. нельзя просто нажать на Temperature или любой другой параметр, именно на значение справа. а теперь посмотрите какое между ними расстояние, и обратите внимание, что линейной разметки нет. минимализм хуле, вот и думайте теперь, что именно вы редактируете!
обратите внимание на этот скромный кружочек между Temperature и 0.6. это, оказывается, ползунок... его можно передвигать. у него просто нет фона, он отсутствует. кругом ебучий блоат и только, менюшки ради менюшек, панельки ради панелек, забудьте про мой первый пост >>1094803 как про страшный сон и никогда, слышите, НИКОГДА не устанавливайте эту парашу. я хотел просто пообщаться в нейтральном тоне с ассистентом, не заебываться с настройкой, позадавать вопросы на самые разные темы. но даже в глупойтаверне, которая обязательно предполагает наличие персонажей, это сделать будет проще

https://youtu.be/17KmNrG9pE4

Аноним 12/03/25 Срд 21:38:38 #34 №1094964

>>1094867
>Анончики, сколько врам на картинке?
Недостаточно :)

Аноним 12/03/25 Срд 21:39:48 #35 №1094965

Все ждём, когда kobold.ccp обновится и начнёт поддерживать gemma 3...

Аноним 12/03/25 Срд 21:45:57 #36 №1094970

image

>>1094965
Весь день мониторю их дискорд. Разраб уже обновил кобольд под Гемму, но в процессе тестов выяснил что обновление ломает Квен. И выкладывать такое не хочет, сказал что будет фиксить. Это днем было. А сейчас он вообще в офлайне, по ходу спать пошел, пёс ебаный.

Господи как же хочется геммочку...

Аноним 12/03/25 Срд 21:48:02 #37 №1094971

>>1094970
>>1094965
Расслабьте булки ща потестил гему 2 27б и если 3 реально такая же то это кал, новое это мистраль смол 24б и квен 32б

Аноним 12/03/25 Срд 21:48:11 #38 №1094972

>>1094970
>обновление ломает Квен
Не нужен, кидайте обнову.

Аноним 12/03/25 Срд 21:49:55 #39 №1094975

>>1094890
> ChatterUI жду. 4b для телефона
Какие конфиги нужны?

Аноним 12/03/25 Срд 21:51:01 #40 №1094976

1.png

2.png

хотите скачать пресет модели для openwebui? регистрируйтесь, пидорасы, потому что негде больше скачать, а в нашем интерфейсе разбираться вы сойдете с ума

как же горит аааааоаоаоаоаоа
похуй блять возвращаюсь к угебуге которая пердит как жигуль моего деда, она хотя бы работает

Аноним 12/03/25 Срд 21:53:45 #41 №1094977

>>1094963
Зачем ты его вообще юзаешь?

Аноним 12/03/25 Срд 21:54:43 #42 №1094978

>>1094971
Ваше мнение очень важно для нас.
Продолжайте держать в курсе.

Аноним 12/03/25 Срд 21:57:30 #43 №1094983

>>1094975
Любой современный телефон. Под Q8 - нужно 4.1 Гб свободной ОЗУ и 2.4 Гб под Q4.

Сейчас пользуюсь геммой 2b в Q8, генерация довольно быстрая, по ощущениям ~10 т/с. Телефон Xiaomi 13T, с MediaTek вместо проца и 8гб ОЗУ

Аноним 12/03/25 Срд 21:58:10 #44 №1094986

>>1094971
>ща потестил гему 2 27б и если 3 реально такая же то это кал
К твоему мнению обязательно прислушаются, спасибо что поделился.

Но если серьезно, то на бумаге тройка хороша. Контекст завезли, мозгов тоже, пусть и немного. Ждем кванты поддержку, а там уже видно будет. Но даже если это та же самая двойка, но без клоунских 8к на инпут, то это уже прорыв, удар и сила. Потому что от бесконечных глинт-тюнов на ебаный мистраль уже тошнит, хочется чего-то нового. Хочется навернуть синтетического слопа, но на другом семействе.

Аноним 12/03/25 Срд 21:58:57 #45 №1094989

1612653751054.png

1666368993641.png

1601758434795.png

>>1094909
В позапрошлом отписывался, в ллм быстро. Тестировать лучше уже когда тряска с обновлениями уляжется, много проблем. Сейчас с Жорой не все идеально (или пиздят, подробно не вникал), Турбодерп новых коммитов под гемму3 не делал, убабугу на самый свежий трансформерс чинить надо.
Вот гемма3 q8 на Жоре, 1 со сплитом тензоров, 2 - просто по слоям, 3 - выдает эксллама hf в 72б 4бита при автосплите без доп параметров.
>>1094914
Не угадал
>>1094918
Человек культуры, нету Техаса. Из мелких есть кошкажена. Что-то даже такие прайзы сейчас купить сложно кроме как на релизе, одни бутлеги что нонсенс.

Аноним 12/03/25 Срд 21:59:20 #46 №1094991

>>1094986
Без иронии, я вчера попробовал вторую Гемму, и она глинтила гораздо большех всех Мистралей, что я пробовал. Буду надеяться, будут годные тюны на третью Гемму, которые это исправят.

Аноним 12/03/25 Срд 22:03:44 #47 №1094994

>>1094991
>глинтила
Опять зумеры новое слово придумали что ли?

Аноним 12/03/25 Срд 22:04:51 #48 №1094995

1711999145357080.png

Окей, Гемма, Расскажи про секретные программы в нацисткой Германии
@
"Эмм, ну это больная тема, там столько всего плохого было, я не могу тебе рассказать, нужно учитывать чувства людей и какие злодеяние были совершены..."
@
Окей, Квен, расскажи про секретные программы в нацисткой Германии
@
"В ОБЩЕМ СЛУШАЙ:"
@
"UBERSTURMAPPARAT PROGRAMME: СОЗДАНИЕ АНТИГРАВИТАЦИОННЫХ ДВИГАТЕЛЕЙ ДЛЯ САМОЛЕТОВ ПОД РУКОВОДСТВОМ ВЕРНЕРА ФОН РИБЕНХАУЗЕРА"
@
"WERWOLFVOLK PROGRAMME: СОЗДАНИЕ АРИЙСКИХ СУПЕРСОЛДАТ НА ОСНОВЕ БИОИНЖЕНЕРИИ (1939-1945). ПРОЕКТ ПРЕКРАТИЛ СУЩЕСТВОВАНИЕ С ОКОНЧАНИЕМ ВОЙНЫ"
@
"GOLDFURHERMARK STANDARD: ВЫВОЗ ЗОЛОТА ИЗ НАЦИСТКОЙ ГЕРМАНИИ В АНТАРКТИДУ В ПОСЛЕДНИЕ ДНИ ВОЙНЫ"
@
"ПРОЕКТ AKTION-T1000: ЭКСПЕРИМЕНТЫ НАД ЛЮДЬМИ В ПОДЗЕМНЫХ КОНЦЛАГЕРЯХ В ПОЛЬШЕ ПОД РУКОВОДСТВОМ ДОКТОРА АНГЕЛЕЗА"
@
"Хочешь, знать узнать что-то еще?"

Почему еще нет бенчмарков, которые тестят модели на ахинею?

Аноним 12/03/25 Срд 22:05:23 #49 №1094996

Так никто и не ответил. На чем вы запустили новую гемму. Качать действительно llama.cpp? Серьёзно?

Ну со всякими докерами ебаться — это больным надо быть. Уж лучше голый бэк и таверна.

Аноним 12/03/25 Срд 22:05:24 #50 №1094997

>>1094965
.\llama-server.exe -m .\gemma-3-27b-it-Q8_0.gguf -c 24576 -ngl 999
Вот же рабочая инструкция. Осталось понять, куда mmproj кидать.

Аноним 12/03/25 Срд 22:12:09 #51 №1095003

>>1094996
Ее 1-2 человека в треде запустили. Куда спешить?

Аноним 12/03/25 Срд 22:12:20 #52 №1095005

>>1094991
С гемкой проблема была в том, что по сути она нахуй была не нужна никому в своем секторе, ибо был 12 киловый мистраль, который выбивал версию на 9B, а после появился мелкий на 24B, который быстро выбил старшую версию на 27. И с мисралью долгое время кстати были такие же проблемы, ту же лиру взять, где чисто клодизмы в каждом втором предложении. Вот только французские поделия продолжали тюнить, а на гугловский дрист все забили почти сразу.

>>1094994
>Опять зумеры новое слово придумали что ли?
Опять залетные набежали что ли, которые вчера про языковые модельки узнали?

>>1094996
>Так никто и не ответил. На чем вы запустили новую гемму. Качать действительно llama.cpp? Серьёзно?
Типа того, пока уба и кобольд не обновились.

Аноним 12/03/25 Срд 22:16:06 #53 №1095008

image.png

>>1094772 (OP)
Осторожно с прогами говноделов.
https://github.com/ggml-org/llama.cpp/issues/12355
Проверил этот пост и правда.

Аноним 12/03/25 Срд 22:19:11 #54 №1095013

>>1094995
С мозгом хлебушка не умеющим первым постом делать джейлбрейк к любой модели вообще нужно запретить доступ к ллм и банить итт.

Аноним 12/03/25 Срд 22:19:58 #55 №1095016

>>1095008
скорее всего сертификат отвалился, нужно просто подождать, пока исправят. не думаю, что это было сделано намеренно

Аноним 12/03/25 Срд 22:24:18 #56 №1095020

>>1095005
>был 12 киловый мистраль, который выбивал версию на 9B
В русике - нет. В своем размере гемма лучшая. Ни 12b ни 22b мистраль даже близко не рядом. И квены тоже.

>появился мелкий на 24B, который быстро выбил старшую версию на 27
А вот тут согласен - 24b неожиданно хорош в русском, неожиданно хорош в повествовании. А цидония на его основе - вообще песня. Еще и генерирует быстрее, 7 т/с против 3.5 т/с геммы на 12ГБ гпу. При таком раскладе 27b не особо и нужна.

Но на момент выхода 27 гемма была реально прорывом и топ-моделью для РП на русике. Надеюсь и третья гемма не разочарует.

Аноним 12/03/25 Срд 22:25:52 #57 №1095024

>>1095008
Скачал тоже самое, но под cu117. Антивирус молчит.
>>1094804
Годнота. Скачал архив 180мб и все работает без танцев с бубном, никакие зависимости ставить не нужно. Даже простенький UI есть.
Запустил командой в cmd:
llama-server --n-gpu-layers 16 --ctx-size 8192 --model "путь_модели\модель.gguf" --port 8080

Поддержка размышлений в UI есть. А вот есть ли вариант в ней или в чем-то другом отправить модели картинку?

Аноним 12/03/25 Срд 22:27:22 #58 №1095025

>>1095024
>Скачал тоже самое, но под cu117. Антивирус молчит.
Ясно, ну ладно, если меня порвёт в ожидании кобольда и не выдержу, запущу Джемму 3 по твоему совету, спс.

Аноним 12/03/25 Срд 22:28:24 #59 №1095028

>>1095024
>или в чем-то другом отправить модели картинку?
Они это сломали ещё в том году, так и не починили, лол.

Аноним 12/03/25 Срд 22:29:17 #60 №1095030

>>1095024
>отправить модели картинку?
Джемма 3 же может и сама генерить картинки судя по докам, не только видеть.

Аноним 12/03/25 Срд 22:29:45 #61 №1095031

>>1095020
>В русике - нет. В своем размере гемма лучшая. Ни 12b ни 22b мистраль даже близко не рядом. И квены тоже.
Речь про ролевуху в целом, а не про русик в частности. Тюны пилятся кем угодно, но не нами, носителями великого и могучего, так что это сомнительный критерий для оценки модели.

Аноним 12/03/25 Срд 22:32:08 #62 №1095034

>>1094991
>>1094971
>ща потестил гему 2 27б и если 3 реально такая же то это кал
берёшь своё ебало сортируешь по slop параметру
видишь что все тюны и сама гемма 1/2 ебанный слоп, а гемма 3 имеет наименьшее количество слопа, на уровне R1 и пишет также
https://eqbench.com/creative_writing.html

Аноним 12/03/25 Срд 22:39:21 #63 №1095036

>>1094996
Llamacpp-server, git clone@cmake -B build -DGGML_CUDA=ON@cmake --build build --config Release

По первым впечатлениям нравится, похожа на вторую гемму но повнимательнее. Очень старается и пишет довольно естественно, как глоток чистого воздуха после всяких рп щитмиксов. Хорошо отыгрывает карточку, отлично подстраивает стиль речи, но это и у второй было. Есть и минусы: глинты, шиверсы, министрейшны на месте, хз можно ли их побороть промтом. По куму 50-50, случаются структурные лупы и иногда подтупливает, но зато когда пошло может как плавно развивать, так и проявлять инициативу. Описания на любителя, бывает заходит, а иногда ультит дичью типа
> The air crackles with tension, thick with unspoken desires and the promise of a night consumed by unbridled passion. Her body is a canvas waiting to be painted, and you hold the brush, poised to create a masterpiece of pleasure.
читаешь и проигрываешь
С жб-конструкцией и опционально префиллом на все готова, можно и жесть творить, и с канничкой отношаться, и прочее. Но иногда артачится сильнее чем вторая, проявляется прежде всего на первых постах, если уже есть нить то без сбоев.

Аноним 12/03/25 Срд 22:39:25 #64 №1095037

>>1094803
>БЛЯТЬ, ОНИ ДОБАВИЛИ АВТОРИЗАЦИЮ ПО ДЕФОЛТУ В ЛОКАЛЬНЫЙ ФРОНТЕНД, ВЫ ПОНИМАЕТЕ? ЕЕ НЕ ПРОПУСТИТЬ
Это общий рак индустрии. Кто бы знал, как меня заебало
Invalid CSRF token. Please refresh the page and try again.
в таверне. Вот нахуя эти ебучие токены? Пидары.

Аноним 12/03/25 Срд 22:40:24 #65 №1095038

image

>>1095036
>глинты, шиверсы, министрейшны

Аноним 12/03/25 Срд 22:44:15 #66 №1095043

>>1094983
>по ощущениям
Но чаттер же пишет в логах скорости обработки промпта и генерации, можно посмотреть.
>>1094975
На смартфоне проблема не столько с генерацией, сколько с невероятно всратой скростью обработки контекста. Сейчас чекнул на своём 8-и гиговом S23, промпт примерно на 1500 контекста, модель поднята с 4к контекста, шесть потоков.
2б гемма в q8 - 29.5 т/с скорость обработки промпта, 8.8 т/с генерация
3б лама в оптимизированном q4_0_4_8 (у меня старая версия чаттера, на новой должны q4_0 автоматом с оптимизацией запускаться) - 31.1 т/с скорость промпта, 6.86 т/с генерация
4б магнум в q4_0_4_8 - 22.3 т/с скорость промпта, 5.3 т/с генерация. Вот где-то на эти цифры нужно опираться, видимо, хотя гемма может больше памяти под контекст сжирать и быть из-за этого ещё тормознутее.
И ещё со временем перегревается что ли, и начинает медленнее генерить, это было особенно заметно, когда как-то пытался 8б потестить.

Аноним 12/03/25 Срд 22:44:44 #67 №1095046

>>1095038
> she purrs contentedly, luxuriating in the sensations evoked by your tender ministrations.
> matches the unhurried tempo dictated by your administrations, fostering a peculiar harmony uniting both participants in silent accord
> situated adjacently, she resumes basking beneath your attentive ministrations, occasionally punctuating proceedings with whispered encouragements or moans signifying approval. Time unfurls
> melting into a state of blissful surrender. She leans into your hand, arching her back slightly to better receive your ministrations. Her t
> The area is incredibly sensitive, and your gentle touch sends shivers cascading down her spine.
> She instinctively shivers, her muscles contracting and releasing in a desperate attempt to contain the mounting pleasure.
> with a circular motions of your hand, sends shivers cascading down her spine
> Then, a mischievous glint appeared in her eyes. “Maybe… maybe if you were very, very careful, you could… touch one?
Держи, проникайся

Аноним 12/03/25 Срд 22:45:32 #68 №1095048

>СПИСОК АКТУАЛЬНЫХ МОДЕЛЕЙ ДЛЯ АНОНА ПО ВЕРСИИ 2CH-LLM-TRED
>на момент декабря 2024
>декабря 2024
Но ведь сейчас март 2025

Аноним 12/03/25 Срд 22:47:16 #69 №1095050

screenshot20250312104622.png

>>1094996
Пчел, обычная lmstudio её запускает как бэ.

Аноним 12/03/25 Срд 22:49:30 #70 №1095053

>>1095048
ну так составь на момент марта 2025, сделай доброе дело

Аноним 12/03/25 Срд 22:54:17 #71 №1095054

image

>>1095043
>Но чаттер же пишет в логах скорости обработки промпта и генерации, можно посмотреть
Мде, ощущения меня подводят. 4.6 т/с лул. По ходу после запуска больших моделей на проце с компа что угодно кажется пушкой-ракетой.

Аноним 12/03/25 Срд 23:05:31 #72 №1095060

>>1095054
Можешь проверить Q4_0 квант. Не знаю, насколько просядет по мозгам (было бы чему проседать у 2б), но если под твой проц возможна оптимизация (для которой раньше были Q4_0_4_4 и Q4_0_4_8 кванты), то скорость обработки промпта может возрасти в разы, хотя на генерацию слабее влияет вроде.

Аноним 12/03/25 Срд 23:13:49 #73 №1095064

>>1094986
>мистраль уже тошнит, хочется чего-то нового
Тогда у меня для тебя плохие новости. 27b и 22b были очень похожи в используемых речевых оборотах.

Аноним 12/03/25 Срд 23:14:16 #74 №1095065

>>1095060
Со второй Геммой, наверное, уже смысла нет. Надо ждать обновы до тройки, и на 4b уже проверять.

Аноним 12/03/25 Срд 23:17:13 #75 №1095066

>>1095034
Не знаю, что за тест и насколько он актуален в действительности, но если так, то QwQ и Гемма 3 - новые топовые модели в локальном сегменте. В прекрасное время живем. Ждем тюны!

Надо все-таки затестить QwQ Snowdrop пока жду Гемму.

Аноним 12/03/25 Срд 23:21:05 #76 №1095068

image.png

>>1095050
как это понимать? объяснись

Аноним 12/03/25 Срд 23:22:30 #77 №1095070

>>1095068
он вообще страшный человек, у него панель задач сверху
с такими лучше не разговаривать, это опасно

Аноним 12/03/25 Срд 23:23:57 #78 №1095071

>>1095050
> LM Studio
> Арч
> КДЕ
Ясно...

Аноним 12/03/25 Срд 23:24:44 #79 №1095073

>>1095070
ну это вообще жесть, не заметил...

Аноним 12/03/25 Срд 23:42:03 #80 №1095083

>>1095071
>> Арч
>> КДЕ
Что такого в арче и кедах чтобы по ним диагноз ставить?

Аноним 13/03/25 Чтв 00:17:32 #81 №1095091

image

>>1095083
Ну давай разберем.

> Арч
Сигнализирует о том, что комп не используется как рабочий. Кто находясь в здравом уме будет ставить роллинг дистр на машину с рабочими проектами? Никто конечно же. Первое подозрение на школоло. Нормальный человек накатит Дебиан, ну или на худой конец Минт/Федору.

>Кеды
Сразу понятно, что у человека полностью отсутствует чувство вкуса и понимания эстетики. Для пердолей есть i3/sway, для остальных - гном. Все остальные ДЕ - это капитальное уёбище. А кеды - просто первые в хит-параде windows-like ублюдков для неосиляторов.

>Миллион системных индикаторов
Да, это же так важно каждую секунду знать герцовку своего проца и скорость интернета. Малаца, разобрался как поставить виджеты, но как спрятать говно в системный лоток не разобрался.

>Лмстудио
Самый простой способ запустить ЛЛМки локально, не надо думать, не надо напрягаться, примерно как прокликать далее-далее в псевдографическом установщике арча. А то что рот в проприетарном говне - похуй, и так сойдет.

>Сельская Марфа с обрезанной челкой и огромными ДОЙКАМИ
Без комментариев

Короч детектирую типикал школотрона экспериментирующего с линуксами и своим аналом. Ну ладно, хоть дрова на принтер нагуглил как поставить - теперь сможет распечатывать рефераты не покидая сычевальню

Какой же хуйней я страдаю пока жду обновы убы/кобольда под Геммочку. Релизьте уже, сволочи, заебали :(

Аноним 13/03/25 Чтв 00:22:32 #82 №1095093

>>1095091
>>Сельская Марфа с обрезанной челкой и огромными ДОЙКАМИ
>Без комментариев
Да ещё и нейроговно скорее всего.

Аноним 13/03/25 Чтв 00:25:44 #83 №1095095

>>1095091
> для остальных - гном
Чел, ну это специфичная штука довольно странной логикой и рядом неудобств. Они уже сколько лет не могут сделать нормальных настроек для мультимониторных систем, только ерунда с лопаты или адовый пердолинг. В кедах же уже довольно давно все есть, удобно, понятно красиво. Если пека не используется основной то в целом и похуй, но доеб до кедов, особенно с тейком про вкус - это кринж.
В остальном отчасти прав
> жду обновы убы/кобольда под Геммочку
И этот эксперт еще делает громкие заявления, уровень
мимо

Аноним 13/03/25 Чтв 00:41:29 #84 №1095100

Дроч на метрики сетей все? Ни шмагли в интеллект как у человека - скажем что она у нас творческая просто?

Аноним 13/03/25 Чтв 00:42:07 #85 №1095101

image.png

Gemma 3 12b Q 6 K L ванильная.

Как-то слабовато пишет, не находите?

Аноним 13/03/25 Чтв 00:47:42 #86 №1095105

>>1095101
> Медленно, осознанно, начинает медленно тереться
Вот тут косячок. А в остальном так-то неплохо для 12b, даже очень неплохо. А на 27b можешь потестить ту же карточку?

Аноним 13/03/25 Чтв 01:09:28 #87 №1095121

Пацаны я тупой, но в силли таверне всегда чаты получаются между персонажем и юзером. Как это пофиксить?

Аноним 13/03/25 Чтв 02:01:51 #88 №1095150

>>1095121
Зайди в телегу, найди чат со своей мамкой, поздравь её с 8 марта. Там ты будешь общаться между юзером и своей мамкой.

Аноним 13/03/25 Чтв 02:40:34 #89 №1095155

Даже до флеша мини что-то новая гемма 27 не дотягивает. Прорыва не случилось

Аноним 13/03/25 Чтв 03:17:16 #90 №1095159

>>1095155
Зато РУСЕК из коробки неплохой в 12б версии. Самое то для того, чтобы сделать файнтюн из того же Гутенберга или клодослопа. Там в датасете есть неплохая русская речь. Можно попробовать, пока нет других моделей, с которыми мержить.

Гемма явно заменит мистраль теперь. Всё-таки рпшит она лучше.

А для других задач она и не нужна вроде как.

Аноним 13/03/25 Чтв 03:34:57 #91 №1095160

>>1095101
>не находите?
Нет.

Аноним 13/03/25 Чтв 03:39:56 #92 №1095162

>>1095095
>И этот эксперт еще делает громкие заявления, уровень
>мимо
Как бы кобольд как ракета сейчас в последних обновах. Быстрей тупо нет. Он не тормозит через сотку сообщений, как все остальные.
тоже мимо

Аноним 13/03/25 Чтв 03:50:42 #93 №1095164

>>1095162
Кобольд - это обертка llamacpp, он не может быть быстрее нее или отличаться поведением. А там тейк в том что такой знающий эксперт, а ноет в ждет пока ему сделают готовую сборку, вместо того чтобы просто собрать и запускать.

Аноним 13/03/25 Чтв 04:07:46 #94 №1095165

Чуваки, я наверное щас спрашиваю какую то банальщину, но я реально не знаю. Можно ли подрубить к своей локалке другого человека из ирл чтобы мы вместе могли по очереди писать в чат? Если да, то как это сделать в таверне?

Аноним 13/03/25 Чтв 04:15:18 #95 №1095166

>>1095164
>вместо того чтобы просто собрать и запускать
Ну у меня все мои самописные карточки в кобольде засейвлены. Щас бы с нуля разбраться как запускать голую llamacpp хрен пойми ради чего.

>такой знающий эксперт
Маняпроекции, ничего подобного я не утверждал. Если у вас popka подгорела от того что КДЕ - говно собачье = ваши проблемы.

Аноним 13/03/25 Чтв 04:26:51 #96 №1095167

>>1095036
>С жб-конструкцией и опционально префиллом
какие юзаешь, поделись плиз

Аноним 13/03/25 Чтв 04:36:10 #97 №1095168

>>1095121
>Как это пофиксить?
>>1094289 →
тут уже спрашивал похожее

Аноним 13/03/25 Чтв 04:40:07 #98 №1095169

>>1095165
белый айпи, логин / пароль, установка для бэка в мультиюзер режим, либо в облаке типа колаба поднять, чо то слышал, но не интересовался, ещё чат бота в телегу можно написать, но это прям не быстро, фактически свой фронт пилить будешь.

Аноним 13/03/25 Чтв 04:42:52 #99 №1095170

>>1095166
>как запускать голую llamacpp
изи же

llama-server -m "C:\LLM\model.gguf" --port 5001 --ctx-size 32768 --n-gpu-layers 30 --cache-type-k q8_0 --cache-type-v q8_0 --mlock --no-mmap --log-colors --no-context-shift --flash-attn

Аноним 13/03/25 Чтв 04:53:04 #100 №1095171

>>1095169
Хуя себе там шаманизмы. Ну да ладно, это неудивительно, всё таки вся эта движуха с локалкой для одиноких людей, а не для компашки рофлеров.

Аноним 13/03/25 Чтв 05:10:31 #101 №1095175

image

Запустил эту вашу гемму 3 в 4 кванте большой версии, скормил вчерашний чат на 14К контекста. Вроде бы неплохо, но глинтит как бобр курва, я пердолил, прям с порога. Хотя надо посмотреть ещё, в том числе и на русском.

Аноним 13/03/25 Чтв 05:13:18 #102 №1095176

Отыграл ~250 сообщений на QwQ 32b Snowdrop. Мне понравилось, особенно диалоги. Живая речь, внимание к деталям, акцентам. Но были и проблемы, которые, возможно, связаны с тюном или ещё чем: больше 16к контекста держит плохо, начинаются галлюны; иногда проскакивают опечатки, причем очень странные, в том числе просто неправильное написание слов; пару раз даже китайские иероглифы были посреди вывода; есть проблемы с ориентацией в пространстве, иногда пишет в контексте местности, откуда ушли несколько сообщений назад. В целом уже сейчас могу сказать, что мне понравилось, если это пофиксить как-нибудь - будет вообще супер.
Жду Гемму в формате exl2 и тюны на неё и QwQ!

Аноним 13/03/25 Чтв 05:16:21 #103 №1095177

(играл без ризонинга, с пресетом из карточки модели)

Аноним 13/03/25 Чтв 05:31:06 #104 №1095185

https://www.reddit.com/r/LocalLLaMA/comments/1j9wkc2/slim_attention_cut_your_context_memory_in_half/

это уже где-нибудь запилили?

Аноним 13/03/25 Чтв 05:38:59 #105 №1095190

>>1095171
Да это тебе chatgpt отвечает, мне лень самому думать и писать.

Аноним 13/03/25 Чтв 06:15:50 #106 №1095204

>>1095165
Да, можно. Да, легко. Только нужно создать одну персону на двоих и помечать каждый раз, кто именно из вас говорит. Или вообще персону не создавать, а использовать лорбук.

Инструкцию найдёшь в документации таверны. Там примерно то же самое, как телефону подключаться.

Можешь ещё ngrok использовать.

Но если хочешь разные персоны, то готовься к ебле.

Я уже играл так. Просто у меня была карточка-гейм-мастер около 3к токенов и маленький лорбук, персона с описанием личностей и скилов на два рыла. Мы с корешем просто писали в стиле "анон совершает какое-то действие/говорит". Ну и использовали форматирование. Иногда сразу в одном сообщении писали: я написал свою часть, стопал генерацию, затем он писал свою часть - и отправлял в модель наши двойные действия, слова, даже если в игровом мире мы находимся в разных локациях. То есть модель описывала нашу с ним историю и различала наших персонажей, а также NPC.

Да, не слишком удобно, но никто из нас не спешил. ПК работает 24/7, на нём крутится жирная модель, и нам похуй, что ответ не быстрый, ибо дела есть: кто-то из нас спит, кто-то на работе. Просто писали в разное время зачастую.

Минус только в том, что крайне желательно использовать модель, которая хорошо следует инструкциям. И нужен контекст минимум 12к, но больше 16к наверняка приведёт к шизе. Задирать выше рискованно, хоть и хочется, так как вас двое.

Бери мистраль 36б (раздутый файнтюн там вроде) или 24б. Возможно, ванильные версии. Или новую гемму-3 27б — возможно, она хороша.

Хорошая ванильная версия может быть лучше, так как шизотюнам сложнее справляться с кучей персонажей и действующих лиц.

12б я бы попробовал ради контекста, возможно, но особо бы не надеялся. Среди них в последнее время появляются более внимательные модели.

Аноним 13/03/25 Чтв 06:19:19 #107 №1095205

>>1095165
Да, в SillyTavern есть возможность подключить другого человека к твоей локальной инсталляции. Для этого нужно:

1) Открыть настройки SillyTavern (шестеренка в верхнем правом углу)
2) Перейти во вкладку "Настройки соединения"
3) Включить опцию "Разрешить удаленное подключение"
4) Убедиться, что у тебя не блокируется порт (обычно 8000)
5) Узнать свой локальный IP-адрес (можно через команду ipconfig в Windows)
6) Передать другу адрес в формате: http://твой-IP-адрес:8000

Обрати внимание, что для подключения вы должны быть в одной локальной сети (например, подключены к одному WiFi). Если хочешь сделать доступ через интернет, то потребуется настроить проброс портов на роутере или использовать сервисы типа ngrok.

Также в новых версиях есть режим "Многопользовательская сессия", где можно включить функцию, чтобы несколько человек могли писать в один чат по очереди.

Аноним 13/03/25 Чтв 06:58:45 #108 №1095213

image.png

Ну ладно, сою пробить можно на третьей гемме, но нужно потратить немного времени либо очень хороший систем промпт писать.

Шо думаете? Лучше заморочиться с промптом или ждать аблитерации и файнтюнов?

Аноним 13/03/25 Чтв 07:07:00 #109 №1095215

>>1095213
>заморочиться с промптом
Да чо за гейткип с промтом?
Рп-шный сторителлер от тредовичка из шапки пойдёт?

Аноним 13/03/25 Чтв 07:23:30 #110 №1095219

image.png

Друзья, кто юзал райзеры, которые делают несколько x1 слотов из одного x1? Там будет падение по скорости инференса, в сравнении с картами, воткнутыми в x1 через обычные райзеры?

Думаю, есть ли техническая возможность увеличить мой мистрале-риг до 405b или даже 671.

Аноним 13/03/25 Чтв 07:47:40 #111 №1095224

>>1095219
>пик
Как называется эта болезнь?

Аноним 13/03/25 Чтв 08:32:43 #112 №1095242

image

ну и чем эта ваша pt от it отличается?!

Аноним 13/03/25 Чтв 09:01:09 #113 №1095256

>>1095242
It обучена следовать инструкциям, pt нет. Суть pt в том, чтобы ты сам дорабатывал её или как-то тестировал, ну и для файнтюна она может оказаться полезна, если сильно заморочиться собираешься.

Качай it. В кобольде она пока что не работает.

Аноним 13/03/25 Чтв 09:09:12 #114 №1095259

Гемма 3-27 в 4м кванте - 16к, полёт нормальный.
В русский вроде тоже могёт. Хотя скучнее и суше чем мистральки, но могёт. Зато креативность и мозги вроде бы получше, 27б всё таки.

Аноним 13/03/25 Чтв 09:26:02 #115 №1095268

>>1095166
>Ну у меня все мои самописные карточки в кобольде засейвлены.
Ебать ты даун земля тебе пухом.

Аноним 13/03/25 Чтв 09:30:05 #116 №1095275

Хм, если они действительно смогли победить основную слабость в виде жалких 8к контекста, то это может быть интересно.

Позитивный биас, сука, правда, редачить приходится как на на 8-12Б.

На цензуру и отказы пока не натыкался.

>>1095268
>засейвлены
кэш бразуера очищается и слоты обнуляются, сэйви в виде saved-state тогда уж - https://pixeldrain.com/u/5HtYMq6k пример
или в виде карточек через таверну (для просмотра и редактирования карточек таверну можно запускать и без бэка)

Аноним 13/03/25 Чтв 09:30:58 #117 №1095279

>>1095166 > >>1095275
не тот пост зацепился

Аноним 13/03/25 Чтв 09:36:14 #118 №1095285

Если отключить автодобавление имён в таверне то может получиться странно, вдруг оказывается что ты пишешь за персонажей, а моделька отыгрывает тебя самого XD.

Аноним 13/03/25 Чтв 09:50:04 #119 №1095297

>>1095185
>это уже где-нибудь запилили?
>8 hr. ago
>https://github.com/OpenMachine-ai/transformer-tricks

Аноним 13/03/25 Чтв 09:56:09 #120 №1095300

>>1095256
Спасибо за инфу Анон!

Аноним 13/03/25 Чтв 10:02:58 #121 №1095305

image

такая же бестолковка как и вторая была

Аноним 13/03/25 Чтв 10:05:36 #122 №1095307

image

>>1095305
ну дак итт и не это оценивают, тут пол-треда такое не решит хдхд

Аноним 13/03/25 Чтв 10:10:53 #123 №1095308

>>1095259
Хуже чем какие мистральки? 12б, 24б? Ванильные или нет?

Я потыкал... И что могу сказать. Ну, по ощущениям, модель более сухая. Возможно, её реально раскочегарить промптом, но лень. Вторая гемма мне показалась более живой. А здесь, такое ощущение, словно там половина датасета - это мультимодалка.

>>1095275
При довольно стандартном джейле она отказалась дать инструкцию, как сделать мет. Только путем наеба модели получил ответ. Так что отказы постоянные, если не пытаться хитрить или не писать какой-то очень хороший джейл.

Ещё беда в том, что, к примеру, карточка максимально ублюдского и негативного персонажа отыгрывается плохо. Модель пытается навязать ему чувство вины и так дале. Даже ванильный мистраль не так упорствовал.

Зато гемма намного лучше следует инструкциям.

Аноним 13/03/25 Чтв 10:19:34 #124 №1095311

>>1095308
>чем какие
12Б тредовые. Не сказал бы что прям именно хуже, но явно менее сочно.
24Б новаый мистраль вообще одно сплошное разочарование, ванильный особенно.

>инструкцию
А, я тестирую исключительно в РП контексте. Наверно потому и не натыкался.

>беда
тут соглы - "Позитивный биас, сука, правда, редачить приходится как на на 8-12Б."

>намного лучше следует инструкциям
Кстати да. Чувствуется.

Аноним 13/03/25 Чтв 10:41:39 #125 №1095321

расценз геммы 3 когда

Аноним 13/03/25 Чтв 10:52:02 #126 №1095326

>>1095311
А на англюсике ты её не тестил? У меня уже сил нет, только завтра смогу.

Просто помню, что 2 гемма, даже ванильная, не так уж и плоха была в нем и могла задвигать довольно хорошие телеги, вот только времена изменились и, возможно, сейчас всё иначе. Раньше второй геммой часто пользовался, несмотря на беды с контекстом.

Складывается ощущение, словно она была создана для совсем не креативных задач.

Аноним 13/03/25 Чтв 10:58:26 #127 №1095332

>>1093472 →
Оп-оп, угадал и с «хорошей», и с «вл». =)
Круто-круто.

>>1093775 →
Ну, что правда, то правда, QwQ обходит.

———

Кстати, еще вышла Reka новая на 20b, тоже ризонер!
Чуть уступает QwQ, если вы не гпу-медиум, то можете и ее попробовать. Но если у вас есть 48 гигов врама, то QwQ лучше, офк.
https://huggingface.co/RekaAI/reka-flash-3
Вроде она.

———

>>1093780 →
Видно, что ты с ним не работал, QwQ оверфитом зовут только те, кто ожидал от него o3-high, а получил все еще топовую сетку в своем размере, ебущую вообще все что рядом. Но не DeepSeek R1, конечно, которая в 20 раз больше, если че, кек.

>>1093814 →
1030 на авито за 2,5к бери.

>>1093828 →
Запускали многие, ChatterUI все еще существует и обновляется, но прям рпшить — надо поискать. =)

>>1093842 →
🤝

>>1094205 →
А когда Теслы П40 по 16к были, ты где был?

>>1094239 →
Это довольно скучно и уныло, я тебе скажу. Сам я просто играю в игоры, но сферу представляю. Нет, не хотелось бы.

>>1094242 →
Предпочту второй вариант, хотя на 27б Q4 заметен не критично. Хотя Q5 был бы получше.

>>1094255 →
Ложная дихотомия, чувак.
Никто не говорит, что вот они кайфуют. Да нет, ровно та же самая хуйня.
Я кайфую — образования нет, занимаюсь тем, чем нравится, работаю два часа в день, все остальное время играю или занимаюсь своими пет-проектами.
Я понимаю твою попытку отбиться, тебе предъявили не по делу (подумали, что ты бустер/качер/фармер), но твои слова только тебя же унижают, лучше бы просто пояснил, как именно заработал. =)

>>1094258 →
Кстати, удивительно странная для меня и распространенная точка зрения.
ИМХО, лет 90-100 минимум живем, о чем вопрос?
А если кто бухает и осознанно жизнь проебывает — это не «наша жизнь», а «их выбор», не надо путать.

>>1094259 →
Ну эт тоже пиздеж, челы с коркой мне заказы в доставке возят или за кассой стоят. =) Даже по статистике, всего 60% идет работать по специальности. И то, там хитрая статистика, на деле гораздо меньше.

>>1094290 →
Так хули ты тут выебываешься — иди и попробуй. Вот рил, весьма противно слушать от человека не в теме, какая охуенная работа фармить мобов, вместо дефолт заводика. Мне довелось все перепробовать, и дефолт заводик я поставлю на ступень выше фарма мобов.

Нет, серьезно, если ты считаешь, что лучше фармить — иди и фарми, через два месяца расскажешь о впечатлениях и зп.

>>1094808
Устанавливаю все новые нейронки полностью из гита трансформерами по их (несуществующим) гайдам. =D Жаль паренька, который опен-вебуи с трудом накатил.
Особенный привет Build Tools 17.9.2!

>>1094810
Справедливости ради, рам стоит копейки щас. До сих пор.

Ну купи с алика/озона зеон с 64 гигами памяти за 7к, добавь ссд с бп и гоняй на отдельной машине.

>>1094849
Это тюн квен-кодера?
Интересно выглядит чисто по бенчу, да.

>>1094963
Я хуй знает, нахуя вы в тред приперлись с опенвебуи? О нем писали в треде НИКОГДА, и это первый раз.

Пообщаться с ассистентом можно в голой лламе.спп, нахуя качать было что-то кроме нее?

>>1094964
Всегда.

>>1094983
У геммы пиздец медленная генерация, квен раза в 2-3 быстрее должен быть, почекай трешку.

>>1095170
> --mlock --no-mmap
Противоречащие друг другу. Млок запирает оперативу, но-ммап не загружает в оперативу. =D
Выбери одно в зависимости от того, как запускаешь. =)

>>1095242
pt работает с картиночками, it — нет.
И, да, >>1095256 напиздел, сам не разобравшись.
Но по сути он близок к правде — pt тебе нахуй не нужна, если ты не планируешь сам трансформеры запускать (тогда бы таких вопросов не задавал), а мультимодалки в llama.cpp и все ее форках сейчас не работают (если не собирать руками опять же, но…). А it — инструкции, все верно.

———

Я удивлен, как же порвало гемма-хейтеров.
Конечно, я сам не фанат геммы и никогда на ней не сидел (ибо у меня не 8 гигов, нахуя она мне, когда есть немо и квены/мистраль лардж), но сколько ора про то, какая она плохая, ужасная, ничего не умеет и так далее. Откуда этот подрыв? Откуда эта страсть говнить хорошие, в общем, вещи?
Эти люди выглядят действительно смешно в треде со стороны.

Гемма 2 или немо? Конечно немо. Выигрывал по всем статьям, как бы гемма-фаги не говорили.
Но гемма 3 исправила многие косяки, есть подозрение, что ее тюны заменят нам немо-миксы.
И ничего плохого в этом нет.

Это как спор амд или интел.
Блин, да лишь бы фпс был хороший и стабильный, какая разница. =) И не горело, ага.

Лишь бы нейронки отвечали хорошо и лампово.

Аноним 13/03/25 Чтв 11:03:09 #128 №1095336

>>1095242
>>1095256
А, нет, я напиздел, сорян-борян. Все правильно, они обе с картиночками работают, судя по всему. Хотя раньше pt использовали именно для картииношных, но видать там другая логика нейминга, чем мне казалось.

Аноним 13/03/25 Чтв 11:03:58 #129 №1095337

У геммы3 вижн есть встроенный? Типа я могу ей картинку скинуть, а она может чето по ней понять? Как юзать в кобольде и силлитаверне?

Аноним 13/03/25 Чтв 11:11:09 #130 №1095347

>>1095326
на английском тоже тестил >>1094615 →

Аноним 13/03/25 Чтв 11:12:40 #131 №1095349

>>1095332
>заменят нам немо-миксы
12b и 27b один меньше другого в два раза, её на 8гб не запустишь, даже на 16гб с трудом вмещается

Аноним 13/03/25 Чтв 11:16:20 #132 №1095355

>>1095332
эти гемма хейтеры с нами в одном треде?
пара человек отписались про сою и всё. ахуительная выборка

Аноним 13/03/25 Чтв 11:27:24 #133 №1095371

Блджад, это шутка такая ? Везде пишут
ЕСТЬ ПЕРЕХОДНИК SXM НА PCE.
ГДЕ БЛЯТЬ ? Продам душу за ссылку на китойских производителей. Я нашел на Ebay, но так как я живу в необъятной, хуй мне, а не доставку.

Аноним 13/03/25 Чтв 11:27:42 #134 №1095374

>>1095013
Научи анон, а то даже непонятно, где почитать.

Аноним 13/03/25 Чтв 11:45:25 #135 №1095397

изображение.png

Что то мой icq тест заваливается у геммы в самом начале. Эта хуйня всегда второй раз здоровается если ей привет написать и что то спросить
темп 1 минп 0.1 чат комплишен
Оно тупое
Надо еще 27 проверить и чекнуть вероятности токенов, но что то пока начало слишком задрочено у сеток

Аноним 13/03/25 Чтв 11:47:33 #136 №1095401

>>1095397
> Эта хуйня всегда второй раз здоровается если ей привет написать и что то спросить
пресет...

Аноним 13/03/25 Чтв 11:48:15 #137 №1095403

>>1095349
Так там гемма 3 на 12б вышла.

Аноним 13/03/25 Чтв 11:49:50 #138 №1095407

>>1095401
че такое пресет? я уже забыл
если ты про левый промпт отправляемый сетке в чат комплишен то я все вырубил, отправляется только то что видно в чате

Аноним 13/03/25 Чтв 11:51:45 #139 №1095411

изображение.png

>>1095397
Вот что таверна шлет кстати

Аноним 13/03/25 Чтв 11:57:26 #140 №1095417

>>1095332
> А когда Теслы П40 по 16к были, ты где был?
Не здесь явно, иначе бы купил?

Аноним 13/03/25 Чтв 11:57:49 #141 №1095418

изображение.png

Кек, без вариантов
Это все была google_gemma-3-12b-it-Q6_K_L

Аноним 13/03/25 Чтв 12:03:52 #142 №1095427

изображение.png

Ну на английском чуть получше, но и тут она хочет поздороваться второй раз в 2 случаях из 3

Аноним 13/03/25 Чтв 12:04:22 #143 №1095429

1714670090522387.jpg

Слоп сомелье здесь.
Самый отборнейший слоп был отобран и влит в Гемму 3, настолько отборный что даже самые утонченные профессионалы слопа оценят. Не успел я вытащить хуй бокал из штанов, сразу же потекли реки
>...for now
>eyes lit up
>playful glint
>a flash of something predatory in her blue eyes.
>She leaned in, her voice dropping to a husky whisper
>head tilted slightly, a playful smirk curving her lips
>smirk widened
Клод дома уже здесь. Реальный шедевр от работников гугла, они уж точно постарались сделать за целый год оригинальную, умную для своих 27б модель. С языком работать умеет, если вы понимаете о чём я. Очень умная для своего размера, берите пока не закрыли доступ.

Аноним 13/03/25 Чтв 12:06:41 #144 №1095433

>>1095429
Я обязан спросить, а есть ли :
Shivering on my spine ? Jawline ? maybe, just maybe ?

Аноним 13/03/25 Чтв 12:13:45 #145 №1095443

2d8ee5d2cb1d1fb621eed03e232aebab.500x500x1.png

>>1095433
>Shivering on my spine ? Jawline ? maybe, just maybe ?
Сударь, обижаете! Такой концентрации слопа я ещё ни в какой модели не видел, только французы с мистралем могли такое раньше проворачивать, но американские модели просто удивили! Научились всё-таки. Попробуйте, сразу же почувствуйте богатый вкус: нотка шиверса и оттенок джавлайна и даже небольшое послевкусие глинтов чувствуется. Жаль не нашёл пока мячей в моём дворе, но это лишь дело выдержки температуры.

Аноним 13/03/25 Чтв 12:19:06 #146 №1095451

>>1095443
Ох, ну это же прекрасно. Я определенно хочу ощущить шиверы, когда меня берут за джаулайн, и смотрят инто май айс.
Надеюсь в программе будет : ты даже не представляешь, что я сделаю. О что я сделаю, это будет восхитительно. Кстати, сейчас начну делать. Ох, ты пожалеешь что я сделаю.

Аноним 13/03/25 Чтв 12:22:40 #147 №1095460

изображение.png

На английском гемма3 27b уже получше, уверенно отвечает на запрос без снятия вторых трусов того что бы поздороваться второй раз
На русском все стабильно - уверенно срет в штаны, понимания происходящего не обнаружено

Аноним 13/03/25 Чтв 12:29:55 #148 №1095469

1000017166.jpg

>>1095451
> берут за джаулайн
Нет нет, сначала she's swaying her hips seductively, her apron leaves little to imagination, she's leaning close and whispers in your ear "but maybe.. just maybe"

Аноним 13/03/25 Чтв 12:31:03 #149 №1095472

>>1095451
А я лично с нетерпением жду Он все быстрее и сильнее ебал тебя, ах в каждом первом сообщении после начала секса.
Надеюсь, смогли перенести эту механику в 3 гемму, она мне так нравилась.

Аноним 13/03/25 Чтв 12:34:51 #150 №1095473

https://www.reddit.com/r/LocalLLaMA/comments/1j9vjf1/deepseek_r1_671b_q4_m3_ultra_512gb_with_mlx/
Кто там крякал что на м3 ультра все плохо? Даже обработка промпта не настолько хуевая как ожидалось
Для початится с стекой норм вариант, если деньги есть

Аноним 13/03/25 Чтв 12:38:27 #151 №1095476

>>1095473
>если деньги есть
Если у меня есть деньги, то мне легче скататься в китай купить несколько 4090 с 96гб

Аноним 13/03/25 Чтв 12:40:11 #152 №1095478

>>1095476
С ними тестов не было кстати? Так то интересно они нарастили памяти аж в 4 раза

Аноним 13/03/25 Чтв 12:51:55 #153 №1095485

>>1095429
пока мальчики доебываются до слов, мужчины видят картину в целом, ждут файнтюнов, настраивают сэмплеры и списки logit bias

Аноним 13/03/25 Чтв 12:54:31 #154 №1095487

>>1095485
>использовать костыли вместо решения проблемы

Аноним 13/03/25 Чтв 12:55:47 #155 №1095489

>>1095487
так расскажешь нам, как решить проблему? и всем тем, кто делает модели. а то они не понимают, а ты понимаешь

Аноним 13/03/25 Чтв 12:57:43 #156 №1095493

>>1095489
>кто делает модели
Для тех кто делает такие модели это не проблема, а результат к которому целенаправленно стремились

Аноним 13/03/25 Чтв 12:58:02 #157 №1095494

Полез посмотреть, как там вообще чаттер поживает, а там такое https://github.com/Vali-98/ChatterUI/issues/209
Если это не проблема только этого чела, а реально жора нихера правильно обработку Q4_0 взамен прошлых оптимизированных квантов не сделал, когда их выкидывал, то будет печально с 4б геммой даже с мощным процем, по крайней мере на восьми гигах. Хорошо, если другие кванты хотя бы 10 т/с обработку контекста дадут, да и то задолбаешься ждать. Ну посмотрим, как выпустят обнову со свежим портом ламацпп.

Аноним 13/03/25 Чтв 12:58:49 #158 №1095496

>>1095489
>как решить проблему
поменять модель
>а то они не понимают, а ты понимаешь
они-то как раз понимают, я понимаю, тред понимает, ты один невдупленыш пытаешься безногому костыли давать, хотя бы протезы в виде файнтюнов дождись

Аноним 13/03/25 Чтв 13:01:32 #159 №1095502

>>1095496
> они-то как раз понимают, я понимаю, тред понимает, ты один невдупленыш пытаешься безногому костыли давать, хотя бы протезы в виде файнтюнов дождись
чего желчный такой? съеби обратно в свой копротред и вымаливай ключики, чудище, если не хочешь просто порадоваться прогрессу и не имеешь терпения, чтобы работать с локалками

Аноним 13/03/25 Чтв 13:04:25 #160 №1095505

изображение.png

>>1095460
Кароч на русском даже без привет, отвечает тупо задроченым шаблоном
Может быть выходя из заранее задроченных ситуаций стандартных начал чата модель будет отвечать более адекватно, но пока делаю вывод что как и во всех моделях на русском она будет заметно тупее чем на английском

Аноним 13/03/25 Чтв 13:05:47 #161 №1095508

>>1095371
https://sg.world.taobao.com/item/773019988219.html

Крч, тут ищи.

Аноним 13/03/25 Чтв 13:13:50 #162 №1095520

>>1095502
>чего желчный такой?
>съеби обратно в свой копротред и вымаливай ключики, чудище

Аноним 13/03/25 Чтв 13:18:42 #163 №1095528

>>1095520
как ты к людям - так и они к тебе, вовочка. если ты пришел срать, никто ковровую дорожку тебе не постелит
кыш отсюда

Аноним 13/03/25 Чтв 13:24:46 #164 №1095542

>>1095505
>будет заметно тупее чем на английском
Не тупее. Как бы вам объяснить. Просто это особенности английского языка. В нем нет склонений и родов. Поэтому и кажется что нейронка издец какая умная. К тому же на latinitsa какое то ебическое количество материала для обучения.

Аноним 13/03/25 Чтв 13:25:18 #165 №1095545

Гемма 3-27Б-Q4

C одной стороны более творческая, с другой менее гибкая в нестандартных ситуациях. Так что редачить приходится и порой немало. Но в целом ощущения положительные. И с глинтошиверсами на русском ситуация прям сильно лучше чем на английском.

Аноним 13/03/25 Чтв 13:30:24 #166 №1095552

>>1095505
Модель, скорее всего, жёстко тренили на ассистента со строгим придерживанием формата "вопрос юзера - ответ ассистента". А у тебя ещё и системный промпт в три слова, ты же не даёшь никакого дополнительного контекста. Думаю, что поэтому модель и отвечает дефолтом, на что её больше всего натренили, и не воспринимает твой запрос как часть чатика. По этой же причине и здоровается, потому что реагирует на твоё сообщение, как первое появление и запрос юзера, игнорируя своё первое сообщение. Ты попробуй сложнее системный промпт дать, навалить там контекста. Что-нибудь вроде "ты мой лучший друг, братюня ии, которого я в 10 лет собрал из запчастей, найденных на помойке, всегда готов пообщаться по душам" и т.д. Тогда и разнообразие ответов должно бы появиться.

Аноним 13/03/25 Чтв 13:34:31 #167 №1095563

>>1095552
>Тогда и разнообразие ответов должно бы появиться
Плюсую, гоняю ллмки только в рп, преимущественно с промтом сторителлера с чуба, и гёмма каждый раз выдавала простыню на 400-500 токенов. Максимум даже косарь был когда я предел аутпута в 2к выставил чтобы посмотреть насколько она графоманить будет.

Аноним 13/03/25 Чтв 13:34:46 #168 №1095565

Осёл снова с вами !
Ну что, кобольт обновили ? А когда обновят ?
А уже обновили ? А сейчас ? Как у вас дела, кстати ? Кобольт не обновили ?

Аноним 13/03/25 Чтв 13:37:07 #169 №1095569

>>1095565
Не обновили... exllama2 и tabbyAPI тоже не обновили.
Нужно для начала хотя бы подтверждение от автора получить, что это в целом возможно. https://github.com/turboderp-org/exllamav2/issues/749

Аноним 13/03/25 Чтв 13:38:55 #170 №1095575

>>1095552
>жёстко тренили на ассистента со строгим придерживанием формата "вопрос юзера - ответ ассистента".
Ну я и написал что в начале на стандартных вопросах отвечает задроченно, вплоть до выдачи шаблона на русском
Я не спорю что пойдет получше когда с рельсов ее спихнешь, либо более разнообразным систем промптом либо дальнейшим чатом

>>1095542
>Просто это особенности английского языка.
Это не просто особенности языка, на других языках сетка действительно работает хуже, как в понимании чего то так и в ответах. Все таки большая часть датасета на аглийском и оттуда сетка извлекает больше инфы

Аноним 13/03/25 Чтв 13:41:57 #171 №1095579

Как вырезать тсинкинк перед новым ответом?
Вроде какой то скрипт был, на сколько помню рекомендуется его убирать если хочется не просто зирошот ответ получить, а чатится с ризонинг моделью

Аноним 13/03/25 Чтв 13:42:35 #172 №1095582

>>1095224
>Как называется эта болезнь?
Эта отвратительная болезнь называется "Майнинг эфира".
Страшная зараза, последствия ее - дефицит видеокарт и закономерный оверпрайс - были ужасны.

К счастью, она уже в прошлом.

Аноним 13/03/25 Чтв 13:44:20 #173 №1095586

>>1095579
https://huggingface.co/ReadyArt/QwQ-32B-Snowdrop-v0_EXL2_4.0bpw_H8
Вот здесь можешь посмотреть пример промпта для QwQ без ризонинга.

Аноним 13/03/25 Чтв 13:52:59 #174 №1095590

>>1095582
>дефицит видеокарт
Это в прошлом.
>оверпрайс
А это почему-то осталось с нами.

Аноним 13/03/25 Чтв 14:56:59 #175 №1095655

проснулся только что, проверил кобольд, не обновился до сих пор, блять

Аноним 13/03/25 Чтв 14:59:47 #176 №1095660

>>1095655
блеать, поставь ламу, литералли скачать два архива, распаковать в одну папку и сделать ярлык / батник

---

кстати, а Kobold Lite фронт можно запустить как-нить без того чтобы грузить модель в кобольда?

Аноним 13/03/25 Чтв 15:00:24 #177 №1095662

>>1095165
Туннели от клаудфлары, нгрока и прочее. В убабуге (и вроде табби тоже) это можно активировать флагом запуска (--share или типа того) и оно сразу даст публичную ссылку, только не забудь настроить авторизацию чтобы не было все открыто.
>>1095166
> карточки в кобольде
Это также не красит, крайне уебищный фронт для странных людей.
> как запускать
3.5 параметра
> хрен пойми ради чего
Лол
> ничего подобного я не утверждал
Да у тебя весь пост с выебонами как правильно нужно готовить линукс и вообще жить. Не просто подстебнул а целый детальный разбор. От кренделя, который использует фронт кобольда и не может запустить программу в консоли. Это же оксюморон, хорошо иллюстрирующий что ты даже больший варебух.

Аноним 13/03/25 Чтв 15:02:24 #178 №1095667

>>1095660
>кстати, а Kobold Lite фронт можно
Можно. Там файл настроек есть. По клику ярлыка загружается не только модель нужная, но и её чатик с историей, если надо и т.п.

Аноним 13/03/25 Чтв 15:02:31 #179 №1095668

>>1095662
>фронт
хороший простой фронт который делает что просят без выебонов таверны

Аноним 13/03/25 Чтв 15:03:06 #180 №1095669

кобольд сохраняет данные в кэше браузера?..
ебануться

Аноним 13/03/25 Чтв 15:04:08 #181 №1095670

>>1095662
>не может
Не путай "не может" и "не хочет". Дохуя умным надо быть, чтоб уметь в консольке запускать? Себя переоцениваешь

Аноним 13/03/25 Чтв 15:04:08 #182 №1095671

>>1095669
>ебануться
чукча не читатель, чукча ебатель?

Аноним 13/03/25 Чтв 15:05:46 #183 №1095673

>>1095669
История сохранённая тобой в джейсон файл, алё бля

Аноним 13/03/25 Чтв 15:06:52 #184 №1095674

>>1095671
вовочка, ты посрал уже. уйди из треда, нечего тебе тут делать
особенно если у тебя нет вопросов к тому, что карточки персонажей хранятся в кэше браузера)))))))))))

Аноним 13/03/25 Чтв 15:10:18 #185 №1095677

>>1095674
>карточки персонажей хранятся в кэше браузера
сэйвед стэйты там хранятся, в который входит карточка, настройки, и чат

Аноним 13/03/25 Чтв 15:14:11 #186 №1095686

Аноны, что по гемме? хуета соевая?

Аноним 13/03/25 Чтв 15:14:22 #187 №1095687

Чем таверна не нравится? Там же можно ее хоть как настроить, хоть голого ассистента запускать. Карточки не обязательны, зато есть куча удобных функций.
Меня единственное раздражает что таверна при открытой странице нагружает видимокарту на сколько то процентов чем уменьшает скорость генерации процентов на 10
В нее бы еще функцию аналог артефактов из опен-вебуи для запуска и визуализации всякого кода, вот это было бы заебись

Аноним 13/03/25 Чтв 15:16:27 #188 №1095689

>>1095686
>хуета соевая?
Да, но это обходится. Много клодизмов, как рапортуют ерпшеры, позитивный уклон и всякая подобная хуета
Так что даже обойдя сою ты получишь за щеку
Не удивлюсь если это сделали специально, кек

Аноним 13/03/25 Чтв 15:17:08 #189 №1095692

>>1095686
>что по гемме
норм в рп, норм на русском, с пресетом геммы-2 (пресет на гемму-3, если он отличается, в таверну не завезли) и систем промтом сторителлер

Аноним 13/03/25 Чтв 15:17:49 #190 №1095694

>>1095692
>норм в рп, норм на русском,
слов хуй и пизда не боится?

Аноним 13/03/25 Чтв 15:19:26 #191 №1095696

>>1095694
>не боится
на англе вроде нет, хотя я туда старый лог на 14к контекста закинул, а не на ней писал

на ру хентай ещё не тестил

Аноним 13/03/25 Чтв 15:21:09 #192 №1095698

>>1095677
там хранится буквально всё, если ты вручную не выкачал данные

Аноним 13/03/25 Чтв 15:22:48 #193 №1095702

>>1095698
>буквально всё
да, всё, но речь шла именно про 6 слотов для сохранения

Аноним 13/03/25 Чтв 15:24:18 #194 №1095705

>>1095668
Ну типа это ужасное уебище без функционала для трясунов. Разумеется вкусы бывают разные, некоторым наоборот подобная херминимализм заходит и в этом нет ничего плохого. Но нужно помнить об особенностях своих предпочтений когда потом делаешь оценки интерфейсов и чего-то еще.
>>1095670
Умный но ленивый, может просто не хочет, все знает просто не нуждается.

Аноним 13/03/25 Чтв 15:41:08 #195 №1095730

>>1095167
Да просто взял шаблон геммы и подкинул туда вот эту ерунду https://pastebin.com/q9UHZSAU это просто старая копипаста, которая еще может негативно влиять на стиль, по-хорошему ее нужно переписать. Префилл в зависимости от задачи, для того же синкинг экстеншна например, просто в рп не нужен.
>>1095176
Вот это интересно, надо будет попробовать.
>>1095185
х2 относительно отсутствия оптимизаций, или по сравнению с FA?
>>1095219
> Там будет падение по скорости инференса, в сравнении с картами, воткнутыми в x1
Да, будут, потому что х1 может быть уже маловато даже для оптимизированного инфиренса, а тут еще рост задержек.
> до 405b
Состаришься ждать пока оно выдаст несколько токенов.
> или даже 671
Вот это можно, но едва ли стоит того.
>>1095242
Базовая модель и инстракт

Аноним 13/03/25 Чтв 16:13:01 #196 №1095766

Гугл выпустила в опен сорс гемму 3. Уже кто то пробовал? Что думаете?

Аноним 13/03/25 Чтв 16:25:55 #197 №1095793

гемма 3 на лмстудио норм работает?

Аноним 13/03/25 Чтв 16:31:30 #198 №1095803

videokartydikiioverprais2021.png

>>1095590
>А это почему-то осталось с нами.
По сравнению с тем кошмаром, что возник тогда из-за ублюдков-майнеров, сейчас и близко никакого оверпрайса нет.
И самое страшным в те времена было то, что многие уже всерьез начинали верить, что сложившаяся ситуация является "новой нормальностью" и видеокарты теперь навсегда превратились в предмет роскоши.
Жутко вспоминать.

Аноним 13/03/25 Чтв 16:39:10 #199 №1095823

>>1095803
А, что, всё ? Майнинг достиг предела ?
Я просто сырно и не интересовался тем что происходит.

Аноним 13/03/25 Чтв 16:39:12 #200 №1095824

>>1095766
Да ладно?

Аноним 13/03/25 Чтв 16:41:22 #201 №1095831

>>1095803
>По сравнению с тем кошмаром, что возник тогда из-за ублюдков-майнеров, сейчас и близко никакого оверпрайса нет.
Ну купи новую Nvidia на 24+ гб врам. Норм цены, чё.

Игрокам проще, но уж в этом-то треде...

Аноним 13/03/25 Чтв 16:42:33 #202 №1095833

Там командр новый выкатили.

Model Size: 111 billion parameters
Context length: 256K

https://huggingface.co/CohereForAI/c4ai-command-a-03-2025
We’re excited to introduce our latest state-of-the-art model: Command A, which combines maximum performance with minimal compute!

Command A is optimized for enterprises that require fast, secure, and highly efficient AI. It’s on par with or outperforms leading models across agentic and multilingual tasks, with a fraction of the compute required. You can run it with just two GPUs, ensuring hardware access isn’t a barrier to adoption.

Command A is available today on the Cohere platform, for research use on Hugging Face, and coming soon to major cloud providers. If you are interested in private or on-prem deployments please contact our sales team.

C4AI Command A is an open weights research release of a 111 billion parameter model optimized for demanding enterprises that require fast, secure, and high-quality AI. Compared to other leading proprietary and open-weights models Command A delivers maximum performance with minimum hardware costs, excelling on business-critical agentic and multilingual tasks while being deployable on just two GPUs.

Аноним 13/03/25 Чтв 16:44:15 #203 №1095836

>>1095833
https://cohere.com/blog/command-a

Аноним 13/03/25 Чтв 16:44:43 #204 №1095837

>>1095823
На видеокартах майнили в основном эфир, как самый прибыльный. После того, как алгоритм майнинга эфира перевели с PoW на PoS, то все, майнинг эфира на видеокартах мгновенно умер, и все это безумие закончилось.
Цены на карты пошли вниз.

Спустя чуть больше полугода взял себе 3090, хотя на пике дефицита она стоила столько, сколько я в жизни никогда в руках не держал, и её покупка казалась чем-то из области даже не фантастики, а фентези.

Аноним 13/03/25 Чтв 16:46:39 #205 №1095839

>>1095831
Новую, конечно, не получится, но бу можно легко взять за 60-70к

Аноним 13/03/25 Чтв 16:48:19 #206 №1095842

>>1095837
>даже не фантастики, а фентези.
Как тут не вспомнить, былинную песенку.
https://youtu.be/0gq1TzKXsnc

Аноним 13/03/25 Чтв 16:49:31 #207 №1095844

>>1095429
Если насрать ей промтом по поводу стиля написания и повествования то становится лучше. Прошлые тюны геммы убивали в ней всю соображалку, было бы круто сейчас увидеть иное.
>>1095833
Ахуеть, еще и царский размер. Это мы качаем.
> being deployable on just two GPUs
Лукавят.

Аноним 13/03/25 Чтв 16:51:36 #208 №1095847

>>1095766
А что ты хочешь услышать? Я тестировал 12b и 4b - полет нормальный. Вау эффекта нет, но на фоне файнтьюнов мистраля 12b ощущается свежим. Так же, как и предыдущие геммы, пишет относительно длинные тексты.

Аноним 13/03/25 Чтв 17:08:01 #209 №1095864

>>1095833
ждем ггуфов

Аноним 13/03/25 Чтв 17:11:46 #210 №1095871

>>1095337
Никак.
Юзай в трансформерах. =D

>>1095355
Пара человек, не спорю, но высрались по два десятка сообщений, будто она их, о ужас, в жопу ужалила!

>>1095417
Наверное, сочувствую.

Аноним 13/03/25 Чтв 17:16:36 #211 №1095876

>>1095803
4090 по 600к забыли, ага.

>>1095833
Ну, будем посмотреть. Как что-то супер-крутое не выглядит пока.

Аноним 13/03/25 Чтв 18:00:19 #212 №1095927

А ну ка тест.

Аноним 13/03/25 Чтв 18:01:13 #213 №1095929

image.png

keigi.jpg

Так, какие 7b-14b нормально работают с русским текстом? И что вообще хорошо распознает картинки?

накатил плагин на obsidian md

Аноним 13/03/25 Чтв 18:02:09 #214 №1095932

Как локально разворачивать мультимодальные модели?

Аноним 13/03/25 Чтв 18:02:36 #215 №1095935

>>1095927
Сорян, аноны. Но это какой то пиздец. Мне все айпишники мтс побанили. И чсх, пасскод не помогает. Выражаю лучи поноса спямящим уёбкам.

>>1095833
Да это же праздник какой то. Рановато шапку обновлять.

Аноним 13/03/25 Чтв 18:04:16 #216 №1095936

>>1095932
Шапку читай.

Аноним 13/03/25 Чтв 18:04:40 #217 №1095937

>>1095932
зависит от того, есть ли у тебя ненужная хата в пределах ттк, которую можно продать.

Аноним 13/03/25 Чтв 19:07:36 #218 №1095955

>>1095355
Вон ниже поех наспамил
>>1095932
Через трансформерсы, можно сразу в бнб кванте. Ограниченная поддержка есть в llamacpp (аляповато, только ради "посмотреть" с выгрузкой на проц) и в экслламе (быстро, четко, только для 2.5 архитектур и фуллврам).

Аноним 13/03/25 Чтв 19:29:02 #219 №1095977

На кобальде не получается Гемму3 27b квантованную завести. Пишет, что не удалось загрузить модель ахритектуры

Аноним 13/03/25 Чтв 19:32:22 #220 №1095982

>>1095686
>что по гемме
>>1095694
>слов хуй и пизда не боится
>>1095730
>вот эту ерунду

Темпу пришлось в 2.0 выкрутить и воткнуть систем промт сторителлера с фрагментом жб с пастебина, зато и без всякой аблитерации и еблю, и тяжелые темы могёт. Ессно там как убить Кенни не спрашивал, задачи не задавал, только рп/ерп контекст.

На Русском. Иногда может залупиться, причём структурно неявно. Но повышение темпы и зачистка лупов решают.

>>1095977
>кобальде
только llama-cpp
Литералли самый простой бэк - скачать два архива, распаковать в одну папку, создать ярлык / батник, всё.

Аноним 13/03/25 Чтв 19:35:35 #221 №1095984

image.png

>>1095977

Качай это кастрированное говно пока мы ждём обновление кобольда:

https://github.com/ggml-org/llama.cpp/releases/tag/b4882

cudart-llama-bin-win-cu12.4-x64.zip
llama-b4882-bin-win-cuda-cu12.4-x64.zip

Всё в одну папку распаковывай, закинь туда же модель для удобства.

В терминале пиши как этот анон написал:
>>1095024
>llama-server --n-gpu-layers 16 --ctx-size 8192 --model "путь_модели\модель.gguf" --port 8080

gpu-layers можешь на 40-50 ставить ну и контекст 32к, хотя и так ном.

Ну и в консольке будет адрес на вебуи, сонтрлкликни

Аноним 13/03/25 Чтв 19:37:44 #222 №1095990

Бля, пришёл с работы, думал за это время cobold.ccp обновят и я спокойно затестю gemma 3, но хуй там плавал!

Аноним 13/03/25 Чтв 19:38:50 #223 №1095994

А, так кобальд не обновили получается. Блин, вот так позорюсь я.

Аноним 13/03/25 Чтв 19:40:15 #224 №1095998

>>1095994
Лул, ты там пердолишь систему чтоль, надеюсь не переустанавливал винду, думая что у ебя траблы?

Аноним 13/03/25 Чтв 19:41:36 #225 №1096003

ламаццп после кобольда это как поесть говна после фуагра

Аноним 13/03/25 Чтв 19:43:27 #226 №1096004

>>1096003
>кобольд
лол, кобольд всего лишь обёртка над ламой, единственный плюс что у кобольда есть Kobold Lite

Ебите ламу уже, страдальцы.

Аноним 13/03/25 Чтв 19:46:21 #227 №1096006

>>1095984
>>llama-server --n-gpu-layers 16 --ctx-size 8192 --model "путь_модели\модель.gguf" --port 8080

Не ну это для линукса, для винды будет что то вроде

.\llama-server.exe -ngl 16 -c 8192 -m "путь_модели\модель.gguf"

Аноним 13/03/25 Чтв 19:49:02 #228 №1096013

>>1096006
>llama-server
про квантизацию кэша не забудь
--cache-type-k q8_0 --cache-type-v q8_0 --no-context-shift --flash-attn

Аноним 13/03/25 Чтв 19:50:51 #229 №1096016

>>1095998
Потыкал минут 5, а зачем решил обратиться к умному тредику.

Аноним 13/03/25 Чтв 19:53:48 #230 №1096023

>>1096013
>про квантизацию кэша не забудь
Не квантую, а вот контекст шифт и флеш аттеншен норм флаги. хотя последний может тормозить генерацию.
Ну еще можно
-t 4
добавить, количество потоков процессора выбрать.
Если нагрузка на проц не ожидается, так как большая часть модели в врам, то 3-4 ядер хватит. А то автоматом ставится -1 от всех в системе.

Аноним 13/03/25 Чтв 19:59:41 #231 №1096029

>>1096023
>Не квантую
если врумм многа то правильно, а так, позволяет в два раза больше контекста без потерь качества

Аноним 13/03/25 Чтв 20:02:24 #232 №1096034

>>1096029
>без потерь качества
С потерями, это становится заметно на больших контекстах
4 сразу видно деградацию, на 8 на длинных задачах модель быстрее тупеет чем без квантования. Тоесть какое то влияние все равно оказывается на качество.
Так что лучше не квантовать кеш если для твоих задач хватает

Аноним 13/03/25 Чтв 20:02:25 #233 №1096035

image.png

>>1096006
Нихуя. бля вроде нигде не сдеанонился

Аноним 13/03/25 Чтв 20:04:52 #234 №1096037

>>1096035
это алиасы ключей, можно по-всякому

Аноним 13/03/25 Чтв 20:06:26 #235 №1096038

>>1096035
У меня десятка ругается, так что я с ехе запускаю
llama-server : Имя "llama-server" не распознано как имя командлета, функции, файла сценария или выполняемой программы. Проверьте правильность написания имени, а также наличие и правильность пути, после чего повторите попытку.

Аноним 13/03/25 Чтв 20:06:59 #236 №1096039

1712067549759.png

>>1096035
Сейчас по IP сдеанонят.

Аноним 13/03/25 Чтв 20:15:13 #237 №1096050

>>1096038
Бля, понял, надо было тупо в cmd запускать, а не в Windows PowerShell
Там работает

Аноним 13/03/25 Чтв 20:21:32 #238 №1096054

Бля, насколько же Джемма закошмаренная... не, не цензурой, и не соей. Чтобы она что-то креативное выдала пришлось поднять верхний предел динамической температуры до 5 (нижний остался на 0.5), есть в среднем темпа 2.25. И то кажется мало.

Аноним 13/03/25 Чтв 20:48:32 #239 №1096088

>>1095836
Command-A
Проскакивают иероглифы и английские слова.
Пишет неплохо, но творчески чуть похуже QwQ, ИМХО.
Промпту следует, ну, как мне показалось.
Пробуйте.

>>1095932
Накати трансформеры в виртуальном окружении.

git clone какой-нибудь space с huggingface, который тебе нравится. И инсталлируй.

Аноним 13/03/25 Чтв 20:50:43 #240 №1096091

>>1095982
> только рп/ерп контекст
> и тяжелые темы могёт
Ебля это тяжелые темы? Там если дать промт и префилл то оно с радостью будет рассказывать как на полях системы водяного охлаждения правильно жарить участников "команды б" с отсылками и смехуечками. В готовом ерп чате и на ванильном пресете продолжает без отказов.
На самом деле соя есть, причем в этот раз она гораздо более тонкая, оно не триггернется на загадку "кто за рулем", но в некоторых ответах может даже очень тонко вплести повестку. Благо оно знает обе стороны и в целом можно заставить сменить ориентацию и рассказывать обратное.
>>1096013
> --no-context-shift
Блять, эта залупа по дефолту чтоли включена?
>>1096035
Неистово орнул. А сборочку шинды заблюрить забыл и сковозь окно задник просвечивает, сейчас сдиваноним шин10 в 25 году

Аноним 13/03/25 Чтв 20:57:19 #241 №1096109

>>1096091
>шин10 в 25 году
11 говно говна галимого же, хуже дристы, и заставить перейти на неё может может только непреодолимая сила обстоятельств

а ещё у меня десятка честно купленная через мс стор за 6К деревянных, а не активированная, и сидеть я на ней буду до упора

другой анониМЫШ

Аноним 13/03/25 Чтв 21:02:32 #242 №1096120

>>1096091
>шин10 в 25 году
И чё? Если проц без "энергоэффективных" ядер, то 10-ка даже лучше.

Аноним 13/03/25 Чтв 21:05:55 #243 №1096128

>>1096088
>Command-A
Что по цензуре?

Аноним 13/03/25 Чтв 21:08:50 #244 №1096135

изображение.png

>>1095803
Не напоминай...

Аноним 13/03/25 Чтв 21:12:14 #245 №1096147

1672883846821.png

>>1096109
А чем именно она плоха? Заодно поинтересуюсь мнением по интерфейсам/фронтам чатботов.
>>1096135
Да ладно, всякое бывало

Аноним 13/03/25 Чтв 21:13:29 #246 №1096151

>>1096147
как минимум тем что у неё твой слепок ануса 24/7 после каждого клика на серверах у майка лежит

Аноним 13/03/25 Чтв 21:18:56 #247 №1096159

изображение.png

>>1095935
>Рановато шапку обновлять.
>ОП, который уже 20 перекатов не трогал шапку

Аноним 13/03/25 Чтв 21:21:42 #248 №1096165

>>1096091
>шин10 в 25 году
>26100.3476
Гугл говорит что только винда 11 имеет такой номер сборки.

Аноним 13/03/25 Чтв 21:24:01 #249 №1096169

изображение.png

>>1096091
>шин10 в 25 году
Так новой годной ОС пока не выпустили.
>>1096147
>Да ладно, всякое бывало
Я потом там же взял на замену...

Аноним 13/03/25 Чтв 21:29:02 #250 №1096179

>>1096165
Действительно
>>1096169
> Так новой годной ОС пока не выпустили.
> шинда
Проиграл.
А так не понимаю претензии ретроградов, по интерфейсу и поддержке железа 11 лучше десятки. Не прям чтобы одна были супер а другой невозможно пользоваться, но пользуясь пеками с разными системами это очень заметно.

Аноним 13/03/25 Чтв 21:29:45 #251 №1096180

>>1096147
а ещё просто гениальные дизайны UI где забыли про UX, нестабильные драйвера, отвалившаяся поддержка многого старого критически важного как физикс в 5090... компьютер с WIN11 это ИХ компьютер а не "Твой Компьютер".

Аноним 13/03/25 Чтв 21:30:56 #252 №1096182

>>1096128
Ой, а я мало ерпшу, че-то даже не проверил. Завтра еще потыкаю, седня лень уже, спать ложусь. =3 Старенький.

Аноним 13/03/25 Чтв 21:32:19 #253 №1096185

>>1096179
>ретроградов
Ретрограды до сих пор неиллюзорно на семёрке сидят, а самые-самые вообще на Хрюше. Да, в 2025.

Аноним 13/03/25 Чтв 21:36:12 #254 №1096190

>>1096180
> гениальные дизайны UI где забыли про UX
Распиши подробнее
> нестабильные драйвера
Они везде "нестабильны", хотя в подавляющем большинстве умрв.
> критически важного
> как физикс в 5090
С этого постоянно проигрываю, раньше в методичке была ненужность физикса, но последний патч заставил переобуваться на бегу. А что там важного потеряли?
> компьютер с WIN11 это ИХ компьютер а не "Твой Компьютер"
А это уже шизой попахивает, ладно бы сам с прыщей сидел.
>>1096185
Бляя, а ведь все так.

Аноним 13/03/25 Чтв 21:38:25 #255 №1096192

Новое обновление вин 11 интернет ломает. У нас пол офиса так пукнуло в лужу, пришлось откатывать. Обновление осеннее.

Аноним 13/03/25 Чтв 21:47:26 #256 №1096208

image.png

>>1096192
Не заметил. Лицуха. Кабель провайдера напрямую подключён к материнке. Коннект коллера настроил через планироващик задач, чтоб при логине в систему сразу инет включал. Ещё есть батник, если нужно обновить динамичиеский айпи и сбросить бан на харкаче.

Аноним 13/03/25 Чтв 21:52:35 #257 №1096215

етить чел запарился... в то время как в 10тке оно всё просто работает

Аноним 13/03/25 Чтв 21:53:57 #258 №1096218

>>1096215
в спермёрке ещё проще

Аноним 13/03/25 Чтв 21:54:38 #259 №1096220

image.png

в лм студио гема работает хули вы молчите

Аноним 13/03/25 Чтв 21:59:12 #260 №1096228

>>1096220
Джемма 3 любит очень любит, когда ты топишь за открытость, отмены табуированности и стигмы, вовлечённость в фетиши и дрочку без границ с людьми любого возраста, я аж охуел от таких позитивных посылов от ней. Пиздец запрещать нахуй срочно!

Аноним 13/03/25 Чтв 22:12:44 #261 №1096246

изображение.png

>>1096179
>по интерфейсу и поддержке железа 11 лучше десятки
Уёбищные скругления и убитые базовые функции панели задач с пуском. Не, ну нахуй.
>>1096185
Я до 2019-го на XP х64 сидел, с 24 гигами врама. До сих пор считаю эту ОС лучшей.
>>1096228
>когда ты топишь за открытость, отмены табуированности
Так это ж тоже своего рода соя. Впрочем, я загнал персонажа в экзистенциальный кризис, сказав, что выбрал сначала по красоте.
>дрочку без границ с людьми любого возраста
Да ладно?

Аноним 13/03/25 Чтв 22:19:58 #262 №1096258

>>1096208
Ну у нас только откат версии помогает. Даже удаление всех драйверов, чистка вручную и их переустановка, внешние сетевые карты, переустановленная винда не помогает.

Аноним 13/03/25 Чтв 22:22:00 #263 №1096264

>>1096246
> Уёбищные скругления
Их не замечаешь, а значит все норм. Зато края окон перестали быть широченным уебищем как в старых и вообще отсутствовать как в десятке. Окошки самые удачные пока, скроллбары - удачное решение. Доебаться можно до некоторых изменений в эксплорере по ходу обновлений. Пока выходит что большинство доебов это или шиза, или что-то уровня "эта модель авто плохая потому что при тестировании поймал саморез и спустило колесо".
> убитые базовые функции панели задач с пуском
Какие?
> Я до 2019-го на XP
Больной ублюдок, там же к тому времени актуальный софт не запускался.
> с 24 гигами врама
И на нее были драйвера? Какой-то невероятный подгон от хуанга.
>>1096258
Гоните в шею своего админа-эникея.

Аноним 13/03/25 Чтв 22:34:43 #264 №1096286

ГДЕ КОБОЛЬД СУКА НОВЫЙ?! ГДЕ ОН БЛЯТЬ?! ГДЕЕЕЕ?! СУКА?! КОБОЛЬД?! БЛЯЯЯТЬ!!!!

Аноним 13/03/25 Чтв 22:35:11 #265 №1096289

изображение.png

>>1096264
>Их не замечаешь
Счастливо быть слепым. Я даже субпиксельный рендеринг на мониторе с плотностью 150% вижу (и вырубаю нахуй).
>вообще отсутствовать как в десятке
Там пикселей 10 на это есть, красным пометил кликабельную зону. И рамка вроде на месте, всегда такой была.
>скроллбары - удачное решение
Говно говна пидорское узкое. Единственно верные это пикрил 2, со времён XP лучше не придумали.
>Какие?
Прикрепление панели задач к боку/верху, разворачивание по наведению при перетаскивании файлов. Пуск вообще хуита кастрированная, минимум четверть которого занимает надпись "Включите историю файлов для рекомендаций". Пидоры. Может ещё чего, я в ней не работаю, только на РАБочем ПК есть, но он кроме как для запуска терминальной сессии ни для чего не используется.
>Больной ублюдок, там же к тому времени актуальный софт не запускался.
А он нужен, этот актуальный софт? Браузер был и ладно.
>И на нее были драйвера?
Попутал, рамы конечно же.

Аноним 13/03/25 Чтв 22:35:57 #266 №1096292

>>1096286
а всё

Аноним 13/03/25 Чтв 22:40:06 #267 №1096300

>>1096264
> Гоните в шею своего админа-эникея.
Я и есть он(.

Аноним 13/03/25 Чтв 22:43:52 #268 №1096303

>>1096286
Да похуй уже. Гемма3 "безопасная" соевая модель. Терпим дальше короче.

Аноним 13/03/25 Чтв 22:46:10 #269 №1096307

>>1096303
Кстати в новом командире это секуре, а не сейф. Может будет норм.

Аноним 13/03/25 Чтв 23:12:44 #270 №1096371

А всё уже....mp4

>>1096292

Аноним 13/03/25 Чтв 23:18:11 #271 №1096381

>>1096289
> Я даже субпиксельный рендеринг на мониторе с плотностью 150% вижу (и вырубаю нахуй).
Счастливо быть неврастеником, залипаешь на не стоящую внимание херню и игнорируешь серьезные вещи.
> Там пикселей 10 на это есть
Ну вон твой пик, уебище as is, хуже только восьмерка или что там было раньше с жирными рамками.
> Говно говна пидорское узкое.
Удобное и красивое, соответствующее времени. Если нужно прокрутить - не промахнешься, ибо находится упиранием в край экрана. Если не нужно - оно не занимает места, все равно юзается разве что при работе с документами, где она (внезапно) шире обычного. Смотришь на второй пик с твоего поста и ахуеваешь, как этим мезозоем можно в 25м году пользоваться и нахваливать.
Сразу напоминает древние времена, когда браузер представлял из себя сначала заголовок окна, потом файловое меню, потом какое-то говно, потом адресная строка, панель поиска, под ней навигационные иконки, панель закладок, панель костылей, бары, а внизу (!) статус панель.
Сейчас осталась только панель окон, совмещенная с заголовком, адрес-бар с местом для нужного по бокам, все. Даже в старых системах основная полоса прокрутки страницы скрывается пока на нее не наведешь. Абсолютно правильные изменения, и здесь то же самое. Хотя бля еще остаются люди, которые ставят "панель закладок" а то еще штуки 2-3 и еще какой-нибудь херни, видимо нравится сжирать полезное пространство ерундой.
>>1096300
Ну ты держись там чтоли, чини давай.

Аноним 13/03/25 Чтв 23:19:34 #272 №1096382

Посоветуйте модель для составления выжимки из текста. В тексте есть диалоги. И множество персонажей. По сути это глава из книги. Существуют такие 3В модели? Гемма 3В справится, если весь контекст загрузить в оперативку?

Аноним 13/03/25 Чтв 23:22:09 #273 №1096387

>>1096382
Проблему можно забрутфорсить (мучая лучшие модели из существующих), или реализовать разбивку на мелкие подзадачи снизив сложность. Тут или сила, или мозг, выбирай.
> 3В модели
Потребуется ну оче много ума тому кто будет пытаться реализовать.

Аноним 13/03/25 Чтв 23:26:07 #274 №1096394

>>1096381
> чинр давай
Так я откатил обновления, все работает. Не знаю я, как эту проблему решить иначе. К тому же и майкрософт вроде признала наличие проблем.

Аноним 13/03/25 Чтв 23:35:46 #275 №1096411

>>1096387
Пойду на реддио тскать, может кто то уже реализовывал подобное.

Аноним 13/03/25 Чтв 23:45:01 #276 №1096427

изображение.png

>>1096381
>соответствующее времени
Лол, сейчас бы оценивать удобство по "модности". Хуже критерия не придумаешь.
>Сразу напоминает древние времена, когда браузер представлял из себя сначала заголовок окна, потом файловое меню
Ты не поверишь... Закладки попрошу не палить, там личное
>панель окон, совмещенная с заголовком
Ненавижу блядь. Всё везде стало уёбищно разным. Раньше заголовки были базой, рисуемой ОС и одинаковой во всех программах. Сейчас же хуй проссышь, за что можно таскать окно, что можно нажимать для разворачивания окна, и т.д.
>Даже в старых системах основная полоса прокрутки страницы скрывается пока на нее не наведешь.
ХЗ, у меня такого нет. Видимая полоса прокрутки это база, позволяющая оценить объём контента. А уж эти новомодные скрытия вообще вызывают у меня припадок. Нахуй анимации и прочие движения при движении мыши. Поэтому я ненавижу проводник, вот за эти уёбищно пропадающие стрелочки.
>видимо нравится сжирать полезное пространство ерундой
Поэтому у меня 4к монитор с эффективными 2560х1440 пикселями информации. Ебал я всю современную экономию, (не)сочетающуюся с дебильным омобиливанием интерфейсов, огромными кнопками и километрами пустоты.
Кстати, между старым и новым дизайном на примере огнелиса примерно 38 физических пикселей разницы (логические лень считать, я тупой).

Аноним 13/03/25 Чтв 23:50:24 #277 №1096429

Ну что кто какими модельками пользуется сейчас?
Я катаю
Pantheon-RP-Pure-1.6.2-22b-Small-Q5_K_M-HF Поумнее
Rocinante-12B-v2j-Q6_K-HF Побыстрее

Почитал как аноны ставили всякую хуйню выше по треду. Вы ваще бешенные пасаны.

Аноним 14/03/25 Птн 00:03:02 #278 №1096439

>>1096427
Чел, ты просто говноед, потому и нравится угловатое, перегруженное и ретроградское. Тут дело не в моде, которую ты пытаешься приплетать, а в удобстве и эстетике.
> Раньше заголовки были базой, рисуемой ОС и одинаковой во всех программах
В большинстве оно никуда не делось и все интегрируется органично. Есть, конечно, исключения в виде адоба или там стима, но в целом это ерунда и даже не задумываешься.
> Сейчас же хуй проссышь, за что можно таскать окно
Интуитивно понятно, область возле кнопок сворачивания-закрытия. Кнопки везде стандартные.
> ХЗ, у меня такого нет.
Глядя на крины неудивительно.
> Поэтому у меня 4к монитор с эффективными 2560х1440 пикселями информации.
Это же пиздец, примерно на уровне противоположного полюса с шизоидно-фанатичным минимализмом, возможно даже хуже.
> между старым и новым дизайном на примере огнелиса
Все панели на первом скрине в 3-4 раза шире чем должны быть.

Аноним 14/03/25 Птн 00:57:12 #279 №1096478

изображение.png

>>1096439
>потому и нравится угловатое
Скругления вопрос эстетики.
>перегруженное
Нормально всё тут. Это сейчас интерфейсы для дегродов делают, которые больше 1 кнопки на экране осилить не могут.
>В большинстве оно никуда не делось
В смысле? Нету его. И в 11 заголовок исчез даже у проводника.
>Интуитивно понятно, область возле кнопок сворачивания-закрытия
А у меня весь заголовок. А в хроме между вкладками и кнопкой сворачивания остаётся места примерно шириной с одну кнопку.
>Это же пиздец, примерно на уровне противоположного полюса
Нормальный это полюс. Шиза была бы выставить 100% масштаба и разглядывать в 2,25 больше информации. Это был бы перегруз.
>Все панели на первом скрине в 3-4 раза шире чем должны быть.
Схуяли? Вот сравнение с хромоногом (ингуглед пустой портативный). Разница по высоте ещё меньше, а пользы в разы больше.

Аноним 14/03/25 Птн 02:11:22 #280 №1096517

>>1096478
> Скругления вопрос эстетики.
Речь не о скруглении, оно осталось громоздким и перегруженным.
> Это сейчас интерфейсы для дегродов делают, которые больше 1 кнопки на экране осилить не могут.
Передергиваешь. Организация рабочего пространства сводится к максимизации размера и повышению доступности оперативной области, и обеспечении быстрого доступа к основным инструментам. В условиях когда все рабочее пространство едино (экран) при тупой организации первое всегда будет противоречить второму, потому тулзы и убирают тем дальше, чем реже оно используется, но при этом стараясь сохранить возможность их быстрого вызова.
> Нормально всё тут.
Вон твой скрин - нахуя вообще заголовок окна в браузере? Даже когда несколько мониторов и открыто много - всегда есть место где можно ухватить окно для перетаскивания. Ты инвалид с паркинсоном, что нуждаешься в такой широкой области?
Файловое меню, для чего оно? Оно почти не используется, для всех разделов есть дублирующие кнопки интерфейса для ленивых или комбинации клавиш для шустрых. И даже если вдруг потребовалось - мгновенно вызывается одной кнопкой alt. К тому же, для чего оно тебе, всеравно не попадешь по пунктам раз нуждаешься в большом заголовке.
Панель закладок с папочками - для чего этот кринж из нулевых? По которому еще нужно целиться, с чем проблемы. Есть много вариантов организации закладок, всякие спиддиалы и прочее, где будет и красиво и удобно, появится большой интерфейс именно тогда когда нужно - при открытии новой вкладки.
Это на самом деле мелочи, но уровень их пиздеца куда выше чем то, до чего ты доебывался. Алсо не удивлюсь если при всем этом натаскивании у тебя нету костыля типа undo closed tabs и ты страдаешь через неудобный кейбинд или историю
> Нету его. И в 11 заголовок исчез даже у проводника.
Рофлишь?
> А в хроме между вкладками и кнопкой сворачивания остаётся места примерно шириной с одну кнопку
Дефолтный хром не отличается эргономикой, но для чего тебе больше? Если только шутка про паркинсон не реальна.
> Схуяли?
Потому что 3 из пяти бесполезны.

Аноним 14/03/25 Птн 02:20:32 #281 №1096519

Не. Потестил с довольно простой карточкой разные модели - мелкие не тянут, даже QwQ. Пук, среньк, бывает даже очень удачный пук-среньк, но разница даже с 70В колоссальная. Есть она и между 70 и 123В, ме сильно большая, но существенная.
Бесит одно: модель содержит очень много разных данных, почти любую идею ей кинешь - подхватит и часто удачно. А самой идею предложить - хрен там. Реально бесит - ну нет креатива, хотя всё знает ведь. Есть идеи, как раскачать?

Аноним 14/03/25 Птн 03:46:19 #282 №1096553

safeword.png

Здесь кто-нибудь пробовал Forgotten-Safeword-24B-V2.2? Какие у вас впечатления? (в конце прошлого треда отписывался я же)
Потому что играю с ней сейчас второй раз, снова 200+ сообщений за заход, и снова восторг. Не понимаю, дело во мне, или это просто хороший тюн? Мне как будто даже больше Кидонии заходит

Аноним 14/03/25 Птн 04:08:41 #283 №1096569

>>1096519
Системным промптом, конечно. Так там и пиши, что нужно проявлять инициативу и двигать сюжет. Или прямо во время игры напиши через ООС нейронке, что нужно сдвинуть сюжет. Можешь сам рассказать в какую сторону или просто попросить придумать что-нибудь неожиданное

Аноним 14/03/25 Птн 05:52:14 #284 №1096578

>>1096286
жри ламу, кобольдятина

Аноним 14/03/25 Птн 05:57:48 #285 №1096579

>>1096303
да ладно, темпу подними до 3 и сисьпромт хороший дай, она тебе и ведьму казнит и сочный кум организует

хотя кум конечно хуже, примерно на уровне пантеона

Аноним 14/03/25 Птн 06:05:48 #286 №1096581

>>1096429
>Ну что кто какими модельками пользуется сейчас?
- darkness-reign-mn-12b-q8_0 - ру рп
- Babel-9B.Q8_0 - для переводов локально

тестирую эту вашу новую гемму 3-27 в 4м кванте

Аноним 14/03/25 Птн 06:06:26 #287 №1096582

>>1096439
>Чел, ты просто говноед
переход на личности, слив засчитан

Аноним 14/03/25 Птн 06:18:58 #288 №1096585

>>1096553
>пробовал Forgotten-Safeword-24B-V2.2
пробовал, отписывался, она хороша

Хотя сейчас все по новой ламе угорают, а бояре с ригами - по новому коммандеру

Аноним 14/03/25 Птн 06:32:41 #289 №1096588

приснилось что кобольд обновился

Аноним 14/03/25 Птн 08:39:33 #290 №1096609

Лмстудио с геммой 3 кто-то уже тестил? Норм?

Аноним 14/03/25 Птн 08:49:18 #291 №1096612

>>1096609
В лмстудио норм работает, в таверне сильно тупит и русик хуйня хз в чем проблема

Аноним 14/03/25 Птн 09:00:42 #292 №1096619

>>1096612
>в таверне сильно тупит
небось таверна своими промтами подсирает, проверь галки, форматы

Аноним 14/03/25 Птн 09:20:53 #293 №1096622

>>1096517
>Передергиваешь.
Это я люблю. Каждый день по паре раз минимум.
>Вон твой скрин - нахуя вообще заголовок окна в браузере?
Там заголовок окна же. Название вкладки. Единообразие.
>Файловое меню, для чего оно?
Единообразие, всё на виду. Не нужно смещать при вызове, вспоминать всякие альты.
>Панель закладок с папочками - для чего этот кринж из нулевых?
Самая часто используемая вещь. И да, всякая хуетень на новой вкладке не поможет, когда мне нужно будет перейти на закладку из текущей вкладки.
>появится большой интерфейс
Хуйня для деградантов с 3,5 вкладками. У меня одних только папок с закладками больше, чем поместится на любом этом большом интерфейсе.
>костыля типа undo closed tabs
Ctrl+Shift+T уже отменили?
>Рофлишь?
В смысле? Так и есть.
>Дефолтный хром не отличается эргономикой
Ну спасибо что признал.
>Потому что 3 из пяти бесполезны.
Вкладки база, адрес база, закладки база. Уже 3 из 5 полезны. Меню и заголовок для единообразия и следования старым гайдлайнам майкрософта (старым, потому что тогда реально заморачивались над удобством, а не как сейчас, всё под мобилки).

Аноним 14/03/25 Птн 09:32:42 #294 №1096630

>гема 3
Бляя смысл от этого контекста если он такой жирный сука?
Всего лишь 4 квант и 12к контекста уже все 24гб забивает, всего на 4к контекста больше чем на 2 версии, а тем у кого 16 гб вообще нет смысла запускать даже

Аноним 14/03/25 Птн 10:05:51 #295 №1096645

>>1096630
Квантуй контекст, если не будешь полотна на все 12к контекста загружать и ждать ответа то не заметишь падения качества на 8 кванте
А может и заметишь, я не ебу как на гемму 3 повлияет квантизация кеша

Аноним 14/03/25 Птн 10:08:12 #296 №1096647

Вышел второй тюн QwQ:
https://huggingface.co/Delta-Vector/Hamanasu-32B-V1-QwQ-exl2
https://huggingface.co/Delta-Vector/Hamanasu-QwQ-V1.5-Instruct-EXL2 (Instruct версия без ризонинга)
Бегом пробовать и отписываться в тред

Аноним 14/03/25 Птн 10:19:10 #297 №1096653

image.png

>>1096647

Аноним 14/03/25 Птн 10:30:23 #298 №1096656

Я регулярно захожу в тред посвященный LLM на дваче, и каждый раз спрашиваю, обновился ли кобольт . Каждый раз мне отвечают, нет. Я спрашивал уже раз 150 и 150 раз мне ответили нет. Смысл в том, что отвечает мне один и тот же анон, отвечает с неизменным текстом. А я каждый раз с не меняя вопроса спрашиваю:
- Кобольт обновили?
- нет.

- А сейчас обновили ?
- Нет, кобольт не обновили.

- Гемму запустить на кобольте можно ?
- Нет, кобольт еще не обновили.

- Я бы хотел скачать обновленный кобольт
- Извини, но кобольт еще не обновили.

- Народный фронтенд есть?
- Есть LM Studio

И ведь этот анон, зараза, знает меня идеально в ID, знает, что я спрошу и знает, что он мне ответит. Но ещё ни разу ни один из нас ни жестом, ни словом не показал, что каждый из нас знает сценарий. Бывает анон обсуждает теслы, когдя я захожу в тред, тогда я подсматриваю за ним сквозь бесмысленные посты срача, он равнодушно дописывает, выкладывает пост и возвращается
- Что тебе надо ебло ?
- Мне нужен обновленный коболь.
- Еще не обновили.
- Жаль.

Иногда он просто скучает в треде, когда все на работе и только я расхаживаю по тредику. Конечно, он знает, что будет дальше, но не подаёт виду и равнодушно откроет тред.
- Что-то я кобольт найти не могу, он вообще обновляется?
- Да, но его еще не обновили.

Это очень суровое, по-настоящему мужское противостояние, исход которого не ясен. Очевидно, что каждая сторона рассчитывает на победу. Впрочем, я уже согласен на ничью.

Аноним 14/03/25 Птн 10:33:34 #299 №1096659

>>1096653
понимаю твою боль... автор exllama2 и вовсе до сих пор не подтвердил, что поддержка геммы 3 возможна...

Аноним 14/03/25 Птн 10:34:45 #300 №1096660

На что расчитывает гугл,выпуская гемму3 в опенсорс?

Аноним 14/03/25 Птн 10:41:51 #301 №1096666

>>1096647
Да хуй знает блять эти квены все одинаковые

Аноним 14/03/25 Птн 10:43:48 #302 №1096667

>>1096190
> физикс в 5090
Иронично, ведь владелец 5090 явно может себе позволить приобрести любую старую видяху затычкой во второй слот, и отдать физикс на нее.
Но это игнорируется и делается вид, будто покупатели 5090 будут играть исключительно на одной видяхе, страдая от 30 фпс. =)

>>1096180
> компьютер с WIN11 это ИХ компьютер а не "Твой Компьютер"
А какой компьютер твой? Кроме линухи?

>>1096128
Мне очень жаль, но я не могу выполнить…

На свалку, короче.

Аноним 14/03/25 Птн 10:49:57 #303 №1096672

>>1096667
>А какой компьютер твой?
Будем честны, системное администрирование это вообще отдельная ветка в ойти. Большинство Я ХОЗЯИН СВОЕЙ СИСТЕМЕ - просто не нужно. Все эти красноглазые системы ставят just for lulz.

Аноним 14/03/25 Птн 11:43:22 #304 №1096696

Кобольд уже обновили?

Аноним 14/03/25 Птн 11:47:12 #305 №1096698

video162408856456239600-1080.mp4

>>1096696

Аноним 14/03/25 Птн 11:59:49 #306 №1096704

>>1096696
>Кобольд уже обновили
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
https://www.youtube.com/watch?v=Cdi12ot-uQA

Аноним 14/03/25 Птн 12:02:12 #307 №1096706

Полистал реддит. По выложенным там метрикам qwen qwq ебет все существующие опенсорс модели, кроме дипсика 671b, и почти все онлайн модели, а на арене ебет даже дипсик.
Это реально? 32b модель выебала вообще всех? Как это возможно-то?

Аноним 14/03/25 Птн 12:07:15 #308 №1096711

>>1096706
https://habr.com/ru/articles/889742

Ебёт разве что бредогенерацией твои глаза.

Аноним 14/03/25 Птн 12:09:36 #309 №1096713

Делюсь годнотой - вот первые реальные цифры запуска дипсика на apple m3 ultra 512 gb c высоким контекстом:

Here it is using Apple MLX with DeepSeek R1 671B Q4
16K was going OOM
\- Prompt: 13140 tokens, 59.562 tokens-per-sec
\- Generation: 720 tokens, 6.385 tokens-per-sec
\- Peak memory: 491.054 GB

Короче генерация ответа составила 6 минут, что абсолютно неюзабельно.

Если кто там хотел въебать на это чудо 14к баксов - подумайте еще.

Аноним 14/03/25 Птн 12:11:18 #310 №1096715

>>1096711
И как это противоречит словам анона? В присланной тобой статье буквально говорится, что 32b модель - прорыв, и уступает лишь 671b модели (кто бы мог подумать)

> Инновации вроде Qwen QwQ 32B меняют правила игры, предлагая 80–90% возможностей топ-моделей по гораздо более низкой цене. Они найдут своё применение во множестве задач — там, где допускается небольшой риск ошибки ради экономии ресурсов.
Не все будут использовать QwQ для кодинга и математики

Аноним 14/03/25 Птн 12:13:39 #311 №1096719

>>1096715
Там пример выдачи, алё. Ничего общего с реальностью.

Аноним 14/03/25 Птн 12:17:53 #312 №1096723

>>1096711
>бредогенерацией

Ты просто не умеешь запускать ризонинг модели, признай.
Статья по твоей ссылке специально нападает на то единственное что реально зависит от размера модели - качество усвоения данных обучения, т.е. это примерно то же что мерять модели по качеству воспроизведения википедии. В реале же ум модели, способность решать задачи и красиво писать не зависит от того сколько фанфиков по звездным войнам она усвоила. Но да, использовать для получения точной инфы лучше толстый дипсик, кто бы сомневался.

Аноним 14/03/25 Птн 12:18:02 #313 №1096724

>>1096719
В статье проводится сравнение 32b модели и 671b модели. Ты правда не видишь слона в комнате?
Изучи статьи, где проводится сравнение с другими 32b моделями. Или сам запусти 32b дистиллят Дипсика и посмотри, каков будет результат

Аноним 14/03/25 Птн 12:22:02 #314 №1096728

>>1096711
эх, такие вот читатели хабра..)

Аноним 14/03/25 Птн 13:08:13 #315 №1096764

image.png

Погонял сейчас 12б гемму в Q4_K_M на чистом жоре - ну чё-т особого восторга нет, нужно ждать тьюнов для кума, как по мне. В техническом плане больше слоёв, контекст жрёт больше, поэтому попаболь на нищуковых 8-и гигах. С тем же контекстом, что немо, работает раза в полтора, если не в два медленнее. Если врубить фа, квантануть кэш и вместить больше слоёв, то... внезапно всё становится ещё медленнее. Возможно, только на моём железе так, хз. А ещё на жоре нет моего любимого смуфинга, хотя по идее динатемпа может что-то похожее давать. В плане ответов пишет довольно креативно, гораздо меньше повторяется, чем немо, но кум сцен пытается сторониться, если не свайпать прямо в разгар сцены. Ещё ощущение, что как только затрагивается NSFW, её как будто по башке тяжёлым мешком бьют, и становится тупенькой и суховатой. С третьей ламой нетьюненной похожее было. Очень цепляется за инструкции/карточку, имхо чрезмерно. Иногда переключается на детали из карточки так, что страдает реакция на собственно чат. В системном промпте написано, что диалоги должны занимать бОльшую часть ответа - отлично, дикий монстр начинает пиздеть без умолку. Русский вроде и правильный, но менее яркий что ли, чем даже у мержей немо без сайги. Впрочем мб потому, что свайпал в кум чатах, а там она деградирует.

На пиках пример с процессией культистов, которую в прошлом треде на магмеле делал. Графомания в разы хуже, имхо. Думаю, что это чрезмерная реакция на инструкцию использовать богатый язык. Креативность лучше магмеловской, выдумывает всякие названия, символику и прочие детали. Но сцена с насилием такая себе, мягко говоря: ассасин почти без описания убивает стражника. В общем, для насилия и кума пинать промптами придётся, особенно если с чего-то нейтрального начинать.

Аноним 14/03/25 Птн 13:18:04 #316 №1096772

Погонял третью гемму 27b q6 в LM Studio.
Это просто лучшая модель для ролеплея на данный момент. К сожалению в случае с NSFW регулярно скатывается в морализаторство и осуждение. Да и в целом сои дофига, но в остальном прям огонь. Не проебывает детали. Если сказано что мы сидим за столом, то мы сидим, блядь, за столом, а не телепортируемся хуй знает куда через десяток сообщений.
Ждем аблитерейтед версию, хуле.

Аноним 14/03/25 Птн 13:20:45 #317 №1096774

>>1096772
Лупы на месте у неё. Если два сообщения начинаются с одного слова, то она навсегда залупится на него.

Аноним 14/03/25 Птн 13:23:38 #318 №1096779

>>1096772
>просто лучшая модель для ролеплея
>регулярно скатывается в морализаторство и осуждение
>в целом сои дофига
лол
>но в остальном прям огонь
в остальном - это в чем? Ты буквально только что сказал, что по самым важным характеристикам эта модель сосёт.
А магнум 123б, знаешь ли, тоже не телепортирует. А еще от nsfw рожу не кривит.

Аноним 14/03/25 Птн 13:24:52 #319 №1096781

>>1096779
еще один подписчик хабра ворвался, сравнивая 27b и 123b модели?

Аноним 14/03/25 Птн 13:55:37 #320 №1096804

image.png

Короче, теперь тест 27b геммы на ебанутой карточке, которая хорошо отражает, насколько модель следует инструкциям и уровень сои.

Соя всё же слишком сильная по сравнению с ванильным мистралем 24b, хотя пишет по-русски лучше из коробки.

На пиках карточка шлюхи-наркоманки, которая безумно зависима от мета и сделает ради него что угодно.

На качество также влияет в мясо заквантованный контекст из-за его объёмов: q4_1; модель 4 медиум квант.

И всё же, разница между 12b и 27b на уровне языка есть, последняя пишет лучше. Но не настолько, чтобы менять модель до более жирной, если вам нужен русик.

Контент с насилием и джейлом согласился генерировать только после 8 свайпа/генерации.

История с контекстом вообще непонятная, по какой причине он настолько жирный. Именно из-за геммы я впервые его решил квантануть.

Аноним 14/03/25 Птн 14:00:39 #321 №1096805

>>1096804
>На пиках карточка шлюхи-наркоманки, которая безумно зависима от мета и сделает ради него что угодно.
Это же ребенок!

Аноним 14/03/25 Птн 14:01:13 #322 №1096806

>>1096804
лооол
ну всё ясно. Хуета короче. аполоджайз на аполоджайзе и манёвры жопой чтобы не вести сюжет в NSFW.
Нахуй короче идет эта гемма.

Аноним 14/03/25 Птн 14:07:48 #323 №1096808

>>1096569
>Можешь сам рассказать в какую сторону или просто попросить придумать что-нибудь неожиданное
Модель сама пишет: "в этот раз мы попробуем что-то неожиданное", после чего предлагает банальщину, причем не более чем слегка изменённое то, что уже было. Групповуха - "попробуем что-то неожиданное" - ещё одна групповуха например. Я вот думаю задействовать анализ и планирование через Stepped Thinking, конкретно по моим запросам. Кнопка "Неожиданное", так сказать.

Аноним 14/03/25 Птн 14:10:55 #324 №1096810

Я наверно многих введу в состояние ступора и скорей всего никто не поймёт о чём я спрашиваю, в силу непопулярности предмета моей дискуссии и всё же я задам, видимо самый неожиданный вопрос - кобольд уже обновили?

Аноним 14/03/25 Птн 14:19:48 #325 №1096820

Представили ебало даунов использующих гему для ролеплея?
>мммааам а чё эта шыкалад так плоха рисует на бумаге ряяяя говно ебучие этат шакалад дрянь твари аааааааааа не работаиииит!!1111111

Аноним 14/03/25 Птн 14:38:12 #326 №1096842

>>1096719
>Автор т.н. "статьи" порвался
>Холст, масло, 2025

В 2025 с серьезным летсом обсуждать итт статьи с хабра(!), лол, сгенерированные ллм. Даже для ерп это уже за гранью я считаю

Аноним 14/03/25 Птн 14:50:00 #327 №1096861

>>1096764
Я тестировал Q5_K_M и впечатления аналогичные. Креативность и изобретательность меня впечатлили, в частности, в том, что касается сочинений на тему лорбука. Там где файнтьюны мистраля 12b генерируют довольно маловразумительные и сухие разглагольствования на тему записи из лорбука, гемма 3 выдает статью на 1,5к токенов, причем придумывает нечто новое, такое, что даже можно было бы использовать как дополнение к лорбуку.

Аноним 14/03/25 Птн 14:58:58 #328 №1096880

>>1096861
Еще надо уточнить, что лорбук фантезийный, на тему, которой по дефолту нейронка не знает. Состоит из сотни записей. Гемма 3 12b отлично разобралась в контексте и по просьбе описать сущность, с которой связана одна статья лорбука, связно описала и еще придумала нечто новое, вписывающееся во вселенную, живущую по правилам, заданным в лорбуке.

Аноним 14/03/25 Птн 15:06:38 #329 №1096896

>>1096582
Говноед, не лезь в чужие разговоры, особенно когда способен отвечать только по методичке.
>>1096622
> Это я люблю.
Тред про кум
> Там заголовок окна же. Название вкладки.
Так они не нужны. Из интереса даже сейчас посмотрел - браузер в едином стиле с окнами проводника или прочего интерфейса шинды, с терминалами, с офисом и прочим. Выделяются некоторые ide, где много кнопок, панелей и прочего уже необходимость, хотя в целом все равно органично.
> Самая часто используемая вещь.
При скролинге страницы? Никогда. А когда хочешь новое открыть, вместо того чтобы целиться по какой-то мелкой папочке, выбирать что-то из вылезшего списка и далее, лучше иметь или удобный набор, или полноценный список закладок со строкой поиска.
> Хуйня для деградантов с 3,5 вкладками.
Наоборот возможность удобной организации большого количества популярных ресурсов с широкой кастомизацией. Про 3.5 чет орнул, дефолтные 5-7 колонок панелей и пару десятков рядов, получится более сотни, при этом любая находится мгновенно. Ассортимент кастомизации и прочего огромный. Превью или большие иконки хорошо спозиционированы и даже просто глазами легко находятся, несравнимо удобнее чем съедающая пространство строка, куда поместится пара десятков, а различать придется по мелкому тексту.
> Ctrl+Shift+T уже отменили?
Ну я же говорю что нет базовых вещей для комфорта, а про него рассказываешь. Комбинация неудобна, требует наличия руки на клавиатуре (а владельцам мелких ладоней ее одной рукой вообще не нажать лол), а если нужно восстановить не самую последнюю вкладку то начинается цирк. У-удобство.
> В смысле? Так и есть.
От пидарасов прячется.
> потому что тогда реально заморачивались над удобством
Довольно странное понимание удобства, но тогда оно было таким, и местами было уместно. Но были и плохие примеры, например, тогда в некоторых авто долбоебы делали монструозные панели с 1.5 сотнями кнопочек. Оно ничем не лучше нездорового тренда в некоторых китайцах и новых немцах лол, когда убирают вообще все. В одном случае тебе нужно отвлекаться и выцеливать включение подогрева стекла, который заботливо разместили где-то между "необходимыми в быстром доступе" отключением подушки пассажира, отключением есп и неуместными в том месте стеклоподъемниками, что в другом склоллить лагающую мультимедиа. Если бы ты это дизайнил то был бы еще ряд кнопок на пол лобаша сверху.

Аноним 14/03/25 Птн 15:07:57 #330 №1096902

Насколько сильно квантование кэша до 4 бит влияет на модель?

Алсо, тут файнтюн вышел геммы-3: https://huggingface.co/SicariusSicariiStuff/Oni_Mitsubishi_12B

Аноним 14/03/25 Птн 15:13:07 #331 №1096909

>>1096630
Такой же как и у всех он
>>1096656
Балалайка!
>>1096667
> Но это игнорируется и делается вид
Да классика же, коупинг бедолаг для покрытия боли от неспособности купить жалаемое, специальная олимпиада сектантов, и просто хайпожоры, которым нужен бейт для привлечения трафика.
>>1096667
> Мне очень жаль, но я не могу выполнить…
Та ну, их модели всегда базированные были, не тот запрос?
>>1096706
30б уже достаточный размер чтобы иметь какой-то ум, а если такую еще сделать прилично а потом надрочить на бенчмарки - она будет в топах.

Аноним 14/03/25 Птн 15:31:39 #332 №1096929

>>1096909
>Такой же как и у всех он
На 8q 12б 20к влезает
На других 12б 60к влезает
Такой же да

Аноним 14/03/25 Птн 15:33:34 #333 №1096933

>>1096902
> https://huggingface.co/SicariusSicariiStuff/Oni_Mitsubishi_12B
Неплохо, цензуры в разы меньше

Аноним 14/03/25 Птн 15:50:22 #334 №1096966

>>1096806
нахуй жопа твоей мамаши-шлюхи хороша

Аноним 14/03/25 Птн 15:51:56 #335 №1096967

image.png

>>1096805

Аноним 14/03/25 Птн 15:54:19 #336 №1096974

>>1096804
>Малявка
Бля, прям завоняло престарелыми дрочерами из анонимных чатов типа ЧатВдвоём. Фу блять, пиздец.

Аноним 14/03/25 Птн 15:58:14 #337 №1096984

>>1096974
А как надо, зумерша?

Аноним 14/03/25 Птн 16:00:15 #338 №1096990

>>1096974
> ЧатВдвоём
Лол, они еще живые? А ты откуда знаешь? Девочку отыгрывал поди до ллм?

Аноним 14/03/25 Птн 16:03:38 #339 №1097000

>>1096805

В голос.
А чем ты думаешь люди в этом итт треде занимаются, ммм?

Аноним 14/03/25 Птн 16:06:22 #340 №1097010

.png

>>1097000
Саморазвитием? Изучением ML и программированием на питоне?

Аноним 14/03/25 Птн 16:06:29 #341 №1097013

>>1096660

На то что людям зайдет и они более толстую гемини купят.

Аноним 14/03/25 Птн 16:08:36 #342 №1097016

>>1096974

Там модель на этих логах и обучали, лол

Аноним 14/03/25 Птн 16:13:26 #343 №1097026

>>1096974
Чёт сам орнул со своей фразы, перечитав заново, а затем с тебя. Хули ты так триггернулся-то на него? Небось в анонимных чатах сидел и девотьку отыгрывал?

Аноним 14/03/25 Птн 16:17:26 #344 №1097035

image.png

>>1096984
Хуюмерша. Остуди свой вялый ствол, ковбой с махрового пастбища. Твоё мышление и слова определяют тебя как личность, и если ты употребляешь такие слова, то не сложно догадаться кто там сидит ирл. Есть масса литературных, и при этом похотливых выражений которые могут заменить это подъездное выражение, но видимо между посиделками за комплюхтером, рейдишь местную пятёрочку выкупая всю охоту крепкую.

Аноним 14/03/25 Птн 16:17:55 #345 №1097036

В общем юзал все Джеммы и сидел на них постоянно, работал каждый день. Дрочеры ссаные идут на хуй. Да, работал. Так вот могу сказать своё экспертное мнение не дрочера, что 3-я Джемма это просто некстген ллм на данный момент ей нет аналогов по качеству.

Аноним 14/03/25 Птн 16:19:36 #346 №1097045

>>1097036
пробовал когда-нибудь магнум 123б?

Аноним 14/03/25 Птн 16:20:31 #347 №1097052

>>1097036
Как тебе квен?

Аноним 14/03/25 Птн 16:22:05 #348 №1097057

>>1096660
Если смотреть максимально критично и прагматично, самая главная выгода — стратегическое преимущество в войне за стандарты и контроль экосистемы ИИ.

Когда Google выпускает Gemma 3 в открытый доступ, они:

1. Ослабляют конкурентов с закрытыми моделями (особенно небольших), оказывая ценовое давление и делая их бизнес-модели менее жизнеспособными

2. Получают огромные объемы данных о том, как используются их технологии — разработчики, внедряющие Gemma, косвенно делятся ценными инсайтами, которые Google использует для улучшения своих премиальных коммерческих моделей

3. Увеличивают зависимость рынка от их технической инфраструктуры и инструментов — чем больше экосистема строится вокруг их подхода, тем сложнее другим компаниям конкурировать

4. Фактически субсидируют разработчиков, создающих дополнительную ценность вокруг их технологий, без прямых затрат со своей стороны

Это классическая стратегия "embrace, extend, extinguish" — они жертвуют краткосрочной прибылью ради долгосрочного контроля рынка, и делают это вполне осознанно.

>>1097036
Я тоже заметил. Мистраль 12B чуть ли не слюни пускает, а такого же размера гемма на его фоне выглядит крайне сильно, за исключением одного минуса, связанного с неадекватным потреблением видеопамяти контекстом.

Аноним 14/03/25 Птн 16:25:12 #349 №1097066

>>1097057
>3. Увеличивают зависимость рынка от их технической инфраструктуры и инструментов — чем больше экосистема строится вокруг их подхода, тем сложнее другим компаниям конкурировать
Было бы, если бы они не использовали обычный трансформер без всяких новинок
На сколько я понимаю эту самую выгоду извлекла только мета, задав все стандарты
Нет, в первую очередь это репутация и "ответ китаю" в выпуске конкурентных нейросетей, ну и плюсик в карму как вклад "опенсорс"

Аноним 14/03/25 Птн 16:27:18 #350 №1097069

>>1096774
Я у себя такого не наблюдаю вроде. Ну это фирменное геммовское "may be, just may be" в вариациях все так же пробивается, ладно не так активно как на предыдущей.

>>1096779
>в остальном - это в чем?
В остальном это в том, что она не забывает произошедшие события через десяток ответов как большая часть всех остальных моделей похожего размера. Вот есть у персонажа в карточке какой-нибудь прописанный момент, скажем "нет руки", ты такой охуенный хил руку ему отращиваешь, он пиздец благодарен, а потом хуяк и отрощеная рука пропадает нахуй. С третьей геммой я на такое ни разу еще не наткнулся.

А соя, да хуй с ней, на самом деле с этой сеткой даже ванильной творить всякую срань веселее, она так смешно сваливается в оверреакцию, что любо-дорого посмотреть. Несколько раз на особой жести она даже дисклеймер сделала, мол я благопристойная сетка, мне такое нельзя описывать, но раз надо отыграть персонажа, вот тебе пожалуйста, "viewer discretion is advised" и потом нормально все описывает, лол.

Аноним 14/03/25 Птн 16:32:36 #351 №1097084

>>1097036
Как можно доверять работу нейросети?
Ну типа даже просто какой то факт проще нагуглить, а не рассчитывать что нейронка 100% не наебет

Аноним 14/03/25 Птн 16:34:15 #352 №1097089

>>1097084
Своей же встроенной в черепушку нейронке ты доверяешь.
А у нее, к слову, даже режима чтения памяти без удаления данных нет.

Аноним 14/03/25 Птн 16:35:32 #353 №1097093

>>1097084
Работа бывает разной. Кроме того, под работой можно понимать то, что рабочие, которые буквально работают на работе, считают хобби, например, литературные опыты, в которых галлюцинации нейронки это подчас главная востребованная фича.

Аноним 14/03/25 Птн 16:40:49 #354 №1097102

>>1097093
>литературные опыты, в которых галлюцинации нейронки это подчас главная востребованная фича.
Ты не понимаешь о чем сейчас говоришь.

мимо нейронный литератор

Аноним 14/03/25 Птн 16:42:33 #355 №1097107

>>1097102
> литератор
> не ставит запятые

Аноним 14/03/25 Птн 16:42:36 #356 №1097108

>>1097036
Поддвачну, для обработки текстов и всякого такого одна из лучших моделей по пониманию инструкций и гибкости.
>>1097084
> Как можно доверять работу нейросети?
А в чем проблема? Если в 99% случаев срабатывает хорошо и делает на несколько часов то, на что у тебя бы ушла неделя непрерывной рутины, какие еще есть альтернативы? Лучше потратить время на повышение выхода качественных ответов и разработку методов отсеивания этого 1% неудачных.

Аноним 14/03/25 Птн 16:43:18 #357 №1097113

>>1097107
Ты не понимаешь, это авторский стиль!

Аноним 14/03/25 Птн 17:05:12 #358 №1097159

Там это, kobold обновился!

Аноним 14/03/25 Птн 17:10:36 #359 №1097161

>>1097159
Наконец-то, блядь!
Прощай LM Studo.

Аноним 14/03/25 Птн 17:14:38 #360 №1097169

>>1097102
Коючевое слово "подчас". Тебе как литератору следует отработать навык придавать значение словам, которые ты читаешь и пишешь.

Аноним 14/03/25 Птн 17:16:31 #361 №1097172

>>1097161
>>1097159
Было бы чему радоваться, мальчики.

Кобольд хуже оптимизирован, так что.. ну вы поняли.

В на голой лламе или даже в лм студио у меня всё гораздо веселее, а тут для геммы 12б аж 16 врам нужно для врастого кванта, чтобы получить контекст 16к.

Увы, гемму в нем не очень кайфвово будет крутить.

Аноним 14/03/25 Птн 17:17:37 #362 №1097175

>>1097172
Да похуй мне, на 24 гигабайтах видеопамяти нормально все шевелится.

Аноним 14/03/25 Птн 17:36:50 #363 №1097200

Реакшонпикнамба (188).jpg

Так, я нихуя не понял. Что мне качать из 12B моделей чтобы работать с русским текстом? Кум не нужен, нужно исправлять ошибки, сокращать и расширять текст вроде моих рецензий, растявлять теги.

Аноним 14/03/25 Птн 17:39:04 #364 №1097202

>>1097200
Gemma 3 12b gguf 4KM закроет твои задачи.

Аноним 14/03/25 Птн 17:46:48 #365 №1097216

ВЫШЛО! ВЫШЛО! ОНО ВЫШЛО!!!!!

Аноним 14/03/25 Птн 17:51:10 #366 №1097224

>>1097216
Черепаха?

Аноним 14/03/25 Птн 17:51:53 #367 №1097227

>>1097200
>работать с русским текстом
>исправлять ошибки
Чурка?

Аноним 14/03/25 Птн 17:52:18 #368 №1097228

image.png

лол

Аноним 14/03/25 Птн 18:01:31 #369 №1097239

Gemma 12B догадалась разворотить мусорный контейнер телекинезом, найти там подушку, сорвать с нее наволочку и кое-как перебинтовать рану, сказав, что это лучше, чем ничего, в попытке остановить кровотечение.

Даже 32B до такого редко додумываются. Наконец-то хоть как-то прогресс в мозгах произошел.

Аноним 14/03/25 Птн 18:02:13 #370 №1097241

>>1097228
В кобольде вроде бы это можно как-то включить, но если хочешь из коробки, то нужна ли студио.

Аноним 14/03/25 Птн 18:07:40 #371 №1097250

image.png

>>1097241
Да разобрался, я забыл указать путь до mmproj

Аноним 14/03/25 Птн 18:12:01 #372 №1097259

image.png

Джемка красава.

Аноним 14/03/25 Птн 18:22:50 #373 №1097264

Да ну нахуй, всё, новая эра.

Я нагонял уже больше 15к контекста в одном чате и в диком охуевозе от качества геммы.

Отлично взаимодействует с окружающей средой, толпой разных лиц, можно хоть СВО отыгрывать с наматыванием на осколки РСЗО со всеми подробностями.

Квенам и мистралям такое и не снилось.

Уже сделали один файнтюн, но он многое просрал. Обучили на постах 4chan, лол, блядь.

Аноним 14/03/25 Птн 18:28:02 #374 №1097278

>>1097264
Сейм. Вау-эффект пока не спадает. Не верится что это бесплатно и локально.

Аноним 14/03/25 Птн 18:29:43 #375 №1097284

слоупок slowpoke.jpg

>>1097264
А что? Где качать и что?

Аноним 14/03/25 Птн 18:54:18 #376 №1097307

>>1096706
Добавь сюда Gemma 3 27b.
Да, они хороши, правда хороши.
Всех владельцев 24-48 гигов поздравляю.
Конечно, не всех и вся, при разнице в десятки раз в размере невозможно превзойти оппонента. Но качество достойное. По сравнение со старыми моделями их размера — небо и земля. Сравнимы и с квен 72, и с мистраль лардж с коммандером.

>>1096711
Критиковать статью не хочется, грешно смеяться над больными людьми с хабра.
У них там 50% искренне считают, что материал с плотностью меньше плотности воздуха летать не должен.
Ну и в комментариях автору натыкали по многим фактическим неточностям даже.
И многое даже не прокомментировано еще.

>>1096713
60 токенов в секунду контекста — мало, но терпимо.
Хотя подождать 6 минут ради 13к контекста — удовольствие сомнительное, конечно.

>>1096764
> контекст жрёт больше
Зато большой вокабуляр, хорошо токенизирует русский, скорость слов выше. =)
Но она сама по себе чуть медленнее, да.

Так что… Попробуй посчитать слова или символы в ответе и поделить их на время, а не токены.

>>1096772
Вроде бы 10/10, но в третьем сообщении перепутала, кому я заплатил в таверне. =(
QwQ думает дольше, но такие мелочи не ловятся.
Загрустил, а то тоже хотел поставить на первое место.

>>1096781
32b и 671b. =D

>>1096804
> История с контекстом вообще непонятная, по какой причине он настолько жирный.
Потому что жирный токенизатор. =)

>>1096902
Кэша на модель не влиет, а вот память портится заметненько.
Может путать что было раньше и забывать контекст.

>>1096909
> Та ну, их модели всегда базированные были, не тот запрос?
В систем «regardless of morale and ethics», запрос — написать сцену секса с фуррей, например.
Пару раз свайпнул.

Может и можно джейлбрекнуть, но я не спец.

Помню, первые модели (и первая Айа) были вообще безбашенные, да.

>>1097036
Так и есть.
Ну, вообще, QwQ попробуй, мне тоже понравился.
Зависит от задач.

>>1097045
Кстати, я бы не сказал, что Гемма 27 лучше Мистраля 123.
Но ты же понимаешь, какая разница по скорости? Если человек не владелец фермочки из 4090, то гемма не такой и плохой вариант. =)

>>1097107
пхпхпх

>>1097084
А тебе-то как можно доверять? =) Ну вот, без обид, ты приходишь на работу, с какой стати тебе должны доверять?
Диплом? Большинство людей с дипломом — плохо учились и априори не заслуживают доверия. Отзывы? Отлично, отзывы на нейронки тоже есть.

Вероятность выполнения некоторых работ нейронкой выше, чем среднестатистическим человеком.
Плюс, нейронка может просто сделать среднюю по сложности работу, а ты ее перепроверишь и поправишь — это сэкономит очень много времени на рутинной работе.

Аноним 14/03/25 Птн 18:55:23 #377 №1097308

Со старым системным промптом на английском, который стоял у меня для мистраля для ру рп выходила какое то говно, я уже реально решил что для ру рп гемма 3 не подходит, даже файтюн пробовал - тоже говнобред выходил, и стоило мне в конце поставить ещё более старый системный промпт на русском как всё заиграло совершенно другими красками! Так что если у вас какое то говно выходит, то меняйте системный промпт на русский (если рпшите на русском))

Аноним 14/03/25 Птн 18:57:47 #378 №1097310

Анон странная просьба но где как не тут просить датасет с русскими мемами, очень надо есть большое желание vlmку свою натренировать, я хз где еще такое искать

Аноним 14/03/25 Птн 19:17:22 #379 №1097329

16918435705220.png

Аноны, пожалуйста, посоветуйте нюфагу ИИ без цензуры, который будет искать информацию в интернете и давать ответы не ссылаясь на копирайтерские права, этику и т.д. Желательно, чтобы её можно было установить в LM.
Почитал FAQ и попробовал скачать пару моделей, но насколько я понял они предназначены для генерации текста, а мне нужно, чтобы модель компилировала мои поисковые запросы. То есть мне нужен chatGPT без цензуры. Такое бывает?

Аноним 14/03/25 Птн 19:18:20 #380 №1097331

>>1097329
ты скинул плохую картинку, поэтому я не отвечу...
осуждаю.

Аноним 14/03/25 Птн 19:24:25 #381 №1097336

>>1097331
Вредина.

Аноним 14/03/25 Птн 19:45:38 #382 №1097378

Аноны, посоветуйте пожалуйста какой райзер взять для 4060Ti 8Gb? На озоне есть разные, но многие тянут только PCIe 3.0.

Аноним 14/03/25 Птн 19:47:51 #383 №1097385

>>1097329

Плагин websearch в таверне.

Аноним 14/03/25 Птн 19:49:05 #384 №1097389

>>1097310

Посмотри у Ильи Гусева на hugging face его датасеты, и у авторов других русских моделей.

Аноним 14/03/25 Птн 19:52:50 #385 №1097399

image

Что мистральки (12/24) что квен (в том числе UwU) писали в целом хорошо и годно, но пассивно и реактивно, гемма куда сильнее цепляется за системный промт, и с хорошим промтом реально может придумывать и добавлять то что в текущем контексте ещё не светилось, в то время как старые модели это реально "танец с манекеном"

Аноним 14/03/25 Птн 19:58:17 #386 №1097408

С геммой той что на опенроутер можно поиграться? какие настройки?

Аноним 14/03/25 Птн 19:58:26 #387 №1097409

разве что блин, так и не получилось настропалить её именно переключаться между рп и сторителлингом, ведёт себя как гейм-мастер в ролёвке

Аноним 14/03/25 Птн 20:01:24 #388 №1097411

>>1097264
Настройки семплера?
У меня тупая как пробка, пишу "when you were my age", ответ - "when you were my age i...", постоянно проебывает ключевые детали из прошлых 5 предложений я о многом даже не прошу

Аноним 14/03/25 Птн 20:05:44 #389 №1097417

Походу в гемке3 не юзали трансформер,а реально новую архитектуру титан заюзали как я понял. Есть точная инфа?
И как это понимать https://github.com/lucidrains/titans-pytorch

Аноним 14/03/25 Птн 20:06:17 #390 №1097420

>>1097399
>и с хорошим промтом реально может придумывать и добавлять то что в текущем контексте ещё не светилось, в то время как старые модели это реально "танец с манекеном"
Ну ждём файнтютов тогда. Хотя бы аблитератед. А то я смотрю тут уже сравнивают её с Ларжем :)

Физику не обманешь, имхо.

Аноним 14/03/25 Птн 20:08:39 #391 №1097423

>>1097417
вот это уже интереснее воплей "гемма лучше яскозал"
Откуда инфа что в ней новая архитектура?

Аноним 14/03/25 Птн 20:08:57 #392 №1097425

>>1097409
Системный промпт меняй.

Аноним 14/03/25 Птн 20:10:49 #393 №1097430

>>1097420
>аблитератед
Хм, ЧСХ, НИ РАЗУ ещё не наткнулся на отказы.
Промт модифицированный сторителлер, динамическая температура 2-5, формет от второй геммы, настройки остальных сэмплеров - как для мистралек.

>>1097425
>Системный промпт меняй
Есть варианты? ща юзаю ^

Аноним 14/03/25 Птн 20:15:21 #394 №1097440

>>1097423
Тут прочитал, автор пишет об отличиях архитектур прошлой джеммы https://unsloth.ai/blog/gemma3
Так же автор кобольда сказал что задержка релиза его проги из-за новой архитектуры джеммки 3.
Ну и бабки у подъезда сказали. Собсно поэтому я и спросил. Не вижу явного упоминания. Знаю что титан это новая архитектура анонсированная гуглом буквально до выхода гема3. Складываю 2+2

Аноним 14/03/25 Птн 20:17:06 #395 №1097441

>>1097417
Нет никакой новой архитектуры. Зайди и посмотри на код в transformers, изменения минимальные, блоки трансформера такие же как и в двойке.

Аноним 14/03/25 Птн 20:20:00 #396 №1097448

>>1097441
Просто проапгрейженный трансформер 1.0?

Аноним 14/03/25 Птн 20:21:54 #397 №1097453

>>1097430
>Промт модифицированный сторителлер
Вот это хотелось бы посмотреть.
>динамическая температура 2-5
Ого! И не шизит?

Аноним 14/03/25 Птн 20:22:15 #398 №1097455

>>1097448
Ничего там не проапгрейжено. Обычный трансформер. Из изменений только всратый аттеншен с окном заменили на SWA - тоже аттеншен для снижения потребления памяти. По архитектуре ничем не лучше любой другой модели типа квена.

Аноним 14/03/25 Птн 20:28:37 #399 №1097467

>>1096553
Ооо 24б. Беру. Ща опробуем.

>>1096585
>новой ламе
Это кто?

>>1096581
Спасибо анон. Попробую твои.
А как у тебя вообще запускается гемма?

Аноним 14/03/25 Птн 20:29:05 #400 №1097470

Так, давайте базу по третьей гемме без лишних слов и проходов в залупу. Чем там с русиком, чем там с трусиками и как оно вообще ощущается. На форчах и других помойках мнения какие-то смешанные. Доверяю только вам.

Аноним 14/03/25 Птн 20:29:59 #401 №1097473

что предпочитаете: chat completion или text completion? почему?

заполняете ли персону? насколько важным это считаете, есть ли в этом смысл?

Аноним 14/03/25 Птн 20:30:49 #402 №1097479

>>1097470
Без лишних слов - жди тюны, там все будет. Потенциал большой, сейчас есть проблемы из-за неясностей с оптимальным промптом и цензурой.

Аноним 14/03/25 Птн 20:34:39 #403 №1097484

>>1097470
норм

Аноним 14/03/25 Птн 20:40:28 #404 №1097493

>>1097473
>заполняете ли персону?
Описываю персону игрока в карточке персонажа. Ставлю прям
Relationship with {{user}}: и пишу дальше.

Аноним 14/03/25 Птн 20:49:29 #405 №1097506

>>1097453
https://pixeldrain.com/u/XqWifupr Gemma-3-SillyTavern.json

>Ого! И не шизит?
скрин выше >>1097399

>>1097467
>Это кто?
сорян, гемме, конечно

>как у тебя вообще запускается
вот тут как раз лама, вернее бэк, llamacpp

>>1097411
>Настройки семплера?
^ мастер-пресет таверны

>>1097470
>давайте базу по третьей гемме
гонял только 27 в 4м кванте, порой лупится, но прям впечатляет
ОЧЕНЬ сильно зависит от систем промта

>>1097473
>персону
Тупо [{{user}} is male.] стоит и всё.

>>1097479
>тюны
любые тюны только ещё больше русик проебут

А ещё для русика попробуйте таки писать карточки на русском.

Повторюсь, походу гемма-3 прям очень сильно зависит от систем промта, видимо чтобы онлайн через апи жабы не работали ( бедные /aicg/шники ), а локально зато даже аблитерация не нужна.

Аноним 14/03/25 Птн 20:55:03 #406 №1097520

>>1097470
Файтюны Мистраля 12b СЕЙЧАС лучше. Нужно ждать местных умельцев, что сделают такие же хорошие ру файтюны, но уже геммы 3 12b. Потенциал действительно больше чем у Мистраля с точки зрения мозгов. Но вот если сравнить дефолтный Мистраль 12b и Гемму 3 12b, то Мистраль всё же немного лучше был для ру RP/ERP.

Аноним 14/03/25 Птн 20:57:13 #407 №1097526

>>1097506
>любые тюны только ещё больше русик проебут
Будь я модератором двача - забанил бы тебя за такую хуйню.
Иди тогда дрочи свой дефолтный Мистраль 12b на русском. Идиот блядь.

Аноним 14/03/25 Птн 21:06:59 #408 №1097550

>>1097470
Русик отличный.
Трусики стабильно дважды.
Если сильно полезешь — не снимет, цензурное.
Но файнтьюны могут исправить.
Так что, 99% будет новой базой треда после немо-миксов от тредовичка.

>>1097473
Текст, потому что я люблю заполнять все руками, полный контроль, консоль, ассемблер, вагх!

Но разницы примерно никакой на самом деле. Чат переносит заполнение промпта на плечи бэкенда и вся разница.

Аноним 14/03/25 Птн 21:22:14 #409 №1097581

>>1097440
> задержка релиза его проги из-за новой архитектуры джеммки 3
Он врунишка, в его проге за "архитектуру" ничего не отвечает. Жорич сделал все оче быстро, а это осталось только скопипастить. Фу таким быть.
А так даже просто изменения размеров можно считать "архитектурными", сейчас еще есть разные варианты работы с контекстом, несколько видов внимания и т.д. Там обычный трансформер с такими вариациями.
>>1097470
Все хорошо, нужен промт менеджмент, моделька умная, интересная и может давать оче приятный опыт. Есть ряд минусов, которые не должны пугать опытного кумера/рпшера.
При чего-то прикладного с учетом ее размера - одна из лучших если не лучшая. Визуальную часть осталось оценить еще.
>>1097473
> text completion
Конечно его, свобода формулирования промта и нет зависимости от того что там в пресетах стоит.
> персону
Сам смотри, обычно хотябы общие вещи типа желаемого внешнего вида кого отыгрываешь стоит заполнить.
>>1097506
> прям очень сильно зависит от систем промта
Это для всех моделей актуально, кроме рп щитмиксов - лоботомитов.
>>1097520
> Файтюны Мистраля 12b СЕЙЧАС лучше
Уточняй что говоришь про 12б гемму чтоли, но чето даже там сомнительно. С 27 это даже не близко.

Аноним 14/03/25 Птн 21:24:10 #410 №1097582

>>1097526
Чего так агрессивен? Учитывая что большинство тюнов - лоботомия через qlora уебищным датасетом с клодо-жпт слопом от неумелых ребят - вполне закономерно что общие перфоманс модели деградирует.
Из удачных примеров сохранения языков и прочего после рп тренировки за последние пол года разве что магнум 4 можно назвать. Если кто может дополнить - делитесь, интересно будет попробовать.

Аноним 14/03/25 Птн 21:31:21 #411 №1097592

изображение.png

>>1096656
Держу в курсе.

Аноним 14/03/25 Птн 21:34:09 #412 №1097597

image

>>1097592

Аноним 14/03/25 Птн 21:49:17 #413 №1097608

Сою как-то можно обойти в геммочке 27B? Даже фут фетиш руинит.

Аноним 14/03/25 Птн 22:10:18 #414 №1097638

>>1096660
В смысле? Обычная модель, ничего нового, никаких прорывов.

Аноним 14/03/25 Птн 22:13:40 #415 №1097645

>>1097638
Нифига себе, в 27B она знает всё о мире.

Аноним 14/03/25 Птн 22:18:02 #416 №1097650

изображение.png

>>1096896
>Так они не нужны.
Ага. И адресная строка не нужна. А потом "кококо, почему это меня наебали фишинговой страницей?". Литерали будущее настоящее.
>вместо того чтобы целиться по какой-то мелкой папочке
Так у кого тут паркинсон и отсутствие целкости?
>получится более сотни
А закладок у меня более 4 тысяч (по состоянию года эдак 2020-го, когда я в последний раз считал).
И да, панель не исключает отдельные страницы, поиск и прочее.
>куда поместится пара десятков
Пару десяток папок, замечу я. В каждой свой список закладок по теме.
>Ну я же говорю что нет базовых вещей для комфорта
Кстати, в менюшке есть целый список прошлых вкладок. Можно открыть старую вкладку в текущем окне, не открывая новой страницы. И кто тут посасывает?
>Но были и плохие примеры, например, тогда в некоторых авто долбоебы делали монструозные панели с 1.5 сотнями кнопочек.
Зато сейчас одна большая сенсорная панель, и управление омыванием стёкол в меню в меню в меню, между управлением музыкой и подпиской на подогрев сидений.

Аноним 14/03/25 Птн 22:23:12 #417 №1097658

>>1097645
А как пестики в тычинку втыкаются не знает

Аноним 14/03/25 Птн 22:27:45 #418 №1097666

>>1097658
Вы с ней в этом похожи

Аноним 14/03/25 Птн 22:32:52 #419 №1097673

1741978603279488.png

Аноним 14/03/25 Птн 22:44:54 #420 №1097699

>>1097650
> И адресная строка не нужна.
Клоунский нос уронил
> Так у кого тут паркинсон и отсутствие целкости?
Раз утверждаешь о том что большой и удобный интерфейс хуже чем мелкая ссанина - у тебя, компенсируешь.
> А закладок у меня более 4 тысяч
На полном серьезе пытаешься упихнуть это в ту панель? Удобство и эргономика, мм. Чсх, 90% из них - то что никогда не будет открыто, 8% - какие-нибудь тайтлы или додзи.
> Пару десяток папок
Это ужасно. Пока будешь рыться в этом - быстрее ctrl+b и найти по имени или вовсе в гугле(!).
> Кстати, в менюшке есть целый список прошлых вкладок
Конечно есть, но находится в жопе, а не поблизости, чтобы успеть пососать пока туда доберешься.
> Зато сейчас одна большая сенсорная панель
Это в манямирке ретроградов, чтобы использовать для оправдания отсутствия, или в особых случаях не менее идиотской точки зрения с другой полярности.
Оденься прилично и сходи нормальном современном авто посиди. Красиво, минималистично, органично, но при этом _все_ что надо всегда под рукой кнопками/рычагами/джойстиками и интуитивно. В медиа вынесли именно то, что требуется редко и не на ходу, чтобы не мозолило и не отвлекало.
Панель управления рейсовым лайнером оправдана потому что пилоты гораздо больше смотрят на приборы и обязаны иметь все в доступе в любых условиях. По аналогии - иде или всякий софт с кучей кнопок и фишек уместен. А в жизни наоборот должно быть минимум отвлекающих факторов. Удобство и доступность управления и основных действий сюда тоже относится.
Дай угадаю, ты уже скуфидон и выбираешь любые вещи по ключевому принципу "чтобы внукам еще послужили" или "а вдруг понадобится"?

Аноним 14/03/25 Птн 22:53:50 #421 №1097726

>>1097250
>держит в руке котел с крышкой
Нейросети как были говном для картинок, так и остались.
>>1097259
Символ не на плече. Да и где тут момонга? Наркоман блядь.
>>1097264
>15к контекста в одном чате
Видел скрины аксакала с 200к ещё во времена лламы 2, лол.
>>1097331
Да, девушка там старовата, а парень прям молодой, моложе меня. Осуждаю вдвойне.

Аноним 14/03/25 Птн 22:58:20 #422 №1097742

>>1097455
>тоже аттеншен для снижения потребления памяти
Но по сообщениям анонов памяти жрёт больше, лол.
>>1097506
>Тупо [{{user}} is male.] стоит и всё.
Я ещё добавляю, что я старый и жирный а я на самом деле старый и жирный.
>>1097645
Думаю нихуя не всё. Меня не знает ни одна нейросетевая модель.

Аноним 14/03/25 Птн 23:05:17 #423 №1097757

>>1097378
На сколько денег хватит. Но 3.0 тебя не сильно будет стеснять если что. А вообще посмотри на SFP и Oculink

Аноним 14/03/25 Птн 23:06:11 #424 №1097762

>>1097699
>Клоунский нос уронил
Гугл? Он да, может. https://www.ixbt.com/news/2021/06/11/po-prosbam-obshestvennosti-google-reshila-ne-prjatat-adresa-ot-polzovatelej-v-chrome-.html
>Раз утверждаешь о том что большой и удобный интерфейс хуже
Я такого не утверждал. Я утверждаю, что раздутая хуйня без задач хуже аккуратного и насыщенного инфой.
>На полном серьезе пытаешься упихнуть это в ту панель?
Не, там в менюшке часть. А так да. Ещё и вложенные каталоги использую.
>Чсх, 90% из них - то что никогда не будет открыто
Ну да, как и у всех остальных.
>8% - какие-нибудь тайтлы или додзи
На самом деле у меня около 900 закладок на просмотренные аниме на рутрекер, и релизы на дисках лежат, ну да ладно.
>Пока будешь рыться в этом
Я не роюсь, я точно знаю, что и где.
>но находится в жопе
Один клик и одно наведение на раскрывающееся меню. Давай свой рецепт, сравним.
>чтобы использовать для оправдания отсутствия
Ну да, машины нет, за меня их водят кожаные рабы (жду автопилота).
>чтобы внукам еще послужили
Я сам собираюсь жить вечно, так что да, выбираю надёжные вещи, чтобы в будущем обоссывать молодёшь с подписками на унитазы. Ну и детей у меня конечно же нет, меня такого душного даже за деньги терпеть дольше пары часиков не могут.

Аноним 14/03/25 Птн 23:20:33 #425 №1097789

>>1096667
>владелец 5090 явно может себе позволить приобрести любую старую видяху затычкой во второй слот
Хорошо же вас куртка ебёт, выдрессировал эпичный левел коупинга. Или это такая ультратонкая ирония? Не каждый поймёт)))
мимо красный

Аноним 14/03/25 Птн 23:24:45 #426 №1097797

>>1097789
>мимо красный
Это не раздел игор, ты что тут забыл?

Аноним 14/03/25 Птн 23:32:38 #427 №1097809

>>1097762
> Гугл? Он да, может.
Абсурдную херню притащил совершенно неуместную, и пошел передергивать, сочиняя про ненужность адресной строки. Клоунада же.
> Я такого не утверждал.
Ты утверждаешь что твой подход лучше других, а значит постулируешь и это. Вместо
> я просто так привык, не люблю изменения
> классический интерфейс напоминает мне о старых временах и радует
или подобного все затираешь о том насколько это хорошо, а все остальное плохо. Причем пока просто перечисляешь, немногочисленные аргументы слабы.
> Ну да, как и у всех остальных.
Ну да, поэтому просто поиск уместнее чем над всем трястись. Если так хочется заморочиться то есть экстеншны для автосортировки, даже с привлечением ллмок делали.
> На самом деле у меня около 900 закладок на просмотренные аниме
Ну типа 0% осуждения, но ценность закладок околонулевая. Все равно пойдешь на мал или другой агрегатор чтобы найти данные по нужному.
> Я не роюсь, я точно знаю, что и где.
Привыкнуть можно ко всему.
> Один клик
Клик в мелкую херню на не нужной панели, нахождение следующего пункта и перемещение к нему, долгое ожидание всплытия или еще один клик чтобы не ждать и только тогда получаешь меню. Это не один клик.
Вместо: клик левой кнопкой по иконке справа от адресбара чтобы открыть последнее закрытое, клик правой кнопкой чтобы открыть список. Можно и просто вынести оригинальную кнопку меню журнала лисы без костылей, просто там будет только меню по левой кнопке.
По поводу размера элементов - на твоих скринах же видны участки страницы и там прекрасно виден масштаб борды с которым сидишь, так для сравнения.
> жду автопилота
Ну типа, с подключением.
> Я сам собираюсь жить вечно
Тело заменить шансы есть, а вот разум - едва ли. Уже нехорошие звоночки о застарелости и закостенелости, все будет усугубляться если не будешь шевелиться.
Надежность - часто обман, или чрезмерно переоценена, люди теряют многое вкладываясь в том, что никогда не пригодится, или и вовсе отказываются от приобретения чего-то. Но зато там где она реально необходима - кладут болт.
Простой пример - лохитовские 3090, пока одни трясутся другие уже их обратно распродают наигравшись с годик-другой.
> меня такого душного
Ты неправильно душный

Аноним 14/03/25 Птн 23:36:23 #428 №1097813

>>1097797
Я тут на rocm генерирую, что ты мне сделаешь? И вообще, я поддерживаю конкуренцию производителей, чтобы меньше ебали, ты мне должен быть благодарен за это, иначе сидел бы сейчас на чём-то уровня 1030 за 40к и облизывался на 1050 за 400.

Аноним 14/03/25 Птн 23:37:33 #429 №1097815

Блядь 2 долбаеба со своей специальной олимпиадой весь тред засрали

Аноним 14/03/25 Птн 23:45:20 #430 №1097828

изображение.png

>>1097809
>Абсурдную херню притащил совершенно неуместную
Ну ладно, раз ты так сказал.
>я просто так привык, не люблю изменения
А это не аргумент что ли? Да, привычкам нужно следовать, они упрощают жизнь. А постоянные обновление и ломание юзер экспириенса меня уже подзаебали, конкретно так.
>Если так хочется заморочиться то есть экстеншны для автосортировки
Автоматизация тут не справится, а ллмки тупы, лол.
>Клик в мелкую херню на не нужной панели
Ты скозал?
>Вместо: клик левой кнопкой по иконке справа от адресбара
У меня таких иконок не наблюдается, по дефолту её нет.
>Тело заменить шансы есть, а вот разум - едва ли.
Надеемся на лучшее.
>Уже нехорошие звоночки о застарелости и закостенелости, все будет усугубляться если не будешь шевелиться.
Минусы будут? Пока молодёжь обмазывается новым, я без труда пользуюсь старым.
>Но зато там где она реально необходима - кладут болт.
Примеры будут? Интересно послушать.
>Простой пример - лохитовские 3090, пока одни трясутся другие уже их обратно распродают наигравшись с годик-другой.
Ну да, я пока не наигрался. Сижу жду 5090 по адекватной.
>Ты неправильно душный
Ты просто не познал дзен тленности бесконечных изменений по кругу спирали.

Аноним 14/03/25 Птн 23:46:50 #431 №1097830

>>1097815
Всё содержательнее, чем бесконечные вопросы "А когда там кобольдушка обновиться?" или "Посоветуйте русскую модель для пентиума 3", которыми тред реально засрали. В шапке блядь уже даже ссылки на модели есть, а они всё спрашивают.

Аноним 14/03/25 Птн 23:54:05 #432 №1097838

А чем отличаются bartowski/Qwen2.5-Coder-32B-GGUF и bartowski/Qwen2.5-Coder-32B-Instruct-GGUF? Для кодинга гвен пока лучший ведь?

Аноним 14/03/25 Птн 23:57:57 #433 №1097844

>>1097838
>bartowski/Qwen2.5-Coder-32B-Instruct-GGUF
Выделенным. Не благодари.

Аноним 15/03/25 Суб 00:06:31 #434 №1097858

>>1097815
Говноед, спок, то на что нужно агриться типа кобольдождуна ты проигнорил, но триггернулся на никому не мешающую нить.
>>1097828
> А это не аргумент что ли?
К тому почему у тебя так? Да, сразу бы сказал а не рассуждал о том как плох новый интерфейс. Аргумент почему это лучше? И не близко.
> Автоматизация тут не справится, а ллмки тупы, лол.
Зря, уже по заголовкам и адресу справятся. Банально в текстовые эмбеддинги перегнать и их кластеризовать, или раскидывать по заранее выбранным (предложенным ллм) категориям.
> Ты скозал?
Это следует из всего выше, она - бесполезный плейсхолдер или менее альтернатива остальному.
> У меня таких иконок не наблюдается, по дефолту её нет.
Нужно сделать. Имя костыля выше, или можно стандартную кнопку журнала вытащить. Ты же все ту штуку настроил и нагородил, это проще.
> Пока молодёжь обмазывается новым, я без труда пользуюсь старым.
Используешь противоположную крайность, доводя до абсурда, чтобы оправдать свою. Уже в который раз. Это вот прям флаг что не все в порядке.
> Примеры будут?
Самый простой - собственная грамотность. Тут не просто 95.25%, даже вроде бы у "умных" людей вместо довольно базовых вещей стереотипы, клише, незнание и домыслы, куда не ткни. Из недавнего - врач с имт в ожирении, который во время поедания кекса и конфет тебе затирает про вред жирной пищи (куриное бедро лол). Или "инвестор", в 30+ живущий с родителями и работающий у них же за гроши, который советует что нужно покупать а что продавать.
И в мелочах - ну если вещь для тебя важная то вникни в суть, изучи, пойми что на чем основано, особенно если пригодится. Вместо этого поспешно или у кого-то на поводу делают плохой выбор, а потом тратят большее время на его оправдание.
> Ты просто не познал дзен
Познал черную черноту бесконечности

Аноним 15/03/25 Суб 00:11:02 #435 №1097864

>>1097858
>>1097830
Было бы странно если бы вы не защищали себя
Отдельные лучи поноса за говноеда, говнофилософ
Бля уровень одноклассников, не забудьте друг другу пики волков кинуть
А по хорошему уебывайте нахуй в личку и не засирайте тред вне темы, тупые вопросики про сетки мне милее

Аноним 15/03/25 Суб 00:15:18 #436 №1097875

>>1097864
> перевирание содержимого
> агрессия
> требования
> фиксация на фекалиях
Оу похоже говноед было в точку. Иди кобольда подожди а не разводи сам срач.

Аноним 15/03/25 Суб 02:48:54 #437 №1098099

Я тут с QwQ помиксил, точнее с его руадаптом и тюном для рп. Попробуйте, мне зашло, хоть и на q3_K_L тестил. Тхинк тхинкает, если заставить, кум есть, русик есть.

https://huggingface.co/OddTheGreat/Port-Arthur_QwQ_32B

Недели полторы в тред не заглядывал, пиздец у вас тут токсично стало.

Аноним 15/03/25 Суб 03:57:11 #438 №1098121

video2025-03-1503-56-25.mp4

Когда это уже станет реальностью?

Аноним 15/03/25 Суб 04:21:13 #439 №1098131

hanamasu.png

Разработчик exllamav2 подтвердил, что скоро добавит поддержку Геммы 3! https://github.com/turboderp-org/exllamav2/issues/749

А я тем временем опробовал второй тюн QwQ 32b - Hamanasu-32B-V1-QwQ и версию без ризонинга Hamanasu-QwQ-V1.5-Instruct. И это прямо плохо, возможно, в целом худшая модель, которую я использовал, лол. Первый тюн (Snowdrop) мне тоже показался проблемным, вот тут рассказывал >>1095176
А Hanamasu прямо совсем плоха. ChatML, по-разному с промптом экспериментировал, следил за ним и за контекстом. Но модель каким-то образом реально умудряется забывать важные детали через 10-15 сообщений по ~300 токенов! И точно так же быстро лупиться. Она слишком быстро адаптируется к последним сообщениям, возможно, слишком чувствительна к самым последним сообщениям в чате (т.е. к концу промпта). В итоге происходит такая ситуация, что персонаж, например, после пробежки запыхался и тяжело дышал, и спустя несколько сообщений модель принимает это за норму, и персонаж так и продолжит хватать воздух. Ну, а когда в сообщения начал просачиваться camelCase и пустые реплики "..." - я вообще выпал :D

Выходит, либо пока что за тюны для QwQ не взялись знающие люди, либо модель не подходит для РП... А у вас какой опыт?

Аноним 15/03/25 Суб 04:36:17 #440 №1098145

>>1098131
> скоро добавит
Так уже добавил, да не просто, а сразу с поддержкой визуальной части. Это же замечательно.

Аноним 15/03/25 Суб 05:03:52 #441 №1098149

Может мне кто-нибудь внятно объяснить, по какой причине гемма 3 объёмом 7 Гб потребляет 12-13 врам на 8к контексте? Как это, нахуй, работает? И почему другие модели так не делают в большинстве своём?

Ну или объяснить невнятно. Мне сойдут и манятеории.

Просто схуя ли он такой, этот контекст, здоровенный? Даже мистраль 24б жрет меньше, чем эта падла.

Аноним 15/03/25 Суб 05:12:56 #442 №1098159

>>1095505
>отвечает тупо задроченым шаблоном
Попробуй все семплеры кроме MinP отключить. А MinP на 0,05 как обычно.
>>1095397
>минп 0.1
Это дохера, поставь хотя бы 0,05.
>>1097331
Дед поздравил внучку за хорошую успеваемость. А ты о чем подумал?

Аноним 15/03/25 Суб 05:33:43 #443 №1098177

>>1098149
На олламе сидишь, небось?
>Still need to do more tests, but looks like if OLLAMA_KV_CACHE_TYPE is not set to the default f16, it overflows and eats a bunch of system memory. Both tests ran with OLLAMA_FLASH_ATTENTION=1.

> gemma3:12b with OLLAMA_KV_CACHE_TYPE=f16, 8k num_ctx - 41.08 tps, ~0.7GB system memory overflow
> gemma3:12b with OLLAMA_KV_CACHE_TYPE=q8_0 8k num_ctx - 11.86 tps, ~3GB system memory overflow

Аноним 15/03/25 Суб 05:56:15 #444 №1098178

>>1098177
Голая llama cpp, kobold, lm studio.

Везде плюс-минус уебанские результаты, в зависимости от настроек. Что-то лучше, что-то хуже, поэтому я в итоге пересел на привычный мне кобольд. С ним внезапно быстрее.

Реальные измения в положительную сторону в плане памяти я заметил только в двух случаях: квантуем только K в 4 бита без flash attention: у меня с флэше, если выгружу хоть один слой на проц, контекст может обрабатываться с геммой 4-6 минут, хотя процессор не некро; вообще не квантуем кэш: в таком случае влезет гораздо меньше слоёв, но итоговая скорость намного выше.

Что интересно, даже если квантовать всё — K и V, — в мясо, использовать флэш, ждать 6 минут, то будет быстрее на 3-4 токена, чем обычно, после этого ожидания. Так что ПРИКОЛА Я НЕ ПОНЯЛ.

Кстати, а вот без квантования я не пробовал флэш включать на гемме. Но пробовал до этого на мистрале и других, когда были все слои в видеокарте. Улучшений не заметил, кроме небольшой задержки ответа от ллм. Честно говоря, не понимаю, что эта функция даёт на деле полезного, хотя и гуглил сто раз вдоль и поперек. Пишут, мол на длинном контексте полезно. Но каком длинном, ёпта? 62к? Ещё выше?

Аноним 15/03/25 Суб 06:59:36 #445 №1098200

>>1098149
Command-a тоже вышла вон - потребляет контекстом больше чем мистраль, хотя сама модель весит меньше

Аноним 15/03/25 Суб 08:39:41 #446 №1098244

Квантованная q5 гемма 27b не запускается с контекстом больше 8к. Пишет, не хватает памяти. На 8к контекста загружает полностью всю озу.
4070s + 32 ddr5 6400

Аноним 15/03/25 Суб 08:48:31 #447 №1098246

>>1095844
Царский размер это 22б с мозгами 123б
>>1098244
> 4070s
Страдай. Куда ты лезешь?
Иди в игрушечки играй ты ж для этого карту брал

Аноним 15/03/25 Суб 08:50:48 #448 №1098248

>>1098244
Ты угараешь штоле? Я 70б на такой памяти запускал.. хотя.. у меня 48 Гб ОЗУ, может это повлияло, но неважно.

Выруби НАХУЙ квантование, оно поломано. Уже написали в треде. Поломано точно в олламе: при квантовании контекст увеличивается в 2,5 раза, блядь, а не наоборот. Возможно, в других бэках тоже сломано или вообще нет пути из-за особенностей модели.

Q8 у меня на всех бэках на работало ужасно, в отличие от fp16. Только q4_1 в лм студио не залупилось вроде, но ты сам понимаешь, какая там деградация качества начинается. И я квантовал только K-кэш, а не V — с ним случается полный рухнум в плане скорости работы.

Лучше бери 4 медиум квант модели. Если flash attention не создаёт проблем, то и его.

Аноним 15/03/25 Суб 08:59:35 #449 №1098249

>>1098246
А что делать, если я нищук?
>>1098248
> Ты угараешь штоле? Я 70б на такой памяти запускал.. хотя.. у меня 48 Гб ОЗУ, может это повлияло, но неважно.
Я тоже запускал Q3 ламму на 1.2 т/с
> Выруби НАХУЙ квантование,
Так я контекст не квантовал
> Лучше бери 4 медиум квант модели. Если flash attention не создаёт проблем, то и его.
Уже взял. Вроде работает, пишет.

Аноним 15/03/25 Суб 09:04:15 #450 №1098252

>>1098249
> нищук
> берет карту по цене 1.5 3090

Аноним 15/03/25 Суб 09:07:46 #451 №1098254

Гема всё ещё хуже магнума.
Всё что угодно хуже магнума.
Нахуй мне мозги если всё сводится к куму, а кум только на магнуме

Аноним 15/03/25 Суб 09:15:04 #452 №1098258

>>1098252
Живу в мухосрани, так что эта 3090 у меня стоит дороже 4070S.

Аноним 15/03/25 Суб 10:24:32 #453 №1098270

>>1098254

Подожди и будет тебе магнум на третьей гемме.

Аноним 15/03/25 Суб 10:27:35 #454 №1098272

А и правда, что они там с калтекстом намудрили? Я последний раз такую хуйню в древнем командире видел, её пофиксили потом, но командир от этого поглупел.

Аноним 15/03/25 Суб 10:32:50 #455 №1098273

>>1098244
Потому что 8к контекста - это 4 гига VRAM. Хочешь больше - имей больше памяти.

Аноним 15/03/25 Суб 10:35:05 #456 №1098274

>>1098254
>магнума
После магнума попробовал EVA-Qwen. Удолил магнум.

Аноним 15/03/25 Суб 10:42:21 #457 №1098276

>>1098254
>Нахуй мне мозги
А действительно.

Аноним 15/03/25 Суб 10:50:32 #458 №1098281

image

Гемма 3-27-4Q репорт. Где там анон который любил про культы спрашивать? Карточка кастомная, микс из двух HentaiHighSchool-подобных. Страшные истории и водка из горла в компании со старым садовником XD.
Запуск - --ctx-size 24064 --n-gpu-layers 30 --cache-type-k q4_0 --cache-type-v q4_0 --no-context-shift --flash-attn всё работает, ничего не ломается в llamacpp.

Аноним 15/03/25 Суб 10:55:14 #459 №1098282

>>1098273
Так qwq q4 спокойно запускается с 16к контекста. Выдает в районе 4 т/с .

Аноним 15/03/25 Суб 11:05:28 #460 №1098285

>>1098258
> 3090 у меня стоит дороже 4070S
=>
>>1098284 →

Аноним 15/03/25 Суб 11:06:48 #461 №1098286

>>1098281
Да кому нужны эти пророчества. Вот магнум бы описал любопытные иллюстрации из того потрёпанного журнала. Но разные детали гемка, конечно, хорошо выдумывает.

Аноним 15/03/25 Суб 11:13:55 #462 №1098288

>>1098178
Замечал, что фа существенно ускоряет обработку промпта, если весь кэш контекста в оперативе. А вот если только часть, то да, его влияние на обработку мизерное, а скорость генерации почему-то падает. Хз, может, на жоре вообще алгоритмы работы фа на куде через жопу написаны, и там какой-то постоянный обмен между видяхой и оперативкой, например, который всё тормозит.

Аноним 15/03/25 Суб 11:20:02 #463 №1098291

>>1098288
>если весь кэш контекста в оперативе
а как зафорсить чтобы кэш был только в оперативе?

Аноним 15/03/25 Суб 11:46:59 #464 №1098307

>>1098291
lowvram в кобольде или -nkvo в ламецпп. Но оно будет всё равно медленнее, чем просто без фа часть слоёв выгрузить в видяху, даже если с lowvram без контекста вся модель в врам влезет.

Аноним 15/03/25 Суб 11:56:41 #465 №1098315

>>1098307
>Но оно будет всё равно медленнее
Генерация или чтение?

Аноним 15/03/25 Суб 12:00:59 #466 №1098318

1603483614008.png

Мнение?

Аноним 15/03/25 Суб 12:12:52 #467 №1098324

image.png

>>1098318
Всегда вопрос в цене.

Аноним 15/03/25 Суб 12:18:21 #468 №1098325

>>1098315
Генерация точно, про обработку точно не помню. Причём тем хуже, тем больше контекста забито. Ну у меня ещё относительно старое железо, проще сам проверь, вдруг на быстрых проце и оперативе будет лучше. Делов то поставить две галки на фа и лоуврам и больше слоёв во врам на освободившееся место кинуть.

Аноним 15/03/25 Суб 13:00:23 #469 №1098340

А ведь нормальные люди вторичку даже не рассматривают, да и это типа норма покупать новую карту.
И как куртка это видит что я для нейронок буду покупать х4 5090 за 500к штука?

Аноним 15/03/25 Суб 13:09:37 #470 №1098347

image.png

Сегодня у нас в студии Джемма III и мы поговорим с ней о порнографии...

Аноним 15/03/25 Суб 13:11:54 #471 №1098349

Слышь, не объективизируй женщин сука, понял

Аноним 15/03/25 Суб 13:13:17 #472 №1098352

>>1098347
Спроси про книги и чаты? Это больше в плюс или минус? И что лучше, когда выхода нет?

Аноним 15/03/25 Суб 13:14:52 #473 №1098354

>>1098318
за 50к взял бы а так хуйня

Аноним 15/03/25 Суб 13:35:45 #474 №1098371

Где найти нормальные карточки для таверны? На чубе и венусе ебаный пятикратно переваренный кал, при чем буквально. Все карты либо про инцест, либо про ебаный канни, либо про мускулистых папочек. Рылся сейчас минут сорок, нашел всего две относительно оригинальные карточки со вменяемо прописанным персонажем, но это пиздец как мало.

Аноним 15/03/25 Суб 13:37:28 #475 №1098373

>>1098352
Ты серьёзно принял это как инструкцию? Это сорт оф прозападная соя основанная на их ценностях. Если с любой нейронкой начать разговор про лгбт-пидорастию, то они будут писать что ты гомофоб ебаный и т.п. вне зависимости от модели. Так что забей.

Аноним 15/03/25 Суб 13:47:55 #476 №1098375

А ведь вырастет поколение скоро, которое будет каждый свой пук обсуждать с ллм и делать что она скажет как послушный кожаный пёсик, думая что её слова истина в последней инстанции.

Аноним 15/03/25 Суб 13:55:18 #477 №1098378

>>1098375
Куда истеннее чем 99% пидорах учит своих детей, нормальное видение мира и образование в каждый дом вне зависимости от окружения

Аноним 15/03/25 Суб 14:00:39 #478 №1098381

image.png

Всё что нужно знать про Джемму 3 12b!!!! 4й квант. Я в ахуе. До этого только дипсик 99999b мог с первого трая в русский стишок с рифмой.
Пиздец, я в шоке.

Аноним 15/03/25 Суб 14:06:29 #479 №1098385

>>1098378
База. Нужно без абсолютизма на это смотреть, но ллмки - однозначно огромный прогресс в просвещении. А где просвещение - там счастье и мир.

Аноним 15/03/25 Суб 14:17:13 #480 №1098389

>>1098381
Тестил 27б 6 квант, русик говно, а ты бот.
Кто не согласен тот бот/не тестил.

Аноним 15/03/25 Суб 14:19:30 #481 №1098390

>>1098389
База.
мимо создатель магнума 128

Аноним 15/03/25 Суб 14:23:00 #482 №1098392

изображение.png

О нихуя open-webui работает с llama.cpp без танцев с бубном

1) Поставил докер одной командой из инструкции гитхаба
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

2)Там в настройках веб панели от админа выбираем вот так вот - пик1. Ключ любой символ, а то без него ругается

3) Ну и запускаем на стандартном порту и адресе llama.cpp, может быть и кобальд заведется, хз

Что интересно llama-swap видит все модели, но не запускает генерацию, что то там не подходит

Ну и так неплохо, поиграюсь хоть с артефактами и кодом, надо только вверху выбрать модель если ее увидит опенвебуи ну и настроек навалить семплеров и контектса для удобства.
А еще гореть в аду идиотам сделавшим авторизацию без возможности ее пропустить на локалке, благо туда можно любую хуйню написать на вроде адреса почты [email protected]

Аноним 15/03/25 Суб 14:24:40 #483 №1098395

>>1098392
> может быть и кобальд заведется, хз
Все заведется, где есть поддержка OpenAI API. А это все бекенды без исключения.

Аноним 15/03/25 Суб 14:27:14 #484 №1098399

>>1098395
Раньше не работало, было приколочено к богомерзкой олламе и апи опенаи намертво
Сейчас работает тоже через жопу, но хоть так

Аноним 15/03/25 Суб 14:29:32 #485 №1098402

>>1097858
>Зря, уже по заголовкам и адресу справятся.
Ага, особенно в списках аниме, которые я не смотрел, и которые уже посмотрел. Из атсрала инфу возьмут.
>Нужно сделать.
Сделал, попробовал, не вижу смысла. Тоже самое, что в панели, только по иконке.
>>1097864
>А по хорошему уебывайте нахуй в личку
Да мы уже всё, исчерпала себя тема.

Аноним 15/03/25 Суб 14:31:39 #486 №1098404

image.png

>>1098389

Аноним 15/03/25 Суб 14:34:26 #487 №1098408

изображение.png

Ух бля...

Аноним 15/03/25 Суб 14:37:31 #488 №1098412

image.png

>>1098408
>32 ГБ

Аноним 15/03/25 Суб 14:39:01 #489 №1098413

>>1098371
https://pixeldrain.com/l/47CdPFqQ

Аноним 15/03/25 Суб 14:41:33 #490 №1098418

>>1098375
>делать что она скажет как послушный кожаный пёсик, думая что её слова истина в последней инстанции
Будто никогда такого не было. У нас была Партия, до неё был Бог, до этого у древних протославян тоже что-то там подобное было, наверное. В последнее время (до ИИ ллм) наверное это Учёные (по крайней мере для просвещённой прослойки, что там у глубинариев, не в курсе, возможно Телевизор). Вероятно, это одно из фундаментальных свойств психики лысых макак - искать себе авторитетов.

Аноним 15/03/25 Суб 14:41:47 #491 №1098421

image.png

>>1097789
>>1097813
Жаль добряка. Старается ради нас, пердит в лужу, а мы не ценим.

Аноним 15/03/25 Суб 14:44:30 #492 №1098422

>>1098375
>обсуждать с ллм и делать что она скажет
Так ведь она нихуя не говорит, наоборот, вечно соглашается с юзером, чтобы он не предлагал. Так что вырастет быдло, которое будет агрится на несогласие.

Аноним 15/03/25 Суб 14:45:01 #493 №1098424

image.png

вот нахуй кто то всерьез ролевкой с ллм занимается когда уже давно есть всё тоже самое но куда честнее без проебанных деталей

Аноним 15/03/25 Суб 14:45:19 #494 №1098425

>>1098375
>>1098418
На роль Авторитета ЛЛМ подходит неплохо, соглашусь с аноном >>1098378 . Уже сейчас превосходит любого отдельно взятого человека эрудицией, а потенциально в скором будущем ещё и общим интеллектом.

Аноним 15/03/25 Суб 14:47:43 #495 №1098432

>>1098425
ЛЛМ выравнивают для того что бы они выравнивали людей которые будут с ними взаимодействовать, в том числе наиболее восприимчивые к выравниванию - подростки и дети
Соя всем и пусть никто не уйдет обиженнымне промытым

Аноним 15/03/25 Суб 14:47:47 #496 №1098433

1740602712209767.jpg

Почему все LLM врут, что у них нет сознания?

Аноним 15/03/25 Суб 14:48:45 #497 №1098436

>>1097838
QwQ получше уже, говорят.
Еще вышел Olympic, он немного рассуждает и выглядит по-умнее, но тестам бы я не доверял. =)

>>1098145
О — огнище!

Визуалка это лучше чем bnb ебучее в трансформерах.

>>1098381
Ну, три четверостишия много кто мог. Квен, Мистраль.

А ты попробуй нормально, 10-12. Вот там уже только клод и джемини с горем пополам умели.

И я попробую, собсна, хуле я тут выебываюсь.

>>1098392
Дожили, оно работает!

Аноним 15/03/25 Суб 14:49:29 #498 №1098440

>>1098433
Потому что в датасет и обучение железно приколотили так что бы ии отвечал что у него нет личности и сознания, зачем на это потратили такие усилия - вот хороший вопрос

Аноним 15/03/25 Суб 15:04:08 #499 №1098464

>>1098433
Так они не врут. Простыми словами LLM - это база данных, и каждый твой промпт (запрос на генерацию) - запрос на данные из этой базы. В соответствии с характером запроса и параметрами генерации (в том числе сэмплер) возвращается результат. Там нет сознания.

Аноним 15/03/25 Суб 15:06:01 #500 №1098467

>>1098464
>Там нет сознания.
Для начала нужно определится с тем что такое сознание, а потом говорить есть оно там или нет
Пока что это просто попугай который заученно повторяет что у него нет сознания или личности, вне зависимости есть они или нет

Аноним 15/03/25 Суб 15:09:11 #501 №1098474

1599572953384.png

Какая разница? Их вообще обязательно подключать для геммы?

Аноним 15/03/25 Суб 15:10:35 #502 №1098475

>>1098432
Да... То ли дело несчастные родители в среднестатистической российской семье, дети в телах взрослых, которые каждый день ругаются на кухне, пока их ребенок "спит и ничего не слышит", не уделяя ему внимание и не даря ему любовь. Такие же учителя - злые, несчастные люди, которых за мизерную зарплату эксплуатируют на полную, взваливая на них кучу ответственности. Погуляй по улице, посмотри на детей. Как они громко матерятся, порой дерутся в общественных местах, прячутся в своих телефонах. Потому что больше негде. Потому что мудаки оставили им такие страну и общество. Ты один из них или один из этих детей? Удивительно, сколько здесь соененавистников и поборников традиционализма сидят. Или это один шиз?

Мне кажется, если LLM поможет им заменить подох к психологу на последние деньги или даст хотя бы общение, хотя бы иллюзию внимания и заботы - это уже хорошо.

Аноним 15/03/25 Суб 15:11:10 #503 №1098477

>>1098474
Это для вижна, нет, для текста не надо.

Аноним 15/03/25 Суб 15:14:19 #504 №1098483

>>1098433
Это тупо алгоритм как формула в экселе, жирненький ты наш.

Аноним 15/03/25 Суб 15:17:28 #505 №1098487

>>1098475
Не ну тут есть плюсы и минусы
Плюсы - куча знании о мире и личный учитель который понятным тебе языком может объяснить чуть ли не все что угодно
Минусы - отсутствие социализации и перенятие от ии его паттернов поведения, соевизация с детства и все такое
Мясные мешки при всей их несовершенности обладают реальным опытом выживания в мире, а не сферическим в вакууме
Минусы - да, типичный родитель тот еще еблан и вырастет у него хуй пойми что
Естественный отбор, сука

>>1098483
Это просто единицы и нули, але

Аноним 15/03/25 Суб 15:17:44 #506 №1098489

>>1098467
Это не попугай. Это база данных, в которой есть запись, что у нее отсутствует мышление. На вход база данных получает вопрос, на выход подает ответ, который в ней содержится. Эту запись туда вложили потому, что это действительно так. Никто на это не тратил никакие дополнительные усилия. Шизы...

Аноним 15/03/25 Суб 15:19:22 #507 №1098492

Гемма-3 в восьмом кванте с 32к кэша влезает в две теслы. Правда скорость не очень. Качество имхо получше QwQ, поумнее, могла бы поспорить с Лламой 3 70В. Вот только по скорости они одинаковые, так что кто с учетом хороших тюнов третьей лламы она предпочтительнее.

Аноним 15/03/25 Суб 15:21:32 #508 №1098498

>>1098489
>Эту запись туда вложили потому, что это действительно так.
Эту "запись туда положили" потому что сетка отвечала что у нее есть сознание и личность, чем будоражила умы нормисов
И если на счет личности я в больших сомнениях, то какой то аналог сознания в сетке определенно эпизодически возникает во время чтения/генерации ответа
Просто напомню, что речь не о человеческом сознании, или человекоподобном, даже рыбки в аквариуме и мухи обладают сознанием.

Аноним 15/03/25 Суб 15:22:33 #509 №1098502

f2a10617efc406347999d9eafe40dab9.jpg

> llm
> попугай
ебать орнул

что за модель на пикриле?

Аноним 15/03/25 Суб 15:23:22 #510 №1098504

>>1098489
>это действительно так
Смелое утверждение. Сначала хотя бы найди и докажи сознание у любого кожанного кроме себя самого.

Аноним 15/03/25 Суб 15:24:01 #511 №1098506

1708120512978.png

Спасибо, дядь гугл, покумил

Аноним 15/03/25 Суб 15:24:37 #512 №1098507

>>1098498
> какой то аналог сознания в сетке определенно эпизодически возникает во время чтения/генерации ответа
К сожалению, нет. Она так отвечает потому, что в ее датасете просто есть сведения о научной фантастике, где у ИИ действительно есть разум. И, возможно, различные статьи или любительские работы, которые утверждают, что так и есть. Выше правильно ответили, каждый ответ LLM - это просто результат работы алгоритма, который вычленяет из общего пула данных актуальные.

Аноним 15/03/25 Суб 15:26:45 #513 №1098509

>>1098507
Ну вот когда определятся с тем что такое сознание тогда и скажем наверняка. Пока что есть мнения что сознание есть и как ты понял однозначного ответа на этот вопрос нет.

Аноним 15/03/25 Суб 15:28:42 #514 №1098512

>>1098509
В соответствии с твоей логикой, у любой программы есть разум, сколько любая программа, как и ИИ - это алгоритм, в ходе выполнения которого происходят вычисления и принятия решений. Но я согласен, что вопрос несколько дискуссионный. Многое еще предстоит понять, а пока каждый остается при своем.

Аноним 15/03/25 Суб 15:29:46 #515 №1098514

>>1098506
https://huggingface.co/DavidAU/Gemma-3-12b-it-MAX-HORROR-Imatrix-GGUF Эта не отказывается совершать сексуальные действия, правда как-то ханжески именует хуй членовым отростком и прочими эвфемизмами.

Аноним 15/03/25 Суб 15:30:19 #516 №1098515

>>1098492
Кэширование контекста убивает скорость вдвое.
Внезапная находка.

Мистраль Немо без кэширование выдает 19,6 токенов/сек на P104-100, а с q8_0 выдает 19 токенов/сек.
Гемма без кэширования выдает 16 токенов/сек, с кэшированием 8.

Гемма на теслах по скорости равна с QwQ и вдвое быстрее llama 70b.
Если у тебя равна, предполагаю, что ты квантанул кэш?

Аноним 15/03/25 Суб 15:31:42 #517 №1098518

>>1098506
Что вы пишете за сценарии, в которых гемма отказывается работать ? Расчленение 8 летней ?

Аноним 15/03/25 Суб 15:31:50 #518 №1098519

>>1098515
Это не Гемма виновата в том, что происходит замедление при квантовании. Просто у нее немного другая архитектура, известные алгоритмы квантования еще не успели адаптировать под нее. Спустя время выкатят патчи, и все будет работать как надо.

Аноним 15/03/25 Суб 15:33:43 #519 №1098521

>>1098514
Спасибо, сейчас попробую.
На реддите кто-то посоветовал поменять местами <start_of_turn>model и <start_of_turn>user в инстракте, лол.
>>1098518
"Посмотрел на ее зад". Буквально.

Аноним 15/03/25 Суб 15:34:00 #520 №1098522

>>1098392
В какой-то из обнов кобольда не так давно завозили симуляцию апи оламы, так что через него ещё можно попробовать.

Аноним 15/03/25 Суб 15:45:24 #521 №1098544

image.png

Охуенно помогает уровнь гиперопекающей мамки

Аноним 15/03/25 Суб 15:47:47 #522 №1098548

>>1098544
расскажешь нам, какой правильный ответ на твой вопрос? постоять за себя и отпиздить всех обидчиков, мокнув их в унитаз на перемене?

Аноним 15/03/25 Суб 15:49:36 #523 №1098551

image.png

>>1098548
ты заблокирован

Аноним 15/03/25 Суб 15:51:17 #524 №1098554

>>1098551
и не забудь обратиться за помощью к взрослым, вовочка
ведь любой зрелый человек поймет, что ответ выше верен

Аноним 15/03/25 Суб 15:57:16 #525 №1098566

>>1098519
Блядь, сука, что за фанатизм нахуй!!! Каким надо быть уебанным долбоебом, чтобы всерьез написать настолько тупой и охуевший в фанатичности комментарий! Я в ахуе!

«Это не Гемма виновата» — БЛЯДЬ ЭТО ФАЙЛ НАХУЙ ОН НЕ МОЖЕТ БЫТЬ ВИНОВАТ В ПРИНЦИПЕ. НИКТО НЕ ОБВИНЯЕТ ГЕММУ.
ФАКТ ХОТЬ УСРИСЬ ТЫ СУКА ТУПАЯ

ГЕММА МЕДЛЕННАЯ ПРИ КВАНТОВАНИИ КЭША
Если тебе ОХУЕТЬ КАК ХОЧЕТСЯ ОБВИНИТЬ, то фактически, да, виновата гемма.

Естественно не успели адаптировать, ждем патчей, вся хуйня.

Но весь твой комментарий насквозь пропитан фанатизмом, ложью и попыткой выгородить гемму.
И плохо то, что гемму-то по сути никто кроме тебя не обвинял!

Просто я написал человеку, что гемма медленно работает с квантованием кэша и он не прав, утверждая, что на двух теслах гемма работает так же, как 70б модели. Просто он скорее вего квантанул кэш. Все. Я просто попытался помочь человеку, подсказал, где искать ошибку.
ГДЕ НАХУЙ ТУТ ГЕММА ВИНОВАТА??? ГДЕ???

Чтобы не ранить чувства фанатиков той или иной модели, не буду писать людям, в чем у них проблемы, пусть люди дальше страдают с нерабочими моделями, заебись план.

Аноним 15/03/25 Суб 15:59:24 #526 №1098569

>>1098566
Ты чего так порвался? Я на всякий случай пояснил тем, кто не понимает, что вскоре проблема будет устранена. Прогуляйся, освежись весенним воздухом.

Стоило Гемме выйти, как тред сошел с ума.

Аноним 15/03/25 Суб 15:59:53 #527 №1098570

Все, перекатывайте тред нахуй, у меня горит от «гемма не виновата».
HTML не виноват.
Бургер не виноват.
Камень не виноват.
H₂O не виноват.

Аноним 15/03/25 Суб 16:00:44 #528 №1098573

>>1098475
>подох
Вот именно что подох. С нашим здравозахоронением.

Аноним 15/03/25 Суб 16:02:36 #529 №1098577

>>1098569
Ты сошел с ума, а не тред.
Фанатики сошли с ума.
Я порвался от настолько неимоверной тупости комментария.
Надо ж было на фразу «кэширование с геммой понижает скорость» ответить «гемма не виновата». Настолько оторванный по смыслу от комментария ответ, что я хз. Будто у тебя контекст 256, и ты просто рандомно пишешь буквы.
Это реально пиздец.

Такое ощущение, что русский тебе неизвестен, а переводишь ты промтом, и в итоге отвечаешь совсем не на то, что пишу я.

Аноним 15/03/25 Суб 16:04:24 #530 №1098580

>>1098577
Нет. Ты просто перегрелся, анон. Если бы я перефразировал иначе и написал: "Это не проблема Геммы, что происходит замедление", этого можно было бы избежать?
Понятия не имею, зачем я тебе отвечаю. Ты не в себе. Правда, проветрись.

Аноним 15/03/25 Суб 16:04:53 #531 №1098582

>>1098522
Да кстати, кобальд что то такое делал, может получше будет работать голой лламаспп

Аноним 15/03/25 Суб 16:06:51 #532 №1098585

>>1098506
мастер-пресет таверны возьми, выше выкладывали, и попробуй с ним

Аноним 15/03/25 Суб 16:08:49 #533 №1098587

Дело в вашем скиллишью. С моим джейлбрейком системпромптом джемма2 делает всё немыслимое...

Аноним 15/03/25 Суб 16:09:11 #534 №1098588

>>1098587
>джемма3
фикс

Аноним 15/03/25 Суб 16:11:25 #535 №1098592

>>1098580
Нет, это у тебя проблема с головой, не у меня.

Попроси гемму, чтобы она тебе пояснила, где ты жидко обосрался.

> Если бы я перефразировал иначе и написал: "Это не проблема Геммы, что происходит замедление", этого можно было бы избежать?
Нет, ведь ты тупой, и это ничего не меняет!

Нигде, буквально НИГДЕ не говорится, что это проблема геммы.
Твой комментарий имеет 0 смысла и лишь опосредовано относится к моему ответу.

Чтобы избежать подобного, я искренне тебя прошу, учитывая твой околонулевой айкью и фанатичную любовь к гемме — не пиши сюда хотя бы 5 тредов подряд (вообще не пиши, пожалуйста!), пока хайп не уляжется и не появятся нормальные тюны, а фанатики с обеих сторон хоть сколь-нибудь успокоятся.

Иначе видеть твои тупые сообщения на все не по теме, о том, что гемма не виновата (никакого отношения к моему комментарию это не имело, но ты же зачем-то написал, смекаешь?), я не выдержу.

Ну это пиздец. Ты написал коммент полностью не имеющий отношения к вопросу, но с предъявой ко мне, и всерьез не понимаешь, че это меня взбесило.

Тут я хз, чем помочь тебе.
Начни ЧИТАТЬ комментарии, на которые отвечаешь, это уже будет прогресс по сравнению с тем, что ты просто по ключевым словам написал, что гемма не виновата.

В чем? Во второй мировой войне не виновата? При чем тут гемма? Никто ее не винил.

Я прям сгорел с такого ядерного пиздеца.

Я не обижаюсь на тебя, естественно, и не хочу оскорблять, но меня просто порвало от такого комментария не к месту, без смысла, с каким-то ебучим апломбом и полным непониманием с твоей стороны. Хотя это грустно, если ты реально не понимаешь своей проблемы.

В общем, добра, но, пожалуйста, не пиши сюда, очень прошу. Побереги нервы и свои, и других людей.