>>330851709 (OP) Используй меньшие модели, нет смысла огромные использовать и нет смысла вот так вот в чате, используй агентов кодовых, mistral/claude/qwen code cli, настраивай и будет заебись, а если не устраивает, ну поставь себе дома серверную с титанами и используй нахуя ток
>>330852769 Чувак я незнаю, мне опеннемо хватает когда не пользуюсь апишкой сторонней, потести пробуй разное, каждый же по своему все делает, ну я думаю тут параметров меньше, должно лучше работать
>>330851709 (OP) Не пользуюсь лмстудией, но ты выставлял офлоад экспертов? В любом случае на ollama должно работать лучше с той же моделью. Также у тебя памяти мало в целом и возможно модель вообще дрочилась через файл подкачки (тут хз, поскольку трудно сделать выводы исходя из графика доступа к диску).
Символ в секунду