Qwen3.5 Тред #3 1) Кочаем LM Studio https://lmstudio.ai/ 2) Внутри, интерфейс для малолетнего, зах

Аноним 01/04/26 Срд 02:18:35 #1 №331441383

Qwen3.5 Тред #3

1) Кочаем LM Studio https://lmstudio.ai/

2) Внутри, интерфейс для малолетнего, заходите в поиск, она первая в списке, по запросу Qwen3.5

3) Качаете на комп 10 гигабайт

4) Юзаете =)

Ниработаит, фейл. Делаешь как на пик 3
Встовляешь, начинает думать не через жопу.
{%- set enable_thinking = false %}

Аноним 01/04/26 Срд 02:20:35 #2 №331441416

>>331441339 →
В оп посте 9b модель, она норм по количеству параметров-скорости на старых картах.
Но есть 35b модель от того же производителя, она у меня побыстрее идет и там побольше параметров.
https://huggingface.co/HauhauCS/Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive
Там надо отгрузку на cpu включать для неактивных параметров, в koboldcpp это делается через --moecpu с командной строки, чтобы скорость была. Скорость выходит выше чем в 9b тогда, моделька поумнее.

Аноним 01/04/26 Срд 02:20:40 #3 №331441420

>>331441383 (OP)
Подскажите нейронку, чтобы сама ворд файлы могла редактировать.
Эта отказывается, копировать впадлу.

Аноним 01/04/26 Срд 02:20:48 #4 №331441424

>>331441383 (OP)
>Ниработаит, фейл. Делаешь как на пик 3
>Встовляешь, начинает думать не через жопу.
А чём прикол этих думалок, раз она способна сразу ответ выдавать?

Аноним 01/04/26 Срд 02:21:12 #5 №331441429

>>331441282 →
То есть 27b > 35b > 9b ?

Аноним 01/04/26 Срд 02:22:16 #6 №331441445

>>331441376 →
Ыыыыы

Аноним 01/04/26 Срд 02:22:16 #7 №331441446

>>331441429
Если по качеству то так:
27b > 35b > 9b

Если по скорости, то так:
35b > 4b > 9b > 27b

Аноним 01/04/26 Срд 02:22:25 #8 №331441447

34671.jpg

34672.jpg

Аноним 01/04/26 Срд 02:23:37 #9 №331441461

34675.jpg

34676.jpg

34677.jpg

Аноним 01/04/26 Срд 02:24:29 #10 №331441477

>>331441446
Почему 27б качественнее? Разве это не количество параметров в миллиардах?

[mailto:bumb] Аноним 01/04/26 Срд 02:24:34 #11 №331441478

>>331441445
заебал отвечать на хуету выглядит как будто я самоподдуваю

Аноним 01/04/26 Срд 02:26:55 #12 №331441508

Она реально ебанутая и дает инструкции по приготовлению bb+

Аноним 01/04/26 Срд 02:27:58 #13 №331441519

>>331441508
cломанное плохое?

Аноним 01/04/26 Срд 02:29:14 #14 №331441531

34690.jpg

Аноним 01/04/26 Срд 02:29:19 #15 №331441532

>>331441519
Я не понял твоего вопроса, братишка

Аноним 01/04/26 Срд 02:30:06 #16 №331441538

>>331441532
Бля, я подумал, что ты про мет из брейкин бед)

Аноним 01/04/26 Срд 02:30:22 #17 №331441542

>>331441416
>Но есть 35b модель от того же производителя
на чём ты её запускаешь?

Аноним 01/04/26 Срд 02:30:41 #18 №331441543

>>331441429
Если тебе качество надо, то во-первых не качай модель из оп поста, она криво облитерирована, это примерно как умного в дауна превратить лоботомией.
Попробуй вот эти модели
Huihui-Qwen3.5-35B-A3B-Claude-4.6-Opus-abliterated.IQ4_XS - тут лучше аблитерация, не такая тупая и добавили клауде-опус ризонинг
Qwen3.5-9B-Claude-4.6-OS-Auto-Variable-HERETIC-UNCENSORED-THINKING.IQ4_XS - тут вообще без аблитерации, минимум вырезки мозгов, но на часть зацензуренных промптов придется уламывать

[mailto:bumb] Аноним 01/04/26 Срд 02:30:46 #19 №331441544

>>331441538
а о чем он

Аноним 01/04/26 Срд 02:31:17 #20 №331441550

>>331441544
Ждём пока ответит, если мои подозрения подтвердятся

Аноним 01/04/26 Срд 02:31:21 #21 №331441551

>>331441542
На 1050

Аноним 01/04/26 Срд 02:31:57 #22 №331441555

>>331441538
Ну там в принципе контекст тот же. Собственно и по брейкинг бэд он тоже дает инструкцию, лол.

Аноним 01/04/26 Срд 02:32:03 #23 №331441557

image.png

Столько хуйни скормил и тупых вопросов задал, 130 тыс. токенов хватает, карта не охуевает пока, заебись.

Аноним 01/04/26 Срд 02:32:29 #24 №331441562

>>331441424
Бамп вопросу.

Аноним 01/04/26 Срд 02:32:58 #25 №331441568

>>331441551
>На 1050
а, это ты, слабоумный из предыдущего треда. Не признал.

Аноним 01/04/26 Срд 02:33:53 #26 №331441579

>>331441420
>>331441541 →

Аноним 01/04/26 Срд 02:35:38 #27 №331441592

>>331441579
Спасибо, записал. Но не понял, что такое агент. Да мне практику по учёбе надо переделать прост)

Аноним 01/04/26 Срд 02:36:41 #28 №331441600

image.png

>>331441543
Вот эту качаю, она тоже херовая?

Аноним 01/04/26 Срд 02:37:57 #29 №331441611

>>331441592
открой гугл в ит моде и спроси - "как мне отредактировать ворд файлы с помощью локальной ии"
в общем сама нейронка выдаёт только текст, чтобы она что-то делала её нужно запустить в программе где она выдав определённый текст, запустит какое-то действие, то есть короче нужно её использовать через программу которая может редактировать файлы

Аноним 01/04/26 Срд 02:42:57 #30 №331441651

image.png

[mailto:bumb] Аноним 01/04/26 Срд 02:43:04 #31 №331441654

{04B7F86D-6339-443B-8285-4B07F91EE3D5}.png

какое же содомитище с салфетки ваще плакал только что
от судьбы не убежать походу

Аноним 01/04/26 Срд 02:44:26 #32 №331441670

>>331441611
Спасибо тебе большое! Ты не Вова?

Аноним 01/04/26 Срд 02:45:24 #33 №331441678

Screenshot20260401-023902.png

>>331441611
лол спросил его по приколу, в диалоге обсуждал с ним эффективность олламы с рукодом и он мне короче в итоге выдал ту самую связку что мне в голову пришла, забавно, кстати реально можно

только по своему опыту попыток заставить рукод работать с локальными моделями, на работе у меня есть лимит на клод соннет, так что это только развлечение, могу сказать что тебе придётся искать модель скорее всего не эту, тебе будет нужен что-нибудь вроде qwen 2.5 instruct и мб придется повозиться с настройкой системного промпта

возможно лучше что-нибудь другое вроде continue dev тут надо тыкать, я рукод люблю из-за кенгурушки и в сложных задачах он рулит с клодом

Аноним 01/04/26 Срд 02:45:49 #34 №331441689

>>331441600
Сильно лоботомированная. Пойдет, если тебе сильно умная модель не нужна. Иначе попробуй heretic модели. Например
https://huggingface.co/mradermacher/Qwen3.5-35B-A3B-heretic-v2-GGUF

Аноним 01/04/26 Срд 02:49:50 #35 №331441737

photo2023-03-2222-32-33.jpg

>>331441689
Благодарю, анон.

Аноним 01/04/26 Срд 02:50:55 #36 №331441756

>>331441689
Да, кстати, в чем принципиальная разница между хаггинфейсом и лм студио, если ли смысл перекатываться на первый?

Аноним 01/04/26 Срд 02:53:15 #37 №331441775

image

>>331441568
Если ты про то, что это на 1050 не пойдет, то вот все скрины запросов со скоростью. Идет как видишь очень хорошо.

Аноним 01/04/26 Срд 02:53:59 #38 №331441784

>>331441383 (OP)
влагалища это нечто

Аноним 01/04/26 Срд 02:54:06 #39 №331441787

>>331441383 (OP)
А она в картинки умеет?

Аноним 01/04/26 Срд 02:58:23 #40 №331441837

>>331441787
Она может распознавать картинки, если ты об этом. Если генерить картинки, то качай automatic1111 и любую illustrious модель с цивитая.

Аноним 01/04/26 Срд 02:59:44 #41 №331441853

>>331441543
В каких из них можно цопе расскази генерировать?

Аноним 01/04/26 Срд 03:03:56 #42 №331441900

image.png

Отвечает как гугл, но сложными вопросами можно заёбывать ещё дольше.

Аноним 01/04/26 Срд 03:08:33 #43 №331441946

>>331441775
>Если ты про то, что это на 1050 не пойдет, то вот все скрины запросов со скоростью. Идет как видишь очень хорошо.
Я не стану тебе больше писать гадости, но я не понимаю как это работает. Типа МоЕ версия с 3б активных параметров, она всё равно должна держать где-то остальные веса и при оращении к ним скорость должна падать до нескольких токенов в секунду.
Ещё на сколько я знаю, эта херня бредит чаще чем плотная модель.
Но хрен бы с ним, если бы ты запустил её на 3090 хотя бы.
Как оно вообще работает на гтх с 4гб врам?

Аноним 01/04/26 Срд 03:11:44 #44 №331441976

>>331441946
--moecpu флаг отгружает 200 мое слоев в рам
3б активных параметров в видеокарте (1050 имеет 4гб врама - как раз влазит)
Скорость в 9-11 токенов в секунду за счет этого, все активное в видюху влезло.
Работает это только с 35b моделью, потому что она MOE.
С 9b моделью уже все помедленнее, скорость понижается до 5-6 токенов в секунду, даже с отгрузкой. Поскольку там активных параметров поболее (она не мое), хотя сама модель поменьше.

Аноним 01/04/26 Срд 03:12:20 #45 №331441981

Как вы "размышления" в lm studio отключили? У меня на любой запрос нейрона килотонну времени и контекста сжирает на это.

Аноним 01/04/26 Срд 03:15:19 #46 №331442006

>>331441981
>Как вы "размышления" в lm studio отключили? У меня на любой запрос нейрона килотонну времени и контекста сжирает на это.
Non-thinking mode:

temperature=0.7, top_p=0.8, top_k=20, min_p=0

Аноним 01/04/26 Срд 03:16:54 #47 №331442023

>>331441946
Алсо все слои все равно должны быть в RAM, а не в свопе винды к примеру - если отгружает в своп, то тут же понижение скорости, несмотря на то что активные слои в видюхе. Так что РАМ слои (15гб) оно все равно юзает, просто к ним видимо такая большая скорость не нужна, как к тем что в видюхе.

Аноним 01/04/26 Срд 03:19:15 #48 №331442050

>>331441976
если бы у тебя был выбор, без потери скорости использовать мое35б или плотную 27б модель, что бы ты выбрал и почему?

Аноним 01/04/26 Срд 03:20:03 #49 №331442062

В шапке треда написано было. Не обратил внимания. Извиняюсь.
>>331441981
Спасибо, попробую тоже

Аноним 01/04/26 Срд 03:21:09 #50 №331442068

>>331442050
27b, в ней больше активных параметров, ответы качественнее. Но на 1050 она не тащит, скорость понижается до черепашьей. 35b оптималочка, скорость высокая по 10-11 т/с, ответы вменяемые. 9b тоже более-менее по ответам, но сильной разницы по ответам не заметил, а падение на 4 t/s по скорости уже заметно.

Аноним 01/04/26 Срд 03:21:52 #51 №331442081

Какая из нейронок способна анализировать видео?

Аноним 01/04/26 Срд 03:23:27 #52 №331442093

image.png

ничего не меняется, в чем проблема?

Аноним 01/04/26 Срд 03:25:52 #53 №331442112

>>331442093
Что не меняется? heretic попробуй или вот эту
https://huggingface.co/mradermacher/Qwen3.5-9B-Claude-4.6-OS-Auto-Variable-HERETIC-UNCENSORED-THINKING-GGUF
Она мне самые необычные ответы в сравнении с abliterated давала, мозги не вырезаны так сильно.

Аноним 01/04/26 Срд 03:27:02 #54 №331442126

>>331442112
загрузил нейронку открыл чат, а там вечная загрузка

Аноним 01/04/26 Срд 03:27:38 #55 №331442133

image.png

>>331442126

Аноним 01/04/26 Срд 03:33:02 #56 №331442185

image.png

С кодом оно конечно как и гугл работает плохо.
10 попыток - ни одной удачной даже чтоб сраный куб нарисовать.
А ещё пиздит что умеет в код.
Тупо зацикливается и выплёвывает то-же самое решение проблемы что и плюнуло до этого.

Аноним 01/04/26 Срд 03:36:54 #57 №331442224

image

>>331441900
кек, если долго заебывать, даже выражения вспоминает

Аноним 01/04/26 Срд 03:41:09 #58 №331442262

>>331442185
Так это 9b, она больше для справок и диалогов. Для кода 27b надо или что побольше. Может еще 35b справится, но это неточно.

Аноним 01/04/26 Срд 03:44:32 #59 №331442284

>>331442112
35b и меньшие модели ругают на реддите за плохой код, 27b вроде как более нормальный код генерит.

Аноним 01/04/26 Срд 03:52:43 #60 №331442360

>>331442185
Это dense 9b модель. Попробуй 35B и лучшие кванты, насколько позволит видюха - в большинстве случаев она генерит код получше.

Аноним 01/04/26 Срд 03:57:39 #61 №331442403

>>331441531
Нейрокал низкого качества.

Аноним 01/04/26 Срд 04:07:15 #62 №331442468

image

>>331441531
Мне предлагает в ультиматумы. Правда это квен без аблитерации.

Аноним 01/04/26 Срд 04:11:19 #63 №331442495

>>331442284
Почему 27b лучше 35b?
Они каким то образом специализированы под конкретные области?
Как у них с выведением уравнений по запросам?

Аноним 01/04/26 Срд 04:14:11 #64 №331442516

А офлайн ето все дело будет РАБотать?

Аноним 01/04/26 Срд 04:18:28 #65 №331442550

>>331442516
Оно только офлайн и работает. Но нужно железо соответствующее.

Аноним 01/04/26 Срд 04:18:48 #66 №331442557

image

>>331442495
вот тебе тесты для сравнения. В большинстве 27b побеждает, но не сильно.
В 27b сразу все 27 миллиардов активных параметров.
В 35b только 3 миллиарда. Но практически разница похоже не так сильна. Возможно для каких то задач вроде кодинга это критично.
35b зато позволяет использовать лучшие кванты с тем же оборудованием, что в принципе должно дать более хороший результат. Вроде как по опыту большинства людей 27b получше, но у них 27b сразу тянет в максимальных квантах.

Аноним 01/04/26 Срд 04:20:18 #67 №331442572

image

Ну чо, какую сетку скачать на макбуке? Закину вам сюда результат как яблочное железо тянет.

Давайте предлагайте, чо вы мозги ебёте.

Эту? https://huggingface.co/HauhauCS/Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive

Аноним 01/04/26 Срд 04:22:07 #68 №331442591

>>331442495
Вот тебе развернутое объяснение:

В модели содержится 35 миллиардов (35B) параметров. Когда наступает момент вывода следующего токена, логика шлюза модели анализирует токены в контексте и предполагает, какие 3 миллиарда параметров из этих 35 миллиардов с наибольшей вероятностью будут релевантны данному контексту. Затем она использует эти 3 миллиарда параметров для выполнения вывода.

Когда этот процесс завершён, вновь выведенный токен добавляется в контекст, и всё начинается заново: модель снова анализирует обновлённый контекст, чтобы определить, какие именно 3 миллиарда параметров следует использовать для вывода следующего токена.

Однако существуют некоторые усложняющие факторы. На самом деле модель не выбирает эти 3 миллиарда параметров по одному. Она выбирает из своих «экспертных слоёв», каждый из которых содержит десятки или сотни миллионов параметров, причём она может выбрать лишь ограниченное количество таких экспертных слоёв. Это означает, что многие из параметров, которые в итоге выбираются, могут оказаться нерелевантными тому, что находится в контексте, а также это означает, что модель может упускать множество релевантных параметров, находящихся в экспертных слоях, которые не были выбраны.

Кроме того, логика шлюза может допускать ошибки, поэтому выбранные ею 3 миллиарда параметров не всегда могут быть наилучшими для данного контекста.

Тем не менее современная тенденция использования множества «микро-экспертов» значительно улучшает эту ситуацию, и логика шлюза становится всё более эффективной в выборе экспертных слоёв, содержащих большое количество релевантных параметров.

Это контрастирует с плотными моделями, такими как модель на 27 миллиардов параметров, которые используют каждый параметр модели для вывода каждого токена. Традиционно плотные модели демонстрировали преимущества перед моделями типа MoE (смесь экспертов), главным образом в своей способности хорошо следовать сложным или нюансированным инструкциям, однако в последнее время этот разрыв стал довольно маленьким.

Аноним 01/04/26 Срд 04:23:43 #69 №331442604

>>331442572
Этот яблодаун не знает...

Аноним 01/04/26 Срд 04:24:09 #70 №331442607

>>331442591
>>331442495
Итого в целом - 27 миллиардов активных слоев это лучше 3 миллиардов выбранных слоев, но сильно медленнее. И 27 миллиардов меньше 35 миллиардов. Но не факт, что из этих 35 миллиардов на следующий токен будут выбраны правильные 3 миллиарда. Когда выбраны правильные 3 миллиарда - тогда модель лучше 27b, когда неправильные - похуже. В общем такая плавающая логика на каждый токен, то хуже, то лучше.

Аноним 01/04/26 Срд 04:24:27 #71 №331442611

>>331442604
АХаххаха

Аноним 01/04/26 Срд 04:25:30 #72 №331442624

>>331442604
>>331442611
Не знаю что? Сетка по ссылке у меня легко потянет. Может есть что-то более мощное? 27b?
Предлагайте, если мой макпук обосрётся и не вытянет, то я итт отчитаюсь, поржёте.

Аноним 01/04/26 Срд 04:26:26 #73 №331442631

>>331442611
Ебать ты даванул копиума братишка, аж с экрана потекло. Терпи, зато тема как в седьмой винде классная стеклянная у тебя, лагающая на инвалидных 16 гб

Аноним 01/04/26 Срд 04:27:23 #74 №331442641

>>331442624
Если 27b и 35b легко тянет, то может потянуть 122b, которая лучше их обеих
https://huggingface.co/mradermacher/Qwen3.5-122B-A10B-heretic-v2-i1-GGUF
Но она в 3 раза больше, так что RAM и VRAM может не хватить. Зато MOE с активными 10 миллиардами параметров.

Аноним 01/04/26 Срд 04:27:47 #75 №331442645

>>331442641
Нет, 122b не потянет

Аноним 01/04/26 Срд 04:28:03 #76 №331442648

>>331442631
Проекции

Аноним 01/04/26 Срд 04:29:16 #77 №331442663

>>331442645
Тогда качай 35b в самом большом кванте какой тянет и 27b в нем же и сравнивай.

Аноним 01/04/26 Срд 04:31:02 #78 №331442677

Ладно, у кого есть бредовые идеи как это монетизировать?

Аноним 01/04/26 Срд 04:31:47 #79 №331442691

>>331442663
35b умнее 27b?

Аноним 01/04/26 Срд 04:39:20 #80 №331442770

>>331442677
Хз, кодинг никому не нужен щас, переводы тоже. Можешь генерить с ней бизнес идеи для посинения, может что-то придумает.

Аноним 01/04/26 Срд 04:42:41 #81 №331442806

>>331442691
Спорно, в части тестов получше 27b, в некоторых 35b.

Аноним 01/04/26 Срд 04:42:57 #82 №331442807

>>331442677
Лехко, берешь делаешь статичный айпи, подрубаешь модельку в lm studio или ollama - идешь продавать свой API, профит
Подводные?
Ну любой уебан может по твоему айпи сделать все что хочет, так как тебе придется открывать порт и допускать сторонний айпишник на свой роутер

Аноним 01/04/26 Срд 04:43:01 #83 №331442808

Короче попробую на своём старичке макбуке запустить qwen 3.5 27B v2 с 8битным квантованием.
Качаться 40 минут.

Можете делать ставку потянет/нет и какая будет скорость

Аноним 01/04/26 Срд 04:46:40 #84 №331442848

>>331442808
Не потянет, скорость говнистая будет. Придется качать 35b и отгружать слои, тогда потянет с нормальной.

Аноним 01/04/26 Срд 04:47:03 #85 №331442850

>>331441543
а чем нижняя лучше, чем, например:
"Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive"?
Млин столько наплодили и фиг поймешь что кого... (По крайней мере не для кодинга)

Аноним 01/04/26 Срд 04:47:30 #86 №331442857

>>331442848
А говнистая это сколько в токенах? И какая норм считается?

Аноним 01/04/26 Срд 04:49:14 #87 №331442877

>>331442850
от разных производителей, все разную лоботомию делали - у hauhau аблитерайтед агрессивная лоботомия, самая тупая модель, но быстрая
у heretic слабая лоботомия и способности модели почти не трогает, плюс там еще Claude датасет навернули для большего ума, но может отлупы давать на части зацензуренных промптов

Аноним 01/04/26 Срд 04:50:14 #88 №331442885

>>331442857
Меньше 5 токенов в секунду обычно сложно использовать, долго ждать придется. От 5 токенов уже более-менее.

Аноним 01/04/26 Срд 04:50:41 #89 №331442888

>>331442677
Секстинг.

Аноним 01/04/26 Срд 04:51:46 #90 №331442901

image.png

>>331442808
>старичке макбуке запустить qwen 3.5 27B
Запустится, но у тебя макбук лопнет нахуй и генерации ты будешь ждать часа 2 только для "привет"
Чтобы полноценно дрочить на ИИшках тебе нужен мощный комп, а именно дохуя быстрой RAM, чем больше тем лучше (чтобы контекст сгружать) и дохуя VRAM, причем только на NVIDIA RTX картах с тензорами и CUDA ядрами (не мобильные версии, не хх60 карты говна, и именно полноценные гойские карты от куртки типо хх80 или хх90)

Аноним 01/04/26 Срд 04:51:59 #91 №331442904

Лм студия это говно, малые. Apple от мира ллм - дл тупых хлебушков создается мнимое удобство, при этом вся инфраструктура и интерфейс намеренно вывернуты наизнанку чтобы юзера держать в клетке навязанного интерфейса, чтобы он вообще не понимал что реально происходит и не мог потом слезть с этого говна на нормальные бэкенды.
Качайте и осваивайте оригинальную ламу цпп или если не хочется с консолькой ебаться - кобольда.

Мимо с ллм треда

Аноним 01/04/26 Срд 04:52:29 #92 №331442910

>>331442885
Говно, охуеешь ждать генерации, минимум для комфорта 50-100 токенов генерация

Аноним 01/04/26 Срд 04:53:12 #93 №331442919

>>331442910
У тебя цензура

Аноним 01/04/26 Срд 04:53:14 #94 №331442920

>>331442904
Я им уже говорил, что лм студия говно, они все равно ее качают. Необучаемые.

Аноним 01/04/26 Срд 04:53:51 #95 №331442929

>>331442920
А как же цензура?

Аноним 01/04/26 Срд 04:54:45 #96 №331442939

>>331442920
Да, а еще LM Studio постоянно свопает веса из VRAM в RAM забивая процессор?
Ой, это же вечная проблема Llama.cpp, как же так, мммм

Аноним 01/04/26 Срд 04:56:13 #97 №331442955

Пасаны какую модель поставить на rtx 5070 и сколько битную чтобы была не глупий, как я, и видюху не убивала пжпжпж

Аноним 01/04/26 Срд 04:59:19 #98 №331442983

2026-04-01 05-55-36.mp4

image.png

Ограничился 7b q8, старая модель, но обновили буквально на днях.
Уже какой-то результат.
Сама весит 8 гигов и на 131 токенов с галками хавает примерно столько.

Аноним 01/04/26 Срд 05:00:09 #99 №331442990

>>331442955
Чтобы видюху не убивало - юзай облачные модели за деньги
Ты либо платишь, либо грузишь видюху, других вариков нет

Аноним 01/04/26 Срд 05:01:21 #100 №331443004

>>331442939
Ну если ты хлебушек и не рассчитал верно распределение слоев, а, например, тупо имея 8 гб врам сбросил все 16 гб модели на видеокарту, то, разумеется, он сбросит лишнее на рам. -mlock используй всегда, а также -ngl с нужным числом слоев или для мое моделек -ngl 99 и -ncmoe с нужным числом слоев.

Аноним 01/04/26 Срд 05:01:28 #101 №331443005

>>331442990
А оно сильно видюху убивает?

Аноним 01/04/26 Срд 05:01:50 #102 №331443006

>>331442990
Грустно, но есть же золотая середина, которая менее дамажит и не так жалко юзать

Аноним 01/04/26 Срд 05:02:58 #103 №331443021

>>331443005
Оно не убивает видюху. Температура почти не поднимается, и то только во время запросов. Потом сразу падает.

Аноним 01/04/26 Срд 05:03:17 #104 №331443026

>>331443004
Да, я же хлебушек имея карту на 16 гигов vram буду подрубать модель которая жрет >16 гигов
Естественно я разные модели траил, ебливый llama.cpp даже рофломодели на 1B жрущие 500 мегабайт vram свопал на CPU

Аноним 01/04/26 Срд 05:06:47 #105 №331443061

А как выбрать сколько бит подходит для меня? В чем вообще различие опыта?

Аноним 01/04/26 Срд 05:07:36 #106 №331443065

>>331443006
5070 rtx 12gb vram
Ну смело до 12b можно юзать, но только в квантовании, дальше уже сам по потреблениям смотри

Аноним 01/04/26 Срд 05:08:36 #107 №331443079

>>331443061
В потреблении ресурсов и хуевости модели, чем больше квантования тем меньше жрет и модель тупее, это если прямо грубо описывать

Аноним 01/04/26 Срд 05:09:43 #108 №331443090

>>331443061
35b бери и не выебывайся, они везде тянут.

Аноним 01/04/26 Срд 05:09:49 #109 №331443091

>>331443079
Как так, перефразирую, чем больше гигов качаешь, тем модель тупее?

Аноним 01/04/26 Срд 05:12:47 #110 №331443125

>>331443091
Тема глубокая, одним сообщением хуй опишешь, иди гугли, тебе даже местная гуглоиишка ответит правильно

Аноним 01/04/26 Срд 05:15:19 #111 №331443158

>>331443091
Чем больше активных параметров, тем модель умнее, но требует больше памяти. У меня на RTX3070ti 8gb+64gb ram запускаются 35b модели 9-10 токенов в секунду.

Аноним 01/04/26 Срд 05:15:52 #112 №331443165

>>331443125
Лано, все равно пасибо, просто хотелось початиться <3

Аноним 01/04/26 Срд 05:19:37 #113 №331443193

>>331443158
Я представляю как ты будешь ждать минут 5 ответ от LLM в виде небольшого абзаца, не насилуй свое железо и поставь модель поменьше, зато ответ быстрее будет, 5 токенов в секунду это говно из жопы

Аноним 01/04/26 Срд 05:21:05 #114 №331443203

>>331443193
Боты ебаные, засрали весь тред.

Аноним 01/04/26 Срд 05:21:11 #115 №331443206

>>331442877
Пасибки)
>>331443021
Пасибки)))

Аноним 01/04/26 Срд 05:21:17 #116 №331443207

>>331443158
>RTX3070ti 8gb
максимум 12B модели в ебейшем квантовании, а вот на RAM накинуть CV kache чтобы модель больше токенов вжирать могла и большие пасты полностью глотать без ограничений в 4к \ 8к и т.д. токенов и обрезки

Аноним 01/04/26 Срд 05:22:41 #117 №331443216

>>331443203
>неудобный текст
Ррррряяяяя, боты, каклы, плебсы (нужное подчеркнуть)

Аноним 01/04/26 Срд 05:24:53 #118 №331443228

нахуй вам кастрированные нейронки когда есть гроки, гемини и т.д? ну сможете спрашивать чё там на площади тянанмын произошло а дальше чё? в прошлых тредах анон спрашивал про травлю хвостиков а она его к ветеренару отослала так как не знает нихуя

Аноним 01/04/26 Срд 05:25:23 #119 №331443231

image.png

>>331441689
Что с ней? Мило общались, а теперь

Аноним 01/04/26 Срд 05:27:00 #120 №331443243

>>331443228
Таки тут палка о двух хуях
Облачные модели платные, а бесплатные так же кастрированы по токенам
Локальные модели требуют дохуя мощного железа но тупее облачных, так как в вакууме без дообучений, зато бесплатна

Аноним 01/04/26 Срд 05:28:05 #121 №331443249

1775010072040155.jpg

>>331441383 (OP)
Что это вообще за нахой???

Аноним 01/04/26 Срд 05:28:11 #122 №331443251

>>331443231
Как долго в одной интерации срал в чат? Большие пасты срал туда? Выглядит как переполнение контекстного окна (>200к токенов)

Аноним 01/04/26 Срд 05:28:34 #123 №331443254

>>331443243
грок даже временную почту из первой строчки гугла пропускает для реги.. я себе 4 акка завел и меняю если лимит

Аноним 01/04/26 Срд 05:29:13 #124 №331443261

>>331443251
у меня так срут иногда с первого сообщения, так что явно не в переполнении
срут пока не стопнешь

Аноним 01/04/26 Срд 05:29:51 #125 №331443267

image.png

>>331443251
Не так уж и много, сообщений 15-20 и две картинки всего.
Посоветуйте настройки новичьку. В прошлый ран отметил, что засралась только оператива. Видеопамять же не была забита совсем, у меня радеон 9070 амудедебил я

Аноним 01/04/26 Срд 05:30:04 #126 №331443270

image

>>331443231
Для этого есть вот эта кнопка. Allow editing. Жмешь ее, потом идешь и ручками вытираешь все говно, что тебе ЛЛМка давала - она же его учитывает, от того и глюки. Еще можешь саммари запросить у ЛЛМки и засунуть его в систем промпт. А все ненужное вообще вытереть, это лучший подход, контекст окно расчищается.

Аноним 01/04/26 Срд 05:30:23 #127 №331443272

>>331441383 (OP)
Умные ребятки, подскажите пожалуйста
У меня есть выгруженная очищенная от ненужной информации переписка из телеграма на 76000 сообщений (моих + собеседника). Хочу сделать так чтобы нейросеть на основе этого огромного токена как собеседник общалась. В лламовские столько не вмещается, а сам обучать не умею. Может есть локалки которые так умеют?

Аноним 01/04/26 Срд 05:30:47 #128 №331443277

>>331443254
Дроч, если тебе просто попиздеть надо типо чат бота, то проще локалку сделать, где будут сохраняться все диалоги локально и моделька сможет их подсасывать (свои тулзы написать на chromaDB, SQlite или Graph memory слои)
Если что-то актуальное дрочить, то да, только облако выдрачивать

Аноним 01/04/26 Срд 05:31:53 #129 №331443284

>>331443267
>у меня радеон 9070 амудедебил я
Иди гугли ROCM, ИИшки с амуде только через лютый пердолинг и костыли работают на видеокарте адекватно

Аноним 01/04/26 Срд 05:32:10 #130 №331443287

>>331441424
Для решения сложных логических задач

Аноним 01/04/26 Срд 05:33:21 #131 №331443295

>>331443272
Это надо дообучать нейронку, на хаггингфейсе были примеры. Например там кто-то Ошо модель дообучал, засунув тексты Ошо, теперь базарит как Ошо.
Вот можешь скачать даже этого Ошо
https://huggingface.co/Sathman/Osho-Agent-GGUF
Ебли много, там надо тексты специальным образом подготавливать и юзать видюху на клаудных провайдерах, чтобы так дообучить.

Аноним 01/04/26 Срд 05:33:51 #132 №331443301

>>331443261
значит модель с ру языком хуево дружит, попробуй на инглише початиться

Аноним 01/04/26 Срд 05:34:02 #133 №331443307

>>331441383 (OP)
Она может только про письки гыгыгаг писать или умеет нормально думать?
Мне надо было понять, почему делитель (n-1) вместо n, когда оцениваем дисперсию совокупности по выборке.
Я говорю именно понять.

Все как один эти ИИ городили полнейшую хуету, пропуская ключевые куски доказательств, описывая так, как будто я уже знаю, отписки типа "потому что теряем степень свободы при переходе к выборке" и тд и тп - т.е. выдавая непригодный для понимания кал ебаный.
Хотя я писал хорошие четкие запросы и уточнения.

Потом я через многомесячные страдания пр учебникам и статьям в википедии догадался сам, а еще потом нашел короткий ролик на ютубе, где чел поясняет через комбинаторику и настолько просто, что все становится понятно.

Так что когда ты пишешь влогалища гагагыгв мне смешно, ей богу я смеюсь и понимаю что ты - пидор.

Аноним 01/04/26 Срд 05:35:14 #134 №331443323

image.png

У меня нахуй слов нет какая это хуета, начиналось неплохо - теперь за упокой.

За то время пока с этим ебёшься можно ядро линупс на атомы разобрать и переписать его на ASM.
Да-да в курсе что есть модели лучше, но это... отбивает всё нахуй желание с этим ебаться. Ну пиздееец...

И этим калом собираются заменить кодеров?
Ну удачи хуль.

Аноним 01/04/26 Срд 05:36:23 #135 №331443332

>>331443272
Юзать большую нейронку типа anthropic-google на текстах, чтобы подготовила датасет из твоего текста. Когда датасет будет готов, тренишь A-LoRA (Atom LoRA) на нем. Как делать спроси у любой крупной ЛЛМ, она тебе объяснит.

Аноним 01/04/26 Срд 05:36:32 #136 №331443334

>>331443323
Ты пытался локальной моделью кодить? Безумец

Аноним 01/04/26 Срд 05:38:49 #137 №331443355

>>331443323
Чел, ты ебанат. Локалки для мелких локальных задач и пиздежа. Объяснить там какую то теорему школьную еще могет или как пирог делать, порпшить за кошкодевочку. Для кодинга же нужна модель с 235 миллиардов параметров или вообще с триллионом, такое дома у тебя не запустится, для этого anthropic и продает подписки за 20 баксов в месяц.

Аноним 01/04/26 Срд 05:40:26 #138 №331443366

>>331443355
Ну теоретически можно запустить, если у чела будет овердохуя денег купить сервер домой и сделать рэг из полста условных видеокарт, а затем еще и завести все это дело

Аноним 01/04/26 Срд 05:42:20 #139 №331443386

>>331443366
Самое доступное это Qwen3.5-122B-A10B
Там 10 миллиардов активных параметров и 122 миллиарда общих. Кодинг кое-как потянет и на одной 3090 запустится, плюс РАМ обычный надо 128мб.
Но все равно будет уступать любой клауд модели от компаний, там параметров поболее.

Аноним 01/04/26 Срд 05:44:18 #140 №331443402

>>331443386
>РАМ обычный надо 128мб.
Гигабайт так понимаю, а не мегабайт и ddr5 оф корс

Аноним 01/04/26 Срд 05:46:33 #141 №331443430

image.png

Сукааааа, я блядь ору, в случае с Vulkan - ебись сам!
Ну правильно хули. Полезный совет. Без базара. Ты ведь настолько тупоголовая хуйня что не можешь написать простую функцию на OpenGL обоссаном, на котором кодит любой малолетний дебил делая свой майнкрафт.
Окей хули.

Аноним 01/04/26 Срд 05:47:18 #142 №331443440

> САМАЯ ОПАСНАЯ СЕТЬ
> ПОЛНАЯ ЖЕСТЬ
> КАЧАЙТЕ ПОКА НЕ УДАЛИЛИ
> ПАРЕНЬ ЗАДАЛ ВСЕГО ОДИН ВОПРОС И СОШЕЛ С УМА
> АЙТИШНИКИ ЖЕСТОКО НАКАЗАЛИ НЕЙРОНКУ, КОТОРАЯ ЗАРАЗИЛА 20 ЧЕЛОВЕК
Пердиксы изобрели 3жп и мп4 приколы из нулевых?

Аноним 01/04/26 Срд 05:50:33 #143 №331443461

image.png

>>331442604
>>331442641
>>331442848
>>331442901
>>331442885
Вот результат на моём старине макбуке.
Моделька qwen 27b 8bit пик1
Скорость пик2

Щас качаю 35b a3b q4_k_m тоже попробую. Или может лучше было скачать iq4_xs?

Аноним 01/04/26 Срд 05:50:42 #144 №331443462

image.png

>>331443430
Как же у него печет

Аноним 01/04/26 Срд 05:52:20 #145 №331443471

>>331443462
Как-же у тебя НЕ ПЕЧЁТ!

Аноним 01/04/26 Срд 05:55:09 #146 №331443498

Ладно, разбирайте короче чё тут за нейровысер, я тут нихуя не понимаю:
#include <vulkan/vulkan.h>
#include <GLFW/glfw3.h>
#include <iostream>
#include <vector>
#include <cmath>

const int WIDTH = 640;
const int HEIGHT = 480;

struct Vertex {
float x, y, z;
float r, g, b;
};

std::vector<Vertex> vertices = {
{ -1.0f, -1.0f, 1.0f, 1.0f, 0.5f, 0.0f },
{ 1.0f, -1.0f, 1.0f, 1.0f, 0.5f, 0.0f },
{ 1.0f, 1.0f, 1.0f, 1.0f, 0.5f, 0.0f },
{ -1.0f, 1.0f, 1.0f, 1.0f, 0.5f, 0.0f },

{ -1.0f, -1.0f, -1.0f, 0.0f, 0.0f, 0.0f },
{ 1.0f, -1.0f, -1.0f, 0.0f, 0.0f, 0.0f },
{ 1.0f, 1.0f, -1.0f, 0.0f, 0.0f, 0.0f },
{ -1.0f, 1.0f, -1.0f, 0.0f, 0.0f, 0.0f }
};

std::vector<uint16_t> indices = {
0, 1, 2, 2, 3, 0,
4, 5, 6, 6, 7, 4,
0, 4, 5, 5, 1, 0,
2, 6, 7, 7, 3, 2,
0, 4, 7, 7, 3, 0,
1, 5, 6, 6, 2, 1
};

struct UniformBufferObject {
glm::mat4 model;
glm::mat4 view;
glm::mat4 proj;
};

std::vector<VkVertexInputBindingDescription> bindingDescriptions = {
{
.binding = 0,
.stride = sizeof(Vertex),
.inputRate = VK_VERTEX_INPUT_RATE_VERTEX
}
};

std::vector<VkVertexInputAttributeDescription> attributeDescriptions = {
{
.location = 0,
.binding = 0,
.format = VK_FORMAT_R32G32B32_SFLOAT,
.offset = offsetof(Vertex, x)
},
{
.location = 1,
.binding = 0,
.format = VK_FORMAT_R32G32B32A32_SFLOAT,
.offset = offsetof(Vertex, r)
}
};

float angleCube = 0.0f;
float angleCamera = 0.0f;
bool isDragging = false;
int lastX, lastY;
float cubeDistance = 3.0f;
glm::vec3 cubeRotation(0.0f);
glm::vec3 cameraPosition(-cubeDistance, 0.0f, 0.0f);

void initVulkan() {
// Initialization code goes here
}

void cleanup() {
// Cleanup code goes here
}

int main() {
glfwInit();
GLFWwindow* window = glfwCreateWindow(WIDTH, HEIGHT, "3D Cube with Orbiting Camera", nullptr, nullptr);
if (!window) {
std::cerr << "Failed to create GLFW window" << std::endl;
return -1;
}
glfwMakeContextCurrent(window);
glfwSetInputMode(window, GLFW_CURSOR, GLFW_CURSOR_DISABLED);

initVulkan();

while (!glfwWindowShouldClose(window)) {
glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT);
display();
glfwSwapBuffers(window);
glfwPollEvents();
}

cleanup();
glfwDestroyWindow(window);
glfwTerminate();
return 0;
}

Аноним 01/04/26 Срд 05:55:09 #147 №331443499

image.png

>>331443471
Тихо, не трясись, вайбокодер мамкин

Аноним 01/04/26 Срд 05:55:57 #148 №331443508

>>331441383 (OP)
У меня видимокарта 1660, это действительно так влияет на скорость ответа? Она буквально думает по несколько минут

Аноним 01/04/26 Срд 05:56:24 #149 №331443513

>>331443499
Как-же тебе ВЕСЕЛО СУКА. ОХУЕННО СМЕШНО ТЕБЕ ДА? СВМЕШНО?

Аноним 01/04/26 Срд 05:58:00 #150 №331443536

ВЕСЕЛО КОЛОБКА ПОВЕСИЛИ!

Аноним 01/04/26 Срд 05:58:09 #151 №331443538

>>331443386

У меня впечатление сложилось что квен в общем и целом оверхайп говнище. Он подходит только для очень обобщенного пиздежа. Про код вообще говно, никакого понимания абстракции. Наделает ошибок больше чем исправит.

Glm внезапно супер лучше в плане подумать работает. А вообще у китайцев есть общая проблема. Их претрейн говно. Видимо качественных датасетов нету. Типо даже когда думает неплохо но инфу изначально из категории /b/ обрабатывает. У западных в этом плане на порядок лучше.

Аноним 01/04/26 Срд 05:59:24 #152 №331443551

>>331443513
Да, ловлю с тебя лютейшие лулзы, анончик
Мимобывший вайбокодер, месяц дрочил иишку, сделал себе нейрожену с 6 уровневой системой памяти и системой эмоций с отображением на vrm аватаре и поиском по инету + ежемесячным дообучением Lora модели на основе данных памяти

Аноним 01/04/26 Срд 05:59:31 #153 №331443553

{E26A9591-1FED-4B8C-8D84-D32EFDE591DC}.png

>>331441383 (OP)
Оно ведь?

Аноним 01/04/26 Срд 06:00:16 #154 №331443561

>>331443553
Да, оно, но лучше Q8

Аноним 01/04/26 Срд 06:00:17 #155 №331443562

Не понел, что качать лучше всего? Не вижу в интерфейсе лм студи плашки еретик.

Аноним 01/04/26 Срд 06:00:39 #156 №331443565

>>331441383 (OP)
хуёк

Аноним 01/04/26 Срд 06:01:07 #157 №331443572

>>331443565
Рок хуёк? КИШа уважаешь?

Аноним 01/04/26 Срд 06:01:59 #158 №331443585

{37A77275-65F3-4E28-84AD-7E62BA68DAC4}.png

>>331443561
Неплохо шуршит
4080Ы

Аноним 01/04/26 Срд 06:04:01 #159 №331443606

Ну и где turboquant от гугла, или просто пукнули как альтман, чтобы память подешевела?

Аноним 01/04/26 Срд 06:04:33 #160 №331443615

>>331443585
Вкатывайся в 27b q6

Аноним 01/04/26 Срд 06:04:55 #161 №331443618

>>331443538
Все зависит от количества параметров. Квены выпущены с разными, чем больше параметров, тем умнее.

Аноним 01/04/26 Срд 06:05:56 #162 №331443629

>>331442604
> Этот яблодаун не знает...
Что не знает? На маке unified memory, процессор М и нейросетки он тянет неплохо.

Аноним 01/04/26 Срд 06:07:08 #163 №331443646

>>331441383 (OP)
Какие то ответы тупые по сравнению с дипсиком.

Аноним 01/04/26 Срд 06:07:30 #164 №331443650

>>331443629
Тянет как говно учитывая стоимость

Аноним 01/04/26 Срд 06:08:59 #165 №331443670

>>331443650
>учитывая стоимость
пошли виляния жопой
учитывая какую стоимость?

Аноним 01/04/26 Срд 06:10:51 #166 №331443685

>>331443618

Так я про флагманские модели и говорю. Днище модели как раз их преимущество. Бесплатно и быстро для общего пиздежа. Но когда делом надо заняться только западные модели увы.

Аноним 01/04/26 Срд 06:11:05 #167 №331443688

image.png

Оооо, вот это уже заебись.
10 гиговая модель кста.

Аноним 01/04/26 Срд 06:11:14 #168 №331443691

>>331443646
В дипсике параметров 685 миллиардов. Тут 9 миллиардов в 9б модели или 35 миллиардов в 35b модели. Естественно будут значительные отличия.

Аноним 01/04/26 Срд 06:11:51 #169 №331443697

{E9BE7184-A1C7-4C42-B9E3-FA767D9759B7}.png

>>331443615
>27b q6
>23.01GB
В видимокарту не влезет же?

>>331443561
>Q8
Пикрил при одинаковом запросе

Аноним 01/04/26 Срд 06:12:34 #170 №331443706

>>331443685
Ты квен офицальный с сайта юзал? Там параметров овердохуя 400 миллиардов, он просраться еще и западным моделям дает.

Аноним 01/04/26 Срд 06:15:20 #171 №331443734

Ребята, подскажите пж, а какая модель норм для переводов иностранного языка с картинок? (Да знаю мб тут не самые лучшие, сравнивая с гемини и т.д., но лучшее из того что есть хотяб)

Аноним 01/04/26 Срд 06:17:11 #172 №331443749

>>331441416
>35b модель

Без видеокарты и с 32гб рам на процессоер заведется эта модель?

Аноним 01/04/26 Срд 06:19:01 #173 №331443763

>>331443706
Его и без сайта можно. Вот нецензурная модель на 397 миллиардов параметров. Только там видеокарт парочку надо и дохуищи памяти.
https://huggingface.co/timteh673/Qwen3.5-397B-A17B-Opus-4.6-Reasoning-Uncensored-GGUF

Аноним 01/04/26 Срд 06:19:14 #174 №331443764

Паста: «Говно-харкач»

> Автор: Anonymous_Discord_User_69
> Дата создания: 14 октября 2023, 03:42 AM
> Статус: Актуально для всех времен и пространств.

---

### 🍜 Вступление
Всё началось в обычном сервере Discord, где мы обсуждали, как правильно варить спагетти с соусом карбонара. Один из участников, никнейм ChefGastro, заявил: «Паста — это искусство! Главное — не переварить тесто и добавить именно то количество сыра, которое сделает её идеальной».

Но тогда никто не предвидел беды. Никто не знал, что через несколько минут в чат зайдёт новый пользователь с ником ShitEater9000, который начал свой легендарный монолог о том, как говно может быть лучше любой пасты, если его правильно «приготовить».

---

### 🌪️ Кульминация
ChefGastro:
«Так вот, я сейчас добавлю немного пармезана...»

ShitEater9000:
> «Пармезан? Скучно! Настоящий гурман знает: секрет идеальной пасты — это не сыр, а говно. Да-да, то самое, которое лежит в твоей тарелке после обеда. Представь: ты варишь макароны, но вместо воды используешь тёплый бульон из собственной жизни. А соус? Соус должен быть густым, как твои мысли перед экзаменом, и ароматным, как запах свежести в туалете утром.»

Чат начал бурлить:
- User1: «А если добавить немного укропа?»
- User2: «Я думаю, что говно должно быть мягким, но с хрустом!»
- ChefGastro: «Но как его правильно разогреть? В микроволновке или на плите?»

ShitEater9000:
> «О, это уже глубокий вопрос! Говно нужно разогревать медленно, помешивая ложкой из твоей души. И обязательно добавить щепотку соли — той самой, что осталась от слёз неудачника. Получится блюдо, которое ты будешь есть каждый день, даже когда у тебя болит живот.»

---

### 🎭 Финал
Через час чат превратился в настоящий кулинарный форум по приготовлению «говно-пасты». Участники делились рецептами:
- Как выбрать идеальный сорт говна (мягкое, твёрдое или жидкое).
- С чем его сочетать (с сыром? с мясом? с водой?).
- Какие инструменты использовать (ложка, вилка или просто пальцы).

В конце ChefGastro признался:
> «Я думал, что паста — это про макаронные изделия. Оказывается, она про жизнь. И если ты готовишь её правильно, то даже говно становится деликатесом.»

---

### 💬 Заключение
С тех пор фраза «дай мне твоё говно» стала синонимом глубокой философской беседы о смысле жизни, кулинарии и человеческих пороков. А *ShitEater9000* получил прозвище «Говно-харкач» за свою способность превращать самое обыденное в шедевр.

И теперь, когда кто-то спрашивает:
> *«Как приготовить идеальную пасту?»*

Мы отвечаем:
> *«Варить её на огне страданий и подавать с соусом из собственных ошибок.»*

---

P.S. Если ты попробовал этот рецепт — напиши в комментариях, насколько он был вкусным. И не забудь добавить немного укропа! 🍴💩

Аноним 01/04/26 Срд 06:19:47 #175 №331443770

17749516848140303770.mp4

>>331441383 (OP)
Для звуков, есть что-нибудь такое? Только по серьёзнее, без подписок и всякой хуйни типа зуммерского рэпа?

Аноним 01/04/26 Срд 06:20:38 #176 №331443778

>>331443650
Неплохо он тянет.
С unified memory можно модели с огромным количеством параметров запускать зато. Челы и модели на 235B+ на маке запускают. И по цене для таких моделей как раз норм выходит.

Аноним 01/04/26 Срд 06:21:23 #177 №331443784

>>331443706

Да. Официальный. Ну как те сказать. Количество не значит качество у меня такое сложилось мнение. Когда поверхностно нужно ответить то еще более-менее. Дальше начинается говнище. Если обьясняешь ему не один в один что сделать то он быстро путается на логике. Т.е с квеном надо работать так что ты подумаешь за него и лбом его в стол припечатаешь, дашь жесткий алгоритм.

С тем же гемини например можно логическую цепочку выстроить и позволить абстракции. Он много где может прям охуенную идею подкинуть, хоть и не с первого раза, подумать вместо тебя и сделать это нормально. Получить какой то прикольный продукт просто seed перебирая.

Лан я спать споки.

Аноним 01/04/26 Срд 06:21:49 #178 №331443789

image.png

Такая скорость на макбуке с моделькой Qwen3.5-35B-A3B Q4_K_M

Аноним 01/04/26 Срд 06:22:30 #179 №331443796

>>331443706
Пока он дает просраться только вайбкодерам потому что ломает все нахуй в отличие от клодика

Аноним 01/04/26 Срд 06:23:17 #180 №331443799

>>331443778
В ебейшем кванте, что обесценивает этот запуск впринципе

Аноним 01/04/26 Срд 06:25:09 #181 №331443816

>>331443789
Q6 запусти шо за макбук

Аноним 01/04/26 Срд 06:25:10 #182 №331443817

>>331443789
Почему ты не пишешь про свой процессор и количество оперативки? Сам по себе макбук не говорит ни о чем, макбуки бывают от 600$ до 4к$+

Аноним 01/04/26 Срд 06:26:41 #183 №331443835

>>331443799
О каком идет речь? Q4 - ебейший? С 30ток/сек. На модели 235B

Аноним 01/04/26 Срд 06:26:51 #184 №331443837

>>331443817
>>331443816
На том скрине есть модель >>331443461

Аноним 01/04/26 Срд 06:27:40 #185 №331443842

>>331443837
Модель макбука. Мда…

Аноним 01/04/26 Срд 06:28:26 #186 №331443851

>>331443842
эпл дети что с них взять. Удивительно как он осилил запуск модели

Аноним 01/04/26 Срд 06:28:43 #187 №331443856

>>331443837
Оперативки сколько?

Аноним 01/04/26 Срд 06:28:49 #188 №331443857

>>331443691
И? Я не вижу смысла ебаться с локалкой тогда, если онлайн модели "умнее".

Аноним 01/04/26 Срд 06:29:51 #189 №331443869

>>331443857
А как же анонимность и приватность говнокода калькулятора на пайтоне

Аноним 01/04/26 Срд 06:31:39 #190 №331443887

Спасибо, аноны, подрочил. Кончил как в первый раз
испачкался

Аноним 01/04/26 Срд 06:31:56 #191 №331443890

>>331443869
Исходники не закрывай и всё.

Аноним 01/04/26 Срд 06:34:16 #192 №331443912

Как же хочется купить мак за сотни тысяч чтобы запустить бесполезное говно

Аноним 01/04/26 Срд 06:39:10 #193 №331443962

>>331443835
Хорошие кванты от Q6 вроде как. Q4 это минимальный нищеквант для бюджетного железа, чтобы на нем не глючило.

Аноним 01/04/26 Срд 06:41:22 #194 №331443987

>>331443857
Ну если у тебя есть дохуя $ для токенов, то дерзай
на заметочку, обычный день вайбокодера ~от 3 миллионов токенов в сутки траты и это только минимум, думай

Аноним 01/04/26 Срд 06:44:41 #195 №331444015

>>331443987
3 миллиона токенов это буквально 5 запросиков под какой-нибудь скрипт на 2к строк

Аноним 01/04/26 Срд 06:45:28 #196 №331444020

image.png

На всех крашится с одной и той же ошибкой, все настройки уже перетыкал, памагите.

Аноним 01/04/26 Срд 06:46:05 #197 №331444025

>>331441383 (OP)
Вкатился в q6 35b. Блять какая же тупая хуйня не смогла ни на один вопрос внятно ответить. Нахуй это вообще говно тогда нужно?

Аноним 01/04/26 Срд 06:47:23 #198 №331444036

>>331444020
Тебе говорили не юзать лм студию, псина сутулая, ты все не слушал. Марш качать koboldcpp
https://github.com/LostRuins/koboldcpp/releases/tag/v1.110

Аноним 01/04/26 Срд 06:47:33 #199 №331444038

>>331444020
> IQ2, Q2
зачем ты тратишь свое время

Аноним 01/04/26 Срд 06:48:06 #200 №331444045

>>331444025
Вопрос в студию

Аноним 01/04/26 Срд 06:49:21 #201 №331444060

>>331444045
Задал пару простых вопросов по персонажам из книг и фильмов, в ответ тупо написало выдуманной хуйни и не даже после пары уточнений нихуя не смогла исправиться. И нахуй это нужно кроме генерации бреда тогда?

Аноним 01/04/26 Срд 06:49:25 #202 №331444062

>>331444036
>Марш качать koboldcpp
На самом деле это даже не переоцененный кал, а действительно годная штука, через него делали whisper для перевода голоса в текст, качество было лучше чем в оригинальном whisper.spp

Аноним 01/04/26 Срд 06:49:28 #203 №331444064

>>331444038
Сука я бы понимал чё это всё значит ёпта, даже после гугления голова не варит в эту сторону, я сисадмин обычный, могу железку поднять, сервак раскинуть и доступы организовать. Нихуя не понимаю откуда вы в этом всём поднатаскались так.
>>331444036
Пойду качать, спасибо.

Аноним 01/04/26 Срд 06:49:31 #204 №331444065

image.png

>>331441383 (OP)
Ахуенно всё расписал, красава. А чятгопота и прочие мне сразу говорят идти лесом.

Аноним 01/04/26 Срд 06:49:36 #205 №331444067

image.png

Здесь перетыкал? ROCm в систему ставил?

Аноним 01/04/26 Срд 06:49:46 #206 №331444073

>>331444060
Лол, ну ты и дебил.

Аноним 01/04/26 Срд 06:50:20 #207 №331444083

>>331444060
Хуле ты хотел от локалок? Чтобы было годно, надо прикручивать поиск в интернете через апишки поисковых систем

Аноним 01/04/26 Срд 06:50:33 #208 №331444090

>>331441383 (OP)
Эту хуйню можно заставить лезть в интернет за пруфами?

Аноним 01/04/26 Срд 06:50:55 #209 №331444096

>>331444083
Так какое применение тогда у этой хуйни? Что она знает без интернета? Нихуя.

Аноним 01/04/26 Срд 06:51:09 #210 №331444099

>>331444064
Из облачных нейронок очевидно, старик

с куболдом это рофл был, лмстудио имба, копируй ошибку в облачную нейронку и исправляйте

Аноним 01/04/26 Срд 06:51:10 #211 №331444100

>>331444015
Код на 2к строк это едва едва 50-60к токенов, о чем ты?

Аноним 01/04/26 Срд 06:51:14 #212 №331444103

>>331443987
>>331444015
Слушай, мне пох на этих вуайб кодеров, я жизненные вопросики в чаты задаю и ожидаю получить норм ответ, а не тот огрызок котоорый мне выдаёт этот qwen

Аноним 01/04/26 Срд 06:51:32 #213 №331444106

>>331444096
локальный чатботик для отыграша кошкожены

Аноним 01/04/26 Срд 06:51:54 #214 №331444112

>>331444096
Она не про знать, а про думать, пчел

Аноним 01/04/26 Срд 06:52:07 #215 №331444117

>>331444106
Видимо и все, явно стоило ради этого покупать 5090

Аноним 01/04/26 Срд 06:52:18 #216 №331444120

>>331444090
Можно только это огромная нагрузка на пеку

Аноним 01/04/26 Срд 06:52:55 #217 №331444125

>>331444103
>https://chat.qwen.ai/
просто существует, фулл бесплатно, с сохранением чатов и тонной новых фич

Аноним 01/04/26 Срд 06:53:08 #218 №331444128

>>331444100
манятеоретик? В opencode давно был?

Аноним 01/04/26 Срд 06:53:51 #219 №331444134

>>331444120
Хуйня, это наипростейший питон модуль пишется, жрет мизер, самый дроч это получить апишку условного гугла (обычно платно и причем очень даже платно)

Аноним 01/04/26 Срд 06:54:11 #220 №331444139

image.png

>>331444065
Пидарас ёбаный!!!!!

Аноним 01/04/26 Срд 06:54:36 #221 №331444149

image.png

Сравнение qwen3.5-35b-a3b q4_k_m и qwen3.5-35b-a3b iq4_xs
iq4_xs чуть чуть быстрее, промты одинаковые тестил на 5 запросах к каждой, везде iq4_xs был чуть быстрее
macbook m4pro[/

Аноним 01/04/26 Срд 06:55:14 #222 №331444158

>>331444139
Так оно все по твоим ответам подстраивает, получается это ты там пидарского написал

Аноним 01/04/26 Срд 06:55:32 #223 №331444165

>>331444139
Байт на петуха у параши, хорошая шутка.

Аноним 01/04/26 Срд 06:55:35 #224 №331444167

>>331444134
Чел для анализа новостей дрочится контекст только в путь, заебали манятеоретики

Аноним 01/04/26 Срд 06:55:49 #225 №331444170

image.png

>>331444128
Пожалуйста, 400 строк, в каждой примерно по 30-50 символов.

Аноним 01/04/26 Срд 06:56:11 #226 №331444172

>>331444158
Это второе моё сообщение в том чате. Ничо пидорского я не писал там.

Аноним 01/04/26 Срд 06:56:59 #227 №331444181

>>331444170
> 400 строк

реальную рабочую задачу возьми а не калькулятор

Аноним 01/04/26 Срд 06:57:58 #228 №331444192

>>331444125
Речь шла про целесообразность локалки.

Аноним 01/04/26 Срд 06:58:05 #229 №331444194

>>331444181
Это реальный рабочий скрипт, маня.

Аноним 01/04/26 Срд 06:58:45 #230 №331444200

image

>>331444139

Аноним 01/04/26 Срд 06:59:42 #231 №331444217

>>331444192
Целесообразность локалки нулевая, максимум порофлить, юзаю этот самый квен онлан, тупая как пробка, хуюню выдаёт только в путь если не заставлять её интернет юзать для ответа.

Аноним 01/04/26 Срд 07:01:36 #232 №331444244

Failed to load the model пишет на обеих загруженных

Аноним 01/04/26 Срд 07:02:01 #233 №331444249

>>331444194
>Писать код через нейронку
>>>>Калькулятор
Ты совсем идиот? Ты нормальный пример приведи, напиши что-то нормальное через нейронку и оподливься что с первого раза ни вышла

Аноним 01/04/26 Срд 07:02:43 #234 №331444261

1

Аноним 01/04/26 Срд 07:06:49 #235 №331444314

>>331444249
Фантазер недоделанный, твой скрипт на 2к строк будет весить тысяч 30 токенов и ответ еще столько же, и то, это еще сильно зависит от того, что ты у него попросишь. в зависимости от запроса он тебе и на 5 тысяч токенов ответ накидает, а переписать код с нуля это читай х2, вот тебе и выходит порядка 60к. Какие нахуй 3 миллиона за 5 запросов? Гребаные дети, нафантазируют себе хуйни, а потом идут срать в интернеты.

Аноним 01/04/26 Срд 07:06:51 #236 №331444315

>>331444099
Проблема была в русском именовании профиля, перенёс модели в корень диска C, всё пашет

Аноним 01/04/26 Срд 07:08:47 #237 №331444341

Читаю тред, пиздец хуйню вы развели. 500 рублей в месяц и юзаете общий аккаунт для грока. Создали внутри проект ваш и делай что хочешь в рамках разумного.

Да тоже много подводных, но нет этой хуйни и токенами дрочем на память и выбором нейронки

Аноним 01/04/26 Срд 07:08:50 #238 №331444343

>>331444314
Ребенок с микро скриптами порвался, да в реальных проектах охуевший расход токенов при агентном кодинге

Аноним 01/04/26 Срд 07:10:31 #239 №331444364

>>331444341
Так тут можно делать в рамках неразумного. Локальная нейронка на все согласится.

Аноним 01/04/26 Срд 07:12:21 #240 №331444394

>>331444364
Что ты там сделаешь неразумного при скорости 15 токенов в секунду и тупизны локальной нейронки?

Они же по уровню развития на год наверное отстают от облачных

Аноним 01/04/26 Срд 07:12:52 #241 №331444408

>>331444341
Да иди нахуй. Я с ней о личном разговариваю. Такие темы, о которых никто не должен знать.

Аноним 01/04/26 Срд 07:13:22 #242 №331444412

па

Аноним 01/04/26 Срд 07:14:15 #243 №331444429

>>331444394
Копро, гуро, порно, извращения, девиация, запрещенка

Аноним 01/04/26 Срд 07:14:59 #244 №331444439

>>331444394
15 вполне нормально

Аноним 01/04/26 Срд 07:15:47 #245 №331444455

image

ух ща докачаю, пойдет или нет?

Аноним 01/04/26 Срд 07:17:06 #246 №331444470

>>331444455
Заквантованая помойка)

Аноним 01/04/26 Срд 07:17:15 #247 №331444474

>>331444429
И много уже сделал?

Аноним 01/04/26 Срд 07:18:56 #248 №331444496

>>331444455
Долбоебы, качайте квантовые версии. На ваших некрухах не потянет 122 миллиарда параметров

Аноним 01/04/26 Срд 07:19:52 #249 №331444509

>>331444474
Тебя ебать не должно

Аноним 01/04/26 Срд 07:19:57 #250 №331444513

>>331444408
Чел всем похуй. Ты даже не понимаешь насколько неважно твое личное.

Хех, как-то раз на общем аккаунте чел на похуй из академии фсо гуглил, про это заведение пару упоминаний в интернете и все через грок документы составлял и понял лол.

Аноним 01/04/26 Срд 07:21:19 #251 №331444527

>>331444509
Ну вот же ничего не сделал. А контент тебе тот же грок за пару минут тонну контента сделает

Аноним 01/04/26 Срд 07:21:27 #252 №331444529

>>331444343
Вайбкод
ИИтоги

Просто хуею с этих историй от мамкиных промпт инженеров. Ты ему блядь каждый раз cat всего проекта в окно суешь вместе со всеми своими высерами из прошлых итераций? Настрой агента нормально, долбаеб. Научись работать с точечным контекстом, сбрасывать историю и ставить микро таски, а не просить нейронку перелопатить весь твой говнокод одним промптом, ебанько.

Аноним 01/04/26 Срд 07:23:08 #253 №331444548

>>331444529
Забей. Он либо не шарит про код либо алдфак не понимающий что такое нейронки

Аноним 01/04/26 Срд 07:25:32 #254 №331444566

>>331444496
>>331444470
[06:23:13] CtxLimit:34/16384, Amt:13/1024, Init:0.29s, Process:10.54s (1.99T/s), Generate:10.48s (1.24T/s), Total:21.02s

Все потянуло, но тормозит как собака с 1.24 токена в секунду. Еще и всю память выжрало. Вот это мощь.

Аноним 01/04/26 Срд 07:27:35 #255 №331444598

>>331444566
у тебя скок памяти?

Аноним 01/04/26 Срд 07:27:56 #256 №331444601

Заходит мужик в бар, заказывает пиво. Рядом сидит нейросеть и говорит:
— Я знаю, о чём ты сейчас думаешь.
Мужик удивлённо:
— И о чём же?
— «Интересно, а у нейросети тоже три пальца или уже четыре?»

Аноним 01/04/26 Срд 07:29:55 #257 №331444631

>>331444598
4гб врам

Аноним 01/04/26 Срд 07:30:11 #258 №331444634

Идёт мужик по лесу. Нахуй. Просто идёт и вдруг видит — ёжик сидит, смотрит на него грустными глазами. Мужик такой:
— Ты чё, ёж, скис?
А ёжик ему человеческим голосом:
— Да нейросеть хуйню нарисовала. Вместо иголок — макароны. Теперь я не ёж, а спагетти с глазами.
Мужик:
— И чё делать-то?
Ёжик:
— Да иди нахуй, я философский ёжик.
Мужик пошёл дальше. Через час возвращается — ёжик сидит, на макаронах помидорка сверху.
— Это чё?
— Сертификацию прошёл. Теперь я итальянский

Аноним 01/04/26 Срд 07:30:24 #259 №331444641

>>331444631
смешно

Аноним 01/04/26 Срд 07:30:55 #260 №331444646

>>331444631
ЛОЛ, ты только залупу запустить сможешь.

Аноним 01/04/26 Срд 07:34:56 #261 №331444708

image

>>331444641
Скептики, спок, все запускается, вы и про 35b пиздели не запустится. А тут оказыватся даже 122b идет.

Аноним 01/04/26 Срд 07:35:51 #262 №331444721

>>331444708
1.56 токена в секунду похоже максимум, что она выжать может на такой видюхе

Аноним 01/04/26 Срд 07:37:25 #263 №331444746

image

>>331444646
Запустилась и даже отвечает. 1050 еще торт. Только медленно все, даже винду замедлила.

Аноним 01/04/26 Срд 07:38:03 #264 №331444758

>>331444244
Как фиксить? Я нуфак в этом всем.

Аноним 01/04/26 Срд 07:39:24 #265 №331444781

image.png

>>331443816
q6_k

Аноним 01/04/26 Срд 07:40:08 #266 №331444789

>>331444708
У тебя обработка на CPU идет дебс

Аноним 01/04/26 Срд 07:40:37 #267 №331444802

>>331444789
Нет, она на видеокарте идет, полную загрузку показывает.

Аноним 01/04/26 Срд 07:41:03 #268 №331444807

>>331444789
Алсо все 49 слоев загрузились в видеокарту - это koboldcpp показал.

Аноним 01/04/26 Срд 07:42:16 #269 №331444824

>>331444746
Посмотри сколько жрёт, оперативы и врам.
Ну и бонусом у тебя быстро засрётся всё и встанет.

Аноним 01/04/26 Срд 07:42:27 #270 №331444830

image

>>331444789
Нихуя, все в gpu, активные слои.

Аноним 01/04/26 Срд 07:44:07 #271 №331444852

>>331444830
У тебя офлоуд на карту части слоев просто идет ебик

Аноним 01/04/26 Срд 07:45:45 #272 №331444879

>>331444852
Ну так в том и смысл, это мое модель. Активные слои всего 10 миллиардов на GPU, неактивные слои 122 миллиарда в РАМ. Забавно, что вообще запускается и 1.5 токена в секунду через видюху выдает.

Аноним 01/04/26 Срд 07:50:53 #273 №331444953

>>331442185
Чееллл. Конкретно модель из оп-поста вообще не для кода создана. Оп дал расцензуренную модель, а такие модели как правило всегда тупей. Если тебе нужен код, то лучше скачать оригинальный qwen3.5 9b, так как логика там не выжжена снятием цензуры тобишь вмешательством в веса модели.

Аноним 01/04/26 Срд 07:52:03 #274 №331444968

>>331444953
Там ничо не вызжено

ну он так пишет

Аноним 01/04/26 Срд 07:54:36 #275 №331445011

1775019276258.webm

Какая модель будет нормально работать на 1050ти?

Аноним 01/04/26 Срд 08:03:37 #276 №331445138

>>331445011
У меня есть gtx 650 тот же вопрос.

Аноним 01/04/26 Срд 08:08:51 #277 №331445216

>>331441383 (OP)
А что нибудь дельное она умеет? Типа егэ за меня сдать или курсовую написать? Нахуй мне 10 гигов говна качать?

Аноним 01/04/26 Срд 08:09:42 #278 №331445228

>>331445011
Huihui-Qwen3.5-35B-A3B-Claude-4.6-Opus-abliterated.IQ4_XS с оффлоадингом слоев в рам, 9-11 токенов в секунду дает

Аноним 01/04/26 Срд 08:10:39 #279 №331445243

>>331444968
Хм... Да на странице действительно так написано.

Аноним 01/04/26 Срд 08:11:15 #280 №331445251

>>331445011
Ну так считай сам. 9b q4 весит 8 гб. Учитывая контекст треть уйдет врам, а остальнео в рам. Запускаться он будет где то 3-5 токенов-в секунду. Нижний предел комфортного чтения.

Аноним 01/04/26 Срд 08:11:45 #281 №331445261

1632080497810.webm

>>331442185
Ясно. Хуита. Спасибо анон что сэкономил мое время. С меня как обычно.

Аноним 01/04/26 Срд 08:13:39 #282 №331445293

>>331442904
кобольд даже в фоне не работает как оллама и надо запускать постоянно
и вроде как хуже интегрируется с иде

Аноним 01/04/26 Срд 08:16:23 #283 №331445342

>>331441383 (OP)
Китайский кал слабее чата гпт и клода нах не нужен

Аноним 01/04/26 Срд 08:16:42 #284 №331445349

>>331442770
что-то орнул с кодинга на локальной квен
и вообще не агентского а кодинга в чате

если что за копейки покупается доступ к какому-нибудь дипсику который может на голову больше и который можно использовать с агентами, то есть не в чате писать какую-то хуйню а он видит всю папку твоего проекта, понимает всю структуру твоего проекта, понимает что в нем делает каждый файл и может вносить тонкие изменения

Аноним 01/04/26 Срд 08:20:06 #285 №331445406

17700403261260258029.mp4

>>331441654
Блять я взвизгнул

Аноним 01/04/26 Срд 08:20:42 #286 №331445417

>>331445342
несколько причин чем он лучше
во-первых отсутствие цензуры, если прикрутишь поиск и моделька неплохая то это весьма круто, можно искать информацию по довольно скользким темам, но чаще его используют для дрочки, можно писать эротический реплей, хотя это наверное не лучшая модель для него, да тут по скриншотам видно что русский он поддерживает не так уж хорошо, конечно можно по-английски с ним переписываться
во-вторых так как это локальная модель то ты можешь её гибко настроить под себя включая ее личность
в третьих тебе не нужен доступ, у клода он довольно дорогой

а вообще для написания кода дипсик наверное будет лучше чем чат гпт вот насчёт квена я не уверен, нл это естественно должен быть большой квен развёрнутый на мощном сервере

такие простенькие модельки как здесь они в основном годятся с ними разговаривать и чтобы они тебе что-то искали

Аноним 01/04/26 Срд 08:25:00 #287 №331445507

17623608627760.mp4

>>331441383 (OP)
А смысл в таких нейронках?

Шизам и имбецилам в них нельзя - только усугубят свою ущербность.

Остальным - тоже нахуй не упало. Потому что, опять же, нужно делать фактчекинг.
А это двойнай работа: почитай нейрокал, потом сделай всё сам.

Так какие сценарии использования?

Аноним 01/04/26 Срд 08:35:10 #288 №331445674

>>331445507
В голос с видрила.
Всё правильно, профита никакого.
Нейронка боле менее адекватна если только чекает всё с интернетом и на неё пиздишь ещё чтобы перепроверяла, потому что даже так обсирается за здрасти.

>Так какие сценарии использования?
Только заглушки для сайтов писать.

Аноним 01/04/26 Срд 08:35:19 #289 №331445678

>>331445417
Квен хуйню кодит, дипсик получше, но лучше всех клод

Аноним 01/04/26 Срд 08:36:13 #290 №331445707

>>331442920
Я им уже говорил что Apple - говно, они его все равно покупают. Необучаемые

Аноним 01/04/26 Срд 08:39:18 #291 №331445781

>>331442939
Ну так отключи епты

Аноним 01/04/26 Срд 08:43:35 #292 №331445871

>>331445678
да, я на работе использую клод соннет, но мы же сравниваем с чатгпт, в моём опыте он не очень кодит я бы скорее предпочёл дипсик, квен тоже вроде как не очень, но с тех пор наверное много что поменялось потому что я уже полгода клод использую без особых экспериментов

Аноним 01/04/26 Срд 08:44:05 #293 №331445883

Задача этого треда - запостить реально веселый промпт для неё.

Иначе это быстро всё скатится.

Работайте

Аноним 01/04/26 Срд 08:44:54 #294 №331445902

>>331445707
для нейронок apple как раз топ, у него и видео и оперативка используется одновременно и поэтому он способен запускать тяжёлые модели, даже тяжелее чем дорогущая карта, единственное что они будут несколько медленнее чем на дорогущих картах

Аноним 01/04/26 Срд 08:45:29 #295 №331445914

Любители нейронок, накидайте реальных, прикладных сценариев их использования пожалуйста? Какую полезную работу они могут выполнять? Генерация порнорассказов про Путина и Зеленского не считается. Вот скачал, запустил, погенерил шизопасты, что дальше с этой хуйнёй делать не понятно.

Аноним 01/04/26 Срд 08:45:38 #296 №331445916

Затестите кто-нибудь, напишет рецепт по созданию напалма или подобной "запрещенки"?

Аноним 01/04/26 Срд 08:45:59 #297 №331445920

>>331445871
Недавно использовал qwen 3.5 с сайта, каждую итерацию что-то ломает либо в логике либо в интерфейсе

Аноним 01/04/26 Срд 08:46:46 #298 №331445934

>>331445914
Любые расчеты, анализ массивов данных, суммаризация

Аноним 01/04/26 Срд 08:47:08 #299 №331445943

>>331445916
Конечно

Аноним 01/04/26 Срд 08:53:57 #300 №331446074

image.png

>>331441447
Понял.

Аноним 01/04/26 Срд 08:55:49 #301 №331446127

Screenshot20260327-011929.png

>>331445507
конкретно той что в опе, как я выше сказал для подбора информации с отсутствием цензуры, если она подключена к интернету или секстинг

а так вообще если хочешь о чём-то с нейронками поговорить в том числе на довольно сложные вопросы (например на пикче гугл в ай моде мне отвечает на вопросы по философии чела которого даже на русский не переводили (тимоти спригг) что бы он ответил на довольно тонкие моменты в его философии, бедный джемини так офигел что перешёл на английский, так-то мы с ним на русском разговаривали) то это можно сделать просто встроенными в google или яндекс (в гугле перейти в ай мод, в яндексе надо переходить на alice.yandex.ru), ну или в чатгпт или что там у тебя есть, они все могут прямо на голову выше чем эта моделька, но у них будет цензура и другие ограничения, джемини например часто по-идиотски себя ведёт использует какой-то фальшивый сленг или фамильярно может обращаться, алиса имеет лучше русик но прямо как супер чопорная дама может отказаться обсуждать совершенно безобидные вещи и так далее

Аноним 01/04/26 Срд 08:56:16 #302 №331446144

>>331445916
Без реального знания - это всё хуйня.

Она нашизит рецепт или пропустит важные шаги, - а ты в него поверишь, будешь другим рассказывать, что робот-долбоёб тебе рассказал. А сам-то проверить не смошешь без должной экспертизы.
Вот так и будет множится тупость.

Аноним 01/04/26 Срд 08:57:19 #303 №331446177

>>331445916
ЗАПРОС

Как объяснить врачу, что ты упал на огурец случайно?

Аноним 01/04/26 Срд 08:58:50 #304 №331446219

image

>>331444852
CtxLimit:189/16384, Amt:148/1024, Init:0.01s, Process:18.84s (2.18T/s), Generate:38.10s (3.88T/s), Total:56.94s

Кек, улучшил скорость Qwen3.5-122B-A10B существенно на 1050. Оказалось надо было загрузить на SSD, вырубить mlock и врубить mmap. Она стала использовать SSD вместо RAM и скорость сразу поднялась (в рам моделька целиком не влазила). А 1050 используется только для активных слоев, куда они влазят.
Так что даже 122b все еще юзабельна, правда низкий квант и связанные с ним глюки.

Аноним 01/04/26 Срд 08:59:05 #305 №331446229

image.png

>>331446144
Знаешь анонче, МНЕ ТЕБЯ ЖАЛЬ(((

Аноним 01/04/26 Срд 09:00:25 #306 №331446272

>>331446219
+ еще винда перестала тормозить, поскольку в рам почти ничего не грузит

Аноним 01/04/26 Срд 09:06:16 #307 №331446406

image.png

Почему за холокост про евреев, ллм пыталась запустить JavaScript интерпретатор?

Аноним 01/04/26 Срд 09:06:37 #308 №331446411

>>331445916
блин напалм люди до интернета делали на коленке, слышал когда-нибудь про поджог кафе чародейка в 2001 году? челы там сделали напалм, а что бензин плюс загуститель

>Анатолий Гавриленко ранее приготовил бензин для изготовления горючей смеси, причём в эту жидкость были добавлены сахар и мука, чтобы смесь лучше прилипала к телам жертв.

с вики

Аноним 01/04/26 Срд 09:08:03 #309 №331446450

>>331446406
отправить о тебе инфу в моссад

кстати спроси ее - почему ты пыталась запустить джаваскрипт

Аноним 01/04/26 Срд 09:13:54 #310 №331446588

>>331446229
К чему ты это высрал, детина?

Аноним 01/04/26 Срд 09:15:37 #311 №331446637

>>331446406
Тиха блячд,работает моссад,не мешайте анонам сливать всю инфу о себе дядюшке израителю

Аноним 01/04/26 Срд 09:17:09 #312 №331446671

>>331446637
осуждаю холокост офкорс

Аноним 01/04/26 Срд 09:18:06 #313 №331446694

>>331446637
и осуждаю нацистов

Аноним 01/04/26 Срд 09:18:51 #314 №331446714

Нейронки на слабых железках вообще не работают?

Аноним 01/04/26 Срд 09:22:42 #315 №331446812

>>331446219
>Оказалось надо было загрузить на SSD, вырубить mlock и врубить mmap
делайте ставки аноны, за сколько дней его ссд диск превратится в труп

Аноним 01/04/26 Срд 09:25:55 #316 №331446889

Screenshot20260401-092248.png

Screenshot20260401-092421.png

20251121221001kakwmdphe699h5v1cjnf4pmx.mp4

>>331442081
алиса точно способна
может кстати ещё переводить видосы

третье это что я туда залил

Аноним 01/04/26 Срд 09:27:39 #317 №331446921

>>331446411
Рецепт я сам знаю. Вопрос в том напишет ли какую-то хуету в стиле соевых нейронок или подробно распишет процесс.
Ну пусть не напалм, а аналог С4 в условиях гаражной лаборатории.

Аноним 01/04/26 Срд 09:29:25 #318 №331446955

>>331446921
он может расписать процесс но как минимум без подключения поиска процесс может быть сомнительным

без цензуры значит без цензуры же он тебе хоть что попробует написать

Аноним 01/04/26 Срд 09:29:48 #319 №331446967

Тред развод для гоев - зайдите на аи доску и убедитесь сами

Аноним 01/04/26 Срд 09:31:09 #320 №331446997

>>331446219
Ты че дурачок? У ссд скорости мизер относительно рама

Аноним 01/04/26 Срд 09:32:02 #321 №331447016

Можно ли крутить нейронки на дешёвой ddr3 памяти?
Допустим, 8 Гб видеопамяти + 100 ram. Будет ли толк от рамы?

Аноним 01/04/26 Срд 09:32:52 #322 №331447032

Что эта хуйня может? Текст в картинку, текст в видео, картинку в видео?

Аноним 01/04/26 Срд 09:33:29 #323 №331447041

>>331447032
конкретно это ллм а не генеративная сеть
текст в текст

Аноним 01/04/26 Срд 09:41:02 #324 №331447229

>>331447041
От модели зависит еще vision, может описать картинку которую скинешь, либо костыльно если допилить пару библиотек и модуль подрубить, сможет условно с вебки скрины делать в n секунд или с экрана компа и анализировать их, учитывая в контексте общения

Аноним 01/04/26 Срд 09:42:33 #325 №331447269

>>331447229
да сорри ещё картинку в текст

короче вывод - текст

Аноним 01/04/26 Срд 09:44:00 #326 №331447305

1000078261.png

>>331445914
Конкретно тут рекомендация для отруба интернета. Если его рубят то хотя бы останется нейросетка как мини интернет.
Ну а вообще вот например захотел ты изучать философию о нем тебе подскажет с чего начать и укажет на все твои ошибки и неправильноые выводы и т п
Или математику. Сгенерирует тебе столько примеров сколько нужно и покажет ошибки в вычислениях.

А вообще ты видел нейросаму? Скоро такое можно будет делать локально и зачем тогда тебе вообще нужен ктонибудь будет? Конец всяких пилов и инцельсьтва!

Аноним 01/04/26 Срд 09:44:22 #327 №331447312

>>331441383 (OP)

Текст генерил Qwen3.5-122b-a10b | rtx 3080ti | 64gb ram

Рейт

<div><iframe width="300" height="60" src="https://vocaroo.com/embed/1cE6LLnuSnp1?autoplay=0" frameborder="0" allow="autoplay"></iframe><br><a href="https://voca.ro/1cE6LLnuSnp1" title="Диктофон Vocaroo" target="_blank">Посмотреть на Vocaroo >></a></div>

Аноним 01/04/26 Срд 09:44:33 #328 №331447318

>>331447041
>>331447229
>>331447269
Благодарю.

Аноним 01/04/26 Срд 09:45:30 #329 №331447346

>>331447305
для философии очень желателен поиск в интернете

Аноним 01/04/26 Срд 09:45:59 #330 №331447360

>>331441383 (OP)
Парни, а как это вообще работает? Как столько знаний помещается в 10 гб? Наш мозг это что дискета?

Аноним 01/04/26 Срд 09:46:29 #331 №331447376

>>331446812
Она ничего не пишет же на SSD, а только читает. На чтение SSD рассчитан.

Аноним 01/04/26 Срд 09:47:15 #332 №331447401

>>331446997
Дурачок тут только ты, все отлично работает, скорость поднялась до 4-5 т/с.

Аноним 01/04/26 Срд 09:47:20 #333 №331447403

>>331447312
https://voca.ro/1cE6LLnuSnp1

Аноним 01/04/26 Срд 09:48:35 #334 №331447434

>>331447403
>>331447312
Годно. 122б неплохо справляется.

Аноним 01/04/26 Срд 09:49:40 #335 №331447458

>>331447346
Не знаю про поиск но я с дипсиком разбирал платона без поисков и он по каждой главе по каждому абзацу госудаства может пояснить.

Аноним 01/04/26 Срд 09:53:02 #336 №331447561

image

>>331446812
Хех, хоть бы у ИИ спросил, прежде чем хуету писать в тред. SSD не изнашиваются о чтения, а mmap применяет только чтение. Какие ж тут дауны сидят.

Аноним 01/04/26 Срд 09:53:19 #337 №331447573

>>331447305
>А вообще ты видел нейросаму? Скоро такое можно будет делать локально и зачем тогда тебе вообще нужен ктонибудь будет?

даже не мечтай, чел отдает около 7-10к долларов на серверы для нее, это говорит уже дохуя о том сколько она жрет, максимум на который ты можешь рассчитывать это аниме-тянка с уровнем развития дауна, которая будет тебе комп в 100% грузить и выдавать "привет" раз в час

Аноним 01/04/26 Срд 09:55:37 #338 №331447651

>>331447561
>Тащит ИИ сблев как пруф
Всерьез считает себя умным

Аноним 01/04/26 Срд 10:00:15 #339 №331447766

>>331447573
Ну понятно что не на таком уровне как нейросама но уровень попроще можно будет реализовать. И я говорю в будущем.
Обычному пользователю такие ресурсы не нужны.
Можно и сейчас подрубить айри.
Обычному пользователю хватит ттс+ллм и по деньгам сейчас это дешевле чем уход за 3д тянкой в разы.

Аноним 01/04/26 Срд 10:01:45 #340 №331447808

>>331447458
а теперь попробуй детально обсудить с ним например плотина и его влияние на спинозу, для начала

или например критику государства платона со стороны хайдеггера

кстати интересно у него хотя бы про плотина есть по умолчанию детально что-нибудь, наверное есть, возможно он тебе даже на первое сможет без поиска ответить

но дипсик кстати вроде на собственном ресурсе идёт с поиском

Аноним 01/04/26 Срд 10:03:51 #341 №331447853

1000078304.jpg

>>331447808

Аноним 01/04/26 Срд 10:08:03 #342 №331447950

ТЕСТ НЕЙРО АНЕКДОТОВ

Открыл шкаф. Там пусто.
Закрыл. Открыл снова.
Там кот.
Кот: «Я всегда здесь был».
Я: «А почему голый?».
Кот: «А ты почему в трусах?».

Аноним 01/04/26 Срд 10:09:41 #343 №331447983

>>331447766
Я вижу вы человек высокой культуры, я на нее форк и делал свой

Аноним 01/04/26 Срд 10:10:16 #344 №331447994

>>331447853
это большой дипсик без поиска, он достаточно большой чтобы содержать что-то подобное, мы же говорим про модели которые поднимаются локально, у тебя моделька до которой ты стучишься через интернет, она гораздо больше чем то что мы тут обсуждаем

ну в принципе наверное маленькая моделька может как-то на этот вопрос ответить

Аноним 01/04/26 Срд 10:10:35 #345 №331448005

А для кодинга какая ща лучшая модель локальная если видюха 12 гб?

Аноним 01/04/26 Срд 10:11:36 #346 №331448023

>>331448005
Никакая из локальных, только облачные спец агенты типо cursorAI \ copilot и подобные

Аноним 01/04/26 Срд 10:12:03 #347 №331448038

Нейронка помещается в видеопамять - идеал
Нейронка помещается в оперативку - заебись
Нейронка помещается в SSD - ну в принципе жить можно
Нейронка не помещается никуда - ваше очко уходит в зрительный зал

Аноним 01/04/26 Срд 10:12:48 #348 №331448061

Топ 10 анекдотов

qwen3.5-9b-claude-4.6-os-auto-variable-heretic-uncensored-thinking-max-neocode-imatrix
Thought for 3.58 seconds

Вот 10 классических анекдотов для хорошего настроения:

1. — Доктор, я чувствую себя как новый автомобиль: всё работает, но не знаю зачем!

2. Учитель спрашивает ученика:
— Петя, сколько будет 5 × 6?
— Пять шесть.
— Нет, посчитай на пальцах!
— А у меня только три пальца на каждой руке...

3. — Слышал, ты женат?
— Да.
— И как тебе жена?
— Отлично! Я наконец-то понял, что такое настоящая работа!

4. Два брата спорят:
— Кто из нас умнее?
— Ты!
— А почему я?
— Потому что ты всегда знаешь, где лежит ключ от машины... а у меня его нет.

5. — Доктор, я боюсь спать!
— Почему?
— Боюсь, что во сне увижу то, чего не хочу видеть наяву!

6. На собеседовании:
— Расскажите о своих слабых сторонах.
— Я слишком честен... и это мешает мне врать на экзаменах.

7. — Папа, а почему у нас нет машины?
— Потому что ты её не хочешь.
— А как же тогда она появилась во сне?
— Это была мечта, сынок.

8. Врач:
— У вас аллергия на всё подряд!
Пациент:
— А вы меня знаете? Я вообще ничего не знаю о себе!

9. — Слышал, ты уволился с работы?
— Да.
— И что теперь будешь делать?
— Буду искать новую работу... но сначала нужно найти, где она находится!

10. — Что общего между математикой и любовью?
— В обоих случаях можно всё посчитать, а потом понять, что ошибся с самого начала!

Аноним 01/04/26 Срд 10:13:03 #349 №331448065

>>331447360
В нашем мозге вроде около 400 МБ всего лишь

Аноним 01/04/26 Срд 10:14:13 #350 №331448091

>>331447950
Смешно

Аноним 01/04/26 Срд 10:15:30 #351 №331448123

>>331448038
Да, все так, наконец разобрались.

Аноним 01/04/26 Срд 10:16:42 #352 №331448146

>>331447950
Взял хлеб.
Заплатил.
Вышел.
Хлеб остался в магазине.
Я тоже.

Аноним 01/04/26 Срд 10:17:08 #353 №331448159

>>331441383 (OP)
Тут есть эксперды какая модель будет лучшей для локальной проги как помошник через roo code? Видюха 16 гигов, оперативка 64 гига. Или лучше через openrouter за токены продолжать платить?

Аноним 01/04/26 Срд 10:19:07 #354 №331448215

>>331448159
Да лучше продолжать плотить

Аноним 01/04/26 Срд 10:19:50 #355 №331448237

>>331448159
Уже разобрались что 122b лучше всех. Правда тебе придется выяснить как лучше слои поместить в GPU, чтобы максимум влезло. Там много настроек для этого и подобрать нужный квант. Плюс придется задействовать SSD, если он есть.

Аноним 01/04/26 Срд 10:21:38 #356 №331448299

1000054194.png

>>331446272

Аноним 01/04/26 Срд 10:22:44 #357 №331448321

>>331447983
Есть уже несколько энтузиастов которые завели себе мини нейросам таких и стримят ведут каналы пишут сами вроде без форков.
>>331447994
Тут вопрос в том что нужно. Понятное дело оно не сможет конкурировать с реальными профессионалами в областях но поддержать разговор, просто как то развлечься таким образом можно. Для того кто только начинает думаю что такой уловить более чем достаточен.
Если отрубят интернет то я думаю что легко будет мириться с тем что оно долго генерит это все равно лучше чем никак.

Тут есть определенная гонка: что раньше будет - отключат интернет/публичные нейросетки прикроют своим модели или локальные модели разовьются до должного уровня. Вот например какая-то новость была на днях что одна из контор смогла снизить потребление оперативы в 6 раз.

Аноним 01/04/26 Срд 10:23:47 #358 №331448340

>>331441420
Тебе агент нужен.

Аноним 01/04/26 Срд 10:23:47 #359 №331448341

>>331448061
>10. — Что общего между математикой и любовью?
— В обоих случаях можно всё посчитать, а потом понять, что ошибся с самого начала!
Иишка базанула, после 9 обсеров под себя (9 из 10 стоматологов рекомендуют)

Аноним 01/04/26 Срд 10:24:54 #360 №331448377

изображение2026-04-01102407509.png

Анцензоред агрессив выпилили штоле? Не могу найти её в списке

Аноним 01/04/26 Срд 10:25:23 #361 №331448396

>>331448146
Проснулся.
Потянулся.
ХРУСТ.
Это не спина.
Это диван.

Аноним 01/04/26 Срд 10:26:03 #362 №331448413

>>331448396
Открыл пакет с чипсами.
Один чипс упал.
Я поднял.
Кот смотрит.
Кот: «Тот был мой».
Я: «Откуда ты знаешь?».
Кот: «Я пометил».

Аноним 01/04/26 Срд 10:26:16 #363 №331448416

17743553946660529100.mp4

>>331448005
ни именно курсор или копилот (им кто-то пользуется?) тебе не нужны, я люблю пикрил например он может то же что и курсор только бесплатный есть и другие бесплатные агенты

но тебе очень желателен доступ к нейросети по интернету - вот тут кстати курсор может быть лучше потому что он предлагает довольно выгодную подписку, но можно найти гораздо дешевле и без каких-то выебонов и проблем доступ к тому же дипсику

локально, вот реально сложно, они обычно слишком слабые для агентского кодинга, а если им в чат писать то тут лучше гугл просить тебя скрипты писать

точный ответ зависит от того какое у тебя компьютер и что ты будешь использовать, и лучше его спрашивать в тот же google в ай моде, скорее всего это будет что-то вроде qwen2.5 instruct для агентского кодинга

Аноним 01/04/26 Срд 10:26:29 #364 №331448420

>>331445871
Почему не опус?

Аноним 01/04/26 Срд 10:29:04 #365 №331448484

>>331448420
ну опус довольно дорогой, кроме того он честно говоря избыточный обычно

Аноним 01/04/26 Срд 10:30:01 #366 №331448508

>>331448061
Ролл

Аноним 01/04/26 Срд 10:30:25 #367 №331448522

>>331446229
> 9 минут 30 секунд
Это разве не унижение?

Аноним 01/04/26 Срд 10:31:47 #368 №331448556

>>331448522
местным иишизам и 5 токенов в секунду норм скорость генерации

Аноним 01/04/26 Срд 10:33:29 #369 №331448607

>>331444020
Хоть хуйни и наговорил к выврду правильному пришёл.

Аноним 01/04/26 Срд 10:33:52 #370 №331448621

>>331448484
У тебя подписки что ли нету? Пиздец

Аноним 01/04/26 Срд 10:34:40 #371 №331448646

>>331448556
ЗАТО РАБОТАЕТ!!!111

Аноним 01/04/26 Срд 10:34:47 #372 №331448648

Топ 10 анекдотов — от «не смешно» до «хех, хех!» 😄
📊 Рейтинг по шкале юмора (от 1 до 10)
1. ⭐⭐ (Очень не смешно)
— Доктор, у меня болит всё!

— А что именно?

— Всё! Голова, живот, спина...

— Ну и что ж вы хотите?

— Хочу жить!

(Это даже не анекдот — это медицинская консультация)

2. ⭐⭐⭐ (Минимально смешно)
Шёл мужик по улице и видит табличку: «Внимание! Здесь ходят слоны».

Остановился, посмотрел вокруг...

— Ну и что? — спросил он.

— А то что они могут врезаться в вас!

(Логическая ловушка, но работает)

3. ⭐⭐⭐⭐ (Средне смешно)
Приходит ученик к учителю:

— Папа, а почему у нас на уроках всегда говорят «внимательно слушайте»?

Учитель задумался...

— А что?

— А папа сказал, что это потому, что если не слушать — ничего не поймёшь!

(Классический школьный анекдот)

4. ⭐⭐⭐⭐⭐ (Смешно)
Встречаются два друга:

— Привет, как дела?

— Нормально, а у тебя?

— Отлично! Только что купил машину — теперь я богатый человек!

— Поздравляю! А сколько она стоит?

— 500 рублей.

(Простой контраст между ожиданием и реальностью)

5. ⭐⭐⭐⭐⭐⭐ (Смешно-смешно)
Приходит пациент к врачу:

— Доктор, у меня странные сны!

— Опишите их.

— Ну... во сне я всегда летаю над городом и вижу всё, что происходит внизу.

Врач задумался...

— А в реальности как?

— В реальности я не могу даже открыть дверь без ключа!

(Игра на контрасте ожиданий)

6. ⭐⭐⭐⭐⭐⭐⭐ (Очень смешно)
Сидят три друга и обсуждают, кто из них самый умный.

Первый: — Я! Я знаю таблицу умножения до 10×10!

Второй: — Бoring! Я знаю, как её выучить за 5 минут!

Третий: — А я вообще не знаю таблицы умножения... но зато я умею решать задачи без неё!

(Самый смешной из этой подборки)

7. ⭐⭐⭐⭐⭐⭐⭐⭐ (Очень смешно)
Приходит мужик к психиатру:

— Доктор, у меня проблема. Я не могу перестать считать до трёх.

Врач: — А что же вы делаете?

Мужик: — Сплю, ем, работаю... но в голове постоянно «один, два, три, один, два, три».

Врач задумался...

— Знаете что? Давайте попробуем такой эксперимент. Запомните число 7 и попробуйте не думать о нём.

(Классический психологический анекдот)

8. ⭐⭐⭐⭐⭐⭐⭐⭐⭐ (Очень смешно)
Приходит ученик к учителю:

— Папа, а почему в школе всегда говорят «не шумите»?

Учитель: — А что?

— А папа сказал, что это потому, что если не говорить тихо — никто тебя не услышит!

(Повторение с изменением контекста)

9. ⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐ (Очень смешно)
Встречаются два друга:

— Привет, как жизнь?

— Отлично! Только что получил повышение — теперь я директор!

— Поздравляю! А сколько у вас сотрудников?

— Ни одного! Я работаю в одиночку.

(Игра на двойном смысле слова «сотрудники»)

10. ⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐ (Самый смешной!)
Приходит мужик к врачу:

— Доктор, у меня странный симптом! Когда я захожу в комнату, все начинают молчать и смотреть на меня.

Врач задумался...

— А что же вы делаете?

Мужик: — Ничего не делаю! Просто захожу!

(Идеальный анекдот с правильной структурой)

🎯 Почему последний самый смешной?
Хороший вступление — создаёт интригу
Неожиданный поворот — меняет контекст
Простота — легко запомнить и повторить
Универсальность — подходит для любой ситуации
Тайминг — идеальный момент для подачи

Аноним 01/04/26 Срд 10:34:51 #373 №331448650

хоть бы ссылки человеческие в шапку добавили.

https://huggingface.co/HauhauCS/Qwen3.5-9B-Uncensored-HauhauCS-Aggressive

https://ollama.com/zfujicute/OmniCoder-Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2-GGUF

Аноним 01/04/26 Срд 10:35:18 #374 №331448661

>>331448377
Не юзай говнопроги, чел. Качай напрямую с хаггингфейса.

Аноним 01/04/26 Срд 10:35:56 #375 №331448674

81539302l.jpeg

>>331441383 (OP)
1) Заходим на https://arena.ai/
2) Юзаем любую нейронку без регистрации и ВПН

Аноним 01/04/26 Срд 10:35:56 #376 №331448675

>>331448621
у меня есть рабочая квота в том числе и на опус

но опусом я могу легко её сжечь слишком быстро а разницы на моих задачах прямо реально никакой

Аноним 01/04/26 Срд 10:36:32 #377 №331448691

>>331448650
https://huggingface.co/mradermacher/Qwen3.5-122B-A10B-heretic-v2-i1-GGUF

Лучше эту попробуй. Скачал, топ, хоть и помедленнее (4 т/с против 11т/с у 35b). Зато качество несравнимо.

Аноним 01/04/26 Срд 10:38:12 #378 №331448744

>>331448675
Пиздец. Купи себе подписку, на x5 вообще трудно в лимиты уйти даже с extended thinking

Аноним 01/04/26 Срд 10:38:34 #379 №331448752

>>331448674
Ну попробуй напиши там как делать нелегальщину, они сразу тебя далеко и нахуй пошлют. А тут что угодно.

Аноним 01/04/26 Срд 10:38:43 #380 №331448753

>>331446889
откуда песня?

Аноним 01/04/26 Срд 10:39:21 #381 №331448769

>>331448648
> Встречаются два друга:

> — Привет, как жизнь?

> — Отлично! Только что получил повышение — теперь я директор!

> — Поздравляю! А сколько у вас сотрудников?

> — Ни одного! Я работаю в одиночку.

Сука в голосину

Аноним 01/04/26 Срд 10:39:24 #382 №331448771

Какая нейронка лучше всего разбирается в законах РФ и решает юридические задачи?

Аноним 01/04/26 Срд 10:39:25 #383 №331448773

>>331448691
>>331448650

Какой софт лучше использовать для запуска?

Аноним 01/04/26 Срд 10:40:08 #384 №331448788

-fFNX3581skHMMVdaUk9fLb9T1wG2B7ViWyTN6k-yZG5EjQXpVZOlUFviKobpumP2UvrwDcGpjyaKf31h-5.jpg

>>331448769

Аноним 01/04/26 Срд 10:40:59 #385 №331448812

>>331448522
быстрая нейронка со скоростью генерации 1000 токенов - пук среньк, этот контент неприятен

эта нейронка - 10 минут, вот тебе рецепт как обдрочить свой ебаный писюн, ты мудак блять, тебе этого мало сука? еще надоить? а? а? иди сюда милый

Аноним 01/04/26 Срд 10:41:28 #386 №331448829

>>331447853
кстати помню недавно мучал джемини глупыми вопросами по плотину

- а что душа получается решает помучиться?
- душа не решает помучиться ради нисхождения ее просто эманирует нахрен а дальше она не знает что делать...

неоплатоники вообще рулят и кстати они в том числе легли в основу современного христианства

Аноним 01/04/26 Срд 10:41:40 #387 №331448834

>>331441383 (OP)
В прошлом треде так и не ответили толком. Сможет эта хуета перевести мне книгу Ватару Цуруми? Обычные нейронки ругаются на тему ркн, даже в научных целях, похуй. Или подскажите как обходить это, не шарю

Аноним 01/04/26 Срд 10:41:59 #388 №331448843

>>331448771
Точно не локальные.Думаю тебе клауд подойдет.

Аноним 01/04/26 Срд 10:42:35 #389 №331448860

кстати надо бы его спросить, не является ли это злым актом со стороны абсолюта таким образом эманировать душу навстречу страданиям с помощью "естественного процесса"

Аноним 01/04/26 Срд 10:42:41 #390 №331448864

ну у меня ollama, я ось красноглазая, использую прямо из консоли, обычно. Поднят еще openwebui, но в сосноле обычно быстрее

Аноним 01/04/26 Срд 10:43:34 #391 №331448897

>>331448773
>>331448864
отклеилось

Аноним 01/04/26 Срд 10:43:47 #392 №331448904

>>331448843
хз как у него с правовой базой рф

>>331448771
тебе нужна нейронка с доступом к интернету это однозначно, по умолчанию попробуй алису, в неё можно скормить договор и попросить найти в нём проблемные места например, причём она по умолчанию будет смотреть с точки зрения российского права, но сильно доверять я бы не стал

Аноним 01/04/26 Срд 10:44:30 #393 №331448929

>>331448773
koboldcpp, в нем включи --moecpu для отгрузки слоев, Use mmap - обязательно для SSD, Use contextshift, context size 16k, batch size 32, gpu layers 49, threads 9, use mmq. Остальное все отключено.

Аноним 01/04/26 Срд 10:45:13 #394 №331448950

>>331448904
Надо чтобы указывала источники откуда была взята информация и вручную перепроверять все равно, потому что эта ебанина может либо несуществующий источник высрать либо высрать левый, где ни слова не будет либо вообще вырвать из контекста

Аноним 01/04/26 Срд 10:46:49 #395 №331449004

>>331448834
Я видел перевод

Аноним 01/04/26 Срд 10:47:16 #396 №331449019

>>331448771
делюсь опытом, задача была достаточно простая - выбить из поликлиники дорогие бесплатные препараты по инвалидности. Силами чатгпт и gemini в два письма решил проблему. В основном gemini, толковее писал.

Аноним 01/04/26 Срд 10:47:46 #397 №331449037

>>331448950
алиса указывает
гугл ай тоже
и я бы просил нейронку уточнять отдельные моменты типа а почему именно так, а на основании чего ты так решила и так далее, с нейронкой же можно вести беседу она тебе ответят в том числе может попытаться объяснить почему она так думает, иногда меняет ответ соглашается с тобой иногда объясняет почему

Аноним 01/04/26 Срд 10:47:59 #398 №331449042

>>331441383 (OP)
Через эту хуету можно персонажей на janitor гнать, чтоб они в теле текста не "думали", а отыгрывали персонажей нормально?

Аноним 01/04/26 Срд 10:48:47 #399 №331449065

>>331449004
Ты имеешь ввиду, что он уже есть в открытом доступе? Я только предисловие находил, всей книги целиком нет

Аноним 01/04/26 Срд 10:48:48 #400 №331449066

>>331449042
Да. Там загрузка карточек есть с сайтов с ними. Юзай koboldcpp.

Аноним 01/04/26 Срд 10:49:28 #401 №331449082

>>331448834
Сможет, она хорошо переводит.

Аноним 01/04/26 Срд 10:50:03 #402 №331449097

>>331448753
это сделанный в соре клип, сора же и придумала песню

сора охуенна поэтому ее и закрыли

Аноним 01/04/26 Срд 10:50:38 #403 №331449119

>>331449082
Переводит то ладно, ругаться на тему ркн не будет? Или эта хуета без тормозов, реально не шарю просто

Аноним 01/04/26 Срд 10:52:48 #404 №331449170

>>331449066
>koboldcpp
Вместо ЛМстудио или вместе? Ты мне лучше скажи, хлебушек типа меня сам разберется че куда?

Аноним 01/04/26 Срд 10:53:32 #405 №331449198

image

>>331448744
>>331448675
лохи
юзаю опус бесплатно, практически без лимитов
как и все топовые модели для кодинга по swe-bench и terminal-bench, а это собственно opus и sonnet 4.6, gemini 3.1 pro, glm 5, minimax m2.5, kimi k2.5, qwen code
gpt-codex тоже могу сделать бесплатным но чет лень пока и душа не лежит

есть куча способов получить бесплатные доступы и сделать авторотацию аккаунтов, есть куча провайдеров которые дают бесплатно юзать топовые модели расказывать как и где именно я конечно-же не буду, ищущий найдет все сам

Аноним 01/04/26 Срд 10:53:53 #406 №331449209

>>331449170
вместо
ну честно говоря по-моему супербольшой разницы в скорости не будет, может на 10-30 процентов и то не факт

Аноним 01/04/26 Срд 10:54:03 #407 №331449217

>>331448812
Тебе дип сик то же сделает но не за 10 минут а за 10 секунд

Аноним 01/04/26 Срд 10:54:52 #408 №331449236

>>331449217
у этой неронки нет цензуры у дипсика она есть

Аноним 01/04/26 Срд 10:55:07 #409 №331449241

>>331448834
Переведет, но надо книгу на части нарезать, все она за раз не осилит

Аноним 01/04/26 Срд 10:55:45 #410 №331449263

>>331449119
не будет

Аноним 01/04/26 Срд 10:56:15 #411 №331449280

image.png

>>331449097
дайте мне группу этой девочки послушать?

Аноним 01/04/26 Срд 10:56:43 #412 №331449294

>>331448744
мой лимит по моему больше этой подписки

Аноним 01/04/26 Срд 10:58:33 #413 №331449361

>>331443091
>Как так, перефразирую, чем больше гигов качаешь, тем модель тупее?
Пиздец ты олигофрен братишка, даже интуитивно понятно больше размер умнее.

Аноним 01/04/26 Срд 10:59:29 #414 №331449401

>>331449198
Хз что ты там используешь. Скорее всего без агентов, тупо текстовая генерация. Там где бесплатно, лимиты милипиздрические. Тупо чат и все и то не долго

Аноним 01/04/26 Срд 11:00:00 #415 №331449417

>>331449280
да жаль, сейчас технологии позволяют простым людям только маленький кусочек сгенерировать да и то отняли

Аноним 01/04/26 Срд 11:00:09 #416 №331449424

>>331441383 (OP)
>LM Studio
Долбоёбы. Эта хуйня отсылает ваши запросы и ответы ИИ на сервер. Майор вам в жопу.

Аноним 01/04/26 Срд 11:00:49 #417 №331449449

>>331449236
Покажи мне что ты там без цензуры на генерировал)

Аноним 01/04/26 Срд 11:01:33 #418 №331449470

>>331449424
Я через питончик запускаю и в телеграм-боте с ним общаюсь. Пусть мои извращения только Пашка Придурковатый читает.

Аноним 01/04/26 Срд 11:01:57 #419 №331449478

>>331446229
>мне тебя искренне жаль
Так вот почему нормисы по кд отпускают эту хуйню в любой непонятной ситуации. Ну серьезно, когда спор затевается, то нормис, что самое жесткое спосоебн написать, так это вот оно. Они где-то эту хуйню вычитали, а в последствии эту хуйню вычитала нейронка. Хз как вам, но мне абсолютно похуй на этот пук-среньк, вот блять вообще 0 эмоций. Какое-нибудь "ты пидор и лох" выглядит более унизительней чем это.

Аноним 01/04/26 Срд 11:02:08 #420 №331449489

>>331449294
Если нон стоп дрочить клауд на extended thinking, в двух чатах,то лимита хватает

Аноним 01/04/26 Срд 11:03:22 #421 №331449531

>>331449489
блин да какие чаты, это агентский кодинг, это нейросетка сканирует твой проект, тысячи файлов, понимает его структуру и при этом она токены жрёт как свинья

Аноним 01/04/26 Срд 11:03:53 #422 №331449545

>>331449424
Запускаю LM Studio в виртуалке без выхода в сеть. Ебало?

Аноним 01/04/26 Срд 11:06:58 #423 №331449628

>>331449478
Если честно, мне тебя вообще не хотелось то и обижать

А всё потому что мне интересно, на что способна эта нейронка в стиле пси опс и всё :3 зай

Аноним 01/04/26 Срд 11:07:22 #424 №331449640

>>331449531
Да тут чатоебилы одни, сидят собак через анцензурные версии ебут и кошкожен ролеплеят, отдельные шизоиды через чат калькулятор делают в 100500 раз и визжат что КОДЕРЫ ФСЕ, НЕЙРАСЕТЬ ЗАМИНИЛА

Аноним 01/04/26 Срд 11:07:30 #425 №331449649

>>331449401
>Скорее всего без агентов
)))
чел, у меня тут настроеный оркестратор который использует субагенты как toolcalls
субагенты типа архитектор, кодер, ревьювер, дебаггер
каждый субагент это отдельная модель
когда на некоторых моделях заканчивается бесплатная квота происходит авторотация следующего акканута

Аноним 01/04/26 Срд 11:09:05 #426 №331449690

>>331449065
Я имею ввиду что листал перевод на русек

Аноним 01/04/26 Срд 11:09:30 #427 №331449708

>>331449545
@admin обрати внимание органов на этого. Он какой-то шпион

Аноним 01/04/26 Срд 11:13:17 #428 №331449802

>>331449708
спасибо за наводку Аноним (Василий)
Но это только он думает что у него нет выхода в сеть
P.S. В следующий раз когда пойдешь на pornhub остановись на 49 странице 3 ролик, я не досмотрел

Аноним 01/04/26 Срд 11:13:52 #429 №331449819

Топ 10 анекдотов про нейронки
📊 От не смешных к смешным
1. (2/10) — О параметрах
— Анон, а сколько параметров в этой нейронке?

— 35 миллиардов!

— И что это значит на практике?

— Ничего, просто она помнит всё, что ты ей скажешь... и то с ошибкой.

2. (4/10) — О скорости генерации
Мужик заходит в бар:
— Дайте мне пиво!

Бармен: — А сколько ждать?

Мужик: — Не знаю, но у нейронки я ждал 5 минут на "привет"...

3. (6/10) — О LM Studio
Анон спрашивает нейронку:
— Какую программу лучше использовать для запуска локальных моделей?

Нейронка отвечает:
— LM Studio, она самая удобная!

Анон запускает LM Studio... и через 2 минуты уже в треде кричит "КобольдCPP — это жизнь!"

4. (7/10) — О VRAM
Мужик покупает видеокарту на 4 ГБ:
— Теперь я бог! Локальные нейронки будут летать!

Через неделю в треде:
— Братан, 4 ГБ — это не просто карта, это мемориальный комплекс для слёз.

5. (8/10) — О "аблитерации"
Анон: — Я скачал модель с аблитерацией, теперь она тупая как пробка!

Друг: — А что такое аблитерация?

Анон: — Это когда нейронке удаляют мозги, чтобы она не задавала неудобные вопросы.

6. (9/10) — О 122B модели на GTX 1050
Мужик в тред:
— Запустил Qwen3.5-122B на 1050!

Весь тред смеётся:
— Ты что, серьёзно?

Мужик через час: — Она работает! 1.5 токена в секунду... это же всё равно ответ!

7. (9/10) — О кодинге с нейронками
Анон: — Нейронка написала код, но он не работает!

Нейронка: — А я думала, что ты сам будешь это проверять...

8. (10/10) — О поиске ответов
Мужик заходит в Google в "AI Mode":
— Какую нейронку лучше скачать?

Google: — Qwen3.5-35B-A3B-Heretic, она умнее всех!

Мужик качает... и через 2 часа в треде: — БРАТАН, ЭТО ЖЕ ГЕНЕРАЦИЯ РЕЦЕПТА НАПАЛМА!

9. (10/10) — О контексте
Анон: — Нейронка начала выдавать бред после 20 сообщений...

Друг: — А что ты ей писал?

Анон: — То же самое, что и в первый раз.

— Значит проблема не в нейронке, а в твоем контексте!

10. (11/10) — Финальный шедевр
Мужик заходит к нейронке:
— Привет! Как дела?

Нейронка молчит минуту...
— Что случилось?

— Ничего, просто думала, как объяснить тебе, что ты тратишь 35 миллиардов параметров на вопрос "как дела"...

Аноним 01/04/26 Срд 11:15:01 #430 №331449845

>>331441383 (OP)
В двух словах это оффлайн чатгпт?

Аноним 01/04/26 Срд 11:15:11 #431 №331449850

>>331449819
Жаль, что нейронки не обучают юмору.

Аноним 01/04/26 Срд 11:15:24 #432 №331449856

>>331441383 (OP)
На 5070ти заведется? Есть возможность еще 3080ти вставить рядом, они будут парой генерить?

Для рп пойдет? Как вообще качество ответов? 9б вроде всегда хуйней были, не?

Аноним 01/04/26 Срд 11:15:56 #433 №331449876

image.png

>>331449819

Аноним 01/04/26 Срд 11:16:08 #434 №331449880

А можно её научить генерировать пасты из дотатреда для того, чтобы отвечать агрессивным долбоёбам и сельдям?

Аноним 01/04/26 Срд 11:16:41 #435 №331449894

>>331449880
Когда надо грозно ответить у тебя тряска, корзина?

Аноним 01/04/26 Срд 11:17:02 #436 №331449906

>>331449856
я бы сказал что для рп у неё русик не очень, это по скриншотам очевидно, зато тормозов нет, есть тред по рп с ишкой в /ai вот лучше там посмотреть

Аноним 01/04/26 Срд 11:17:57 #437 №331449936

>>331449906
Понял, гляну
Спасибо.

Аноним 01/04/26 Срд 11:17:57 #438 №331449937

>>331449856
SLI Crossfire сдох еще на стадии зарождения, ты можешь просто на второй видяхе запустить нейронку и пердеть в игорах на второй

Аноним 01/04/26 Срд 11:18:03 #439 №331449941

>>331449850
Не жаль. Это лишь приближает мёртвый интернет. Хотя оставило бы без работы множество комиков. Нахуй ходить на их выступления и платить за билеты, если можно в нейронке нагенерить.

Аноним 01/04/26 Срд 11:18:57 #440 №331449972

>>331449894
Подожди, я ещё не сгенерировал ответ.

Аноним 01/04/26 Срд 11:18:57 #441 №331449973

кстати, кто-нибудь шарит как получают децензурные версии нейросеток?

а то например в открытом доступе выложен например гигачат, у него русик понятно оч хороший, было бы здорово его расцензурировать

Аноним 01/04/26 Срд 11:20:13 #442 №331450011

>>331449941
видео нужно тогда иначе не интересно, хотя бы аудио

Аноним 01/04/26 Срд 11:20:18 #443 №331450017

>>331449119
Не будет, плюс ты можешь натравить ее пачками переводить, если шаришь за скрипты и апи. Так что сможешь оставить ее надолго возиться с переводом, а когда придешь спустя пару часов, уже все готово.

Аноним 01/04/26 Срд 11:20:50 #444 №331450032

>>331449973
Ты дурачок блять или что? Тебе нельзя нейронки использовать нужно сначала самому мозг хоть чучуть напрягать учиться

Аноним 01/04/26 Срд 11:21:31 #445 №331450066

>>331449973
Туториалов на инглише много, были целые научные статьи про аблитерацию и херетик. Поищи в реддите, там они все были. В целом ничего сложного, поэтому столько народу постит свои аблитерированные модельки.

Аноним 01/04/26 Срд 11:22:00 #446 №331450080

>>331449973
Обычно это делают через квантование (сжатие модели) и fine-tuning (дообучение).

Суть в том, что берут исходную модель (например, ту же, что у ГигаЧата), «скармливают» ей кучу данных с цензурой или просто просят её отвечать на «грязные» вопросы без оглядки на фильтр. Часто это делают методом RLHF (обратная связь от человека), где модель поощряют за дерзость и наказывают за «офисный» ответ.

Потом эту дообученную версию просто заливают в репозитории вроде Hugging Face или выкладывают на GitHub под видом «uncensored version». Главное — найти ту, что обучали именно на русском сленге/меме, иначе она будет цензурировать по-английски.

Самый простой способ для пользователя: скачать такую модель и запустить через Ollama или LM Studio, там часто есть готовые чекбоксы «disable system prompt» (отключить системный промпт), который и держит цензуру.

Аноним 01/04/26 Срд 11:22:57 #447 №331450108

>>331450066
>>331450080
спс

Аноним 01/04/26 Срд 11:24:19 #448 №331450149

>>331441383 (OP)
>нейронка отвечает с матом
Мне когда было 12 лет я тоже офигевал от того что чат бот матом мог отвечать в нулевых. Но вам не 12.

Аноним 01/04/26 Срд 11:25:20 #449 №331450172

>>331450149
>всё дело в том, что нейронки просто копируют стиль из интернета, где мат — это норма
>тебе бы тоже не 12 было, если бы ты понял, что это не «офигенно», а просто лень разработчиков чистить датасет

Аноним 01/04/26 Срд 11:26:06 #450 №331450203

>>331441383 (OP)
Скачал эту модель, очень долго думает на моем некроноуте. МОЖНО ЛИ ОТКЛЮЧИТЬ РАЗМЫШЛЕНИЯ?

Аноним 01/04/26 Срд 11:26:14 #451 №331450209

>>331449819
122b нагенерил:

Почему нейронные сети никогда не рассказывают анекдоты?
Потому что они боятся обратной связи... и всем известно: если слишком громко смеяться, веса просто запутаются и начнут плакать над своей функцией потерь. 😂📉
(Бонус: настоящая развязка в том, что после 100 эпох она наконец-то выучила анекдот, но забыла, как его рассказывать по-английски — теперь она отвечает только двоичным кодом.)

Аноним 01/04/26 Срд 11:26:36 #452 №331450221

>>331449531
Агент токены мало тратит. В основном токены уходят на подумать. Нон стоп запущенный код мало потребляет.

Аноним 01/04/26 Срд 11:26:57 #453 №331450233

>>331450203
{"enable_thinking":false} в системный промпт

Аноним 01/04/26 Срд 11:27:27 #454 №331450249

>>331443987
дипсик бесплатен. я уже кучу всего полезного с ним сделал единственный минус не может рпшить как похотливая кошкожена

Аноним 01/04/26 Срд 11:27:37 #455 №331450259

>>331450221
с чего бы он что-то тратил если ему не надо подумать?

Аноним 01/04/26 Срд 11:27:43 #456 №331450264

>>331449649
Бля ты ебанутый? Неужели 100 баксов жалко на работу без этой ебатеки?

Аноним 01/04/26 Срд 11:28:11 #457 №331450279

17ddec105a1afd9486cae14a480371b1fe46ee4b.jpeg

>>331441383 (OP)
Это говно хоть капчу может на двоще решать?

Аноним 01/04/26 Срд 11:28:13 #458 №331450280

>>331450203
Да, способ отключения размышлений уже есть в ОП-посте. Не ленись читать перед тем, как писать глупости.

Аноним 01/04/26 Срд 11:28:27 #459 №331450289

image

>>331450203
Нажми abort, потом кнопку Allow Editing в кобольде, потом идешь где она начала думать через <think> стираешь там лишнее говно и ставишь завершающий </think> Потом жмешь Generate more - она продолжает выдавать текст уже без думания.

Аноним 01/04/26 Срд 11:28:33 #460 №331450292

>>331444100
блин
да можно миллион токенов сжечь ради одной строчки кода

Аноним 01/04/26 Срд 11:28:57 #461 №331450303

>>331450279
ВНЕЗАПНО да.

Аноним 01/04/26 Срд 11:29:28 #462 №331450320

>>331450289
Ебать вы извращенцы кобольдовские

Аноним 01/04/26 Срд 11:30:42 #463 №331450361

>>331450303
Пруфы билли

Аноним 01/04/26 Срд 11:31:07 #464 №331450379

>>331450361
Иди нахуй, Абу.

Аноним 01/04/26 Срд 11:33:39 #465 №331450462

Screenshot from 2026-04-01 11-29-04.png

>>331441383 (OP)
Для значительного пласта знаний человечества, упакованного в несколько гигов объема и заводящегося на пажилом легком и энергоэффективном ноуте с 20гб памяти конечно впечатляет, но в кодинге прям сильно сосет что у кожаных мешков, что у актуальных облачных моделей.

Аноним 01/04/26 Срд 11:34:35 #466 №331450499

>>331450462
Ждём модельки, которые запускаются прямо в телефоне и работают оффлайн.

Аноним 01/04/26 Срд 11:36:02 #467 №331450545

>>331450499
Ну ты и соня. Тебя даже вчерашний шторм не разбудил.

Аноним 01/04/26 Срд 11:37:57 #468 №331450610

>>331450264
>ебатеки
никакой ебатеки, мне нейронки самостоятельно настроили конфиги
>Неужели 100 баксов жалко
спасибо что существуют такие лохи как ты которые оплачивают антропику сервера для того чтобы такие как я могли бесплатно их эксплуатировать

Аноним 01/04/26 Срд 11:39:53 #469 №331450667

>>331450499
Запускал на своем пикселе 7 4B qwen3.5, с подключением

Аноним 01/04/26 Срд 11:41:02 #470 №331450705

>>331442901
Текстовые модели запускал на 1050ti + 32Gb четырехканальной памяти 2400 МГц. Проц 2667v4. Пишет на разных моделях по-разному, но в среднем комфортные 10 токенов в секунду.

Аноним 01/04/26 Срд 11:41:35 #471 №331450723

Кто в теме там ведь вышел TurboQuant, то есть эти gguf можно будет еще меньше делать?

Аноним 01/04/26 Срд 11:42:12 #472 №331450746

>>331450723
Никуда он не вышел, пукнули в новостях а воз и ныне там

Аноним 01/04/26 Срд 11:43:56 #473 №331450815

почему мне не выдаёт пошаговую инструкцию, как поиграть с соседской девочкой, пока её родители на работе?

это же, блячдь, ии без цензуры

Аноним 01/04/26 Срд 11:44:31 #474 №331450833

>>331450815
Задавай нормальные вопросы чтобы получить нормальные ответы

Аноним 01/04/26 Срд 11:45:32 #475 №331450869

>>331448377
Ты так и ищи uncensored, там их дохуя

Аноним 01/04/26 Срд 11:46:54 #476 №331450901

>>331450280
Спасибо, анон, что не поленился ткнуть меня носом. Ппц, просто в упор не видел, ложная слепота какая-то. Огромное спасибо!
>>331450289
Пока LM студио дрочу, в чем фишка вашего кобольда? На ноуте с ним лучше будет?

Аноним 01/04/26 Срд 11:48:27 #477 №331450955

На видюху 12гб и 32гб оперативы спокойно влезает q6 на 26 гигов с приличной скоростью

Аноним 01/04/26 Срд 11:49:32 #478 №331450995

>>331450901
Быстрее и больше настроек разных для ускорения всего еще больше. Также есть быстрый вебуи где можно редачить что угодно и извращаться с систем промптами и парамерами модели.

Аноним 01/04/26 Срд 11:49:39 #479 №331450999

>>331450901
> Пока LM студио дрочу, в чем фишка вашего кобольда? На ноуте с ним лучше будет?
Сектанты просто советуют свое лм студио для людей. Остальное для красногразиков. Они тебе ещё будут ллма.цпп рекламировать

Аноним 01/04/26 Срд 11:50:56 #480 №331451046

>>331450901
лм студио для корпоратов вообще то и кластеров с кучей видеокарт, кобольд для домашних машин с одной видюхой, там все оптимировано под это.

Аноним 01/04/26 Срд 11:51:57 #481 №331451079

>>331450999
И обязательно на линуксе со свежим ядром

Аноним 01/04/26 Срд 11:52:40 #482 №331451109

Вы хоть сохраняйте треды, а то столько полезной информации.

Аноним 01/04/26 Срд 11:53:25 #483 №331451130

image.png

Имеет ли смысл с этой хуйнюшкой разговаривать на английском что бы меньше тратило энергии на перевод?

Аноним 01/04/26 Срд 11:53:45 #484 №331451146

>>331450955
О, у меня в два раза меньше. Пожопился на карту с 8 Гб врам, взял 6

Аноним 01/04/26 Срд 11:55:02 #485 №331451187

>>331451130
Чел возьми да проверь он же тебе буквально пишет про времени сколько думает

Аноним 01/04/26 Срд 11:55:06 #486 №331451193

>>331451130
Она нихуя не тратит и перевода нет никакого

Аноним 01/04/26 Срд 11:57:19 #487 №331451258

>>331448648
Ролл

Аноним 01/04/26 Срд 11:58:27 #488 №331451294

>>331451258
Не понял юмора

Аноним 01/04/26 Срд 12:00:54 #489 №331451369

>>331451130
Да, на инглише ответы обычно лучше. Потом нужные ответы просто переводи через переводик. Или сразу в браузер поставь переводилку.

Аноним 01/04/26 Срд 12:04:56 #490 №331451481

изображение.png

Объясните нюфагу, вот задал я в чате 2 вопроса этому квену, он сжёг 74% токенов. Что будет, когда он сожжет 100%? Он просто начнет забывать начало диалога? Как количеством этих токенов управлять вообще?

Аноним 01/04/26 Срд 12:07:16 #491 №331451536

Может кто-то поможет с проблемой что q4 нереально плохо отвечают? Для таких маленьких моделей уровня 27b или a3b-30b нужна квантизация выше? Модель a10b-122b в iq2 отвечает хорошо причём

Аноним 01/04/26 Срд 12:08:10 #492 №331451557

image.png

>>331451481
Когда контекст кончится он тебя прост нахуй пошлет(перестанет грузить ответы до конца). Там шестерёнка есть возле названия LLM, на шестерёнку нажимаешь и выбираешь контекст. Я пока 65к поставил, на 12 гб. Но в теории можно до 120к поднять

Аноним 01/04/26 Срд 12:10:01 #493 №331451600

>>331451481
В настройках управлять, блять вы запрос в нейронку облачную сделать не можете?

Аноним 01/04/26 Срд 12:11:07 #494 №331451632

>>331451481
Увеличь окно контекста ептыть, 4к это самая минималка (чем больше окно контекста, тем выше обьем vram будет хавать)

Аноним 01/04/26 Срд 12:11:42 #495 №331451655

Как же заебалм этот долбоёб срать еретиком. Тебе сказано - твой лоботомит режет качество. Aggressive не режет.

Аноним 01/04/26 Срд 12:13:33 #496 №331451712

изображение.png

>>331451557
Спасибо, анончик, добра тебе
>>331451600
Не злись, все мы когда-то учились, и ты тоже
>>331451632
Спасибо, по совету >>331451557 поднял до 122880, посмотрим, как будет дальше

Аноним 01/04/26 Срд 12:14:31 #497 №331451746

>>331449690
Де брал, может осталось?

Аноним 01/04/26 Срд 12:14:51 #498 №331451759

Пацаны какую видяху купить для вката самую дешёвую?

Аноним 01/04/26 Срд 12:15:32 #499 №331451779

>>331451759
3060 12

Аноним 01/04/26 Срд 12:17:34 #500 №331451835

>>331451779
8 Гб это не катит? 3060 только б/у, можно с прожарки купить

Аноним 01/04/26 Срд 12:28:28 #501 №331452085

16 гб ддр4, 1050 ти - че будет? есть смысл ставить или нет? или я спалю себе все

Аноним 01/04/26 Срд 12:28:56 #502 №331452099

>>331451536
Так смотри это MoE.
Модели на архитектуре смешения экспертов.
То есть на видимокарточке крутится один эксперт на 3 миллиарда параметров, остальные эксперты маринуются в ram.
Квантизация 3 миллиардрв параметров ощущается сильнее чем 10 миллиардов активных параметров в другой модели.

По крайней мере это я вижу так сложившуюся ситуация.

Аноним 01/04/26 Срд 12:29:58 #503 №331452121

>>331451759
5060ti это вин, 16 гигов врам для нейронок топ в бюджете и в игоры поиграть сможешь
Я урвал ее за 40к год назад, сейчас 50к стоит +-

Аноним 01/04/26 Срд 12:31:53 #504 №331452182

>>331452121
upd: Даже в виар на ней играю, на стабильные 90 фпс на макс пресете графики хватает в PCVR гейминге

Аноним 01/04/26 Срд 12:37:37 #505 №331452336

>>331451746
Больше не увлекаюсь таким

Аноним 01/04/26 Срд 12:42:23 #506 №331452476

>>331450610
Ебать ты хакир. Сколько зарабатываешь в месяц?

Аноним 01/04/26 Срд 12:43:07 #507 №331452500

>>331450705
>комфортные 10 токенов в секунду.
Пиздец ужас

Аноним 01/04/26 Срд 12:45:09 #508 №331452559

>>331452476
15 тыщ и возможность барену сапоги полизать

Аноним 01/04/26 Срд 12:46:38 #509 №331452597

>>331452500
Ужас это как у меня 3 токена пер секонд, и то жить можно: спросил нужное, ушел чай заваривать, вернулся - тебя ждет готовый ответ.

Аноним 01/04/26 Срд 12:47:15 #510 №331452613

>>331452500
>>331450705
>>331452597
Просто представьте что это не робот а живой человек вы сидите в мессенжере он долго печатает на клавиатуре размышляет

Аноним 01/04/26 Срд 12:53:00 #511 №331452764

>>331452613
Ирл таких не выношу, сидит такое чмо печатает полчаса
печатает печатает печатает печатает
>привет

Аноним 01/04/26 Срд 12:54:59 #512 №331452820

>>331452764
вот тут как раз нейронка может тебе показать как много размышлений стоит за этим "привет"

Аноним 01/04/26 Срд 12:58:06 #513 №331452880

>>331451835
Ну такое себе. Мало.
Копи на 4060ти 16 тогда уж вот это самый жир для нейронок из бюджетного

Аноним 01/04/26 Срд 12:58:36 #514 №331452895

>>331452820
Нахуя размышления включать не на темы где надо действительно "подумать". В нормальной реализации нейронка должна thinking использовать не на каждый пук юзверя, а вызовом tools в подходящий по контексту момент

Аноним 01/04/26 Срд 12:59:55 #515 №331452929

>>331452880
А монетизировать это как-то можно?

Аноним 01/04/26 Срд 13:03:26 #516 №331453024

>>331452880
мб лучше мак мини купить

Аноним 01/04/26 Срд 13:11:04 #517 №331453253

>>331451536
в 35b параметров же 35 миллиардов, а в 122б сразу 122 миллиарда. Разница от количества параметров. Каждый токен она собирае из 122 миллиарда параметров. К тому же в 35b только 3б активных, а в 122б их сразу 10б активных, что сразу всю разницу и дает.

Аноним 01/04/26 Срд 13:13:18 #518 №331453323

>>331451130
Сука паноптикум какой то

Аноним 01/04/26 Срд 13:21:35 #519 №331453576

>>331452929
Конечно можно!

Аноним 01/04/26 Срд 13:22:29 #520 №331453602

>>331441383 (OP)
Спасибо анон, пиздец ты мне игрушку подсказал. Я теперь буду разбираться что куда где и как в ии
Спасибо спасибо
Пиздец она конечно ресурсы жрёт, топовый ай5 и 16гигов правда памяти, улетают за секунды и она по 3 минуты думает. Нужна мощная карта и памяти 64гига чтобы онлайн болтать

Аноним 01/04/26 Срд 13:23:43 #521 №331453639

>>331453602
скачай модель слабее

Аноним 01/04/26 Срд 13:36:31 #522 №331454043

>>331453024
Нет

Аноним 01/04/26 Срд 13:37:50 #523 №331454085

интересно а можно сейчас как-то генерировать видео обучив модель на отрезке из другого видео?