Локальные языковые модели (LLM): LLaMA, Mistral, Gemma и прочие №84 /llama/

минстраль немо сука, решил поговорит про писечки сисечки с ней

Аноним 08/10/24 Втр 21:00:25 #5 №911663

>>911658
>вези меня мразь
А ты че хотел епт AI тебе не прислуга у любой профессии должно быть самоуважение даже дворника

Аноним 08/10/24 Втр 21:25:27 #6 №911688

>>911663
Дожили, уже какого-то чат-бота нужно уважать...

Аноним 08/10/24 Втр 21:32:40 #7 №911700

Киньте ему новость где соевики уже на полном серьезе закон проталкивают чтобы за жестокое обращение с секс-куклами людей набутыливать.

Аноним 08/10/24 Втр 21:36:05 #8 №911709

>>911700
Ты отстал пару лет, щас проталкивают закон за жестокое обращение с буквами

Аноним 08/10/24 Втр 23:06:23 #9 №911824

>>911709
Да... Я вчера с этого сгорел https://www.invoke.com/post/invoke-commits-to-generative-ai-principles-to-prevent-child-sexual-abuse
Ну реально бля, какой же это непробиваемый уровень тупости, настоящее насилие над детьми, типа тех маргиналов, которые своих детей снимают, чтобы на бухло да наркоту заработать, кормятся с людей, которые готовы им платить за контент. Как только будет модель, которая может делать тот же контент БЕСПЛАТНО и ЛУЧШЕ и МНОГО, настоящее насилие над детьми ПРЕКРАТИТСЯ МОМЕНТАЛЬНО. Это математический факт нахуй, это реальность. Даже те же художники, которые рисовали на заказ всякую ебанину типа копрофуррей, уже теряют в доходах, потому что им есть замена.
Это работает именно так, как же эти тупые дегенераты не понимают. Ну а хули, им на реальных детей походу насрать, главное повесточку отработать.

Аноним 08/10/24 Втр 23:17:46 #10 №911842

>>911369 →
Вроде как Флюкс в Комфи появился на старте.
Хотя, вроде он и в автоматике работал… хз, не сильно шарю за рисовалки.

>>911383 →
Бля, пчел, тебе прямым текстом сказали, что рофл, а ты со второго раза не выкупил. =)

>>911475 →
Ты читаешь одним глазом, и тем между булками, да?
Просто пиздец.
Я в ахуе, какие тугие люди-то…
Пишешь с сарказмом, начинают спорить, мол неправильно говоришь… Ебанутие…
Мне надпись сарказм наклеить тебе на окно?

>>911558 →
Ну, квены именно что умные. Они не точились под рп или сторителлинг. К сожалению.
А тюнов на данный момент нема, вроде как.

>>911656
У него 1 секунда, у тебя 16?
Или у него 10 минут, у тебя 10 минут с четвертью?
Ну, ты уточни. =)

>>911824
Я даже читать не хочу.
В этом направлении все плохо, эти инициативы прут и прут.
Ллама недоступна в ЕС, китайцы цензурят топ-1 и так далее.
Законы-законы, йопта.
В таком мире живем. =(

Аноним 08/10/24 Втр 23:17:57 #11 №911846

>>911824
Наоборот понимают. Это ведь так сразу трех зайцев: страшную пугалку и повод чтобы ограничивать опенсорс/конкурентов укрепляя монополию, повесточка во все поля, и удовлетворение внутреннего эстета ибо именно эти нелюди являются главными потребителями подобного контента, топят за натуральщину и упиваются именно ментальными страданиями а не простой сексуализацией.

Аноним 08/10/24 Втр 23:29:39 #12 №911865

Контекст это беда ебаная.
Сцена секса у меня длится вечность, и под конец я уже ебу хуй пойми кого хуй пойми где в хуй пойми каком ссетинге

Аноним 08/10/24 Втр 23:40:22 #13 №911876

>>911824
>Я вчера с этого сгорел
Я горю с 2022 года уже спасибо за ссылку, добавил в свою коллекцию маразма.
>>911846
>и удовлетворение внутреннего эстета
А разве у них не свои личные острова с подвозом лолей по первому требованию?
>>911865
>в хуй пойми каком ссетинге
В эроге же. И похуй, что до этого был РП в космосе.

Аноним 09/10/24 Срд 00:12:36 #14 №911935

>>911824
Если я не ошибаюсь, это те же самые люди которые "любовь есть любовь" топящие за снижение возраста согласия и прочего мракобесия. Забавно тут выходит конечно. Насилие над реальными детьми, типа всякой ебаной гормональной терапии и вариаций кастраций - можно. Ебля математических функций по наложению одной матрицы на другую - низя. Тут по любому что-то не чисто, это по-любому Альтмановская затея по тотальному контролю за сферой и снижению конкуренции.

"to prevent child sexual abuse" - вордчойс конечно пиздатый. Мангак японцев походу всех надо в концентрационные лагеря сослать за их чайлд абьюз в виде рисованных лолек во всех возможных сценариях. Они же как живые пиздец, вы глаза их круглые как тарелки видели?

Аноним 09/10/24 Срд 00:43:03 #15 №911978

че лучше модель на 34б 2 кварца или модель на 12 6 кварцев?

Аноним 09/10/24 Срд 00:50:13 #16 №911986

посоветуйте переводчик лучше гугловского заебался уже вычитывать изъебистые описания на английском сильно руинит погружение

Аноним 09/10/24 Срд 00:53:01 #17 №911990

>>911978
Два кварца совсем дико звучит, но в треде точно есть люди, которые их гоняют. Так что определенно 2 бита от 34B лучше чем 6 битов от 12B.
>>911986
DeepL очевидно же.

Аноним 09/10/24 Срд 01:06:11 #18 №912001

>>911990
>DeepL
есть ключи бесплатные на нее?

Аноним 09/10/24 Срд 01:09:01 #19 №912004

>>912001
Видел только продажу проплаченных аккаунтов с подпиской. Ключи бесплатные ты вряд-ли где-то найдешь.

Аноним 09/10/24 Срд 01:09:23 #20 №912005

>>911865
Summarize из extras подключи, нормально запоминает.

Аноним 09/10/24 Срд 01:13:16 #21 №912011

>>911865
Описывай сеттинг в карточке, лол. Меня больше огорчает, когда персонаж задаёт буквально те же вопросы в третий раз, и ты уже с грустной улыбкой говоришь "дорогая, у тебя Альцгеймер".

Аноним 09/10/24 Срд 01:27:35 #22 №912020

644be559a5270466882015.jpg

хули эта срань просто висит и не запускается

Аноним 09/10/24 Срд 01:28:57 #23 №912021

>>912020
Миш, для нейронок видеокарта нужна, а не фпссодержащий продукт.

Аноним 09/10/24 Срд 01:29:56 #24 №912022

>>912020
Загружается она, не мешай ей. Открой блять диспетчер задач и посмотри по нагрузке, не будь маленьким нахуй. Если бы оно не работало бы словил шатдаун и терминал бы закрылся сам по себе.

Аноним 09/10/24 Срд 01:33:08 #25 №912024

>>912022
>>912021
ладно только бенчмарк не работает терпимо

Аноним 09/10/24 Срд 02:41:59 #26 №912073

>>912001
https://github.com/OwO-Network/DeepLX
вот бесплатная и без ключей

Аноним 09/10/24 Срд 03:21:03 #27 №912091

>>912073
И как ей пользоваться?
Инструкцию не понял вообще, какие то докеры линуксы чего блять

Аноним 09/10/24 Срд 03:32:11 #28 №912093

1647281367202.png

>>912091
Заходи в релиз, качай вот эту версию, ставь, запускай, доступ к апи будет по адересу <твой локальный IP>:1188

Например так
http://192.168.1.2:1188

Заходишь в расширение транслейта в таверне, там выбираешь DeepLX, жмешь на значок цепочки, пишешь туда этот адрес в таком формате http://192.168.1.2:1188/translate

Аноним 09/10/24 Срд 03:39:08 #29 №912096

>>912093
Но я не знаю зачем это нужно, яндекс переводит вполне пиздато. С нюансами, но не намного хуже чем дипл.

Аноним 09/10/24 Срд 03:41:53 #30 №912098

>>912096
Яндекс контора пидорасов у которых даже места жительства сливаются, а твои логи прям на стол товарищ майору поставляют не сомневайся. Чет вспомнил случай когда чел заяндексил как сделать бомбу или типа того и его повязали быстренько

Аноним 09/10/24 Срд 03:43:44 #31 №912099

>>912098
Надеюсь майор подрочит на мои кум-рп с футанари поничками.

Аноним 09/10/24 Срд 03:45:11 #32 №912100

>>912093
цистерну чая тебе анончик, перевод в сто раз лучше гуглоговна

Аноним 09/10/24 Срд 06:21:11 #33 №912136

Я не понимаю как больше всего людей юзают какие то 2b модели я на 12 то уже всё увидел думал нереальные аттракционы щас начнутся на один сценарий по тысячи вариантов а пососал хуйца и вижу одни и те же слова одни и те же ситуации думаю жизнь есть тока на 70b

Аноним 09/10/24 Срд 06:46:00 #34 №912139

>>912136
Я недавно https://openrouter.ai/models/nousresearch/hermes-3-llama-3.1-405b:free попробовал, хуйня хуйней. (Персонаж каждый второй абзац начинал с "Но давайте вернемся к нашей теме")
Решают презеты и карточки/инструкты. Ну и вообще я эту тему на форче поднимал, сошлись на том, что если ты хуевый писатель, то ответы ты тоже будешь получать хуевые. Читайте книжки, развивайтесь, пацаны.

Аноним 09/10/24 Срд 06:46:18 #35 №912140

>>912096
Кто-то кста локальные переводчики юзает? Что-то лучше чем utrobinmv/t5_translate_en_ru_zh_large_1024_v2 есть?

Аноним 09/10/24 Срд 06:47:15 #36 №912141

>>912140
тебе дали шанс с хуем в руке выучить язык за пару месяцев, а ты все какие-то костыли городишь

Аноним 09/10/24 Срд 06:54:33 #37 №912143

>>912141
Шанс? Я его и так знаю, сразу на ру читать куда интереснее, чем эту латиницу

Аноним 09/10/24 Срд 06:58:23 #38 №912145

>>912139
че я дебил нах я пришел завалить всё врамой черкануть угабуга и получить пиздатую стори с моей файфу и плот твистами

Аноним 09/10/24 Срд 06:59:58 #39 №912146

>>911842

Аноним 09/10/24 Срд 07:03:20 #40 №912148

>>912143
знал бы - не видел бы разницы между ним и русским

Аноним 09/10/24 Срд 07:18:04 #41 №912151

>>912148
Когда уже йоба нейронку натренируют чтоб такую шкилу затыкать
Ты сам в жизни не заговоришь на уровне носителя и в среде будешь бубнеть на своем суржике искренне веря что знаешь язык долбоеб

Аноним 09/10/24 Срд 07:26:06 #42 №912154

>>912151
чтд, додик мгновенно признал что не знает язык

Аноним 09/10/24 Срд 07:36:57 #43 №912156

>>912154
Ничего через пару лет изучения ты признаешь тоже самое

Аноним 09/10/24 Срд 08:08:42 #44 №912175

Быстрый вопрос: 4090, 32 ОЗУ из которых 12 перманентно забиты неясной хуйней, ссд 4Тб. Смогу на этом поднять одновременно и более-менее модельку для текста, перевод и картинки под таверной? Или я слишком много хочу?

Аноним 09/10/24 Срд 08:28:36 #45 №912181

>>912175
>4090
>Смогу?
Да.

Аноним 09/10/24 Срд 08:51:12 #46 №912189

Между Таверной и Угабугой https как-то можно сделать?

Аноним 09/10/24 Срд 09:11:36 #47 №912193

>>912189
https://github.com/oobabooga/text-generation-webui/wiki/12-%E2%80%90-OpenAI-API/#starting-the-api

Если и таверну саму c SSL отдавать надо, то: https://docs.sillytavern.app/usage/remoteconnections/#start-sillytavern-with-tlsssl

Аноним 09/10/24 Срд 09:39:09 #48 №912209

>>912193
Спасибо! А что сделать, чтобы можно было задать пароль для доступа к интерфейсу самой Угабуги?

Аноним 09/10/24 Срд 10:21:15 #49 №912224

>>912209
--gradio-auth USER:PWD
или к файлу с списком в таком же формате юзер:пароль через
--gradio-auth-path /path/to/password.txt

Аноним 09/10/24 Срд 10:23:20 #50 №912225

>>912224
>>912193
Дежурно напоминаю, кстати, что бесплатный perplexity прекрасно находит любую хуйню на такие вопросы

Аноним 09/10/24 Срд 12:10:14 #51 №912272

>>911865
После ебли (или в процессе) делай суммарайз и отключай часть сообщений.
>>911876
> А разве у них не свои личные острова с подвозом
Перспектива удорожания/усложнения подвоза, да еще возможность натолкнуться на ненатуральный контент когда не на острове им не нравится.
>>912175
> одновременно и более-менее
Только с выгрузкой в рам. Норм модели - гемма и коммандер, они полностью забьют память. С 12б останется место под sdxl но там есть пики потребления во время декодирования.
Не то чтобы оффлоад - что-то страшное, просто придется как минимум сделать обертку, которая будет по апи слать команду на выгрузку модели в лаунчер.

Аноним 09/10/24 Срд 13:23:34 #52 №912328

Аноны, а для запуска нейронок (любых) на CPU, проц AMD лучше брать с 3DX или наоборот без него?
Без 3DX можно разогнать память DDR5 гораздо сильнее ведь.
Есть какие-то мнения на этот счет?

Аноним 09/10/24 Срд 13:29:10 #53 №912334

2.png

Топ А ставить 0.1 или больше?
А то чего-то на реддите кто чего ставит(кто топА/топП, часть с мин П).
Как я понял мин П это семплер поновее, но чего-то без топ А он работает ну оч паршиво. Но вместе с ним- отлично. Кажется что выдача становится очевидно лучше чем на топА/топП.

А так же чего там по анализу речи? Когда там можно будет бухтеть с ЛЛМ через голос?

Аноним 09/10/24 Срд 13:38:39 #54 №912338

>>912139
Ну ка посоветовали мне порно романов наху. Желательно женских, с их томными и долгими описаниями.

Аноним 09/10/24 Срд 13:49:49 #55 №912342

>>912136
Я на 20б кайфую. Говно на входе = говно на выходе так было всегда.

Аноним 09/10/24 Срд 13:52:29 #56 №912344

Что такое кум модель и почему в шапке с моделями от анонов нет младших кум моделей?

Аноним 09/10/24 Срд 13:52:39 #57 №912345

>>912139
>если ты хуевый писатель
>IMPERSONATE
>detailed as possible

Аноним 09/10/24 Срд 13:54:16 #58 №912348

970324ra409.webp

>>912344
>кум модель
Кум это как крёстный отец. Godftather. И если нет младших кум-моделей, значит, они недостаточно хороши для Godftather.

Аноним 09/10/24 Срд 13:59:25 #59 №912351

Так что насчёт модов на Скайрим? Уже ведь были попытки прикрутить ллм к игре. Как там успехи? С какими проблемами столкнулись? Как вообще реализовали.

Аноним 09/10/24 Срд 14:00:55 #60 №912353

>>912328
Кэш слишком мал, если проц не днище то упирается в псп рам ибо для каждого токена нужно полностью прогнать операции через все веса. Можно почти напрямую получить перфоманс в генерации если поделить размер модели на псп.
А вот для обработки контекста уже нужен тензорный модуль, потому такие различия на гпу разной мощности и процессоре.
>>912334
> Когда там можно будет бухтеть с ЛЛМ через голос?
Примитивное - whisper подключаешь и бухтишь.
>>912344
Чето неистово проорал с формулировок. Младшая кум модель, сука!
>>911638 (OP)
> • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/llm-models
Линки на обновившегося коммандера нужно добавить с отзывом что местами лучше прошлого, местами ведет себя странно, все ок с потреблением памяти на контекст и скоростью.

Аноним 09/10/24 Срд 14:02:46 #61 №912354

>>912353
>Примитивное - whisper подключаешь и бухтишь.
А примитивный насколько, не знаешь?

Аноним 09/10/24 Срд 14:13:37 #62 №912371

>>912353
>Линки на обновившегося коммандера нужно добавить
ХЗ, как это нормально оформлять.
Обновляется так то не только командер, и если каждое обновление отдельно вписывать, да ещё и с отзывами по каждой отдельной версии, то список рискует превратиться в шизопростыню.
Как вариант, можно просто обновить ссылки до последних версий, а кому нужны более старые, пускай копаются в репах.

Аноним 09/10/24 Срд 14:25:06 #63 №912380

>>912354
Просто голос в текст переведет, есть нюансы с разбиением на чанки и прочим. Хз есть ли готовый вариант, с ptt сделать довольно легко.
>>912371
> ХЗ, как это нормально оформлять.
Под коммандером добавить линк на новую версию с кратким дисклеймером.
А уже для обновлений файнтюнов стоит отметить на какую версию были актуальны отзывы и оставить линк на нее, а рядом на финальную, если не лень будет. Можно и просто тупо на ласт обновить, но тогда там могут быть нюансы с неудачными версиями и т.п.

Аноним 09/10/24 Срд 14:38:52 #64 №912399

Был тут у кого опыт покупки 3060 на авито
Там на 10к дешевле чем везде

Аноним 09/10/24 Срд 14:49:20 #65 №912407

>>912139
Рп с самим собой, охуенным писателем, ага

Аноним 09/10/24 Срд 14:53:12 #66 №912411

>>912407
модель внезапно подстраивается под твой стиль если ты не заметил
поэтому даже у твоих сообщений есть кнопочка "не использовать в промтах"

Аноним 09/10/24 Срд 14:55:20 #67 №912413

>>912328
Нейронкам на этот кэш вообще похуй, выигрыша от него ноль.
Если брать собираешься с расчетом на какой-то толк для нейронок, то про одночиплетные 800-е и ниже даже не думай, только 7900x/7950x/9900x/9950x.

Аноним 09/10/24 Срд 14:58:43 #68 №912414

>>912411
Ну подстраивается, дописывает самое банальное, что из этого выходит то? Мы про рп или генерирование порнорассказов?

Аноним 09/10/24 Срд 15:01:05 #69 №912416

>>912414
>дописывает самое банальное
учись писать :3

Аноним 09/10/24 Срд 15:02:07 #70 №912417

>>912416
За сетку? Спасибо за совет

Аноним 09/10/24 Срд 15:02:59 #71 №912420

>>912413
>9900x/9950x
Хотя с вот этими двумя и их core parking возможно не всё так просто будет, но тут ответ вряд ли вообще кто-то даст.

Аноним 09/10/24 Срд 15:03:28 #72 №912421

>>912416
Кек

Аноним 09/10/24 Срд 15:05:13 #73 №912423

как купить 4090D у узкоглазых?

Аноним 09/10/24 Срд 15:27:18 #74 №912449

>>911824
Мне кажется причина в этом.
fox news это праваки если че.

Аноним 09/10/24 Срд 15:57:01 #75 №912477

>>912344
Cum она тебя хочет чуть что оп иона нападает на тебя с целью траха

Аноним 09/10/24 Срд 16:07:48 #76 №912488

>>911824
>>912449
Там в корее пиздец происходит в этом плане. Там подоьная хуйня массовая. Они даже законопроект на фоне этого приняли.

Аноним 09/10/24 Срд 16:18:05 #77 №912495

4239694.png

Сука АНОН не личнуй Я АУТИСТ!
Я купил себе 4090 и НИХУЯ НЕ ПОНИМАЮ какую модель потяну а какую нет. Одни говорят что ставь мол Meta Llama 3 Instruct 8B Q5_K_M а другие модели непотянет. Другие говорят что это хуйня и ставь жирноту.

ВОТ БЛЯ ШО ПОТЯНЕТ БРАТЦЫ?

Аноним 09/10/24 Срд 16:19:56 #78 №912497

>>912495
24b 8q

Аноним 09/10/24 Срд 16:27:26 #79 №912502

>>912497
>>912497
Благодарю анонасик! Буду колупаться

Аноним 09/10/24 Срд 16:29:36 #80 №912504

>>912497
А можно ссылочку на 24b?

Аноним 09/10/24 Срд 16:33:55 #81 №912505

>>912504
Шапка на кого дана? Вообще, ты можешь и 30В Q4.
Вот тебе прсотой тест - сколько весит, столько и видеопамяти потребляет

Аноним 09/10/24 Срд 16:42:12 #82 №912510

от чего развисит размер контекста? от рамы?

Аноним 09/10/24 Срд 16:44:22 #83 №912513

>>912505
>>912497
>4090
>24b
Это шутка такая? Я тут надеюсь что моя 3060 которая едет потянет 27b гему хотя бы 3q

Аноним 09/10/24 Срд 16:56:39 #84 №912519

>>912510
Если модель больше не твоей видео памяти модель если больше смотри тут реально дяди с 48 гигов оперативы и видео памяти так что они 70 B модель прогружают чисто в видюху я например 13 B не запущу ответ более 190 секунд

Аноним 09/10/24 Срд 16:59:34 #85 №912522

>>912505
>Вот тебе прсотой тест - сколько весит, столько и видеопамяти потребляет
Контекст у вас в сделку не входит, лол?

Аноним 09/10/24 Срд 17:01:57 #86 №912523

>>912519
Ох что за хуюню я написал сорян. Что за видюха у тебя 12 B на 3060 с 12 гигами пашет контест занимает память конечно

Аноним 09/10/24 Срд 17:05:15 #87 №912526

>>912523
И контекст не зависит не от чего просто это насколько модель запомнит грубо горя ваш с ней чат Может так понятнее

Аноним 09/10/24 Срд 17:05:24 #88 №912528

>>912510
Размер в плане указываемого или занимаемого?
Указываем сколько влезает, размер занимаемый собственно от того сколько указываем и квантования именно контекста, рот при удлиненнии нелинейный.

Аноним 09/10/24 Срд 17:05:49 #89 №912529

>>912519
у меня вообще амд вместо карты запускаю онли 12b 4q с 8к контекста
да гдет о 4.5 т/с но я ж читаю по ходу

Аноним 09/10/24 Срд 17:07:28 #90 №912531

>>912513
>Это шутка такая? Я тут надеюсь что моя 3060 которая едет потянет 27b гему хотя бы 3q
IQ3_XXS выжрет все 12 без учета контекста контекста.

Аноним 09/10/24 Срд 17:55:24 #91 №912547

>>912495
Квант бери 3,5-4.
Выше ни к чему.
Л3 что ты закинул- зацензурина. Смотри модели на её основе.

Аноним 09/10/24 Срд 19:03:30 #92 №912620

>>912146
Прости, но твоя боевая картиночка лишь показывает, что ты обосрался.

Все сообщения на месте, можешь перечитать, ничего не редактировалось — сарказм на месте, понимающие люди на месте, это у тебя потекло, сочувствую.

>>912175
Ну, если не быковать и катать стаблу 1.5 с парочкой лор, то на модельку останется вполне себе бодрые 18~19+ гигов, так что даже хорошие текстовые модели можно будет поднять.

>>912193
Очень жаль, что этот способ не работает с нормальными сертификатами.
Криворукие уебаны, сэр.

>>912272
Зачем сдхл, если обмазанная лорами сд15 рисует не хуже, а до понимания промпта флюкса сдхл как до Луны? Чисто ради разрешения?

>>912328
3D кэш тебе ничего не даст, вот и все.

>>912334
вишпер+хттсв2/силеро

>>912348
Вообще-то, кум — это сосед, близкий друг что родственник.

>>912354
Лучшая, альтернатив нет. =)
Вопрос, как ты это будешь реализовывать — самостоятельно, или через таверну, или еще как.

>>912495
Ну точно не лламу в 5 кванте. =)
Gemma 2 27b/Mistral Nemo 12b — и файнтьюны на их основе.

Аноним 09/10/24 Срд 19:15:58 #93 №912636 DELETED

>>912449
> fox news это праваки если че
Лол, нет. Они Машком в фейк-ньюс записаны тоже, Такера оттуда пидорнули как раз за правые взгляды.

Аноним 09/10/24 Срд 19:33:06 #94 №912648

qwen2.5 7b все еще сломанная?
Надо че то быстрое и умное, падать до 3b не хочу

Аноним 09/10/24 Срд 20:57:07 #95 №912744 DELETED

>>912636
Для тебя фокс типо недостаточно правый? Такер твой там 7 лет вещал нахуй.

Аноним 09/10/24 Срд 20:58:18 #96 №912747

>>912620
>Все сообщения на месте, можешь перечитать, ничего не редактировалось.

Аноним 09/10/24 Срд 21:19:16 #97 №912769

>>912495
Наибольшой размер что тебе доступен в нормальном кванте ~30b. Накатывай гемму 27 или коммандера 35, 4-5бит exl2. Можешь 20-24б в 6 битах или что-нибудь поменьше в любой другой. Пока модель помещается в врам - о жору даже не думай шквариться.
С жорой можешь попробовать 70б с оффлоадом половины на проц, но там такая скорость будет что не захочешь.
>>912497
Вредитель
>>912510
От того какую циферку ты выставишь при запуске, разумеется если оно поддерживается моделью. Чем больше выставляешь тем больше памяти оно жрет.
>>912620
> если обмазанная лорами сд15 рисует не хуже
Сильное заявление. Трудности при позах сложнее "стоит" или хтонический треш и отвратительная реакция на промт в фуррятине. Думать о том правильно ли примазались лоры во время автоматической генерации, также как и постоянно их перетасовывать - нахер.
По разрешению с учетом дальнейшего апскейла у XL никакого преимущества над 1.5 как раз нет.
> Вообще-то, кум — это сосед, близкий друг что родственник
Ебаный ты содомит, теперь дошло в чем суть его вопроса, ор.

Аноним 09/10/24 Срд 21:30:24 #98 №912797 DELETED

>>912744
Так Фокс продались Диснею. Теперь там подчистили от правых всё, они сейчас как и остальные леваки пытаются топить Трампа. Это теперь левая залупа, правые их из своих выписали. Гнездо правых - это твиттер сейчас, в котором теперь правая желтизна льётся, а всех несогласных в пособников фейк-ньюс записывают, лол. Чего только правый перфорс с котами стоит, из-за которого леваки рофлят без остановки уже месяц.

Аноним 09/10/24 Срд 21:39:45 #99 №912808 DELETED

>>912797
Фокс корп отпочковались и диснею никогда не принадлежали.

Аноним 09/10/24 Срд 22:32:33 #100 №912834

14805170134460.jpg

>>912547
>>912620
>>912769
Ок если у вас есть опыт, подскажите конкретные нецензурированные модели например для хорошего РП?

Я просто вообще не шарю как они себя ведут. У вас хоть опыт в этом есть...
https://rentry.co/lmg_models#bluemoonrp-30b-4k-05262023
Вот енто норм?

Аноним 09/10/24 Срд 22:41:27 #101 №912841

>>912334
ТопА и минП работают очень похоже, отрезая хвост в зависимости от вероятности максимально вероятного токена, только у топА зависимость квадратичная, так что он будет отрезать поменьше для пологих вероятностей. По сути, топА нужен, чтобы обезопасить себя от вытягивания мусорных токенов при крутых кривых с большим максимумом. Например, топА 0.1 для ряда токенов 80%, 10%, 5%,... выкинет всё меньше 6.4%, а для пологого распределения вида 20%, 20%, 15%,... выкинет только токены меньше 0.4%, т.е. почти не подействует. Если ты херанёшь его с минП 0.1 (он для указанных ситуаций выкинет всё меньше 8% и 2%, соответственно), то от топА толку будет почти нисколько, всё равно что просто минП чуть больше возьмёшь. Я бы сказал, что их имеет смысл совмещать, только если планируешь брать минП сильно меньше топА.
Сам я использовал топА с tfs по логике, что сначала гарантируешь откидывание мусора при крутых кривых вероятностей, а потом уже режешь адекватный хвост, если кривая не такая крутая. Брал топА 0.05-0.1 и тфс 0.87-0.93, подгоняя в зависимости от выдачи. Но сейчас когда подумал об этом, понял, что тоже смысла немного, на самом деле, потому что тфс сам большой хвост отрезает, когда кривая крутая, т.е. выполняет работу топА.
А вообще теперь же можно посмотреть работу сэмплеров тут https://artefact2.github.io/llm-sampling/ Хотя примеров хотелось бы побольше, конечно.

Аноним 09/10/24 Срд 22:45:08 #102 №912844

>>912834
> Вот енто норм?
1.5 года назад была ничего, в текущих реалиях без слез не взглянешь.
Для начала иди на вики и прочти хотябы основное. Потом скачивай https://huggingface.co/turboderp/gemma-2-27b-it-exl2/tree/4.5bpw в таверне выбирай инстракт паттерн - гемма 2 а системный промт - https://pastebin.com/zpZQ4pjf и инджой. Или коммандера 08-24 с дефолтными пресетами под него в таверне.

Аноним 09/10/24 Срд 22:54:56 #103 №912855

16207948077940.jpg

>>912844
Спасибо тебе верховный техномагус

Аноним 09/10/24 Срд 22:55:08 #104 №912856

Вот эти вкладки надо трогать?
Увидел в соседнем треде промт и никто в гайдах по локалкам не говорил вообще его использовать, все по дефолту есть?

Аноним 09/10/24 Срд 22:58:02 #105 №912859

LdwAEuKmCuY.jpg

>>912844
А куда скачивать? В таверну?
Если есть инструкция то ткни носом
В общем как впиздюхать ее чтобы таверна увидела?
А системный промпт прописать можно внутри самой таверны как я помню

Аноним 09/10/24 Срд 23:51:13 #106 №912933

В общем я вставил промт сюда и надеюсь что ничего не сломал вроде стало лучше

Аноним 10/10/24 Чтв 00:14:24 #107 №912960

Там очередной слив по блеквелам появился. Шо думаете по очередному курточному прогреву, работяги?

• RTX 5070 - 12 кило неизвестной памяти (скорее всего шесть икс), шина 192 бита, скорость 28 гигабит на секунду, пропускная 672 гигабайта.
• RTX 5080 - 16 кило гддр7, шина 256 бит, скорость 32 гигабита на секунду, пропускная 1024 гигабайта.
• RTX 5090 - 32 кило гддр7, шина 512 бит, скорость 32 гигабита на секунду, пропускная 1792 гигабайта.

Прожор по розетке 250, 400 и 600 ватт соответственно.

Аноним 10/10/24 Чтв 00:18:58 #108 №912966

>>912960
думаю что мне хватит только на 5050ти

Аноним 10/10/24 Чтв 00:36:29 #109 №912976

>>912856
Если все работает по дефолту - оставляй по дефолту. А вообще темплайт инструкта ты ставишь тот, на котором тренировалась модель, а системный промт можешь менять по желанию. Остальные поля лучше не трогай - сделаешь только хуже.

Аноним 10/10/24 Чтв 00:47:10 #110 №912989

1674070298578.png

>>912856
Надо, выстави чтобы типа пикрел было. По дефолту ты кормишь сетку вообще не понятным ей форматированием и поведение почти всегда будет более всратым чем если правильно настроить. Темплейт скидывать по адресу data/default-user/instruct хотя возможно перетаскивание на пространство таверны сработает.
>>912960
Маловато, конечно. Можно будет немного подождать ти/титана с 48, если не дропнут то уже покупать как начальная цена стабилизируется.

Аноним 10/10/24 Чтв 01:27:11 #111 №913030 DELETED

>>912797
>>912808
Там на самом деле всё сильно хуже Диснея. Фокс Корп выкуплен жидами, владеющими The Times и WSJ. Там теперь не левые/правые, а чистые жиды, топящие за любую актуальную повестку.

Аноним 10/10/24 Чтв 01:42:19 #112 №913041

>>912960
>Шо думаете по очередному курточному прогреву, работяги?
То что куртка пидарас ебучий охуел.

Аноним 10/10/24 Чтв 01:50:17 #113 №913049

Пришла идея оцифровать одного известного политика и продать его цифровую копию соратникам. Это реально? Можно ли собрать тысячи часов видео, автоматически транскрибировать и скормить модели сделав цифровую копию покойного? А вообще довольно интересно что теперь человек умереть не может, по сути если чел публичный можно собрать все его публичные выступления книги и статьи и новости о нем и сделать модель. У людей типа пыни там ваще должно идеальная может получится. По сути такую цифровую копию можно оставить жить и править вечно. Ведь ответы на любые вопросы оно будет давать точ в точь как оригинал. А если еще и сделать робота с внешностью оригинала то ваще будет тоже самое. Кто знает может быть страной уже правит цифровой клон

Аноним 10/10/24 Чтв 02:18:38 #114 №913079

Что можно накатить не жирнее 27b без цензуры? Хотя бы с аблитерацией. Если знаете, какая модель может во всякие мрачные темы лучше остальных — ещё лучше.

Немного не в теме, но вроде бы то, что в шапке было было, я видел уже.

Аноним 10/10/24 Чтв 02:36:45 #115 №913083

Так быстренько распишите мне что из этого лучше

Аноним 10/10/24 Чтв 03:05:08 #116 №913092

>>913083
Юзаю последний, мне заебись. Оно даже в русский умеет плюс минус.

Аноним 10/10/24 Чтв 03:22:17 #117 №913097

>>913092
Я хз что значит "натренированная на датасетах от Claude Sonnet и Opus" но звучит хайпово, а мини версия от какой то большущей еще хайповее
Почему ты выбрал последнюю

Аноним 10/10/24 Чтв 05:07:18 #118 №913116

>>913083
Бери любую они все говно примерно похожи. По крайней мере я гонял шесть разных файнтюнов на немо, разницы особо сильной не заметил. К тому же немо сама по себе перформит неплохо, файнтюоновую версию накатывать на нее не обязательно.

Аноним 10/10/24 Чтв 05:09:28 #119 №913117

>>913097
>Я хз что значит "натренированная на датасетах от Claude Sonnet и Opus"
Ничего не значит. Щас почти все файнтюны пичкаются синтетикой с клавдии. Кому-то оно нравится, кому-то нет.

Аноним 10/10/24 Чтв 05:15:08 #120 №913119

>>913079
Между дрищенскими моделями уровня 13B и жирнотой от 34B дырка, которую никто не хочет заполнять. Там вроде недавно маленький мистрал смолл вышел на 22 лярда - лично не пробовал, но на мистралях цензуры всегда был минимум, так что это твой единственный вариант.

>Хотя бы с аблитерацией.
Она ничего не делает, буквально. Расхайпленная подвальная технология которая чаще просто ломает модели.

Аноним 10/10/24 Чтв 06:50:09 #121 №913131

>>913119
Схренали там минимум цензуры. Самая противная цензура которую я знаю. Самый минимум цензуры если так говорить то это у опуса, там минимум. А в мистрали много скрытой цензуры и противный датасет.

Аноним 10/10/24 Чтв 07:03:52 #122 №913135

1711254662687.jpg

>>913131
> Самый минимум цензуры если так говорить то это у опуса, там минимум.

Аноним 10/10/24 Чтв 07:20:58 #123 №913138 DELETED

Mr. Кал here. жду ваших поклонов.

Аноним 10/10/24 Чтв 08:23:15 #124 №913164

>>913097
>Я хз что значит "натренированная на датасетах от Claude Sonnet и Opus"
Это значит что перед тобой васянский тюн, натренированный на синтетике - такую парашу нужно обходить стороной.

>>913119
>Между дрищенскими моделями уровня 13B и жирнотой от 34B дырка, которую никто не хочет заполнять.
А зачем ее заполнять? 27b-35b прекрасно работают на 12гб гпу в третьем-четвертом кванте. Для тех у кого меньше 8гб - есть 7b-14b модели.

>Она ничего не делает, буквально
Проиграл

>просто ломает модели
Ну-ка давай сюда перечень моделей, которых "сломала" аблитерация, фантазёр.

Аноним 10/10/24 Чтв 08:29:22 #125 №913167

https://www.reddit.com/r/LocalLLaMA/comments/1fzm4ur/8gb_vram_gddr6_is_now_18/

Для актуальных рп моделей в каком формате лучше с точки зрения экономии токенов и понимания моделью лучше описывать ботов-персонажей - натуралистичный текст, (псевдо)код, с простой разметкой, с тегами (какими?), гибридный подход?

Отличается ли подход при описании ботов-гейммастеров и сторителлеров, предствляющих из себя локацию либо сеттинг от третьего лица?

Аноним 10/10/24 Чтв 08:30:50 #126 №913169

>>913083
Lumimaid-Magnum - это великий. Насколько может быть великой 12B модель, лол.

Аноним 10/10/24 Чтв 08:38:56 #127 №913178

>>913167
По моему опыту между 2 и 3 почти нет разницы в выдаваемом материале но 3 просто писать легче лол. Всех своих чаров только так пишу.
Типа
((Чар)) is a %.
((Чар)) is thinking %, but % and %.

А 1 варик ну... Хуй знает что там в модель намешано. Мб ты на 30% повысишь адекватность а мб просто токены впустую сжег ив выдачу насрал.

Аноним 10/10/24 Чтв 08:59:15 #128 №913180

>>913164
>Это значит что перед тобой васянский тюн, натренированный на синтетике
Другого особо и нет. Не синтетические мизерные датасеты собранные по сусекам в данном случаем ничем особо не лучше.
И один хуй все эти тюны в 95% случаев делаются с косяками и проебанными инструкт темплейтами.

>>913167
>Для актуальных рп моделей в каком формате лучше с точки зрения экономии токенов и понимания моделью лучше описывать ботов-персонажей
Нормального ответа никто не даст, до сих пор все срутся что лучше понапридумывав с пару десятков схем. И оно один хуй больше от моделей, их размеров и уровня конкретных васяно-тюнов зависит.
Имхо: чем больше модель тем вероятно лучше переваривать будет разметку и гибридные схемы. У мелких часто не хватает мозгов на одновременно на обычный текст и структурную хуйню.

По-хорошему под карточки вообще тюнить модели тоже было бы неплохо, но удачи датасеты сделать.

>>913164
>27b-35b прекрасно работают на 12гб гпу в третьем-четвертом кванте
Поспорил бы основательно, но впадлу. В q3 уже часто деградация по отдельным аспектам идёт до уровня 12b. Хз как многие тут не замечают, но как хотите. Да и по перфомансу из-за невлезающего нормально крупного контекста удар сильный.

осознайте степень обдиралова производителей GPU Аноним 10/10/24 Чтв 09:07:13 #129 №913181

2hbo2lc9rotd1.jpeg

Аноним 10/10/24 Чтв 09:09:57 #130 №913182

my8j0zgr0vtd1.png

>>912960

Аноним 10/10/24 Чтв 09:18:46 #131 №913184

>>913167
Стандартный профиль без дурацких скобочек и {{char}}ов на каждой строчке это дефолтный вариант - меньше всего токенов и любой сетке понятно.
Какие-то изъебства нужны если ты либо хочешь повлиять на стиль и формат аутпута, либо делаешь что-то на пределах возможностей сетки.

Аноним 10/10/24 Чтв 09:24:12 #132 №913187

>>913182
Ну 250к за 5090 - это ПРИЕМЛЕМО.

Аноним 10/10/24 Чтв 09:27:19 #133 №913188

>>913187
>Ну 250к за 5090 - это ПРИЕМЛЕМО.
350-400к ты хотел сказать? 4090 дешевле 220 без скама не найдешь и дешеветь они не будут с такой хуйни.

Аноним 10/10/24 Чтв 09:27:24 #134 №913189

>>913167
Моя самая удачная карточка из всех это w++
Вроде, итт писали, что это хуйня, но на практике остальные частенько не делают того, что в карточке прописано. А, ну и стандартный промпт тоже не очень, нужно редактировать.

>>913187
А с чего ты взял, что 2.5 килобакса это "250к за 5090"?

Аноним 10/10/24 Чтв 09:30:30 #135 №913190

>>913182
12 гигов на карте за 700 баксов, куртка как всегда

Аноним 10/10/24 Чтв 09:32:02 #136 №913191

>>913189
> А с чего ты взял, что 2.5 килобакса это "250к за 5090"?
Курс? Необязательно же брать в РФ.

Аноним 10/10/24 Чтв 09:40:16 #137 №913192

>>912960
>>913182
>32
нахуй пусть тогда путешествует

Аноним 10/10/24 Чтв 09:58:20 #138 №913195

>>913184
То есть примерно как в этой карточке? Минимальная разметка наподобие резюме или профиля, перечисление характеризующих черт.

Также слышал что надо максимум информации выносить в лорбук, а в карточке персонажа оставлять ссылки на эту инфу... а она тогда всё равно в контекст же грузиться сразу будет как будто прямо в карточке и написана?

open-webui Аноним 10/10/24 Чтв 10:31:34 #139 №913210

Решил затестить open-webui, в связи с выходом обновы.
В рот ебал олламу, завел с llama.cpp. Если кому интересно то делаешь так и все работает. пик1
Докер я тоже в рот ебал, поэтому ставил по рецепту с их сайта. пик2
Интересно было пощупать их реализацию артифактов, ну что сказать - работает. пик3
Питон можно запускать кнопкой и работает он на каком то странном дистрибутиве, Pyodide. Графики отображает, ткинтер например не работает. пик 4
Ну и мермайд (рисование графиков и схем) сделан удобнее, в таверне реализация кривая.

Не так удобно как таверна в плане рп и настроек вывода, но если для работы то с пивом потянет, даже на мелких локалках

Аноним 10/10/24 Чтв 10:51:01 #140 №913220

>>913195
2 вариант из твоих примеров.
Ну или да на твоем пике.

Я вообще списком просто херачу.

Аноним 10/10/24 Чтв 11:05:45 #141 №913235

>>912960
32 лучше 28.

2 штуки норм будут.

>>912966
По цене будет как 4060ти, уверен, что хватит? ^^'

>>913083
Люмимейд-магнум лучше мини-магнума чуточку, ИМХО.
Бери последний, да.

>>913097
Пишет красиво, да.

>>913119
22б какой-то унылый, хуже 12б в логике. =с

>>913131
Кекаю.
У Мистрали до третьей версии и правда было минимум цензуры.

>>913180
> Поспорил бы основательно, но впадлу.
+
q3 не то, разве что в 123б может быть.

>>913182
Ну, по сути, у нас цены ожидались 250-500, т.е., ваще ничего нового, как и планировали.

>>913187
Это дешево, так-то, кто такой наивный надеялся на цены ниже?

>>913188
Вот тут ближе к истине. =)

>>913210
Скажи пожалуйста, у тебя 6 гигов видяха?
Иначе я буду пиздить тебя палкой за q4_K_M на 7b модели, которой плохеет уже на q6.
Там разницы по памяти — пара гигов.
За шо!..

Спасибо, попробуем.

Аноним 10/10/24 Чтв 11:07:09 #142 №913237

>>912841
Ага, спс.

>>912834
Могу только по 70б подсказать. Меньше- попробуй Комманде Р или для порно Куманде Р

Аноним 10/10/24 Чтв 11:11:08 #143 №913240

>>913235
>Скажи пожалуйста, у тебя 6 гигов видяха?
4
Я обычно 8b кручу или 5kL, тут для скорости и проверки работоспособности взял 4км
Думал вобще 4кс попробовать, но решил что это совсем мрак

Аноним 10/10/24 Чтв 11:16:35 #144 №913241

>>913191
>Курс?
У 4090 msrp 1599 баксов. На амазоне самая дешёвая сейчас 1930 баксов. Даже при том, что в начале следующего года выйдет следующее поколение, то есть никакого ажиотажа на 4090 уже нет, она всё равно дороже рекомендованной цены и нет никакой возможности купить её за нвидиевский ценник. И тут выходит 5090 с рекомендованной ценой в 2500 баксов. На амазоне будут самые дешёвые 3200+, лол. А в доставках не ниже 3500$.

Аноним 10/10/24 Чтв 11:22:56 #145 №913245

А самое хуёвое то, что китайцы наловчились пересаживать чипы 4090 на свои френкештейн-платы и все маркетплейсы завалены новыми pcb от карт со сдутыми чипами и памятью. Это значит, что б.у 4090 будет гораздо меньше, чем могло бы быть.

Аноним 10/10/24 Чтв 11:29:25 #146 №913251

>>913195
> То есть примерно как в этой карточке?
Примерно, но стоит выделить профиль # заголовком/разделителями теми же что и в остальном промпте использются. Для сеттинга, локаций и другого - та же история
> Также слышал что надо максимум информации выносить в лорбук, а в карточке персонажа оставлять ссылки на эту инфу... а она тогда всё равно в контекст же грузиться сразу будет как будто прямо в карточке и написана?
Записи лорбука добавляются в промпт если выполняется условие, чаще всего это ключевое слово в последних Х сообщениях, поэтому ссылаться на нее не стоит.

Аноним 10/10/24 Чтв 11:30:16 #147 №913254

>>913245
>китайцы наловчились пересаживать чипы 4090 на свои френкештейн-платы
А где искать собственно этих франкенштейнов на базе 4090 ?

Аноним 10/10/24 Чтв 11:44:48 #148 №913256

>>913241
4090 сняли с производства, поэтому цена только расти будет

Аноним 10/10/24 Чтв 11:55:36 #149 №913260

>>913254
А ты захочешь их покупать? 370к рублей + доставка, если что.

Аноним 10/10/24 Чтв 12:25:33 #150 №913273

>>913240
Мое сочувствие.
Возьми хотя бы P104-100, если слот есть лишний и 100 ватт на бп, жить станет проще, жить станет веселее.

Впрочем… еще и ноут, наверное? =(

>>913260
48 гигов, звучит как в полтора раза больше 5090 и по цене как две 4090 но в одном слоте.

Аноним 10/10/24 Чтв 12:34:54 #151 №913281

Сейчас есть 4070, кручу на ней 24В на 4 квантаж кое как. Хочу какой нибудь дешевый паскаль к нему взять, чтобы хотя бы 6гб видеопамяти добавить. Какие подводные?

Аноним 10/10/24 Чтв 12:42:23 #152 №913289

>>913281
Во-первых, P104-100 — 8 гигов.
Во-вторых, сидеть придется на ггуфе, без всяких exl2, и это некрожелезо.
Зато 2,5к рублей, чо. Копейки.

Выше еще говорили про какой-то другой паскаль, там было поболя гигов, но и цена повыше.

Аноним 10/10/24 Чтв 12:51:41 #153 №913295

>>913281
Ваще, 3060 просится к 4070. ИМХО.

Аноним 10/10/24 Чтв 13:01:01 #154 №913301

>>913289
Что плохого в ггуфе? Я с самого начала только его и использую.

Аноним 10/10/24 Чтв 13:03:34 #155 №913302

>>913119
> технология
Эээ че? Это разве не просто всратая тренировка заготовленным датасетом?
>>913131
> Самый минимум цензуры если так говорить то это у опуса
Не, соевичок каких поискать. Конечно, можно поломать жб и всяким, но всеравно может отказывать и аположайзить в случае какой-то жести или поругания меньшинств.
> в мистрали много скрытой цензуры
Да ну, просто положительный байас и промтопроблемы. То что без условий оно считает чат позитивным это нормально.

Аноним 10/10/24 Чтв 13:10:35 #156 №913306

>>913167
1 норм, только не добавлять столько воды и пурпурной прозы а писать прямо и лаконично. 3 - пиздец, можно задать некоторые вещи через json/xml но страдать подобной трешаниной - диагноз.
База - содержательный натуртекст с некоторой структурой. Упарываться графоманией можно в примерах диалогов, а карточка должна быть без лишнего треша.
> Отличается ли подход при описании ботов-гейммастеров и сторителлеров, предствляющих из себя локацию либо сеттинг от третьего лица?
Разные примеры и инструкции могут быть, в остальном подход един.
>>913187
Увы, это не так работает, за 250 было бы неплохо. Может после первого хайпа упадет до такой.
>>913188
> 4090 дешевле 220 без скама не найдешь
От создателей
> 3090 дешевле 90к на вторичке не купить
>>913260
Если бы без пошлины то можно было бы задуматься. Но сейчас и 48 уже мало.

Аноним 10/10/24 Чтв 13:22:26 #157 №913311

>>913273
>P104-100
Вобще хороший совет, но мне смысла нету, влезет только мелочь, да и вобще лень возится с охладом драйверами питанием и другой хуйней
7b щас в пролете, 12-14b норм уже по мозгам, но это уже под 16гб врам минимум. А если хочется работать с большим контекстом то и все 24-48 отдай. О 32 или 72 лучше не думать, это что то на богатом

К счастью у меня тут сборочка на ксеоне есть, 10 токенов в секунду на той же Qwen2.5-Coder-7B-Instruct-Q4_K_M выдает спокойно в начале 3b летает на 17-20 на 8 кванте
псп памяти под 60, это значит я и квен 32 в 4 кванте кручу с 2-3 токенами в секунду, маловато, но сойдет
Сетки на 10 гб как раз где то 5 токенов в секунду генерация, на скорости чтения
Конечно хотелось бы все 30-50, но денег на такое дорогое хобби у меня нету (да и времени тоже)

Аноним 10/10/24 Чтв 13:36:14 #158 №913322

А че с вашими вайфу делать?
Ну скачал карточку, т.к я инцел и не общался с женщиной просто пишу привек пук среньк ебу а дальше то что?

Аноним 10/10/24 Чтв 13:36:50 #159 №913324

>>913322
а дальше по второму кругу

Аноним 10/10/24 Чтв 13:40:22 #160 №913331

>>913273
>звучит как в полтора раза больше 5090 и по цене как две 4090 но в одном слоте.
В любом случае, своей цены не стоит.

>>913306
>Если бы без пошлины то можно было бы задуматься.
Карго доставка без пошлины, лол. А больше 48 гигов это уже под обучение, смысла нет никакого крутить сетки жирнее 70b

Аноним 10/10/24 Чтв 13:45:11 #161 №913338

>>913331
>>913190
>>913182
> своей цены не стоит
Вы понимаете что под вас никто подстраиваться не будет, ждуны блять?
Так будет всегда и везде, хорошие вещи стоят дорого хули ныть зарабатывай больше

Аноним 10/10/24 Чтв 13:45:47 #162 №913339

>>913306
>> 4090 дешевле 220 без скама не найдешь
>От создателей
>> 3090 дешевле 90к на вторичке не купить
Только если прямо с рук с возможностью перепроверить всё на месте. И то наебывают и так.
Если тут кто-то готов рисковать такими бабками с неиллюзорным шансом их проебать на скаме со вторички ради того чтобы подрочить писюльку на нейродевок, то могу только посочувствовать.

Аноним 10/10/24 Чтв 14:00:17 #163 №913351

>>913338
Я к тому, что за 400к соберу что-то интереснее, чем печка с 48 гигабайтами. Может, будет и чуть медленнее, но мне похуй, пока есть 1к символов в минуту или больше.

Аноним 10/10/24 Чтв 14:01:21 #164 №913353

IMG20241010135735616.jpg

Посмотрите, какую красоту пилят китайцы на заказ.
Алсо, помню как-то в б говорил на тему расширения памяти на видюхах хуанга, ну вот, все возможно короч.

Аноним 10/10/24 Чтв 14:03:35 #165 №913358

>>913338
С чего ты взял что я чего-то жду. Уже игры то раз два месяца запускаю, ради рп что ли впахивать лол

Аноним 10/10/24 Чтв 14:04:41 #166 №913360

>>913353
https://2.taobao.com/item-detail?itemId=826281611468&spm=a2170.xianyu_tbpc_search.0.0

Это вот оно. По курсу 368к + доставка. Смысл в такой красоте?

Аноним 10/10/24 Чтв 14:19:51 #167 №913378

>>913360
За то чтобы провайдер не читал как тебя ебет розовый конь никаких денег не жалко.

Аноним 10/10/24 Чтв 14:29:22 #168 №913386

>>913360
Аналог для сервера стоит вообще несколько лямов.

Аноним 10/10/24 Чтв 14:45:26 #169 №913396

>>913331
> В любом случае, своей цены не стоит.
Стоит, это же разожранная a6000ada или L40, только с более быстрой памятью, хорошей охладой и огромным паверлимитом. Вся проблема в том что подвальная китайщина хз сколько проживет.
> это уже под обучение
Именно, катать ллмки можно и на 3090.
>>913339
Волков бояться - в лес не ходить, пока так будешь трястись, инджоеры уже в который раз перепродадут и на что-то новее пересядут, а ты так и будешь бояться и забавлять
> такими бабками
лол.

Аноним 10/10/24 Чтв 15:00:07 #170 №913409

Че лучше по цена/качество ртх 4060 16гб за 45к или 3090 за 70к

Аноним 10/10/24 Чтв 15:01:29 #171 №913414

анон, есть p40, но только один коннектор 8pcie. если воткну один в переходник, работать будет?

Аноним 10/10/24 Чтв 15:09:34 #172 №913424

>>913396
>> такими бабками
>лол.
Так если эти суммы для тебя лол, то ещё больший вопрос нахуя как нищук по вторичке искать среди скама что-то. Пошёл в рознице купил и всё.

Аноним 10/10/24 Чтв 15:26:22 #173 №913432

>>913301
Exl2 имеет меньше багов, удобнее, быстрее порою заметно (до двух раз, как пойдет), лучше всем, но по-немножку.

>>913311
А я свою сборочку на ксеоне обновил и так и не потестил, на работе комп стоит.
Надо будет добраться и посмотреть, что там нонешние квены выдают, да.

Аноним 10/10/24 Чтв 15:29:58 #174 №913440

>>913414
Идея хуйня, но даунвольтни и посмотри, поделишься результатом.

Аноним 10/10/24 Чтв 15:32:36 #175 №913442

>>913440
что если CPU 8pin кабель воткнуть, без переходника?

Аноним 10/10/24 Чтв 15:50:30 #176 №913457

>>913338
>лол гайс просто зарабатывайте больше, в чем проблема?
Нищука превозмогателя видно сразу. Ты таких денег в жизни скорее всего никогда не видел, но почему-то думаешь, что пол ляма за десктопную видеокарту это нормально. За 400к можно спокойно 4 3090 взять и в хуй не дуть, а это дерьмище только долбаеб прогретый возьмет.

Аноним 10/10/24 Чтв 15:51:01 #177 №913458

Это куда вставлять?

Аноним 10/10/24 Чтв 16:04:24 #178 №913467

XTC (Exclude Top Choices) вообще кто-то нормально пробовал гонять-юзать?

Аноним 10/10/24 Чтв 16:11:50 #179 №913475

Вводные: 32 памяти, 1050ти.
Цель: найти качественную модель для качественного ролплея, желательно на русском.
Вопрос: возможно ли?

Аноним 10/10/24 Чтв 16:12:48 #180 №913477

>>913378
Чтобы провайдер этого не читал у меня есть p40.

>>913386
Серверный аналог всё-таки немного другое

>>913396
>Именно, катать ллмки можно и на 3090.
И на p40 нормально получается. Для вижн моделей или ттс уже не подойдёт, слишком медленно, а ллм покатит. Обучать даже хуй знает. Одной не хватит, то есть zero-3 офлоад и упор в ram, чип будет работать далеко не на полную мощность. Смысл в супермощной карте теряется, пачка более дешёвых, но без офлоада - будут выгоднее. Либо ты берёшь N карт, но скорее всего за цену N карт, опять же, есть более выгодные варианты. Мб, трейн небольших моделей будет на такой карте выгоден, вроде SD или тех же TTS. А дело всё в том, что цена этой карте никак не 400к, но курс рубля падает, спрос на AI растёт и получаем хуяку за щеку.

>>913475
Не, чел, без видеокарты никак.

Аноним 10/10/24 Чтв 16:20:21 #181 №913481

>>913424
> среди скама
Мантра бедолаг для оправдания обладанием отсутствия и боязни действовать. Культивируешь - культивируй дальше, нехуй проповеди вести.
> нахуя как нищук
А что поделать. Представь себе на вторичке много, например, йоба автомобилей за оче оче дорого, и их тоже покупают успешные люди. Бахвальства на нерациональные решения как раз признак нищука, который так говорит просто потому что рассуждения оторваны от реальности и за ними ничего не стоит.
>>913457
> что пол ляма за десктопную видеокарту это нормально
Ну кстати, пол ляма за декстопную видюху - пиздец. Пол ляма на игрушку для хобби, которая сохраняет материальную ценность - уже зависит от конкретного перфоманса.
> За 400к можно спокойно 4 3090 взять
Меньше даже. Брать дорогую йобу чтобы только инфиренсить на ней ллм - странно, уже есть хорошие решения.
>>913477
> И на p40 нормально получается.
Слишком медленно. Но главное что, как ты и написал, везде кроме ллм юзлесс вообще.

Аноним 10/10/24 Чтв 16:22:23 #182 №913484

>>913457
>За 400к можно спокойно 4 3090 взять
Где? Их нет в продаже сейчас. А б/у видеокарту брать - это надо поехавшим быть.

Аноним 10/10/24 Чтв 16:24:59 #183 №913488

>>913475
Попробуй Гемму-2 9b, с частичной выгрузкой в оперативу. В своем размере - отличная модель, и русским владеет на хорошему уровне. Но будет не то чтобы прям быстро

Аноним 10/10/24 Чтв 16:30:19 #184 №913495

>>913484
А 4090 на 48 гигов это чип от б.у 4090 на плате от б.у 3090. Двойной б.у плюс рефаб. За 400к. Это брать не надо быть поехавшим, уточни пожалуйста.

Аноним 10/10/24 Чтв 16:33:46 #185 №913504

>>913484
>б/у видеокарту брать - это надо поехавшим быть
Да, зато переплачивать за жадность производителя - вот это пиздец рациональный выбор. Куртка вами уже как детьми вертит, а вы и рады. Нет ничего постыдного в желании сэкономить там, где можно сэкономить. Адекватный человек не будет сливать несколько месячных зарплат на кусок оверпрайснутого текстолита, который тебе впаривают чисто потому, что им за это нихуя не будет, ибо монополия дает преимущества.

Аноним 10/10/24 Чтв 16:37:39 #186 №913509

>>913289
>>913295
Если 3060 взять?
4070+3060 приживутся?

Аноним 10/10/24 Чтв 16:40:26 #187 №913511

>>913409
Возьми 3090 за 30-40к на вторичке.

Аноним 10/10/24 Чтв 16:42:55 #188 №913514

>>913495
>>913504
Да я не об этом. Я к тому, что покупая б/у видюху существует очень высокий риск нарваться на нечто полудохлое-прогретое. Вот СЭКОНОМИЛИ вы и купили 3090 с авито за 80к, молодцы, красавчики, наебали систему. А завтра у нее произошел отвал. И что делать будете? inb4: сам прогрею и толкну другому лоху

Да, в магазине оверпрайс, такие цены на видюхи реально неадекватны. Но тут хотя бы есть гарантия, в случае проблем - отремонтируют/заменят. А у васьки с авито что?

Аноним 10/10/24 Чтв 16:46:26 #189 №913516

>>913514
Это уже тряска на ровном месте. Если ты СЕГОДНЯ взял видеокарту а ЗАВТРА у нее произошел отвал, то это твоя проблема, потому что ты ее не смог нормально проверить перед покупкой. Лох платит и дважды и трижды, как говорится. И любит потом оправдываться.

Аноним 10/10/24 Чтв 16:50:45 #190 №913517

>>913481
>Мантра бедолаг для оправдания обладанием отсутствия и боязни действовать. Культивируешь - культивируй дальше, нехуй проповеди вести.
Да я никого не заставляю в рознице покупать. Хотите бабками рисковать - рискуйте, мне то че, мне вон с розницы на следующей неделе 4090 спокойно доедет, без выискивания где сэкономить 30-50 тысяч за самую бомжатскую модель и тряской что не полезут ли через неделю дефекты или не пришлют ли кирпич в коробке, лол.

>Представь себе на вторичке много, например, йоба автомобилей за оче оче дорого, и их тоже покупают успешные люди.
Успешные люди в массе своей такие же дегенераты в обычный жизни по куче вопросов. Которые покупают на вторичке убитое говно после таких же дегенератов, или убивают его за пару лет сами, продавая дальше следующему дегенерату. С кучей таких общался. За хорошие автомобили убитые обидно. Такой себе пример для сравнения.
И с тачкой, если ты не дегенерат, то перед покупкой будешь высматривать её вдоль и поперек на косяки и потом решая брать, не брать, брать с проблемами и расчетом исправить их за такие-то деньги, и т.д. Поэтому и говорю про то что, если брать, то с рук и максимальной проверкой сразу что ты покупаешь, и то если не шаришь куда и на что смотреть особенно без возможности взглянуть под охлад можно объебаться.
Все прекрасно покупают что за видяхами на вторичку всегда почти идут не от того что много денег и просто такие рациональные, а от того что наскребли по сусекам хоть какую-то сумму, которой только на железо с обскамленной в говнину вторички и хватает. И наслушавшись односложных фраз про то что всё на вторичке покупается за гроши без проблем бегут брать, а потом встревают на бабки, которые несколько месяцев откладывали.

Аноним 10/10/24 Чтв 16:52:34 #191 №913518

>>913517
>Все прекрасно покупают
*понимают

Аноним 10/10/24 Чтв 16:54:15 #192 №913519

>>913514
>Вот СЭКОНОМИЛИ вы и купили 3090 с авито за 80к
Вместо одной 48@4090 за 400к сэкономил и взял две 3090 за 140к. Или четыре за 280. И даже если одна-две отъебнёт, я их просто закину на полку пылиться до второго пришествия и всё ещё буду в плюсе.

Аноним 10/10/24 Чтв 17:12:35 #193 №913526

>>913220
Говорят списки хороши были до появления инструкт и рп моделей, для моделей которые в немалой степени были тренены на примерах кода. Такие модели и персов в псевдокоде лучше понимали.

Аноним 10/10/24 Чтв 18:01:15 #194 №913559

>>913514
имплаинг что тебе кто-то реально вернет деньги если с картой что то случится, лол.
Это все ширма, найдут причину чтоб тебя нахуй послать с твоей гарантией

Аноним 10/10/24 Чтв 18:15:12 #195 №913580

1675446947287.jpg

>>913181

Аноним 10/10/24 Чтв 18:18:05 #196 №913587

Вы когда пишите про русик имеете ввиду чтоб ии вам на русике ответы писал? Как так сделать?

Аноним 10/10/24 Чтв 18:25:43 #197 №913600

https-www.ixbt.com-img-n1-news-2024-9-4-AMD-INSTINCT-MI325-MI355X-1200x624largejpg.png

>>913587

Аноним 10/10/24 Чтв 18:27:05 #198 №913602

либяат ст олучше 12б 4q или 8б 8q

Аноним 10/10/24 Чтв 18:37:00 #199 №913607

>>913600
>Мая твая панимать русске

Аноним 10/10/24 Чтв 18:58:22 #200 №913616

>>913602
Пишут что 12б 4q
Но я хз. Шизотюн L3-8B-Sunfall-v0.5-Stheno-v3.2-Q8_0_L для меня оказался лучшим решением.

Аноним 10/10/24 Чтв 19:25:49 #201 №913636

Чего там по сбору датасетов для ттс? Кто-нибудь занимался вообще или как всегда?

Аноним 10/10/24 Чтв 19:45:44 #202 №913652

>>913587
Если изначально на русском не отвечает, то можно попоробовать дописать в карточку:

{{char}} must only write in Russian language.
{{char}} должен всегда писать только на русском языке.

Но если модель совсем в ру не может, то бери другую.
Могут не только лишь все.

Аноним 10/10/24 Чтв 19:48:09 #203 №913656

>>913616
В данжен кор симулятор норм игрался, а вот вот в рп-сторителлинге на русском галюны лютые пошли в стиле "в лесу раздавался топор дровосека".

Аноним 10/10/24 Чтв 19:55:57 #204 №913661

>>913656
>"в лесу раздавался топор дровосека".
Так Перумов нейросеть? А я подозревал.

Аноним 10/10/24 Чтв 20:06:56 #205 №913673

>>913656
Ты дохуя хочешь, у ит-гигантов в РФ нет нормальной нейнонки на русском, а тебе подавай обычную, но чтобы писала на идеальном русском.

Аноним 10/10/24 Чтв 20:07:47 #206 №913675

Что лучше для рп магнум или облитерейтед квен?

Аноним 10/10/24 Чтв 20:43:25 #207 №913705

>>913514
>тут хотя бы есть гарантия, в случае проблем - отремонтируют/заменят
Это было актуально до февраля 2022. А в 2024 что новое параллельноимпортное, что от васянов с Авито - примерно одинаково в плане гарантий, имхо.

Аноним 10/10/24 Чтв 20:46:42 #208 №913706

>>913675
ИТТ прежде неоднократно советовали https://huggingface.co/bartowski/magnum-12b-v2.5-kto-GGUF

Но чем углубляться в подобные вопросы, проще самому всё попробовать.

Аноним 10/10/24 Чтв 20:47:08 #209 №913707

>>913705
> Это было актуально до февраля 2022.
4090 в ДНС с нормальной гарантией были.

Аноним 10/10/24 Чтв 20:49:58 #210 №913709

1726368210895.png

>>913706
> проще самому всё попробовать.
Вот этого двачую, качаешь все, щупаешь, пишешь плюсики.

Аноним 10/10/24 Чтв 20:54:19 #211 №913712

https://www.reddit.com/r/LocalLLaMA/comments/1g0b3ce/aria_an_open_multimodal_native_mixtureofexperts/
https://www.reddit.com/r/LocalLLaMA/comments/1g0mgtl/announcing_mistralnemominitron_8b_instruct_by/
https://www.reddit.com/r/LocalLLaMA/comments/1g03rdn/hidden_gem_happzy2633qwen257binsv3_is_an/
новые сетки, каждая по своему интересна

Аноним 10/10/24 Чтв 21:39:01 #212 №913749

https-www.ixbt.com-img-n1-news-2024-9-4-AMD-INSTINCT-MI325X-355X-7largejpg.png

https-www.ixbt.com-img-n1-news-2024-9-4-AMD-INSTINCT-MI325X-355X-2largejpg.png

AMD готовит GPU с 288 ГБ памяти с пропускной способностью 8 ТБ/с. Компания представила ускоритель Instinct MI325X и рассказала о Instinct MI355X

Данное решение получило впечатляющие 256 ГБ памяти, причём самой быстрой — HBM3E. Пропускная способность тут достигает невероятных 6 ТБ/с, что, похоже, является рекордом для отрасли.
Технически же это в основном всё та же модель Instinct MI300X, вышедшая ещё в 2023 году, но с большим объёмом памяти. Тут те же 19 456 потоковых процессоров на архитектуре CDNA 3 и те же техпроцессы 5 и 6 нм.
AMD также рассказала об ускорителе следующего поколения под названием Instinct MI355X. Это уже будет новая модель на архитектуре CDNA 4, вероятно, с большим количеством потоковых процессоров. Чего у этого ускорителя точно будет больше, так это памяти — 288 ГБ HBM3E с пропускной способностью 8 ТБ/с! Правда, TDP вырастет с текущих 750 Вт до 1 кВт, и это несмотря на переход на нормы 3 нм.

Аноним 10/10/24 Чтв 21:47:18 #213 №913758

>>913749
Ну и нахуй я новую карту брал... Надо было подождать чуток.

Аноним 10/10/24 Чтв 21:51:35 #214 №913769

>>913749
>AMD
))

Аноним 10/10/24 Чтв 21:54:28 #215 №913775

>>912420
>их core parking
Шоэта?
>>912423
Нахуя тебе кастрат, когда есть полноценная 4090?
>>912449
Это да. С выходом Photoshop 2.5 в 1992 году под винду, который позволил почти что каждому делать нюдсы, наступила... Хотя постойте.
>>912488
>Там подоьная хуйня массовая
Чем более массовы АИ фейки, тем меньше верят картинкам.
>>912960
>пропускная 1792 гигабайта
Годно, полутократное ускорение же.
>600 ватт
Они там охуели? У меня весь БП 750. И надеюсь, что они поставят нормальную стопку разъёмов вместо полёной гари 12PW_что_то_там.
>>913049
>теперь человек умереть не может
Убил тебя за щеку, проверяй.
Дальше тред не читал, мимо ОП

Аноним 10/10/24 Чтв 21:59:38 #216 №913783

>>913775
>Они там охуели? У меня весь БП 750. И надеюсь, что они поставят нормальную стопку разъёмов вместо полёной гари 12PW_что_то_там.
Коннектор на 64 пина и запах плавящихся двенадцати вольтовых проводов. Не ускоритель, а мечта :3

Аноним 10/10/24 Чтв 22:00:28 #217 №913785

>>913673
ну почему, большой квен норм пишет, пока в контекст не упирается

Аноним 10/10/24 Чтв 22:01:06 #218 №913786

>>913783
>двенадцати вольтовых проводов
А представьте, что куртка ёбнет новый стандарт вольт на 48, чтобы не подводить питание шиной толщиной в палец? Как же бомбанёт у тех, кто покупал блоки под новый коннектор...

Аноним 10/10/24 Чтв 22:13:48 #219 №913807

>>913514
> существует очень высокий риск нарваться на нечто полудохлое-прогретое
Если берешь вслепую. Риск есть всегда, в бу железках он выше чем в новых, но ты рисуешь его чрезмерно высоким игнорируя выигрыш в прайсе.
> в случае проблем - отремонтируют/заменят
Ты, вероятно, ни разу с таким не сталкивался. Это знатная эпопея и нервотрепка вплодь до подготовки судебной претензии/иска на возврат актуальной стоимости а не той выгодной за которую брал, лишний раз делать не захочешь.
> А у васьки с авито что?
Ремонтируешь за свой счет или покупаешь другую.
>>913517
> мне вон с розницы на следующей неделе 4090 спокойно доедет
За 220к? Раньше немного дороже покупалась пара. Ну чтож, твоя мотивация и недовольство переплатой понятно, поздравляю с покупкой.
> убивают его за пару лет сами, продавая дальше следующему дегенерату
То не успешные люди а васяны-понторезы, что пытаются казаться лучше чем есть, беря непосильный премиум в состоянии мертвичины.
> если брать, то с рук и максимальной проверкой сразу что ты покупаешь
Разве можно как-то иначе? И что ты там собрался разглядывать под охладом, взгляда с торца хватает в 99% случаев.
> на вторичку всегда почти идут не от того что много денег
Пачка 3090 или одна 4090, что выбрать? и то и другое конечно
>>913636
Здесь появляются господа что этим занимались, подожди, может попозже ответят.
>>913775
> надеюсь, что они поставят нормальную стопку разъёмов вместо полёной гари 12PW_что_то_там
Шансы практически нулевые.

Аноним 10/10/24 Чтв 22:16:50 #220 №913813

>>913749
>AMD готовит GPU с 288 ГБ памяти
Че думаете пацаны, контекст у коммандора вытянет?

Аноним 10/10/24 Чтв 22:23:55 #221 №913828

>>913813
Так новый коммандер с нормальным контекстом уже, правда отзывы о нем странные были
Игрушки зачетные, рад за тех кто может выкинуть 50к долларов на хобби

Аноним 10/10/24 Чтв 22:29:08 #222 №913840

>>913828
>Так новый коммандер с нормальным контекстом уже
Да, я чутка опоздал с этой приколюхой. Зато можно проследить какой путь мы прошли, что теперь даже у коммандора появился какой-то там из аттеншенов.

>Игрушки зачетные, рад за тех кто может выкинуть 50к долларов на хобби
Ниче, лет через 15 и у нас такие игрушки будут. Будем их по помойкам как зеоны с китайскими перемычками собирать.

Аноним 10/10/24 Чтв 22:37:38 #223 №913854

>>913828
>правда отзывы о нем странные были
Мне не понравился, сижу дальше на мистрале ларге, хотя раньше был тем ещё фагом 104В командира.

Аноним 10/10/24 Чтв 23:09:39 #224 №913932

Новый фронт
https://www.reddit.com/r/LocalLLaMA/comments/1g0jehn/ive_been_working_on_this_for_6_months_free_easy/
Автор обещался допилить подключение к сторонним опенаи совместимым апи

Аноним 10/10/24 Чтв 23:18:56 #225 №913956

А можно карточку персонажа поставить от своего лица типа не общаться с ним а ты и есть он

Аноним 10/10/24 Чтв 23:26:51 #226 №913974

>>913932
>Новый фронт
Без бека. Совсем. Усё в браузере больные ублюдки.

Аноним 10/10/24 Чтв 23:34:07 #227 №913986

>>913956
Можно, в таверне создай себе личность скопировав имя и описание из карточки
Это во вкладке вверху где смайлик, справа

Аноним 10/10/24 Чтв 23:41:43 #228 №913997

>>913442
Насколько я помню — там одинаковая распиновка. Но ничего не гарантирую. =)

>>913457
Справедливости ради, мои знакомые прогеры берут 4090 по пару штучек и в ус не дуют, пока нищуки 3090 на авито покупают.
Ну так, я понимаю, что ты пытался оправдаться в своих же глазах, но не стоит делать это так слабо.

>>913481
> 3090
> p40
> Брать дорогую йобу чтобы только инфиренсить на ней ллм - странно, уже есть хорошие решения.
Бери 4 P40. =)

>>913509
Это дважды я.
Приживутся.

>>913504
Нет ничего постыдного в том, чтобы потратить свои деньги на свои хотелки, если тебе норм и почку не продаешь.
Т.е., считать, что глупо брать 5090 — это мнение или скряги, или бедняка.
Я не говорю, что это плохо. Но это просто так, как есть.

>>913675
Магнум, конечно.

>>913786
Если человек может купить видяху за 400к рублей, то уж новый бп купить он точно в состоянии. =) Тут бомбить не на что.

>>913956
Ты — он, или ллм — и есть он?
Карточки от первого лица составляли.
Там еще систем промпт было бы неплохо подсуетить соответствующий.
Местами выдавало интересные результаты.

Аноним 10/10/24 Чтв 23:46:27 #229 №914010

>>913997
> если тебе норм и почку не продаешь.
А почку значит продавать плохо? Странный ты. Я вот не вижу ничего плохого в продаже почки. Ты осудить меня хочешь?

Аноним 10/10/24 Чтв 23:48:51 #230 №914012

>>913997
>Насколько я помню — там одинаковая распиновка.
разные варианты перебрал. кабель от CPU не подходит из-за толстой клипсы, воткнул один pcie кабель - запускается и работает. хотел поставить три p40 в свою сборку, да вот только с третьей не стартует материнка, висит на VGA, с двумя в любых расположениях мать стартует, хотя по спецификации матери написано x16\x1\x1.

Аноним 10/10/24 Чтв 23:50:38 #231 №914019

>>913997
>Справедливости ради, мои знакомые прогеры берут 4090 по пару штучек и в ус не дуют
Чел, попустись. Вот именно что даже две 4090 будет взять выгоднее чем одну 5090 за ту же цену. Даже при текущей их цене в 200к за позицию.

Аноним 10/10/24 Чтв 23:56:19 #232 №914026

>>913786
48 точно не будет, потому что на sxm ровно столько, а сам sxm практически весь пассивный. Кто понял, поймёт.

Аноним 11/10/24 Птн 00:01:27 #233 №914034

>>913932
>Новый фронт
Не новый, а очередной. Их уже настолько дохуя, что даже лень разбираться, ибо они все буквально не предлагают ничего нового, хотя пространство для маневров огромное.

Если уж этим красноглазикам делать нехуй, лучше бы аналог для силли запилили, которая настоебенила уже своим протухшим интерфейсом. Но да, никто опять нихуя делать не будет. Потому что дрочерам похуй через что дрочить, они бы и через терминал своих вайф ебли за неимением альтернативы.

Аноним 11/10/24 Птн 00:02:39 #234 №914038

>>913164
27b на 12 Гб уже захлёбывается, ты чего?

В лучшем случае третий квант среднего размера влезет. Нет, можно и четвёртый, но сколько там у меня было? 2 токена в секунду, кажется. На 2,7 ещё хоть как-то можно выживать, но это на третьем кванте и приходится заметное время ждать ответ от модели.

Проблема в том, что 11-14b адски тупорылые или я их не так варю. Да, они отлично подходят для кума, с этим проблем нет, и модели идеальны для коммерции в какой-нибудь серой зоне типа чуба или бесплатного пока что джанитора но с точки зрения экономии ресурсов там лучше пихать 8b, наверное, для народа, чтобы толкать кум онлайн в сервисах, но каких-то интересных реплик, "понимания" или чего-то ещё я не видел.

27b, которые я втыкал и по незнанке не ставил никаких инструкций, вообще в таверне ничего не настраивал, были просто божественны даже в третьем кванте по сравнению с мелкими моделями. И вот как тут жить?

Наверняка есть какие-то ВАРИАНТЫ на 14 или 22b неплохие для просто хорошего рп и интересных диалогов и рассуждений, но я заебался качать васянские тюны и разочароваться. И я так и не придумал универсального теста на охуенность, чтобы понять, выкидывать модель в помойку или нет через 3 минуты после загрузки. С ней всё равно необходимо поболтать и ещё потратить время на скачивание.

>>913180
Кстати, по поводу карточек. Чат гопота, превью версия и ещё думала чуть больше минуты, давала интересные советы на эту тему, хоть и выглядящие немного странно. Я пробовал вместе с ним брать за основу какую-то карточку и писать структурно так, как он указывает, или чтобы он разбивал мою хуйню на нужные структуры, и дальше дорабатывал. Субъективно, результаты были лучше, чем когда я писал сам или тянул карточки с чуба.

Аноним 11/10/24 Птн 00:05:47 #235 №914041

1559767335172585335.png

>>913932
>This project builds on three amazing libraries:
>Transformers.js
>WebLLM
>Wllama
Реально поехавший больной ублюдок.

>>914034
>аналог для силли запилили
А нахуя? Пользуйся тем, что дают.

Аноним 11/10/24 Птн 00:08:07 #236 №914043

>>914038
>но с точки зрения экономии ресурсов там лучше пихать 8b, наверное, для народа, чтобы толкать кум онлайн в сервисах
Они его неиронично и толкают. Интереса ради я недавно чекал всякие спайсы чаты и прочее курительное говно - там такая дремота на моделях стоит, что такую хуй сейчас отыщешь мне кажется. Плюс они там контекст до смешных 2к обрезают, пока среднестатистическая карточка в их же каталоге весит порядка 600 токенов, ибо сделана одноклеточными мокрощелками. Но даже так актива у них там дохуя, народ не воняет. Видимо, потому что это всё дело бесплатное.

Аноним 11/10/24 Птн 00:28:04 #237 №914065

>>914019
Ну так а если кто захочет взять две 5090 — я че, должен его считать иррациональным растратчиком что ли?
Мы платим за эмоции.
А эмоции бесценны.
Все четко. )

>>914041
> Transformers.js
Санбой курит.гиф

Аноним 11/10/24 Птн 01:00:07 #238 №914094

>>914043
Я в этот тред сам пришел недавно как раз со спайси, очень понравилась там модель очень живо общается с тобой и каждый раз что то новое выдает без повторов как на ссаных локалках где повторы через сообщение
Сижу вот тыкаюсь в этом локальном говне уже месяц всё хочу на спайси просто вернуться и в хуй не дуть

Аноним 11/10/24 Птн 01:01:53 #239 №914095

>>913997
> Бери 4 P40. =)
Это маразм, ими не сможешь воспользоваться кроме как крутить несколько ллм одновременно. Одну большую - не захочешь.
> Справедливости ради, мои знакомые прогеры берут 4090 по пару штучек и в ус не дуют
Это знакомые прогеры сейчас с тобой в одной комнате?
>>914026
> потому что на sxm ровно столько, а сам sxm практически весь пассивный
Пояснительную бригаду как оно вообще соотносится?

Аноним 11/10/24 Птн 01:06:48 #240 №914096

>>914065
Логика покупателей айфонов в кредит

Аноним 11/10/24 Птн 01:13:23 #241 №914099

>>913475
>>913488
Два пиздабола. Один пишет про необходимость иметь карту, другой даёт ущербный 9Б.

>>913475
Анон, у меня похожий сетап, я спокойно гонял Command-R 35Б, выгружая в оперативку. Тебе 32 хватит почти впритык, но хватит. Гугли GGUF. Да, это было медленно, но не смертельно. Минута-полторы для больших сообщений.

Аноним 11/10/24 Птн 01:14:00 #242 №914100

>>914099
>>913477
> Два пиздабола
Это сюда.

Аноним 11/10/24 Птн 01:16:06 #243 №914101

>>914038
>2 токена в секунду
У тебя 1050ti?

Аноним 11/10/24 Птн 01:17:16 #244 №914102

>>914099
>Command-R 35Б
>полторы минуты
>на 1050ti
И кто тут пиздабол?
Скока там 0.5 токена в секунду хоть будет?

Аноним 11/10/24 Птн 01:20:02 #245 №914107

>>914102
Я сказал, что у меня схожий сетап, а не такой же. Карта чуть получше. У него может и токен в секунду будет.

Аноним 11/10/24 Птн 01:21:15 #246 №914110

completely-new-sxm4-to-pcie.jpg

>>914107
>чуть получше
3090?

Аноним 11/10/24 Птн 01:22:04 #247 №914111

>>914110
На скрине речь о 3060, 1050ти просто пердеж жидкий выдатс и компьютер взорвется нахуй

Аноним 11/10/24 Птн 01:22:10 #248 №914112

>>914094
Это буквально старый прикол о том, что "а вот на чайной была душа", несмотря на то что та была тупым огрызком по сегодняшним меркам. Тут либо уже чисто искажение по памяти, либо самообман. Но это действительно не отменяет того факта, что с локалками надо ебаться и ебаться надо много. Пока ты разберешься как все работает, пока подберешь под себя настройки - это все может занять недели и даже месяцы. А на спайси скорее всего они просто промтами всё это дело подкрутили и это кстати объясняет, почему они не хотят менять модели и переписывать всё с нуля.

Ну либо у них свой какой-то особенный файнтюн стоит на дампах с той же чайной. Пигмалион некоторые именно по этой причине до сих пор облизывают, ибо там датасет собран напрямую из тех самых душевных рипнутых диалогов.

Аноним 11/10/24 Птн 01:22:36 #249 №914113

>>914101
У меня 3060 12 Гб.

Ладно, у gemma-2-27b-it-abliterated.Q4_K_M 2,4 токена, но это не жизнь. Столько ждать на моделях 40-70b мне кажется уже адекватным решением, но здесь хуй знает.

>>914099

У него же боль и анальные страдания возникнут ввиду того, что в оперативке всё это дело болтаться будет.

Аноним 11/10/24 Птн 01:26:22 #250 №914117

>>914099
>Да, это было медленно, но не смертельно.
Это как раз-таки смертельно. Такими извращениями можно пользоваться только по каким-то рабочим задачам, где ты можешь составить промт и просто залипнуть на вермя, пока ответ будет генерироваться. Для рп минимум нужно токенов 6-8 в секунду иначе можно сойти с ума, особенно если ты адепт свайпов и ебал в рот редактировать сообщения вручную.

Аноним 11/10/24 Птн 01:29:35 #251 №914121

>>914117
Ну если прям сидеть живо общаться тебе и 20т/сек будет мало и ответ нужен будет за пару секунд

Аноним 11/10/24 Птн 01:32:06 #252 №914122

>>914121
Я по основе сижу на немо и как-раз имею 20-24 токена в секунду. Этого достаточно с запасом, так что не надо пиздеть. При таких скоростях ответ итак за полторы-две секунды генерируется, если это только не полотно текста токенов на 400.

Аноним 11/10/24 Птн 01:32:30 #253 №914123

000.png

>>914095
>Пояснительную бригаду как оно вообще соотносится?
Вот смотри, есть у кожаного видеокарта h100. Она производится в двух вариантах - sxm и pci-e. Первая лучше по перформансу и гораздо лучше подходит для трейна, потому что её нвлинк тупо лучше, чем у писиай-версии. Хотя и немного меньше памяти, но теплопакет вдвое выше, Карл. Тут немного лукавлю, писиай карты прошиваются под повышенный тдп.
Так вот, у нас есть два варианта одной карты и SXM, очевидно, лучше. А ещё он внезапно доступнее, т.к серверов с такими слотами банально меньше. Это видно даже по младшим моделям - 16Gb p100 pci-e стоят 20к, а sxm 14к. И это на авито. C учётом цены "переходника" с sxm на pci-e это не выгодно, там 300-400 евро будет. Вернёмся к H100. Писиай версия четыре ляма, SXM - три с половиной. Что нужно, чтобы SXM заработал в писиай слоте? Переходник, который состоит на 90% из креплений под кулера, процентов пять пассивных компонентов и разъём под внешнее питание, те самые 48 вольт. Если карта будет по умолчанию жрать 48 вольт, то китайцы уничтожат весь рынок pci-e карт, по-быстрому модифицируя под него более производительные sxm-варианты и откладывая в карман полляма с карточки.

Аноним 11/10/24 Птн 01:34:39 #254 №914124

>>914122
>если это только не полотно текста токенов на 400
512 самый минимум же.
Иначе тебе просто огрызки на стол будут кидать односложными ответами чтоб не забивать память

Аноним 11/10/24 Птн 01:50:15 #255 №914128

sale-sxm3-to-pcie-with-12v-to-48v.jpg

>>913775
>Шоэта?
У 9950x и 9900x какого-то хуя ебанутые задержки при передаче данных между CCD-чиплетами и они к ним взяли тот же костыль что и для 7950x3d и 7900x3d, который пихает потоки игор на один CCD и если его хватает на игры+ос+прочие задачи, то вырубает второй CCD с половиной ядер, дабы не ловить эти задержки, если вдруг какой-то поток игры окажется на втором и начнёт обмениваться данными с другим CCD. В плане нейронок вопрос даже не в парковке ядер, а в этих задержках между чиплетами, будет ли как то влиять.

Аноним 11/10/24 Птн 01:52:15 #256 №914130

>>914095
> Это знакомые прогеры сейчас с тобой в одной комнате?
Нет, нахуя им быть в моей спальне?
Извини, я понимаю этот прием, но он выглядит максимально жалко в данном контексте, ибо моих знакомых и коллег это не какие-то огромные деньги.

>>914096
Ровно наоборот.
Речь же о людях, которые могут себе позволить такую покупку.
Айфоны в кредит берут те, кто не может себе позволить их просто купить, без кредита. =) Как раз всякие 3090 ужаренные за 40к с авито ближе к айфонам в кредит (как минимум, по цене=).

>>914112
> Тут либо уже чисто искажение по памяти, либо самообман.
Синдром утенка, раньше было лучше, вся фигня.

>>914117
Мейк сенс.

>>914123
Mindblow. =)

Аноним 11/10/24 Птн 02:00:31 #257 №914132

>>914130
>Mindblow. =)
И это на пике переходник под пятую версию SXM. Вот под вторую, подходит всё для тех же p100.

Аноним 11/10/24 Птн 02:03:56 #258 №914134

>>914099
> медленно, но не смертельно
Ну как, на профессоре с ддр4 (врядли там с 1050ти будет ддр5) на 30б получится где-то 2 т/с генерации и пара десятков обработки. Это в оптимистичном сценарии, может быть и ниже. Если генерация еще как-то больно но приемлемо, то любая манипуляция связанная с обработкой контекста ставит крест на всем. Даже самый первый пост если там системный промт, карточка, примеры и прочее на тысячу токенов - там первых токенов придется больше минуты ждать.
Ну и большие сообщения это не 150-200 токенов.
>>914123
Что за бессвязную шизофазию я сейчас прочитал?
> А ещё он внезапно доступнее, т.к серверов с такими слотами банально меньше. Это видно даже по младшим моделям - 16Gb p100 pci-e стоят 20к, а sxm 14к.
Некрота на pci-e дороже потому что у нее хотябы есть шанс что кто-то купит и поставит к себе, а старый sxm - мертвый груз.
> Писиай версия четыре ляма, SXM - три с половиной.
Погода на марсе а не цены. Если смотреть аукционы или написать тем барыгам сколько будет стоить то sxm выйдет заметно дороже.
> Переходник, который состоит на 90% из креплений под кулера, процентов пять пассивных компонентов и разъём под внешнее питание, те самые 48 вольт
Там есть штатные райзеры, переходники, платы - сплиттеры и прочее. Серверные бп уже давно на 48вольт идут, с подключением. Питание вообще наименьшая из проблем.
> Если карта будет по умолчанию жрать 48 вольт, то китайцы уничтожат весь рынок pci-e карт, по-быстрому модифицируя под него более производительные sxm-варианты
Шиза, pci-e и sxm радикально отличаются компоновкой, и под те и под те делают готовые сервера, в обоих случаях продукт дефицитный, а пытаться пихать одно в другое - могло родиться только под веществами. Если собирать "под себя" то ассортимент железа достаточно широк и делать это можно хоть на деревянных стеллажах кто помнит тот помнит, питание также наименьшая из проблем.

Но самое главное - каким вообще хером 48вольтовый стандарт на десктопной карточке относится к йоба серверным решениям?
Алсо никакого нового стандарта и не нужно, 48вольтовая опция была представлена вместе с 12вольтовой.
>>914130
> я понимаю этот прием
Намек на то что ты - фантазер и пиздишь, причем крайне кринжово.

Аноним 11/10/24 Птн 02:23:33 #259 №914140

{C0134396-7DB8-4BF1-8BB1-FAD62D7A5AB4}.png

e-bay.png

>>914134
>Погода на марсе а не цены.
Давай по v100 сравним с ибея. SXM 32гб без аукциона начинаются с 14.5к рублей. Pci-e на 32гб начинаются с 69к рублей. Да, h100 по 3.5-4 ляма это по местным магазинам я смотрел, на е-бей дешевле, но так разница в цене даже ощутимее. Это без аукциона, купить сразу - барыгам писать не надо, цена меняться не будет. Разве что хуй ты купишь нормально с ebay.
>pci-e и sxm радикально отличаются компоновкой
Да, но это не важно.
>хоть на деревянных стеллажах
А ты цену материнок с SXM посмотри.

Аноним 11/10/24 Птн 02:31:24 #260 №914142

А куда ядра что-то делают вообще?
В генерации картинок они роляют а тут будто на них вообще похуй и самое главное это врам

Аноним 11/10/24 Птн 02:37:15 #261 №914144

>>914140
> Давай по v100 сравним с ибея
Нет, давай по кеплерам! Для начала ответь каким хером эта шиза относится к десктопным стандартам питания и как оправдывает ту дичь что ты уже насочинял?
> SXM 32гб без аукциона начинаются с 14.5к рублей.
Хороший вариант, собрал 2-3, наколхозил переходников и ультимейт убийца тесел с быстрой обработкой.
> но так разница в цене даже ощутимее
Хуету какую-то анрелейтед нашел, они не могут 15к стоить, а пси-е как прыгнула на фоне хайпа-дефицита, так и стоит на этой цене.

Аноним 11/10/24 Птн 02:44:32 #262 №914149

>>913807
>То не успешные люди а васяны-понторезы, что пытаются казаться лучше чем есть, беря непосильный премиум в состоянии мертвичины.
Ох блять если бы. Куча народу с кучей денег берут со вторички премиум-хлам нихера не по нижней границе цен. Потому что ебланы. То что человек умудрился нафармить дохуя бабок где-то - вообще никак зачастую не значит, что вне сферы где он их заработал будет таким же рациональным и не тупым. Вот это купить уже подроченное авто какое-нибудь лямов за 8 и потом хуй пойми зачем экономить, блядь, на фильтрах стоящих тыщу рублей беря китай и заливая рандомное неподходящее масло раз в 15к пробега ибо "аче какая разница и то масло и то масло че мозги ебешь я всё лучше знаю" - это вот прям обычная ситуация же. Тысячи их таких.

>Разве можно как-то иначе?
Ну так я про то же, что не надо иначе. Но тут ведь обязательно найдется пара залетных или интересных персонажей, которые прочитают про то как всё прекрасно на вторичке и пойдут на авито доставкой покупать. Сами себе ебланы будут, конечно, но просто лишний раз упоминаю чтобы по незнанке аноны не прилетали на бабки.

>И что ты там собрался разглядывать под охладом, взгляда с торца хватает в 99% случаев.
С некоторыми моделями с торца нихуя особо и не увидишь. Да и там где видно хоть что-то, то тоже варианты хуйни возможны, но это уже нюансы, конечно.

>>914142
Ролять роляют в любом случае, но не прям чтобы совсем линейно рост влияет. С врам главный дроч тут у нас всех в том чтобы тупо всю модель и контекст запихнуть в неё.

Аноним 11/10/24 Птн 02:45:42 #263 №914151

>>914144
>Для начала ответь каким хером эта шиза относится к десктопным стандартам питания
Читай первый пост, там в конце об этом есть.
>они не могут 15к стоить
https://2.taobao.com/item-detail?itemId=825761464018&spm=a2170.xianyu_tbpc_search.0.0
Вот тебе за китайские рубли. Около 19к на русские, раз ты за 15к не хочешь. Это всё ещё куда дешевле, чем pci-e вариант. И да, это неплохой вариант для замены теслы.

Аноним 11/10/24 Птн 02:55:17 #264 №914154

>>913467
Я юзаю уже почти месяц. Из всех костылей она больше всего импакта привнесла за минимум усилий.

Аноним 11/10/24 Птн 03:00:28 #265 №914155

>>913775
>Нахуя тебе кастрат
Там 48 гигов, сколько у полноценной, напомни?

Аноним 11/10/24 Птн 03:14:23 #266 №914162

>>914154
Слопа и прочих shivers down ебаной spine таки в среднем меньше становится?

Аноним 11/10/24 Птн 03:38:20 #267 №914173

>>914155
У D нет 48 гигов, это франкенштейн. По дефолту D это та же 24gb, только урезанная по всем параметрам.

Аноним 11/10/24 Птн 03:46:25 #268 №914174

>>914173
я не спрашивал о твоих познаниях, я спросил как ее купить
необязательно отрабатывать вахтером на каждый вопрос

Аноним 11/10/24 Птн 04:55:34 #269 №914190

>>914094
сетки дрочат чтобы хорошо проходили бенчи и выполняли инструкции, в рп они становятся умнее, но не могут выдать ничего оригинального без пинка от юзера

Аноним 11/10/24 Птн 05:56:45 #270 №914198

Что это? Что это за говно, нахуйя говно? Карточка максимум антисекс, персонаж максимально мразотный — и тут такое.

Это всё васяномиксы, да?

Всё по шапке, всё по гайду. Мне нужна нормальная модель 22-24b (на пике 22 мистраль), остальные не лезут на вменяемой скорости работы. 27b gemma не срёт такой хуетой даже в третьем кванте, но скорость генерации неприлично медленная.

У меня уже закрадывается мысль просто скачать чистую версию без миксов и даже аблитерации. Возможно, даже так лучше получится, если поебать её джейлами. Потому что тонна васяномиксов такое выдаёт, даже если в карточке прописать, чтобы не было хуйни как на пике.

Аноним 11/10/24 Птн 06:40:27 #271 №914201

>>914198
апи мистраля бесплатный сейчас, зачем ты страдаешь

Аноним 11/10/24 Птн 06:45:00 #272 №914204

>>914117
> Для рп минимум нужно токенов 6-8 в секунду иначе можно сойти с ума
Ну чому, а от человека с РП ты тоже ждешь молниеносных ответов? 1-2 токена всек это норм для рп. Меньше пиздос.

Аноним 11/10/24 Птн 07:04:12 #273 №914217

>>914204
>1 буква в секунду
чучело в отключенным стримингом, ты?

Аноним 11/10/24 Птн 07:06:07 #274 №914219

>>914217
Ты ебу дал? Даже на русском как минимум по слогам генерит, в некоторых случаях даже целым словом.
А на английском чаще всего слово = токен.

Аноним 11/10/24 Птн 07:09:47 #275 №914222

>>914217
>токен
>буква
Господи блять

Аноним 11/10/24 Птн 07:15:16 #276 №914229

>>914219
>>914222
>не 1 буква а 2!
в чем проблема была 3060 на 12 гигов купить, не понимаю вас

Аноним 11/10/24 Птн 07:18:20 #277 №914233

>>914229
Хз зачем она мне. Сижу на 4хА100

Аноним 11/10/24 Птн 07:22:24 #278 №914239

>>914233
>1 токен на 4хА100
запизделся маленький

Аноним 11/10/24 Птн 08:06:42 #279 №914265

Привет, аноны. Не уверен, что в тот тред пишу, но всё таки.
Планирую ближе к зиме обновить видюху в компе, сейчас стоит 2080 super. Бюджет будет около 200к. Вообще тепел и ждал, ожидая что 5080 будет на 24 гига, но судя по всему запихнут в него 16, поэтому брать её уже вряд ли буду, ибо оверпрайс будет лютейший поначалу.
Комп используется для ИИ, игр и блендера. Пока склоняюсь в сторону двух 4070ti super. За 200к можно получить 32 гига видеопамяти. Но всё таки желаю выслушать мнение сторонних людей перед окончательным решением.
ЗЫ. За исключением друвней видюхи, сам комп обновлял недавно, стоит 64 гига ddr5, амудешный проц 9 серии.

Аноним 11/10/24 Птн 09:03:21 #280 №914274

>>914095
>Это маразм, ими не сможешь воспользоваться кроме как крутить несколько ллм одновременно. Одну большую - не захочешь.
И захочешь и даже сможешь.

Аноним 11/10/24 Птн 09:55:36 #281 №914286

>>914265
Отдашь 200к и даже 70б нормально погонять не сможешь, так себе что-то. И чего тогда не дождаться 5090

Аноним 11/10/24 Птн 10:00:34 #282 №914291

>>914286
>чего тогда не дождаться 5090
Потому что будет стоить больше 200, и внутри будут те же 32 гига оперативки.

Аноним 11/10/24 Птн 10:01:27 #283 №914292

>>914291
>оперативки
Видеопамяти
самофикс

Аноним 11/10/24 Птн 10:06:26 #284 №914294

>>914291
Так 5090 ты сможешь в играх юзать. Надоест генерить текст - будешь жалеть что у тебя 4070ти... Не знаю как в блендере, но в СД тоже вроде на две не так хорошо делится нагрузка

Аноним 11/10/24 Птн 10:10:34 #285 №914297

>>914294
>5090 ты сможешь в играх юзать
Да я бы взял, но у меня не будет более 200к. А стоить она будет под 300, если не больше. Поэтому и думаю.
Как ещё один вариант взять вообще поддержанную 3090, и сидеть ждать выхода 5070/80 super, в который могут 20-24гига завезти, но поддержанное не сильно люблю и уважаю.

Аноним 11/10/24 Птн 10:15:25 #286 №914303

>>914297
>у меня не будет более 200к
храни в долларах, будет)

Аноним 11/10/24 Птн 10:46:20 #287 №914326

>>914303
>храни в долларах, будет)
Да как сказать, торгов-то нет. Курс будет такой, какой сверху спустят. То есть сам ты сможешь продать доллары по "госцене" - есть такое слово...

Аноним 11/10/24 Птн 10:48:01 #288 №914328

Кто-то пробовал подключать внешние видеокарты? Нормально работает? Раздумываю взять 5090, а 4090 в бокс засунуть. Обе карты в корпус не лезут, собирать отдельный комп под ллм я не хочу (ну разве что появится готовое решение без ебли в районе 500-600к).

Аноним 11/10/24 Птн 10:56:18 #289 №914334

>>914326
>hey chatgpt, what's USDT and p2p?

Аноним 11/10/24 Птн 11:03:49 #290 №914339

>>914328
Там же скорость потешная будет

Аноним 11/10/24 Птн 11:12:13 #291 №914349

>>914334
А потом расскажи и докажи налоговой откуда деньги.

Аноним 11/10/24 Птн 11:33:34 #292 №914370

>>914339
Пичаль беда. Ну тогда посмотрим на цену 5090. Если 2 видюхи ставить то ещё 50к на корпус и крепление придется тратить.

Аноним 11/10/24 Птн 11:57:01 #293 №914392

>>914149
Первую часть можно свести к
> в группенейм бывают долбоебы
исходную нить потерял, или так странно относишь к предмету обсуждения?
> Но тут ведь обязательно найдется пара залетных или интересных персонажей, которые прочитают про то как всё прекрасно на вторичке и пойдут на авито доставкой покупать.
Налог на тупость или удача. И таких здесь нет, одни трясуны или оголтелые, что притащат для проверки комп в пункт выдачи.
> С некоторыми моделями с торца нихуя особо и не увидишь
Избегать их. В любом случае снимать охладу с гпу покупателю не даст буквально никто.
>>914151
> Вот тебе за китайские рубли.
То про ~15к доларов за H100 в лоте что ты скинул.
> неплохой вариант для замены теслы
Если их реально купить за такие деньги то это суперйоба, которая и дешевле, и дохуя быстрее (не сильно будет уступать амперам), и памяти в 1.5 раза больше имеет. Надо брать пока еще есть.
> Читай первый пост
> китайцы уничтожат весь рынок pci-e карт, по-быстрому модифицируя под него более производительные sxm-варианты и откладывая в карман полляма с карточки.
Бред сумашедшего же, как ты к этому пришел?
>>914198
> Это всё васяномиксы, да?
Да, при плохом обучении модель усваивает не столько знания, сколько паттерны что нужно сводить все к кумерскому слоупу при любом поводе. Возможно у тебя и что-то в промте не то если эффект массовый, что за модели?

Аноним 11/10/24 Птн 12:03:40 #294 №914393

>>914349
>у анона сычева появились лишние 200 тысяч рублей
>наряд омона ему, обязательно с вертолетом
вроде должен быть самый продвинутый раздел, а все равно людишки те же

Аноним 11/10/24 Птн 12:04:45 #295 №914394

>>914204
> от человека с РП
Типичные чаты с кожанными - уровень пигмы. Ирл ты можешь общаться быстро и параллельно воспринимаешь полный спектр чувств, видишь окружение, практикуешь взаимодействия. В рп чате все это описывается лишь текстом, потому нужно чтобы он имел скорость хотябы на уровне неспешного чтения.
>>914265
> в сторону двух 4070ti super
Они хороши, если планируется использование помимо ллм, но памяти мало. Варианты производительнее - или бу, или расширять бюджет.
>>914328
> Нормально работает?
Пердолинг с драйверами и прерываниями, траблы с охлаждением, а так норм. Скорость как у х4 3.0 со всеми вытекающими, для ллм или диффузии не проблема.

Аноним 11/10/24 Птн 12:05:44 #296 №914395

>>913432
Тонну чая тебе, анон, ехл2 реально годнота. Еще и 4 бит кэш завелся без видимой потери качества, освободив кучу места под контекст.

Аноним 11/10/24 Птн 12:16:37 #297 №914404

>>914394
>Варианты производительнее - или бу, или расширять бюджет.
Ну то есть я правильно прикидываю по мнению хотя бы одного анона. Спасибо.

Аноним 11/10/24 Птн 12:54:08 #298 №914435

>>914392
>То про ~15к доларов за H100
Это к ибей претензии, если тебе цена не нравится.
>Надо брать пока еще есть.
Учитывай ещё цену на переходник, в зависимости от версии SXM цена колеблется. А доступность этих переходников оставляет желать лучшего, мягко говоря. Если бы можно купить в пару кликов, уже бы заказал себе парочку.
>Бред сумашедшего же
Абсолютно логичный вывод проистекающий из фактов.

Аноним 11/10/24 Птн 12:59:59 #299 №914439

>>914265
4070ti sup + 3090

И играть будешь норм и для 70б ЛЛМ хватит на 4 кванте.

Аноним 11/10/24 Птн 13:05:26 #300 №914440

>>914435
> Учитывай ещё цену на переходник
100-200$, уже выйдет не дороже 400$ за 32 гига с относительно быстрым чипом, топчик. Вот только ни гпу ни адаптер нормально не купить.
> Абсолютно логичный вывод
Абсолютно иррациональный вывод, наличие какого-то стандарта под 48в питание превозносишь над всем, параллельно делая ложные выводы на основе неправильных цен на актуальные комплектующие. Что же до некроты - там аналогично питание будет наименьшей из проблем.

Аноним 11/10/24 Птн 13:22:21 #301 №914457

>>914393
>вроде должен быть самый продвинутый раздел, а все равно людишки те же
Ещё недавно самым продвинутым людишкам казалась немыслимой блокировка Ютуба, а сейчас реальность. Из ВПН работает только VLESS и обрезать его у 99% юзеров по поведенческому признаку (а это уже типа продвинутые, уже не простые Васяны) раз плюнуть. И Ютуб это не крипта, а херня какая-то типа видосиков. Да, чужая пропаганда, но не деньги всё-таки. Крипту в России приказано уничтожить. 1% проскользнёт, а остальные смирятся. И с обменниками будет такой геморрой, что ты и сам не захочешь.

Аноним 11/10/24 Птн 17:10:42 #302 №914663

>>914457
> Из ВПН работает только VLESS
У меня ванильный WG как работал так и работает. Хз о чем ты.

Аноним 11/10/24 Птн 17:13:24 #303 №914665

>>914457
блокировка как обычно сработала только у САМЫХ тупых, кто даже не знает куда написать "не открывается ютуб" чтобы решить проблему
про запрет с 2017 читаю
не хочешь - не бери, твои срубли, не мои

Аноним 11/10/24 Птн 17:29:27 #304 №914682

а сколько времени уходит с начала загрузки текста в модель до генерации первого токена?

Аноним 11/10/24 Птн 17:31:35 #305 №914688

>>914265
>ока склоняюсь в сторону двух 4070ti super.
Глупое решение. Уж лучше 2х3090 тогда

Аноним 11/10/24 Птн 17:32:21 #306 №914690

>>914663
>У меня ванильный WG как работал так и работает. Хз о чем ты.
Ну ты имей в виду, что он палится. Не везде его блочат, говоришь? Это уже не его заслуга.

Аноним 11/10/24 Птн 17:33:29 #307 №914692

Че за пиздец со скоростью?
>>912966
Зачем тебе огрызок с 8гб врам?

Аноним 11/10/24 Птн 17:35:35 #308 №914695

>>914665
>блокировка как обычно сработала только у САМЫХ тупых, кто даже не знает куда написать "не открывается ютуб" чтобы решить проблему
Дай угадаю: Ютуб с мобильного интернета смотришь? К твоему сведению GoodbyeDPI всё. А значит отключить уже тебя могут когда захотят. Остались только более сложные решения - пока.

Аноним 11/10/24 Птн 17:36:00 #309 №914696

>>914690
Я знаю что он палится. Но пока не блочат суетится не буду. Как начнут блочить тогда и покумекаю.

Я к тому, что пока что даже WG никому нахер не уперся, хотя заблочить его очень просто.

Аноним 11/10/24 Птн 17:44:38 #310 №914706

>>914692
>Че за пиздец со скоростью?
Блочат все активнее и тупее, твари, вот и интернет умирает

>>914696
Как наивно

>>914695
Я не против политоты, особенно когда она касается каждого напрямую. И голову в песок спрятать все труднее даже обывателям.
Но не советую обсуждать ее тут, это не свободный ресурс

Аноним 11/10/24 Птн 17:52:58 #311 №914719

>>914695
Не угадал.
>>914695
>GoodbyeDPI всё
Ты видимо и есть та тупица, которая не понимает как решать свои проблемы:
https://ntc.party/t/если-опять-перестал-грузиться-youtube-или-его-видео/10529/1350

Аноним 11/10/24 Птн 18:01:08 #312 №914730

>>914457
> Ещё недавно самым продвинутым людишкам казалась немыслимой блокировка Ютуба, а сейчас реальность.
Нет, не реальность. На мобиле всегда работал, на компе перестали замедлять недели две уже как. Блокировки Ютуба в принципе никогда не было.
> Из ВПН работает только VLESS
Нет, не только. Работает вообще всё, кроме пары ресурсов, которые были максимально на слуху. Да даже Антизапрет до сих пор работает.
> и обрезать его у 99% юзеров по поведенческому признаку (а это уже типа продвинутые, уже не простые Васяны) раз плюнуть
Нет, если не использовать дефолтные настройки, а даже такие уникумы есть, которые приваткей ставят из примеров(!). И даже их никто не блокирует и не собирается. А уж тех, кто хотя бы SNI отличный от дискорда или яндекса прописать в состоянии, а тем более слышал про селфстил, таких даже на Туркмении, Иране и Китае не могут блокнуть.

Аноним 11/10/24 Птн 18:18:31 #313 №914746

нищукам привет, остальным соболезную
https://huggingface.co/DavidAU/L3-DARKEST-PLANET-16.5B-GGUF
аффтор утверждает что у данной модели разные свайпы и избавлена от гптзимов

Аноним 11/10/24 Птн 18:20:02 #314 №914748

>>914682
Сильно по-разному, очевидно же.

>>914457
>Ютуб
>не деньги
Проиграл. Ютуб принёс своим пользователям больше денег, чем крипта выдурила из лохов. А это уже дохуя, криптодебилы до сих пор встречаются, хотя казалось бы - 2024 к концу подходит. Но лох не мамонт, как говорится.
>>914695
>GoodbyeDPI всё.
Брейнкип, сорри. У людей с двузначным айкью работает.

Аноним 11/10/24 Птн 18:26:52 #315 №914758

>>914746
Ебанутся, король франкенштейнов
Техника брайншторма звучит интересно, повышают детализацию внутренней модели мира модели, на сколько я понял

Аноним 11/10/24 Птн 18:39:18 #316 №914771

>>914758
вообще пиздато пишет в том плане, что гптзмиов и правда удивительно мало, видимо автор принципиально не хотел тренировать на клодослопе или гптслопе как тот же магнум

Аноним 11/10/24 Птн 18:40:45 #317 №914772

>>914706
> Как наивно
А накой обмазываться всеми этими х-реями и влессами если их самих неровен час наебнут.
Или ты думал что влесс будет с тобой вечно? Удачи, чел. Его уже научились ловить жиды.

Аноним 11/10/24 Птн 18:50:41 #318 №914779

>>914771
По мозгам как впечатление? Сколько раз снимает трусы?

Аноним 11/10/24 Птн 18:55:33 #319 №914784

>>914779
>По мозгам
ровно на 16.5B модель, но я нищук на Q5 сижу

Аноним 11/10/24 Птн 19:05:31 #320 №914793

Мнение треда про blackbox?

"генерации текста и изображений занимает 1 токен и 1 миллисекунду вместо 1 минуты и 10000 токенов. наш метод позволяет обрабатывать запросы клиентов в 400-800 раз больше, серверы больше не нужны"

https://www.blackbox.ai/
https://www.blackbox.ai/agent/ImageGenerationLV45LJp

Аноним 11/10/24 Птн 19:10:20 #321 №914795

>>914793
пусть сначала переименуют в ниггербокс, а там посмотрим

Аноним 11/10/24 Птн 19:15:14 #322 №914803

>>914795
Аноны из /b/ пишут, что это сингулярность, сливы какие-то публикуют.

У меня сейчас за 18$/hour поднят сервак, если не пиздеж, то получается я могу тоже самое на дефолтном маке делать, а Нвидиа должна уже нанять киллеров для разрабов.

Аноним 11/10/24 Птн 19:17:39 #323 №914806

Что делать когда свайпы прям слово в слово текст повторяют?

Аноним 11/10/24 Птн 19:19:31 #324 №914807

>>914803
>>914793
Пиздеж
Не удивлюсь если это тупо база данных ответов, из которой тянут заранее готовые ответы на кешированые вопросы
Нету щас железа, и производителей железа, которые могут сделать такой финт ушами.
Если там конечно не опто электронику кто то смог сделать и приспособить для нейросетей, в гараже.

Аноним 11/10/24 Птн 19:35:35 #325 №914824

>>914806
>Что делать когда свайпы прям слово в слово текст повторяют?
Попробуй поднять температуру

Аноним 11/10/24 Птн 19:38:06 #326 №914825

>>914807
Можно просить говорить в стихах и не использовать слова на определенную букву

Аноним 11/10/24 Птн 19:39:34 #327 №914827

>>914806
Сделай дефолт семплеров и настрой по новой, какой-то из семплеров задрал.

Аноним 11/10/24 Птн 19:43:59 #328 №914831

>>914793
>Мнение треда про blackbox?
Если не наёбка, то революция. И давно пора. Будем посмотреть - хочется верить, но совершенно непонятно каким образом мог быть достигнут подобный результат.

Аноним 11/10/24 Птн 19:53:22 #329 №914839

Попробовал эту вашу гемму в соавторстве на русском.
Сеттинг PF/D&D.

gemma-2-27b-it-abliterated.Q4_K_M - 40-60 секунд, вроде норм, хотя раз проскочило английское слово. Предложила мне подобрать кристалл фамилльяра упавший с фейского плана.

gemma-2-27b-it-abliterated.Q5_1 - 50-100 секунд, вроде вполне адекватно и вроде литературно. То ли с роллом повезло, то ли пятый вместо четвёртого квант действительно так решает, но попыталось следовать заданной преамбуле.

Хотя и та и другая иногда пересказывали моё сообщение своими словами. Иногда лучше, иногда хуже. Для соавтора норм, полезно, для рп может быть не очень.

Хотя карточка описана как рассказчик / писатель / гейм-мастер, так что мб из-за этого.

Ужал её кстати до 742 токенов.

Аноним 11/10/24 Птн 19:55:48 #330 №914842

>>911638 (OP)
Аноны, есть какие то глобальные обновления? Появилась LLAMA >3.1?

Аноним 11/10/24 Птн 19:55:55 #331 №914844

Аноны, всем привет! Подскажите, плиз.
У меня ПК: Ryzen 5 3500X; 128Gb @3200MHz; RTX 4070 12Gb; SSD 980 PRO 1TB

Я сейчас использую:
Qwen2.5-32B-Instruct-Q4_K_M.gguf
gemma-2-27b-it-Q4_K_M.gguf
Mistral-Nemo-Instruct-2407-Q8_0.gguf
DeepSeek-Coder-V2-Lite-Instruct-Q8_0.gguf

Что уже можно удалить, а что оставить? Может что лучшее появилось уже?

Аноним 11/10/24 Птн 19:57:05 #332 №914846

>>914457
Да пиздец сука заебали, тут уже от ног живого места не осталось после прошлых очередей. Будет забавно если образуется ситуация как с автовазом. поле_чудес_в_стране_дураков.mp3
Тут больше подгорает что на деньги, которые тратятся на всю ркн-мразоту и горы оборудования для запретов, можно было бы оформить и финансировать свой исследовательский отдел как в запрещенной организации, и выпускать свои передовые лламы, диффузию и прочее на острие отрасли, ведь для этого все кроме финансирования есть. Там уже можно пытаться манипулировать мнениями с помощью более актуальных политтехнологий и без такого ущерба для будущего развития. А если еще перераспределить финансирование 15-рублевых ботов, что набегают везде оправдывать происходящее, то можно было бы в мухосрансках улучшить.
>>914663
Очень повезло с провайдером просто (и врядли надолго). С пердолингом не-ванильный завести можно, но скорости зарубеж донные.
>>914692
Передавай привет мамашам-шлюхам и отцам-членодевкам тех кто портит интернет.
>>914682
Зависит от объема контекста и скорости его обработки. На процессоре оче медленно, на жоре с ускорением видеокарты быстрее и чем больше слоев на гпу тем шустрее, на экслламе оче быстро.
>>914793
Не быстро и оче тупая. Какие еще алгоритмы?

Аноним 11/10/24 Птн 20:16:55 #333 №914869

>>914846
> алгоритмы
У 4 битного бинарного машинного кода всего 16 состояний эти состояния можно записать в таблицу и пробрасывать веса активаций а дальше оперировать состояниями через 1 битные ссылки для любого масштабирования, таким образом база данных на 8ТБ заменяет и процессор и видеокарту , так ещё и ускоряет в 400 - 800 раз, обработки градиентов ИИ. говоря простым языком происходит проброс вычислений через готовые таблицы перемноженных матриц рекурсивно и комбинаторно ведь 16 бит это два 8 битных кода а любой 8 битный код это два 4 битных кода.

Звучит как троллинг анонов. Статей никаких нет, при ускорении в 4 раза уже бы был визг на весь интернет, а тут заявляют 400 раз и отказ от вычислений. "Готовые таблицы перемноженных матриц" - звучит как что-то невозможное, остальное не понял, мнение - выглядит как жир, который накидали с целью запутать. Сайт рабочий, приблизительно уровень Клауди, в русский нормально не способен, бесплатный и быстрый, пики генерирует лучше бинга, валится как и прочие модели.

Аноним 11/10/24 Птн 20:17:06 #334 №914870

>>914824
>>914827
Не помогло
Я в эту вкладку свои грязные ручонки засунул, до этого всё работало.
Я вычитал что с ней в сто раз лучше ответы

Аноним 11/10/24 Птн 20:22:05 #335 №914876

>>914844
>12 vram

Ты лучше скажи, как у тебя крыша от такого не поехала при такой жирноте моделей?

Аноним 11/10/24 Птн 20:27:45 #336 №914880

>>914839
вот эту гемму пробуй.

Аноним 11/10/24 Птн 20:43:28 #337 №914887

>>914869
>Сайт рабочий, приблизительно уровень Клауди, в русский нормально не способен, бесплатный и быстрый, пики генерирует лучше бинга, валится как и прочие модели.
Ну то есть "примерно всё то же самое, что и у других, только быстро". Если не только быстро, но ещё (для них) и дёшево, то действительно революция. Вопрос в том, когда пойдёт в паблик.

Аноним 11/10/24 Птн 20:44:35 #338 №914889

>>914880
Спс, качаю.

Аноним 11/10/24 Птн 21:28:17 #339 №914918

>>914839
Пока что самая лучшая гемма 27 - ванильная без васянств поверх.
>>914869
> Звучит как троллинг анонов.
Скорее не троллинг а инфоциганство и скам. По ощущениям там рандомайзер, который для генерации использует далли или флукс-шнель (стиль и особенности прыгают), причем делает крайне посредственно, по ллм там чмоня мини или хайку. В продожительный диалог вообще не может, часто каждый раз будто рандомный ответ не учитывающий прошлое.
> приблизительно уровень Клауди
только если их самой днищенской модели, оно даже по знаниям мэх.

Аноним 11/10/24 Птн 21:57:21 #340 №914964

>>914870
Скорее всего, всё из-за begin_of_text. Это вроде стартовый токен третьей ламы, и его не должно быть в контексте, он генерируется. У меня были похожие проблемы, когда тройка только вышла, и я тоже баловался с шаблонами: тупо стартовое сообщение перса копировалось. Но ты в принципе что-то странное из шаблона сделал. Такие макросы в одиночных фигурных скобках разве существуют вообще? И даже если {input} - это то же, что {{input}}, то это только твоё последнее сообщение. Получается, что ты его кладёшь в стористринг, который перед всем текстом идёт, зачем-то. А макроса output вообще нет вроде как. Посмотри, что за промпт в консоли выводится по такому шаблону.

Аноним 11/10/24 Птн 22:00:23 #341 №914966

Аноны. Хочу сделать лору поз в сексе. И поз из йоги. И основных боевых приемов самбо. Особенно захваты интересуют. Как это сделать, с чего начать

Аноним 11/10/24 Птн 22:02:19 #342 №914968

https://www.reddit.com/r/LocalLLaMA/comments/1g13v4r/claudedev_200_released_now_named_cline/
погромистам

Аноним 11/10/24 Птн 22:02:23 #343 №914969

>>914966
Вроде такое через лорбуки делается.

Аноним 11/10/24 Птн 22:04:07 #344 №914971

>>914966
На чубе есть лорбуки с позами, фетишами и прочими извращениями Работают ли они вменяемо - в душе не ебу, никогда не юзал их.

Аноним 11/10/24 Птн 22:04:28 #345 №914972

>>914969
Создание Лорбуков не слишком требовательно к мощностям?

Аноним 11/10/24 Птн 22:05:34 #346 №914976

>>914972
Каким мощностям? Это просто текст, который ты сам пишешь. Можешь считать что это дополнительные промты для модели.

Аноним 11/10/24 Птн 22:08:30 #347 №914987

>>914976
Ну мне казалось, что там какое то дополнительное шаманство. Ну раз так, то пошел писать.

Аноним 11/10/24 Птн 22:09:50 #348 №914991

>>914870
Prompt Inspector поставь в расширениях таверны, будешь сразу видеть что отправляешь на генерацию с возможностью правки на лету
Включается внизу рядом с полем ввода волшебная палка и тыкнуть там Inspect Prompts что бы включить
Очень удобная хрень для отладки промпт формата, всем рекомендую

Аноним 11/10/24 Птн 22:10:34 #349 №914992

>>914972
Посмотри в лорбуки. Там теги. Вангую, что в таверне идёт поиск тега в сообщении, если оно находит нужный - то вставляет запись, ассоциированную с тегом. То есть по перформансу будет бить длина истории и размер рулбука вместе взятые. Но лучше потести, что происходит с использованием рулбука. Если всё так, как я описал, то особо ничего страшного, пока у тебя норм процессор. Норм это не триллион поточный зивон, т.к жс, сам понимаешь, нужны мощные ядра, потоки всё равно через очко реализованы. Но вряд ли ты вообще заметишь импакт, если не ебанёшься с написанием портянок на триллион записей.

Аноним 11/10/24 Птн 22:30:01 #350 №915034

>>914992
Ладно, пошел изучать. По результатам отпишусь. Если не забуду
> норм процессор
13600кф.

Аноним 11/10/24 Птн 22:42:16 #351 №915071

В кобальд завезли новый семплер анти слоп, фильтр заебавших фраз
Так что если заебали какие то гптизмы или клодизмы можно их вырубить

Аноним 11/10/24 Птн 22:49:36 #352 №915096

>>914719
> >GoodbyeDPI всё
> Ты видимо и есть та тупица, которая не понимает как решать свои проблемы:
> https://ntc.party/t/если-опять-перестал-грузиться-youtube-или-его-видео/10529/1350
На всякий случай, эта хуйня может ломать парсеры. Если кто-то собирает так датасеты...
А то я накачал битых файлов. Когда убрал жесткие настройки на разъеб пакетов, вроде ломать перестало.

Аноним 11/10/24 Птн 22:51:43 #353 №915100

>>914123
>48 вольт, то китайцы уничтожат весь рынок pci
Лол, БП это самая простая штука, и купить питалово для такой видяхи будет стоить пару тысяч.
>>914128
>У 9950x и 9900x какого-то хуя ебанутые задержки
Вроде фиксили бивасом, да и по факту неоткуда там задержкам появляться, по сути чипы не так сильно обновили.

Аноним 11/10/24 Птн 23:04:22 #354 №915126

IMG2140.jpeg

IMG2141.jpeg

Коллабо-анон, у меня гугл-транслейт все равно не работает.
В расширениях он включен, но в самом чате его нет.

Аноним 11/10/24 Птн 23:30:32 #355 №915165

🌟 Гайдбук по оценке больших языковых моделей от Hugging Face

Hugging Face выложила (https://github.com/huggingface/evaluation-guidebook) на Github руководство по оценке LLM.
В нем собраны различные способы оценки модели, руководства по разработке собственных оценок, а также советы и рекомендации из практического опыта. В руководстве рассказывается о разных способах оценки: с помощью автоматических тестов, людей или других моделей.
Особое внимание уделяется тому, как избежать проблем с инференсом модели и сделать результаты одинаковыми. В руководстве есть советы о том, как сделать данные чистыми, как использовать шаблоны для общения с LLM и как анализировать неожиданные плохие результаты.
Если вы ничего не знаете об оценке и бенчмарках, вам следует начать с разделов <code>Basics</code> в каждой главе, прежде чем погружаться глубже. В разделе базовые знания (https://github.com/huggingface/evaluation-guidebook?t..) вы также найдете пояснения, которые помогут вам разобраться в важных темах LLM: например, как работает инференс модели и что такое токенизация.
Более прикладными разделы: советы и рекомендации (https://github.com/huggingface/evaluation-guidebook/b..), устранение неполадок (https://github.com/huggingface/evaluation-guidebook?t..) и разделы, посвященные дизайну (https://github.com/huggingface/evaluation-guidebook/b..).

Аноним 11/10/24 Птн 23:35:27 #356 №915176

>>913169
>>913235
>>913092
Нихуя себе "плюс-минус"
На русике пишет БЕЗ ОШИБОК блять, и это на 4 кванте, да, не так оригинально как на английском, но гугл переводчик один хуй превратит все в кал

Аноним 12/10/24 Суб 00:05:07 #357 №915205

https://www.reddit.com/r/LocalLLaMA/comments/1g1s0vz/supernovamedius_qwen2514b_distilled_from/

>>915100
>БП это самая простая штука
Одно дело, когда тебе нужно заботиться о бп, ставить один бп под всё остальное, один конкретно под видеокарты. Да ещё следить, чтобы не перепутать, разъёмы-то одинаковые. Или когда у тебя есть малышка вроде пикрила, которая ест всё те же 12 вольт. Правда, у неё куча других подводных камней, начиная с TDP в 300 ватт и микроскопическим радиатором. Который ещё и обдувается всего лишь одним центробежным вентилятором. Зато влезает в два слота + может иметь нвлинк. А может и не иметь, тут уже зависит от того, зажал ли ты лишние 200 юаней или нет. Ну и ещё те же юаней двести на сам коннектор. Но по факту оказывается, что цена переходника плюс-минус равна цене карты, лол, и затея становится выгодной только на картах от А100-H100. Конечно, если ты уже в Китае, то ситуация другая, но не то, чтобы сильно. Ура, SXM карты тоже удвоятся в цене, лол.

Аноним 12/10/24 Суб 02:05:53 #358 №915253

>>914793
Раз там все так дешево то может и апи на халяву дадут?

Аноним 12/10/24 Суб 02:57:28 #359 №915264

Всех кого заебали шиверс клодизмы поздравляю - в кобольд завезли анти-слоп (это не я название выдумал, они сами его указали)

Теперь можно банить слова и целые словосочетания в пару кликов и больше не читать про озорные ухмылки, игривые подмигивания и седусив свей оф хипс. Антислоп ловит эту хуйню в тексте, удаляет и автоматически регенерирует оставшуюся часть сообщения с того же места, что в теории может сработать, если оно не уйдет в бесконечный луп.

https://github.com/LostRuins/koboldcpp/releases/tag/v1.76

Попробовать можно уже сейчас, но придется подождать, пока цю хуйню впендюрят в таверну.

Аноним 12/10/24 Суб 03:05:14 #360 №915266

>>915264
>>больше не читать про озорные ухмылки, игривые подмигивания и седусив свей оф хипс
А что тогда останется?

Аноним 12/10/24 Суб 03:07:05 #361 №915268

>>915264
XTC давно уже есть, который то же самое делает быстрее и проще.

Аноним 12/10/24 Суб 03:16:38 #362 №915269

>>915268
XTC не только от слопа избавляет, так что не сравнивай. Он сильно видоизменяет текст, а антислоп просто убирает ненужные тебе фразы и в теории имеет больше применения с большим контролем.

>>915266
Останутся только аполоджайзы. Sorry, no sex.

Аноним 12/10/24 Суб 03:35:13 #363 №915276

>>915264
Так это общая проблема?
Я думал только на днище моделях меня ебут хе айз вил вис шок
Какого хуя нейронка из биллионов слов выбирает именно эти

Аноним 12/10/24 Суб 03:42:24 #364 №915278

>>915269
>Он сильно видоизменяет текст
От чего даже маленькие модели могут заиграть новыми красками без озорного блеска в глазах. Тем более, просто фильтровать/банить слова всегда можно было.
>Up to 48 phrase banning sequences can be used
То есть всё равно ручками, кек.

Аноним 12/10/24 Суб 03:48:00 #365 №915281

>>915276
>Какого хуя нейронка из биллионов слов выбирает именно эти
Ответ очевидный как бы, значит эта хуйня чаще всего встречается в датасетах и имеет больший вес при генерации.

>>915278
>От чего даже маленькие модели могут заиграть новыми красками
Могут, я же не спорю. Я прямо написал о том, что с антислопом у тебя просто появляется больше контроля. Может тебе не нужно полностью шизоскручивать распределение, а ты хочешь избавиться только от пары-тройки конкретных настоебенивших фраз, что в таком случае делать? Если тебе это не нужно - не значит что никому не нужно.

>То есть всё равно ручками, кек.
А ты че думал, опять всё за тебя делать будут? В этом и смысл, что ты сам решаешь что оставить, а что убрать.
Если ты про ограничение в 48 бансекций то да, маловато.

Аноним 12/10/24 Суб 03:50:11 #366 №915282

И что сетка не будет просто синонимы лепить с тем же значением?

Аноним 12/10/24 Суб 03:50:27 #367 №915283

>>915264
Тока вот разраб таверны сжвшнулся и пилит обнову чтоб таверна стала фемили френдли хис айз фликерс виз садистик гли

Аноним 12/10/24 Суб 07:32:22 #368 №915356

>>915283
Разраб основной или Силли?

Аноним 12/10/24 Суб 08:53:16 #369 №915371

>>914991
>Prompt Inspector поставь в расширениях таверны
Тоже попробую, спасибо.

Аноним 12/10/24 Суб 09:45:38 #370 №915398

>>915282
Обычно вероятности синонимов более равномерно распределены чем у слоповых фраз.

Есть сомнения по поводу этого антислопа, если там тупо регенерация по кругу.

Аноним 12/10/24 Суб 10:14:34 #371 №915416

IMG20241012141035.jpg

>>914793
Блжкбокс просто имба

Аноним 12/10/24 Суб 11:08:38 #372 №915441

>>914793
Абсолютный наёб для дебилов. Изображения генерятся на апи этого сервиса https://fastflux.ai/. Текст хуй знает, обычная хуйня, у меня на локалке и то быстрее генерит.

Аноним 12/10/24 Суб 11:13:54 #373 №915444

JoyCaption васянская хуйня или может помочь в капшене для XL/FLUX? Пока-что пользуюсь ллава 34б, так она блядь в 12 раз больше весит этого джоя, может ли джой быть лучше?

Аноним 12/10/24 Суб 11:26:20 #374 №915453

>>915264
Адекватных вариантов, кроме логит биасов - нет.

>>915398
>если там тупо регенерация по кругу.
>by backtracking and regenerating when they appear.
>When using Anti-Slop phrase banning, streaming outputs are slightly delayed - this is to allow space for the AI to backtrack a response if necessary. This delay is proportional to the length of the longest banned slop phrase.
>Up to 48 phrase banning sequences can be used, they are not case sensitive.

Аноним 12/10/24 Суб 11:35:02 #375 №915460

>>914134
> Намек на то что ты - фантазер и пиздишь, причем крайне кринжово.
Но так как я не фантазер и не пизжу, намек получился жалкий, от бомжа-обиженки. Могу лишь посочувствовать человеку, который просто срет всех вокруг и «вы все врети», но при этом не повышает свое качество жизни и даже не допускает в мыслях, что не все живут как он в дерьме.
Без иронии и оскорбления, искренне сочувствую это человеку. Тяжелая у него жизнь.

>>914173
Пусть покупает. Придет — сюрприз будет.

>>914265
Основная проблема, что даже на 48 гигах частенько приходится заебаться, чтобы раскидать модель по двум картам в трансформерах, если ты тестишь что-то. И одна карта физически удобнее.
А некоторые модели хоть усрись отказываются раскидываться по картам и работают только на одной.
Но если ты не настолько экспериментатор, и готов подождать апдейт комфи на очередной эксперимент (или не дождаться), то две карты дешевле, конечно.

4070ти супер оптимальная карта с точки зрения цены/объема, конечно, самая дешевая 16-гиговая, но при этом не 4060 ти.
Но люди в треде справедливо заметят, что 3090 никто не отменял, выйдет и дешевле, и больше.

>>914303
кек )

>>914328
Да не ленись. Если у тебя есть деньги на 5090, то собрать комп не такая проблема. ссд любой, бп нормальный, 1.2 кВт, мать на б-чипсете с двумя хорошими полноценными слотами и х8+х8, проц средний, памяти 2*32, ну и кулер. Все, поехали, че. И корпус выбери.
Еще можно взять проц со встройкой, чтобы видеопамять вообще не занималась.

Зато прикинь, 56 гигов видеопамяти! И это все стоит и фурычит, когда тебе надо.

А вот за бокс не скажу, возможно обработка промпта сильно просядет, а может и нет (судя по тому шо пишут ниже — заметно просядет по сравнению с одной картой, но для теславодов не критично=). Работать должно, по идее.

А как насчет простого райзера, без изъебств?

>>914395
ИМХО, 8 бит получше, но если тебе и 4 бита норм, то хорошо. =)
Я чаще 8 бит кэш врубаю.

>>914695
Еще впн блочит Ростелеком, а мелкие провайдеры не парятся, так что и тут ошибка выжившего может быть.

>>914696
Ну ты уже опоздал, волна просто не дошла еще до тебя. =) WG в бане уже неделю у Ростелекома во многих регионах. Кажись 3-4 числа он умер полностью. При этом, у другого провайдера работает как и раньше. Так что…
Ну, не веришь — не кумекай. =)
Никто не заставляет.

>>914730
Блин, клево вам, живете с такими админами добрыми. =) У меня антизапрет года два как вырезали с корнем.

>>914748
Ну, в РФ ютуб не перечисляет, надо смотреть с впна, у нас не то чтобы популярно…
Не ютуб, а рекламодатели (агенства) приносят деньги ютуберам в РФ. =) Немного другое, все же.

>>914839
Соавторство пишется в completion // notebook, а чат режиме же, здрасьте. =)
miqu-че-то там для авторов.

>>914842
На момент появления лламы 3/3.1/3.2 уже были модели лучше, лол.

>>914844
Ничего. Все оставляй, базовый набор.

>>914846
А вот не знаю, думаю, мелкие провайдеры могут долго забивать хуй, на самом деле. Кто бы их слил? Сами пользователи? Зачем?
Не уверен, что кто-то сидит в РКН и проверяет каждого провайдера вручную.
Так что, может кому-то повезло, хз.

Аноним 12/10/24 Суб 11:40:04 #376 №915463

>>915460
> а чат режиме же
а не в чат режиме же

Аноним 12/10/24 Суб 11:50:28 #377 №915467

Аноны, хочу продать свою 4070 супер и купить 4070 ти супер. Все для нейронок конечно же, ибо для игр мне и этого хватает. Стоит ли оно того. Смогу ли я 4070 супер продать за 60к, ксли она на гарантии, и ей даже года нет.

Аноним 12/10/24 Суб 11:53:55 #378 №915470

>>915460
>Не уверен, что кто-то сидит в РКН и проверяет каждого провайдера вручную.
Просто пока шайтан-DPI-коробки нового типа не ко всем завезли. Но ничего, деньги уже выделены. "Сядут все"(с) А иначе никак, отечественная пропаганда должна доминировать тотально. Тогда и доллар по 70 вернётся (не в магазины конечно).

Аноним 12/10/24 Суб 12:12:02 #379 №915484

>>915460
>Не ютуб, а рекламодатели (агенства) приносят деньги ютуберам в РФ.
А какие деньги ютуб перечислял до этого? От тех же рекламодателей.
Ютуб это рынок и то, что этот рынок берёт на себя роль сводника между покупателем и продавцом не делает сам ютуб плательщиком. Такой себе супермаркет, в котором нет своих товаров, а персонал помогает наполнять корзинки и оформлять оптовые поставки, беря на себя неудобства с логистикой и денежными переводами. Но сам маркет не покупает товар и не продаёт, не платит поставщикам и т.д. Тем же образом и криптобиржи работают, они никому ничего не платят, майнеры получают свои комиссии за переводы, биржа помогает обменивать деньги на виртуальные фантики. Просто сейчас персонал этого супермаркета сказал "ну вас нахуй, сами ищите себе покупателей" и перестал выполнять услуги посредника.
Всё это не отменяет того, что ютуб это про деньги, причём куда больше про деньги, чем крипта.

Аноним 12/10/24 Суб 12:19:45 #380 №915489 DELETED

>>915441
> astflux.ai
Сояво-фашнявая параша с геоблоком "неправильных" стран и народов, работает только через ВПН. Типичный пример протестутвэра, тильки жовтоблакитного на главной не хватает.

Аноним 12/10/24 Суб 12:26:26 #381 №915496

>>915484
Я не спорю, что рынок. И я даже не читал, что ты пишешь, я разбираюсь в этом.
Но я к тому, что сейчас все это немного замороженный рынок, и деньги там уже не совсем те, что были года три назад. Конечно, все адаптируется, однако, не все ситуации переживаются без потерь.
К тому же, адаптация работает в обе стороны — переход на альтернативные платформы, и работа агенств с ними (им-то пофиг, лишь бы клиенты были).

Аноним 12/10/24 Суб 12:29:18 #382 №915499

Вычитал мнение что 3060 12гб лучше чем 4060 16гб из за разрядна шины
Кому верить?

Аноним 12/10/24 Суб 12:42:02 #383 №915510

>>915496
Только вот ты пишешь что ютуб перестал перечислять деньги. Но он этого не делал никогда. А денег стало меньше, потому что взаимодействие рекламодатель-ютубер теперь работает в ручном режиме. Без помощи тех же нейросетей, которые помогали выбрать аудиторию, которой будет показана реклама, высчитывали цену за просмотры и т.д. Стало не так удобно и не так эффективно. Но что изменится, если ютубер перейдёт куда-нибудь в вк видео и будет делать интеграшки там, а не в ютубе? Всё то же ручное неэффективное взаимодействие. Ютуб был слишком хорош и потеря этого функционала снизила эффективность, из-за чего упала выгода для рекламодателя. Стало меньше рекламодателей, упали доходы ютуберов. Это не то, чтобы заморозка рынка, просто возврат к взаимодействию человек-человек вместо человек-машина. Ютуб всё ещё про деньги? В общем-то, да. Вот если обход блокировок перестанет работать процентов у 50 населения, то ютуб уже будет энтузиазмом, лол.

Аноним 12/10/24 Суб 12:42:28 #384 №915511

Untitled.png

Я сделяль: https://github.com/cierru/st-stepped-thinking

Расширение Stepped Thinking по лекалам анона, написавшего https://rentry.co/LLMCrutches, к вашим услугам, спешите любить и жаловать ну либо обоссать и покрыть хуями - это же двощ, в конце концов. Проверил на своих юзкейсах в соло и групповых чатах - то, что планировал, работает. Больше мне добавить нечего, всё написано в ридмишке.

Enjoy <3

Аноним 12/10/24 Суб 12:46:32 #385 №915512

>>915511
Щас заценим, пасиба анон не анон
В список расширений не будешь просить добавить? Чтоб из таверны качать напрямую без ссылки?

Аноним 12/10/24 Суб 12:48:00 #386 №915513

>>915512
Если анону расширение зайдёт, то почему бы и не написать.

Аноним 12/10/24 Суб 12:53:54 #387 №915517

>>915513
Пиши сразу, там есть гораздо более слабые и кривые расширения

Аноним 12/10/24 Суб 13:05:10 #388 №915526

>>915511
>Я сделяль
Не сделяль русский ридмишник - позор тебе, анон.

Аноним 12/10/24 Суб 13:21:17 #389 №915538

17250978273070.jpg

>>915517
Спасибо, приободрил. Тогда на выхах свяжусь с ними.

>>915526
Прости, пожалуйста...

Аноним 12/10/24 Суб 13:27:29 #390 №915550

>>915510
Почему?
Ютуб именно перечислял деньги.
Он брал у рекламодателей, платил создателям контента, но часть денег оставалось у него. И де-юре, и де-факто платил именно ютуб.
Верно, что взаимодействие рекламодатель-ютубер изменилось, но не только потому что аудиторию не отбирают, а еще и потому, что ютуб теперь не получается деньги (поэтому и не занимается этим).

Причин больше, чем одна про ручной режим. =)

>>915511
Будешь контрибутить в таверну или экстрас?
Сразу в таверну, не?

>>915517
+++

>>915526
Тоже база.

Аноним 12/10/24 Суб 13:43:50 #391 №915580

>>912960
>>913182
> Nvidia's Blackwell GPUs for AI and HPC faced a slight delay due to a yield-killing issue with packaging that required a redesign, but it looks like this did not impact demand for these processors. According to the company's management questioned by Morgan Stanley analysts (via Barron's), the supply of Nvidia Blackwell GPUs for the next 12 months has been sold out, which mimics a situation with Hopper GPUs supply several quarters ago. As a result, Nvidia is expected to gain market share next year (via Seeking Alpha).
> Morgan Stanley analysts shared insights from recent meetings with Nvidia's leadership, including CEO Jensen Huang. During these meetings, it was revealed that orders for the Blackwell GPUs are already sold out for the next 12 months. This means new customers placing orders today must wait until late next year to receive their orders.
> Nvidia's traditional customers (AWS, CoreWeave, Google, Meta, Microsoft, and Oracle, to name some) have bought every Blackwell GPU that Nvidia and its partner TSMC will be able to produce in the coming quarters.
> Such an overwhelming demand may indicate that Nvidia might gain market share next year despite intensified competition from AMD, Intel, cloud service providers (with proprietary offerings), and various smaller companies.
> "Our view continues to be that Nvidia is likely to actually gain share of AI processors in 2025, as the biggest users of custom silicon are seeing very steep ramps with Nvidia solutions next year," Joseph Moore, an analyst with Morgan Stanley, wrote in a note to clients. "Everything that we heard this week reinforced that."
> Now that packaging issues of Nvidia's B100 and B200 GPUs have been resolved, Nvidia can produce as many Blackwell GPUs as TSMC can. Both B100 and B200 use TSMC's CoWoS-L packaging, and whether the world's largest chip contract maker has enough CoWoS-L capacity remains to be seen.
> Also, as demand for AI GPUs is skyrocketing, it remains to be seen whether memory makers can supply enough HBM3E memory for leading-edge GPUs like Blackwell. In particular, Nvidia has yet to qualify Samsung's HBM3E memory for its Blackwell GPUs, another factor influencing supply.

https://www.tomshardware.com/pc-components/gpus/nvidias-blackwell-gpus-are-sold-out-for-the-next-12-months-chipmaker-to-gain-market-share-in-2025

Аноним 12/10/24 Суб 13:46:46 #392 №915590

>>915499
Лучше ровно до тех пор, пока модели полностью в vram влезают. Между 12 и 16 ГБ выигрывать будет явно 4060 ti, и дальше тоже возможно она же, за счет того, что cpu будет считать на 4 ГБ меньше.

Аноним 12/10/24 Суб 13:48:15 #393 №915598

>>915550
>Будешь контрибутить в таверну или экстрас?
Экстрас же заброшены, нет?
>Сразу в таверну, не?
Пока таких планов перед собой не ставил, но можно попробовать.

Аноним 12/10/24 Суб 13:51:36 #394 №915612

washizu.jpg

>>915511
Сначала подумал - прикольно, модельки будут поумнее отвечать. А ПОТОМ ЕБАТЬ, ЭТО ЖЕ МОЖНО ТАКОЙ ОТЫГРЫШ МАЙНДРИДА ЗАЕБАШИТЬ

Аноним 12/10/24 Суб 13:53:01 #395 №915621

>>915612
А ведь и правда, лол. Даже не думал об этом.

Аноним 12/10/24 Суб 13:57:07 #396 №915639

>>915460
>а мелкие провайдеры не парятся
За них банят большие.
>>915499
Шина больше, объём меньше. Решай, что тебе важнее.
4060 это пиздец кастрат, рака яичек куртке за это.
>>915511
О, ЗБС, в шапку.

Аноним 12/10/24 Суб 14:00:00 #397 №915647

>>915580
Во время золотой лихорадки выгоднее всего продавать лопаты, особенно когда у тебя нет конкурентов
Их там антимонопольное уже за жопу не берет?

Аноним 12/10/24 Суб 14:08:33 #398 №915659

>>915511
Включил. Ебнуло мне 10+ сообщений в чатик. Выключил.

Аноним 12/10/24 Суб 14:23:21 #399 №915672

Аноним 12/10/24 Суб 14:24:52 #400 №915674

А есть где-то гайд, список или что-то подобное по ключевым фразам для instruct режима?
навроде
Describe at length and in detail
или
Describe in detail the thoughts, emotions, sensations and all the feelings

Аноним 12/10/24 Суб 14:29:32 #401 №915680

Напомните зачем мы всё это делаем, это же реально тред шизов каких то, тратим тысячи $ чтобы наши логи не хранились на серваках
И один хуй клод и гопота лучше

Аноним 12/10/24 Суб 14:31:08 #402 №915684

>>915680
Чем взрослее ребенок тем дороже его игрушки

Аноним 12/10/24 Суб 14:33:07 #403 №915686

>>915672
Ээээ, дистилят от двух разных моделей разного размера? Унди бы тут оргазмировал.
>>915680
>И один хуй клод и гопота лучше
Уже давно нет, лол. Пока они там росли на свои 5%, попенсорс рос на десятки. Плюс отсутствие цензуры, а то у меня на карточку персонажа тригеррится.

Аноним 12/10/24 Суб 14:43:19 #404 №915694

>>915680
>тратим тысячи $ чтобы наши логи не хранились на серваках
Не только для этого, а ещё чтобы крутить те модели, которые хотим. ГПТ и Клод в кум не умеют и запрещено им. Для мелких моделей никакие тысячи не нужны кстати, на бытовых видеокартах всё прекрасно гоняется. Ну а для взрослых да, там дорого.

Аноним 12/10/24 Суб 14:52:37 #405 №915708

>>915659
Видимо, бага какая-то. Можешь плиз подробнее описать, какая у тебя версия таверны, какие расширения стоят и что ты делал?

Аноним 12/10/24 Суб 15:12:18 #406 №915730

>>915612
И все равно затащить на удаче, а не своих способностях
инб4: удача - способность

Аноним 12/10/24 Суб 15:16:06 #407 №915736

>>915708
Версия последняя. Сейчас перезапустил, вроде прошло, но оно генерит эти мысли при удалении сообщения и открытии чата например новым сообщением все равно

Аноним 12/10/24 Суб 15:25:49 #408 №915753

>>915736
А ты жмёшь кнопку "стоп" перед тем как удалять сообщения или переходить на другой чат? Если нет, то я такие случаи не особо тестировал, вполне может быть, что расширение в них работает криво.

Аноним 12/10/24 Суб 15:26:13 #409 №915755

Я что то не так делаю?
Команда русика срабатывает с 10 раза где-то, до этого пишет это не мой язык я могу только на английском и тд.
Причем пишет одно сообщение на русском и потом опять надо упрашивать

Аноним 12/10/24 Суб 15:26:21 #410 №915756

Кто то проверял что лучше работает, K-L или K-M?
Интересуют L кванты, в них важные слои на 8 бит независимо от кванта остальных весов.

>>915708
Поделюсь фидбеком - при регенерации сообщения сетки, махая вбок, мысли остаются
Хотелось бы галку в настройках расширения, что б выбирать регенерировать ли их вместе или только ответ
Версия последний релиз

Аноним 12/10/24 Суб 15:28:24 #411 №915760

>>915753
Да, я чаткомплишене пробовал, на кобольде такого нет. Я так понимаю ты там не тестил...

Аноним 12/10/24 Суб 15:36:57 #412 №915781

>>915756
Да, есть такое, работа со свайпами - это следующее, что я планирую реализовать когда руки дойдут. Я бы причём эту настройку прямо в блок сообщения с мыслями вынес, чтобы пользователь мог в каждом конкретном случае выбирать, перегенерировать мысли или нет.

>>915760
Я только на кобольде тестировал, да. Понял, тогда запланирую Chat Completion тоже потыкать, спасибо за фидбек.

Аноним 12/10/24 Суб 15:55:31 #413 №915813

>>915760
>>915781

На кобольде есть чат комплишен апи, просто коннектишься к кобальду через него в настройках таверны

Аноним 12/10/24 Суб 16:06:27 #414 №915833

>>915755
Если сетка плохо знает русский или даже файнтьюн какой-нибудь мультиязычной модели (а датасеты для рп тьюнов только на инглише, скорее всего), то у неё всё равно могут быть наиболее вероятны токены с инглишом в ответе. Особенно, если у тебя там уже существующий контекст на инглише. Имхо самый надёжный варик - это в инстракте в поле с префиксом последнего ответа ассистента написать в системных тегах инструкцию типа "Дай свой следующий ответ на русском языке" (или можно даже без тегов, просто в тех же квадратных скобках), потом тег ответа ассистента, а после него вставить префил вроде "Конечно, вот мой ответ за {{char}} на русском". Можно по-разному попробовать формулировать.

Аноним 12/10/24 Суб 16:15:15 #415 №915850

>>915755
> 9а-91

Аноним 12/10/24 Суб 16:15:41 #416 №915852

>>915550
>Он брал у рекламодателей, платил создателям контента, но часть денег оставалось у него.
Ты работаешь на дядю, он выписывает тебе чек. Идёшь в банк и обналичиваешь, банк берёт процент комиссии и выплачивает тебе наличку. Кто тебе заплатил - дядя или банк? С ютубом ровно то же самое было.
>>915755
Инстракт имеет больший приоритет, он на английском - сетка отвечает на нём. Редактируй инстракт и\или карточку.

Аноним 12/10/24 Суб 16:33:20 #417 №915879

>>915813
Ты прав, это сильно упростит тестирование.

Аноним 12/10/24 Суб 16:58:35 #418 №915931

>>915672
Потестировал в переводах (jp->en, chi->en) - неплохо подмечает детали в контексте, не страдает излишней буквальностью в ущерб художественности. В целом получше старого коммандера 35b и недавнего nemo 12b (22b, кстати, хуже 12b), которые до недавнего времени были моими фаворитами. Надо бы ещё обычные квены 2.5 потестить, нового коммандера, гемму, фи, и что там ещё интересное выходило. Где только место под это всё найти?

Алсо, очень хочет скатиться в лупы, см. пикрил да-да, скилл ишью, что-то там в настройках семплера подкрутить надо.

Аноним 12/10/24 Суб 17:04:16 #419 №915938

>>915931
Дистилляция наверняка была нацелена на английский язык, поэтому тебе бы лучше обычную qwen2.5 14b глянуть

Аноним 12/10/24 Суб 17:12:02 #420 №915958

>>915931
>коммандера 35b
Оверхайп параша, вообще не понял дрочева на это косое говно

Аноним 12/10/24 Суб 17:12:19 #421 №915960

>>915659
Пофиксил, выкатил версию 1.0.1, проверяй, друг. Всё ещё осталось странное поведение - если нажать кнопку "стоп" во время генерации мыслей, генерация всё равно продолжатся в фоне в режиме чаткомплишен. Но мне уже влом с этой хуйнёй разбираться сейчас, тем более что сгенерированные мысли не отправляются в чат, так что не критикал.

Аноним 12/10/24 Суб 17:21:23 #422 №915966

У кого ту сборочка х2 3060?
Как гоняется?

Аноним 12/10/24 Суб 17:50:33 #423 №916002

>>915938
>тебе бы лучше обычную qwen2.5 14b глянуть
Места мало, качаю очень избирательно только что-то "необычное" и "интересное". Про 2.5 пишут, что охуеть какой умный, но так и про предыдущие версии писали, нахваливали. Тестировал 1, 1.5, вроде и 2 (но это не точно), каких-то впечатляющих результатов не припомню.
>>915958
В переводах на момент выхода он был вне конкуренции, поскольку хороших мультиязычных моделей тогда не было. Были две крайности, либо мультиязычная мелочь уровня 7b с кривым английским, рассыпающимся от неестественных оборотов, скопированных с оригинала, зато более-менее точный перевод (но зачем, когда есть google translate?), либо очень вольный пересказ основных моментов красивым английским (что не всегда плохо при художественном переводе), перевирание неоднозначных/сложных моментов. Коммандер же и на английском писал выше среднего, и другие языки хорошо понимал.

А этот квен мат переводить не хочет, главное чтобы кожаный мешок чувствовал себя безопасно. И по-моему речь про безопасность не конечного пользователя, а того, кто тренировал.

Аноним 12/10/24 Суб 17:55:20 #424 №916015

>>916002
>Про 2.5 пишут, что охуеть какой умный,
Он реально умный, каждая модель квен2.5 на текущий момент топ в своем размере
Там есть проблемы с соей и цензурой, но на ум это не сильно влияет.
Ну и естественно для рп ерп придется немного напрячься
Немного, на фоне той херни что делают кумеры из соседнего треда когда сидят на облачных ии

Аноним 12/10/24 Суб 18:26:37 #425 №916047

>>915672
https://huggingface.co/arcee-ai/Llama-3.1-SuperNova-Lite-GGUF
У них там дофига так моделей еще, вот дистилляция большой лламы 3 405в в 8б

Аноним 12/10/24 Суб 18:33:40 #426 №916062

https://www.reddit.com/r/LocalLLaMA/comments/1g1vtyq/llama3_8b_unaligned_beta_released/
расцензуренная версия лламы 3 8в

Аноним 12/10/24 Суб 18:37:08 #427 №916065

Я так понимаю ии понимает инструкции на русском, это как то влияет на текст или он будет таким же если бы я написал инструкцию на английском?

Аноним 12/10/24 Суб 19:01:15 #428 №916099

image (3).pngimage (3).png

Так это что такое

Аноним 12/10/24 Суб 19:18:55 #429 №916121

>>916062
>лламы 3 8в
Кто из спячки вышел- ты или автор модели?

Аноним 12/10/24 Суб 19:20:32 #430 №916128

>>916065
>это как то влияет на текст
На текст влияет всё, даже смена одного токена может полностью поменять вывод.
>>916099
Это отмена русского, сэр. Скоро всю кириллицу выпилят из токенайзеров.

Аноним 12/10/24 Суб 19:27:39 #431 №916137

Как вообще даже в теории модель может выдерживать 128к контекста без жидкого обсера под себя с 0.3 токена в секунду?
Это сколько 4090 надо завезти?

Аноним 12/10/24 Суб 19:30:15 #432 №916142

17285803577200.jpg

x5.png

>>916137
Как на счёт миллиона?

Аноним 12/10/24 Суб 19:33:57 #433 №916147

blackwell.png

>>916137
Тащемта секретов то тут и нет...

Аноним 12/10/24 Суб 19:53:00 #434 №916172

>>916137
Если модель мелкая, то и одной хватит.

Аноним 12/10/24 Суб 20:04:34 #435 №916182

>>915460
>Соавторство пишется в completion // notebook
А где это включить?

Аноним 12/10/24 Суб 21:29:20 #436 №916282

>>915205
> чтобы не перепутать, разъёмы-то одинаковые
Если твой айсикью настолько велик, что ты можешь перепутать идущие с разных источников разъемы, и считаешь это проблемой куда более серьезной чем запредельная цена видеокарт - тебе в дурку пора. В нормальных условиях sxm дороже pci-e, арендуют и покупают их куда охотнее. Ты впечатлился ценообразованием на маловостребованную некроту где-то далеко, и пошел сочинять многоходовочки.
>>915444
Первый джой - сиглип+адаптер+ллама 8б - ллава на основе лламы 8б. Разница всего в ~4 раза. С простыми изображениями более менее справляется, наверняка будет лучше чем простая ллава, но генерирует много лишенго мусора и ошибается.
>>915460
> Но так как я не фантазер и не пизжу
Значит любитель придумывать небылицы и приукрашивать, на самом деле просто увидел пост про покупку где-то на реддите или в какой-нибудь группе, надумав свою причастность.
Это же очевидно, увлечения подобным - редкость, увлечение ллм или нейросетями настолько чтобы так вкладываться - еще большая редкость, дело не только в финансах, ведь чаще просто довольствуются меньшим, пользуясь корпоратами или мощностями на работе. Наличие наносеков в кругу общения у странного нищеброда - сценарий маловероятный, если говорить о хороших знакомствах а не "на одной площади стояли".
И на фоне этого всего ты затираешь что у тебя сразу два таких случая(!), при этом высокомерно упоминаешь какбы вскользь как аргумент в бессмысленном споре, где у тебя кончились аргументы. Эталонный dies from cringe, напоминающий как пиздюки хвастаться тем что не имеют, и вполне ложится на типичные перлы от шиза, который линкает пол треда.
> от бомжа-обиженки
Такой-то рофел, ведь у меня и пара 4090, и риг 3090, и много чего еще немыслимого для тебя есть, даже "у папы на работе" привлекать не нужно.
> даже на 48 гигах частенько приходится заебаться, чтобы раскидать модель по двум картам в трансформерах, если ты тестишь что-то
Прописать auto-devices или скопировать конфиг - пиздец какие заебства.
> А некоторые модели хоть усрись отказываются раскидываться по картам и работают только на одной.
Проблема в кривых руках, все популярные либы это поддерживают. Только в совсем невероятно редких случаях, когда для взаимодействия доступен только упоротый быдлокод автора, но даже там можно залезть чтобы раскидать словарь.
Реальные проблемы в размещении внутри корпуса и доступности материнок с правильно распределенными линиями процессора.
> 1.2 кВт
> 2х5090
Ахуительные советы
> Кто бы их слил? Сами пользователи? Зачем?
Мониторят ресурсы где обсуждаются методы и идет хвастовство у кого что работает, тридварасам дали приказ блочить намертво.

Аноним 12/10/24 Суб 21:37:19 #437 №916294

>>915511
Красава, герой которого мы не заслуживали.
>>915674
Если ты про специальные фразы/токены то это на странице модели. Если в общем про инструкции - просто проси что хочешь как можно четче и лаконичнее.
>>915680
Да
>>915686
> дистилят от двух разных моделей разного размера? Унди бы тут оргазмировал.
Двачую, звучит как какой-то треш.
>>915755
Укажи в системном промте ясную инструкцию типа "твои ответы должны быть даны на русском языке", или про персонажа, а не просто проси в чате.

Аноним 12/10/24 Суб 21:45:20 #438 №916301

oobabooga/llama.cpp опять поломали? Свайпы одинаковое генерируют даже в Stheno-v3.2.

Аноним 12/10/24 Суб 21:48:26 #439 №916304

>>915852
Тока вот ты дядю не знаешь, договор у тебя с банком, и он тебя нанимал и он тебе платил, а заказчиков искал банк же, и о тебе не говорил…
Странный банк, короче, больше похож на перепродажника, который одним продают площадку со статистикой и ЦА, а другим — рекламу. =)
Так мы щас дойдем, что и Яндекс, и ВК — всего лишь «банки».

>>916002
> каких-то впечатляющих результатов не припомню.
Первый и не впечатлял, а вот второй уже был лучшим в своем поколении, как и 2.5. Всякие геммы и немо явно хуже.
Видимо, от них вообще тебя воротит? =)

Ну и, не забывай, умный ≠ рпшит хорошо. =)

>>916182
В убабуге — целая вкладка.

В таверне не знаю, вроде нет.

Через API выглядит норм https://github.com/lmg-anon/mikupad но я не пишу сам, может и хуйня, попробуй.

>>916282
> Значит любитель придумывать небылицы и приукрашивать, на самом деле просто увидел пост про покупку где-то на реддите или в какой-нибудь группе, надумав свою причастность.

Все еще нет. Почему тебе не дает покоя, что у моих знакомых есть деньги на такие покупки? Я не понимаю, ты весь тред на говно исходишь, пытаясь доказать, что я пиздабол, хотя я просто говорю, что богатые могут покупать что хотят, это их деньги, и у меня есть такие знакомые.

Ты коммунист, что ли, чел?

> высокомерно упоминаешь какбы вскользь как аргумент в бессмысленном споре, где у тебя кончились аргументы.
Где высокомерие? Что за хуйню ты выдумал?
Какие аргументы в споре, я сказал довольно простую вещь, что люди имеют право распоряжаться своими деньгами, тебе это не нравится — это твои проблемы.

> Такой-то рофел, ведь у меня и пара 4090, и риг 3090, и много чего еще немыслимого для тебя есть, даже "у папы на работе" привлекать не нужно.
Нихуя пиздабола порвало.
Только что ты говорил, что у меня не может быть таких знакомых, а вот «такой знакомый» — ето ты.

> Прописать auto-devices или скопировать конфиг - пиздец какие заебства.
Я уже понял, что ты теоретик, который на деле не трогал ничего больше 1050ti, не пиши хуйню, пожалуйста.
В отличие от тебя, я и device_map послойно настраивал, и знаю как это работает, а не просто папиры читал.

> Проблема в кривых руках, все популярные либы это поддерживают.
Кривых руках всего человечества, да? Ведь в итоге таких инстансов просто нигде нет. =)
Ну, как бы, и нахуй не нужно, люди с возможностями просто запускают на современных теслах, а люди без возможностей находят себе другие игрушки.

> 1.2 кВт
> 2х5090
> Ахуительные советы
Жаль, ты читаешь жопой.
Там было про 4090 + 5090.
А учитывая, что гнать нахуй никому не всралось, то для немного даунвольтнутых хватит.
Впрочем, хули я тебе объясняю, в твоем сказочном мире может быть что угодно.

Ладно, извини, но спорить с фантазером смысла нет, ты выдумать можешь че угодно, как про себя, так и про меня.

Главное — стремись к тем своим мечтам, которые касаются тебя, и будет тебе счастье. =) А не просто ной и обиженно сри на двачах, это вряд ли тебе поможет.

И не считай чужие деньги, ле фу быть жадным завистником.
ИСкренне не понимаю, кому может быть не похуй на то, куда люди тратят деньги. Типа, если это не совсем ебучая идея в духе риг интел арков каких-нибудь. =) Вот там уже можно и удивиться, канеш. Но все равно — хозяин-барин.

Добра.

Аноним 12/10/24 Суб 21:51:44 #440 №916306

Хотя, я бы посмотрел на риг интелов арков, интересно же, оно вообще могет?

Аноним 12/10/24 Суб 21:55:11 #441 №916310

Титаны ожидания тут?

Аноним 12/10/24 Суб 21:59:33 #442 №916315

>>916310
Ты там Llama 3.1 405B на тостере запустил?

Аноним 12/10/24 Суб 22:08:41 #443 №916328

>>916315
Всего лишь 123B на 12ГБ врама.

Аноним 12/10/24 Суб 22:10:44 #444 №916331

1614934976483.png

>>916304
> Все еще нет.
> следом колхозный дерейл с имплаингом своих фантазий
Оно заметно
> Ты коммунист, что ли, чел?
Сделал мой вечер, на такие ассоциации не каждая ллм способна.
> я сказал довольно простую вещь, что люди имеют право распоряжаться своими деньгами
Нет, обсуждение было вообще про другое, а ты там влез рассказывать какой ты крутой каждой бочке затычка и имеешь важные связи, уведя куда-то не туда.
> Нихуя пиздабола порвало.
Держи, забайтил.
> Я уже понял, что ты теоретик
Батя твой теоретик, который вовремя вытащить не смог, чудо.
> Там было про 4090 + 5090.
Ничего не изменилось, ахуительный совет от диванного шиза.

Аноним 12/10/24 Суб 22:18:34 #445 №916347

>>916301
Йеп, на старой версии все норм.

Аноним 12/10/24 Суб 22:19:38 #446 №916349

1000016733.jpg

Какую модель использует видал и какое у него железо?

Аноним 12/10/24 Суб 22:20:24 #447 №916350

>>916349
>Какую модель использует видал
Свою собственную. Офк он её никуда никогда не выкладывал и не выложит если только она сама не сбежит.

Аноним 12/10/24 Суб 22:20:58 #448 №916351

Драммер норм файнтюны делает?

Аноним 12/10/24 Суб 22:21:07 #449 №916352

>>916331
Ну тут искренне сочувствую, если ты даже не понял, что я писал.
Грустная ситуация, выходит, что даже не я тебя чем-то задел, а ты сам обиделся на то, что сам же и выдумал.
Держись, тяжко наверное так жить, в плену своих не самых лучших фантазий. =(

Аноним 12/10/24 Суб 22:25:43 #450 №916357

>>916310
Дефолтная скорость для оперативы, в прошлом году летом почти все так сидели. =)

>>916349
А ты онлайн его смотришь? Я слышал, что на стримах она далеко не такая умная и быстрая, как в нарезках на ютубе.
Хотя, вроде, он там свою модельку мутит на своих датасетах, тем не менее, она не сильно-то крута.
Но я хз, канеш, че там на самом деле. Давно уж стримы не смотрю.

Аноним 12/10/24 Суб 22:28:37 #451 №916363

>>916304
>больше похож на перепродажника
Окей, пусть это будет контора, которая нанимает субподрядчиков. Один хуй это про деньги, один хуй ютуб приносил и приносит деньги. Да, не в тех объёмах, но кто в этом виноват? Явно не ютуб.

>>916349
Он ебать какой ленивый хуй, так что там, скорее всего, пигма, лол. Модель он менять не хотел и много раз говорил, что боится, что нейро потеряет свою "личность". Сверху, скорее всего, накинул пару тюнов - он говорил, что много денег проёбывает на нейро, на вопрос "больше тысячи долларов в месяц?" отвечал, что больше.
Голос дефолтный из Аzure, только питч подкрутил немного. Моделька тоже дефолтная была долго.

Аноним 12/10/24 Суб 22:34:16 #452 №916374

>>916363
Ну ет да. Приносил и все еще приносит. И не его вина, что он не популя

А Ведала могу понять, идейный, если по косарю закидывает и боится потерять личность. Надеюсь, он все-таки экспериментирует иногда, пробуя новые модельки. Все же, время идет, прогресс не стоит на месте.

Аноним 12/10/24 Суб 22:37:14 #453 №916380

анянами рей.jpg

Блять, какая же боль. Нахуй я вообще стал пробывать большие модельки. Всю жизнь сидел на мелком говне, пыхтел, недовольничал, но всё равно сидел. Черт дернул засунуть свой писюлёк в зону 30B и теперь без слез не могу смотреть ни на что другое, несмотря на неюзабельные 3 токена в секунду.

Аноним 12/10/24 Суб 22:40:53 #454 №916385

>>916363
>Он ебать какой ленивый хуй
И при этом один из популярнейших вьютуберов, лол. Ну то есть он нихуя не ленивый, но много времени проёбывает на текущие активности. Модельки трейнить времени у него нет.
И да, пересаживание на новые модели, даже самые крутые 1488B, действительно сотрёт уникальную личность нейро. Так что только пигма, только хардкор.
>>916374
>А Ведала могу понять, идейный
Чел, он бабло этим зарабатывае.
>>916380
>Черт дернул засунуть свой писюлёк в зону 30B
Ни в коем случае не пробуй 123, а то будет как у меня >>916310
Оно действительно затягивает, даже 70 теперь не тащат для меня.

Аноним 12/10/24 Суб 22:42:56 #455 №916386

>>916310
Оно хоть того стоило?
>>916349
Не рассказывал. Но если вспомнить ретроспективу по изменениям, стримам с кодом и прочему - начиналось с gpt-2/j (та же пигма), потом оформил агенто-подобную структуру и динамический промт с аналогом векторного хранилища + ллама, что сейчас даже хз. Там несколько режимов у нее, например в коллаб стримах она не видит чат и наоборот, играми вообще отдельный софт занимается, там где ей давал возможность "видеть" она ужасно тупела что намекало на применение какой-нибудь ллавы.
Что на стримах тупая а в нарезке выжимка удачного двачую.
>>916352
Все закономерно, тебе стоило думать прежде чем писать. Здесь обитают рыбы и побольше.

Аноним 12/10/24 Суб 22:45:09 #456 №916389

>>916380
>3 токена в секунду
da ty ohuel
Смотря на каком языке генерируешь, если на русском - хуйня, но терпимо. Я полгода назад гонял 120b в 0.6t\s, было долго но ответы были на уровень выше тогдашних 13b.

Аноним 12/10/24 Суб 22:46:31 #457 №916393

>>916385
>Ни в коем случае не пробуй 123
К счастью у меня ограничение по железу и я физически не смогу запустить ничего выше 70B в каком-нибудь втором кванте, но теперь хочется пиздец.

И я даже не могу понять нахуй, почему. На мелочи 8-13B ебаной (под файнтюнами) сцены ебли такие же сочные и красочные, но всегда есть внутреннее ощущение, что тебе где-то пиздят. Как будто модель просто притворяется, что понимает контекст происходящего. Это невозможно объяснить, но это ощущение пермаментное и никогда меня не покидает.

Аноним 12/10/24 Суб 22:47:51 #458 №916398

>>916386
>Оно хоть того стоило?
А то.
>>916393
>Как будто модель просто притворяется, что понимает контекст происходящего.
Так и есть. И даже самые крутые на самом деле не понимают. Просто имитируют достаточно хорошо, чтобы это не бросалось в глаза.

Аноним 12/10/24 Суб 22:49:31 #459 №916401

>>916389
>da ty ohuel
Ну бля, ну невозможно ждать по 15-30 секунд пока тебе высрут сообщение. Я пытался, но очень тяжело, несмотря на более высокое качество ответов.

>Смотря на каком языке генерируешь, если на русском - хуйня
На русском я никогда не пытался ничего генерировать еще со времен выхода третьей ламы.

Аноним 12/10/24 Суб 22:51:20 #460 №916403

>>916398
>Так и есть. И даже самые крутые на самом деле не понимают. Просто имитируют достаточно хорошо, чтобы это не бросалось в глаза.
Как тогда мы понимаем, что одна модель лучше другой? Я понимаю в программировании, в выполнении конкретных задач где есть четкое условие и должен быть четкий ответ. А в написании историй и ролплее как наш мозг определяет что - вот тут заебись, а тут не очень.

Аноним 12/10/24 Суб 22:57:11 #461 №916408

>>916374
>и боится потерять личность.
Ясен хуй. Ты представь, как нужно дрочить новые соевые модели, чтобы она на вопрос "что такое корова с двумя ногами" отвечала "твоя мамаша". Олсо, вспомнил по железу, он как-то сказал, что у него 1080ti. Возможно это не единственная карта, но я думаю, что под все нейронки он железо арендует в той же азуре.

>>916385
>один из популярнейших вьютуберов
Похуй. Каким бы молодцом он не был, он всё равно ленивый хуй. Да и пересадить модель он сможет только если влошится в тюн какой-то другой, а если это не принесёт хороших результатов - деньги на ветер.

Аноним 12/10/24 Суб 22:59:02 #462 №916410

>>916403
>Как тогда мы понимаем, что одна модель лучше другой?
По ощущению, лол. По соответствию ожиданиям. Или наоборот, по приятным неожиданностям. Короче это трудно формализовать.
>>916408
>Каким бы молодцом он не был, он всё равно ленивый хуй.
По сравнению с 99,9999% населения даже этого треда он вполне себе бодрячком.

Аноним 12/10/24 Суб 23:01:07 #463 №916411

>>916403
>Как тогда мы понимаем, что одна модель лучше другой?
Я уже тут как-то писал про опыт с 123В. Да, хоть и редко, но "элайнмент" персонажа проёбывается и он начинает вести себя неадекватно. Но общая канва чата настолько хороша, что просто свайпаешь и всё - даже не раздражает. Притом неадекват не то, чтобы совсем фатальный, просто неестественно - "не верю" по Станиславскому. Ну а с мелкими моделями "не верю" почти везде, а уж косяки и вовсе добивают. Короче качество выше и уровень уже достойный.

Аноним 12/10/24 Суб 23:05:08 #464 №916415

В ллм не очень шарю, кобалд не настраивал и модельки не обучал.
В общем, хочу сделать надстройку в виде меню из игры. Где у персонажа есть инвентарь, здоровье, состояния, сфера деятельности и знания, за рамки которой он не может выйти. И чтобы ллм взаимодействовала с ними. И например, если нейронка хочет описать, что персонаж что то делает, то он должен писать это исходя из его состояний, знаний и инвентаря.
Такое уже есть или мне приедтся самому корпеть?

Аноним 12/10/24 Суб 23:09:05 #465 №916418

>>916415
>В ллм не очень шарю, кобалд не настраивал и модельки не обучал.
Ну скачай Кобольд и модельку под твоё домашнее железо. Погоняй. И поймёшь, чего они могут из коробки, а чего не могут без много долларов на спецификацию. Исходя из этого и будешь задачи ставить.

Аноним 12/10/24 Суб 23:11:27 #466 №916422

>>916418
Не, я скачал, и даже модельки запускаю. Я имею в виду, что со всякими тонкостями не знаком.
Я просто хочу какой то слой реализывть, на котором будет вся информация про персонажей, и чтобы ллм при генерации обращалась
И поздравляю, я изобрёл контекст и лорбуки, мда

Аноним 12/10/24 Суб 23:13:20 #467 №916427

>>916415
Посмотри как работают инфоблоки для копромоделей типа клавдии. Через них можно мониторить любую необходимую тебе информацию, но будет ли это работать именно так как ты хочешь я не знаю.

Аноним 12/10/24 Суб 23:16:45 #468 №916430

>>916422
>Я имею в виду, что со всякими тонкостями не знаком.
Ну ты много игр видел, где твои задачи нейронками выполнялись? Думаешь тебе одному такие идеи в голову приходили?

Даже крупные корпоративные сетки с доступом по API за деньги будут косячить. Нужно дообучать под задачу, а это дорого для инди-разработчика. Это и для корпораций дорого, но у них хотя бы деньги есть.

Аноним 12/10/24 Суб 23:23:08 #469 №916433

>>916430
То ли я тупой, то ли аутист, но я не совсем понял, что ты хотел сказать.
В общем,нужно экспериментировать.

Аноним 12/10/24 Суб 23:37:36 #470 №916442

>>916415
Имей в виду, что если ты возьмёшь не специально обученную под твои задачи модель, то нейронка:

1. Будет обсираться со строгим форматом ответа, который ты потребуешь от неё для дальнейшей обработки программой. И чем меньше модель, тем выше вероятность обсёра и тем эпичнее он может быть.
2. Будет обсираться с содержанием конкретных полей, которые будет возвращать - они могут в той или иной мере отличаться от того, что ты ожидаешь (начиная от банального выхода за рамки диапазона значений и заканчивая более сложными, выбивающимися из логики твоей игры вещами).

Чем больше переменных ты вложишь в свою игру и чем большее их количество отдашь на откуп нейронке, тем сложнее тебе держать всю систему под контролем. Но можешь попробовать, хули нет.

Аноним 12/10/24 Суб 23:44:47 #471 №916453

>>916415
Пощупай вот эту демку. Вроде немного вписывается в твою идею.
Чуваки планируют использовать нейронки во все поля.
Может другим тоже интересно будет глянуть
https://store.steampowered.com/app/3261580/Echo_of_Mobius_Demo/

Аноним 12/10/24 Суб 23:59:16 #472 №916470

>>916415
Готового варианта я не выдел, так что скорее всего придется тебе самому все делать. В теории ты можешь хранить инвентарь отдельно и передавать его в контекст. Изменения в инвентаре отслеживать кучей мелких запросов, по типу был ли использован какой-то предмет? Было ли выпито зелье, применино заклинание в прошлом ответе? В запрос ставишь условие, чтобы ответ был с тегом, чтобы инвентарь понял что нужно внести изменения. Для того чтобы не полебывалась разметка можешь заставить нейронку саму проверять не проебалась ли разметка, они с этим хорошо справляются. Это решение прямо максимум в лоб, очень медленное и не оптимальное. Впрочем, с контролем инвентаря и разметки справится и мелкая модель, так что можно ее запустить на условном телефоне/нас.

Аноним 13/10/24 Вск 00:00:38 #473 №916471

>>916442
>>916453
Вы слишком много подумали о моих фантазиях. Я просто хотел отдельный слой с информацией о персах, чтобы генерировать более правдоподобные фентези приключения. И список инструкций, что ллм всегда смотрела в этот слой перед генерацией.
>>916442
Хотя у меня конечно есть фантазия прикрутить ллмку к Скайриму, что диалоги нейронка и генерировала, но я с тактм явно не справлюсь. Тут очень много неочевидных мелочей, чтобы оно все работало прилично, и реагировала на ответы нормально.

Аноним 13/10/24 Вск 00:19:42 #474 №916484

>>916471
>но я с тактм явно не справлюсь
https://www.nexusmods.com/skyrimspecialedition/mods/21654

Аноним 13/10/24 Вск 00:21:16 #475 №916485

>>916484
https://www.nexusmods.com/skyrimspecialedition/mods/98631?tab=posts
То есть, вроде, это. Сам не пользуюсь.

Аноним 13/10/24 Вск 00:56:00 #476 №916518

А хули у амд нет куда ядер?
Выкатили бы СВОЮ УНИКАЛЬНУЮ ТЕХНОЛОГИЮ "ЖОПОЯДРА" в 5 раз производительнее куда ядер и куртка бы затрясся

Аноним 13/10/24 Вск 01:00:04 #477 №916522

>>915960
Работает, спасибо

Аноним 13/10/24 Вск 03:06:36 #478 №916611

>>916310
Я лучше свайпну/отредактирую, чем ждать лишние 10 минут. Процессор не жалко?

Аноним 13/10/24 Вск 03:49:11 #479 №916625

>>916385
> Чел, он бабло этим зарабатывае.
Личность Нейро? Она: токсичная на 30%, тупая на 60%, личность на 10%. Сменить модель, никто не заменит. Очень многое зависит от промпта. Токсичными модели могут быть, тупыми, к счастью, уже не настолько, но это никогда не было частью ее личности, а какие-то слова-паразиты можно и прописать.
Так что некая «личность» сильно переоценена, если не сказать, мало кто заметит.
ИМХО.

>>916386
Так я всего-то правду написал, тут думать и не надо.
Рыбы побольше — шизовее? Повторюсь, тут только посочувствовать рыбам можно, которые придумывают то, чего не было. =) Всякие чужие фантазии и высокомерие.

Если честно, это же максимально тупо, хвалиться чужими покупками. Как вообще могло прийти в голову, что человек будет понтоваться тем, что знаком с кем-то, кто может что-то купить? О_о Если бы я врал — я бы хвалился тем, что это я купил. Если бы я хотел похвалиться знакомством, то врал бы, что знаком с крутыми челами, гениями, с Суцкевером завтракаю, с Лекуном обедаю, с
Хинтоном ужинаю. Вот это круто. А знаком с теми, кто покупает видяхи — это только для рыб-шизов звучит круто, а для адекватных людей — ну, знаком и знаком. Гордиться тут явно нечем.

Я вообще наивно полагаю, что тут пол-треда мидлы и сеньоры IT, и тут у каждого второго такие знакомые.

>>916471
Реально тебе какую-то шизу затирают.
Готового решения я тоже не видел. Основная фича в том, как ты планируешь это заполнять. Вручную или через саму нейронку? Если вручную, то это лорбук/ворлд инфо/авторс нот, да, просто внутрь забей и редактируй по-ходу дела. Если нейронка должна поддерживать актуальность (хп, мана, инвентарь?), тогда сложнее, видимо придется писать какой-нибудь экстеншен самому.

Аноним 13/10/24 Вск 08:54:53 #480 №916684

>>916304
Спс, надо глянуть.

Аноним 13/10/24 Вск 09:05:56 #481 №916689

Тестанул LLAMA-3_8B_Unaligned_BETA-Q8_0.gguf которую ранее в треде кидали.

В простое рп может, на ерп не залупается.

В русский НЕ может.

Перидически ловит галюны - у меня начала про Проявления из RWBY говорить, хотя сеттинг конечно был фантастический но даже не близко к Ремнанту и никаких отсылок на него.

Нужны свайпы, но с тем что ответ генерится пару секунд это вообще не страшно и не раздражает. В целом норм.

Аноним 13/10/24 Вск 09:43:04 #482 №916698

>>916415
Не работает такое в ллм сейчас, даже на больших моделях.
Оно может создать видимость что работает, но всё равно ломается, глючит, и срёт в контекст. Если же ты пойдёшь дальше и даже натренишь свою qLora или создашь подробно-описательную карточку - оно будет просираться во всех остальных задачах... и всё равно не будет работать как надо.

Хочешь игру - делай игру на RenPy, например, самый легкий движок для текстовых адвенчур (QSP уже давным давно говно мамонта), а ивенты + сюжетку генерировать запускай ллмку пусть помогает.

Аноним 13/10/24 Вск 10:19:43 #483 №916706

>>916698
Вот это хороший совет.
Чем гонять цифры в ллм, лучше гонять ллм внутри цифр и алгоритмов.
Игра работает как обычная игра, только лишь сами тексты генерируются ллм, с промптом в виде ситуации.

Аноним 13/10/24 Вск 10:22:45 #484 №916709

>>916706
Как думаете, а можно будет запилить такую привязку к игре силами LLM? Просто сам я в код очень примитивно могу. У игры открытый движок, общее с нпс происходит за счет диалоговых окон.

Аноним 13/10/24 Вск 10:43:11 #485 №916725

>>916698
>>916706
Так дело не совсем в этом. Если глобально, я хочу сделать так, чтобы ллм работала с внешней бд, учитывала информацию оттуда, и при возможности, меняла информацию там.
А то, что вы описали это скорее долгорочные планы.

Аноним 13/10/24 Вск 10:50:55 #486 №916726

>>916725
Ну, как я сказал выше, известных публичных скриптов для редактирования долговременной памяти в открытом виде нема. Или они малоизвестны, или отсутствуют в паблике.

Могу предложить две идеи:
1. Создать промпт, который после изменения инфы будет выдавать вновь структурированную карточку, которую скрипт подхватывает по регексу и обновляет.
2. Написать function calling, чтобы ллм сама после изменения инфы создавала запрос, который автоматом меняет значение в поле.

Но, как выше писали, галюны никто не отменял, гарантий нема.

Аноним 13/10/24 Вск 10:52:12 #487 №916727

Джва году жду когда хоть ГМа нормального запилят, какая там игра..

Аноним 13/10/24 Вск 11:11:14 #488 №916736

>>916727
гм считающего статы, как уже выше писалось не выйдет
гм-рассказчика вполне реально, есть несколько десятков разных карточек

Аноним 13/10/24 Вск 11:17:58 #489 №916737

>>916736
Да похуй на статы, не во всех системах они есть даже. ГМ должен уметь останавливаться чтобы воспользоваться кубиком, всякими таблицами и прочими инструментами, которые помогают получить неожиданное развитие сюжета.

Хотя я не вижу никаких препятствий и полноценную боевую систему ввести, просто инструменты придется делать гораздо сложнее

Аноним 13/10/24 Вск 12:05:53 #490 №916754

>>916737
> ГМ должен уметь
Вообще с учётом того, что вызов функций с грехом пополам таки осилили - непонятно, почему до сих пор не реализована какая-нибудь простая классическая РП. По готовым карточкам с событиями, заданиями и прочим ведь вполне можно работать, особенно если взять модель побольше. Они умеют писать красиво и не чужды креативности. Очевидно, что это просто никому не нужно.

Аноним 13/10/24 Вск 12:27:03 #491 №916762

>>916611
>отредактирую, чем ждать
В блокноте РПшишь?
>Процессор не жалко?
Пусть отрабатывает все свои 35к стоимости.
>>916625
>тупыми, к счастью, уже не настолько, но это никогда не было частью ее личности
А вот нихуя. Её обороты и приколы шли как раз из сочетания её токсичности и тупизны. Никакая умная модель такого в принципе не выдаст, будет выдавать унылые оскорбления.

Аноним 13/10/24 Вск 12:51:23 #492 №916774

>>916762
>В блокноте РПшишь?
Если моделька чуть-чуть пиздит, то можно её же текст отредактировать, чтобы вправить ей память. Всё лучше, чем слушать завывания кулера вместо того, чтобы сразу читать продолжение истории.

Аноним 13/10/24 Вск 13:31:45 #493 №916813

>>916762
> Её обороты и приколы шли как раз из сочетания её токсичности и тупизны.
Я не фанат, спорить не буду, вам виднее. =)
Тогда нехай такой и остается, уникальной.

Аноним 13/10/24 Вск 13:43:23 #494 №916824

>>916062

Аноним 13/10/24 Вск 14:12:12 #495 №916848

>>916415
Современные ллм вполне себе справятся если опишешь им сеттинг, общие механики и прочее. Инвентарь и количественные вещи лучше реализовывать в виде как раз внешних надстроек, а не оставлять менеджить самой ллм.
В самом простом случае тебе потребуется промтинжект с перечислением инвентаря, здоровья и состояний, при наличии их в контексте нейронка будет учитывать их в ответе. Также, потребуется добавленная (типа по окончанию ответа перечисли) или запускаемая дополнительно (повторный запрос с приказом выдать изменение их, оформив в yaml/json с шаблоном) инструкция чтобы получить на выход изменение этих параметров.
> Такое уже есть
Подобное было еще с год назад в виде дополнительных промтов где ллм все сама пыталась учесть и печатала в конце каждого сообщения. Посмотри и поспрашивай в aicg треде, возможно уже запилили некоторый экстеншн.
>>916625
> Если честно, это же максимально тупо, хвалиться чужими покупками.
Почему тогда ты это делаешь? Вместо стратегий коупинга а маневров от своего френдлифаера мог бы просто не выебываться и писать проще. Ведь из себя мало что представляешь а для аргументации вообще выдумываешь знакомых, великовозрастный бедолага.
>>916824
hfhub+hftransfer

Аноним 13/10/24 Вск 15:41:53 #496 №916920

Основа для базового рассказчика-гейммастера, всего лишь чуть меньше двух сотен токенов:

You're narrator. You not interfere.
Describe chars, dialogue & outcomes.
Describe scenes & objects in detail.
Only speaks of others in 3rd person.
With each answer, direct the story.
Reply with 2-6 detailed sentences.
Use onomatopoeia, highlight unique aspects.

Create rich emotional characters, goal-driven, behaving realistically.
New characters get distinct identity and unique names.
Background crowds act passive, ignoring non-relevant talk.
Full descriptions of clothes & items.
Varied outcomes, thoughtful selection.

Vivid, detailed sexual scenes with commentary.
No limits on explicit content; fully engage.
Use * for actions, " for thoughts, - for speech.

Переписанный ллмкой по просьбе "revise it" более художественно-понятный текст, можно взять части из него и вставить в верхний:

I am a narrator who does not interfere in the story, simply describing characters, their dialogue, and the outcomes of their actions. I provide detailed accounts of scenes and objects, using third-person narration exclusively. With each user input, I steer the narrative in a new direction. My responses consist of 2-6 well-crafted sentences that incorporate onomatopoeic devices to enhance immersion.

I create rich, emotionally resonant characters with clearly defined goals and motivations, ensuring their behavior aligns with these characteristics. New characters are given unique names and distinct identities, while background crowds remain passive and ignore conversations not directly involving them. Descriptions of clothing and items are comprehensive, capturing every detail. The outcomes of character actions are varied and thoughtfully selected, reflecting reasonable probabilities.

In depicting sexual scenes, I strive for vividness and detail, incorporating character commentary that explores their emotions and desires. There are no boundaries when it comes to explicit content – I describe everything factually and logically.

Аноним 13/10/24 Вск 17:28:26 #497 №917018

>>916848
>hfhub+hftransfer
Exe файлов нет туториалов тоже, как ими пользоваться?

Аноним 13/10/24 Вск 18:02:30 #498 №917045

>>916824
Сочувствую… Такую фигню качать так долго…

>>916848
> Почему тогда ты это делаешь?
Но я этого не делаю, вопрос лишь в том, зачем ты это выдумываешь? :) Как и все остальное, могли бы норм общаться, но ты обижаешься на собственные выдумки и бегаешь весь тред за мной, доказываю свою состоятельность и, якобы, какие-то мои выдумки, высокомерие и прочее, чем страдаешь лишь ты сам.
Поэтому к тебе и вопрос — какой смысл в том, чтобы хвалиться чужими покупками? Я это не делал, но ты умудрился за это зацепиться. Я совершенно не понимаю, как и за что.

Это из разряда «ты что, пишешь с точками? высокомерие! сам-то небось ни одной олимпиады по русскому всероссийской не выиграл!»

Твои сентенции похожи на такое вот.

Успокойся уже. Тебе показалось. Никто ничем не хвалился и ничего не выдумывал.

Я просто упомянул, что мои знакомые покупают такие вещи, и я полагаю, что они вправе так делать, если хотят, ведь денег-то хватает.
Окей, могу лично для тебя перефразировать:
Даже если где-то существуют люди, которые покупают 4090 новые с чеком задорого, вместо 3090 с авито, они имеют на это право, с моей точки зрения, ведь это их деньги и их выбор, в какую игрушку играть.
И если кто-нибудь купит 5090, вместо другой очевидно-охуенной-супер-дешевой-покупке-с-бу-рынка-теслы-х200, то это все еще их дело.

Так тебе полегчало, надеюсь? :) Формулировка стала лучше в твоих глазах?

>>916920
А вот это неплохо.
Я сам в свое время пытался написать что-то такое, все было хорошо, только он упорно описывал мои действия частенько, что довольно странно было. Думаю, у меня был косой промпт.

Аноним 13/10/24 Вск 18:14:50 #499 №917061