Так как тут сидят киборги 500к-1м+ супернаносеки, пожалуй задам вопрос. СРОЧНО ПРИЗЫВАЮТСЯ В ТРЕД M

Аноним 06/10/25 Пнд 17:28:49 #1 №325244431

i.webp

Cursos-gratis-SAP-logali.jpg

2.webp

scale12001.jpg

Так как тут сидят киборги 500к-1м+ супернаносеки, пожалуй задам вопрос.

СРОЧНО ПРИЗЫВАЮТСЯ В ТРЕД ML, DS И ПРОЧИЕ ИИ АНАЛЬНИКИ

Что дешевле для первых месяцев RAG с сотнями пользователей?
Serverless или сервер? Учитывая что LLM будет внешним как API?

Компоненты:
- Векторная БД (Сhroma или Pgvector для сервера так как векторов меньше 2000)
- Эмбединг модель (планирую брать те, что жрут не больше 2-2.5GB, но возьму скорее gemma embedding, что укладывается в 600мб)
- Serverless compute (если бессерверный вариант чтобы дергать RAG логику) типа Vercel Functions/Netlify functions

И еще тупой вопрос вдогонку - для эмбединг модели если она на сервере - нужна видяха или хватит CPU? Хочется экономить.

Аноним 06/10/25 Пнд 17:31:13 #2 №325244503

>>325244431 (OP)
Зависит от облака, но во многих serverless это под по цене виртуалки, нахуй оно надо, когда можно на говне и палках куб поднять и крутить там? Хочешь дам тебе ansible репу, которая поднимет тебе куб на раз-два?

Аноним 06/10/25 Пнд 17:31:21 #3 №325244507

бамп

Аноним 06/10/25 Пнд 17:32:46 #4 №325244547

>>325244431 (OP)
>дешевле
>с сотнями пользователей
Чел, на таких нагрузках ничто не должно быть дорого.

мимо airbnb анон

Аноним OP 06/10/25 Пнд 17:34:35 #5 №325244605

>>325244503
> куб
> на микроговне

Бля аноныч ну ты чево, я даже докер не планироваю первые полгода.

Аноним OP 06/10/25 Пнд 17:36:41 #6 №325244665

>>325244547
>мимо airbnb анон
Ты сравниваешь обычные скрипты с содержанием на сервере пусть и легкой, но нейросети?

Аноним 06/10/25 Пнд 17:38:00 #7 №325244697

>>325244605
Вопрос в том, что тебе всё равно придётся это осваивать, если это коммерческий сервис, иначе ты просто вгонишься в ловушку техдолга. Пиши сразу cloud native, с шедулером там и всей хуйнёй, а не чтоб твои даги висели и жрали деньги за простой. А там можно вкатиться в пущее бомжатство с спотовыми нодами и всяким таким.

Аноним 06/10/25 Пнд 17:38:52 #8 №325244722

>>325244665
>с содержанием на сервере пусть и легкой, но нейросети?
Не сразу понял, о чём ты. А не проще у себя локально сторить?

Аноним 06/10/25 Пнд 17:41:18 #9 №325244792

Я бы взял облако и не ебал мозги, селф мб и выйдет дешевле вот вообще не факт. Но поддержка и прочие скачки нагрузки - надо оно тебе.

Аноним OP 06/10/25 Пнд 17:41:57 #10 №325244817

>>325244697
>даги висели и жрали деньги за простой
Пояснительную бригаду.

>Хочешь дам тебе ansible репу, которая поднимет тебе куб на раз-два?
Ето.

Аноним 06/10/25 Пнд 17:53:13 #11 №325245192

image.png

>>325244817
У тебя пустой под будет висеть и нихуя не делать. Зачем он нужен, ресурсы кушать? Можно напердолить шедулер, который будет запрашивать под, выполняющий dag, а потом всё подчищать. Посмотри как airflow делает короче.

А вот твоя репа: https://hub.2853.org/s/SdLxNpHgdnXx4it
Мопед не мой, я просто обернул его в .gitlab-ci

Тебе потребуется свежий гитлаб (бери публичный, похуй) и образ с ansible (можешь взять официальный или через pip собрать сам, тоже похуй)

Аноним 06/10/25 Пнд 18:18:26 #12 №325245988

>>325244792
У анона может MVP даже не готов, может быть, а ты ему облако сразу. Пусть на своей хуйне покрутит, но хотя бы сразу в кубе, чтоб потом перенести быстренько и всё.

Аноним OP 06/10/25 Пнд 18:19:01 #13 №325246006

>>325245192
Спасибо.

Аноним 06/10/25 Пнд 18:28:48 #14 №325246315

>>325245988
Да я как раз из этих же соображений. На его месте собрал бы на langchain чего по быстрому, да выбрал провайдера аишки подешевле, векторную бд бы пришлось самому развернуть, но это готовый докер образ с эластиком или ещё чем. Ушло бы < 1 дня работы, с учётом, что питон вообще не мой язык. Есть ли смысл платить только за эмбендинги - хороший вопрос, но с самой llm я бы вообще не думал.
Леха, ты на ОПе?

Аноним OP 06/10/25 Пнд 18:30:33 #15 №325246369

>>325246315
> Леха, ты на ОПе?
Нет.

Аноним 06/10/25 Пнд 18:31:22 #16 №325246391

>>325246369
И слава богу

Аноним 06/10/25 Пнд 18:33:12 #17 №325246449

image.png

>>325246315
Я просто смотрю, и как будто облако дороже, чем взять даже один дэдик и хотя бы на нём, первое время. Но дело хозяйское, как говорится.

Аноним 06/10/25 Пнд 18:42:45 #18 №325246775

>>325244503
Мне дай.
Мне не столько репу поднять, сколько разобраться чего там и как

Аноним 06/10/25 Пнд 18:44:10 #19 №325246827

>>325246775
Возьми docker desktop, там kind приделали и можно мультинодовый куб запилить у себя локально, на поиграться хватит. Репа ссылкой выше.

Аноним 06/10/25 Пнд 18:44:11 #20 №325246828

>>325246449
Вот именно что, а я бы взял минимальную вдс (2 яда 4 гига или типо того). А бабки да спустил на токены, чтоб вообще самому ничего ресурснозатратного не делать. У нас векторная база и запросы, все.

Аноним 06/10/25 Пнд 18:45:32 #21 №325246889

>>325246827
сяп

Аноним OP 06/10/25 Пнд 19:00:13 #22 №325247401

scale1200.jpeg

>>325246449
>>325246828
https://www.hetzner.com/cloud я тута скорее всего буду брати.

Аноним 06/10/25 Пнд 19:01:09 #23 №325247425

>>325247401
хорошее решение

Аноним 06/10/25 Пнд 19:01:36 #24 №325247443

А что за продукт? В какой стране регистрировать будете? ИНвесторы есть?

Аноним 06/10/25 Пнд 19:01:57 #25 №325247463

Я бы почитал вашу презентацию для инвесторов.

Аноним 06/10/25 Пнд 19:02:49 #26 №325247491

>>325247401
Ничего не могу сказать. Вряд ли это будет сильно лучше mail.sru-шного openstack или хуяндекса, так что если ты из СНГ, есть ли смысл переплачивать за забугор?

Аноним 06/10/25 Пнд 19:04:14 #27 №325247537

>>325247443
>>325247463
Нахуй кому твои гроши? Двач -- борда наносеков. Да и пенсия по шизе не прям, знаешь, деньги.

Аноним 06/10/25 Пнд 19:04:24 #28 №325247544

image.png

анончик возьми мои бабки, вы станете успешными а меня сделаете миллионером

Аноним OP 06/10/25 Пнд 19:04:55 #29 №325247561

>>325247491
>смысл переплачивать за забугор
Где переплата? Покажи российские дешевле? Также мой рынок это забугор, а не СНГ. Хотя конечно дешевые серваки в Гермашке, вот с США было бы лучше.

Тем более последние новости что дохуя ботнет трафика идет от российских хостинг провов.

Аноним 06/10/25 Пнд 19:05:27 #30 №325247572

>>325247561
>Также мой рынок это забугор, а не СНГ
а как ты типа деньги туда переводишь?

Аноним OP 06/10/25 Пнд 19:06:00 #31 №325247598

i.webp

>>325247544
Продолжай.

Ты модератор?

Аноним OP 06/10/25 Пнд 19:07:10 #32 №325247646

>>325247572
Так мульон способов оплат. Начиная с предоплаченных карточек, заканчивая оформлением банковского акка в Казахиях и прочих Индиях.

Аноним 06/10/25 Пнд 19:08:06 #33 №325247676

>>325247646
что вообще за продукт? Валидация рынка есть?

Аноним OP 06/10/25 Пнд 19:09:44 #34 №325247734

>>325247676
Ести. Я MVP запускал без продукта. Накатило с пердитов народу с желанием уплотить. Направил в waiting.

Аноним 06/10/25 Пнд 19:10:57 #35 №325247776

>>325247734
>Накатило с пердитов народу с желанием уплотить
заебись. Последний штрих - каждый такой желающий должен тебе в привлечении стоить чуть дешевле, чем он у тебя оставляет денег. Если это может работать на маленьком масштабе, тогда ты можешь загрузить в свой продукт условно 10к долларов, и крутить их по кругу.

Аноним 06/10/25 Пнд 19:11:27 #36 №325247798

17588163546670.jpg

>>325244431 (OP)
на звод пойти работать не пробывал?

понаобучают хуйни всякой и в попу балуются

Аноним OP 06/10/25 Пнд 19:15:53 #37 №325247953

>>325247776
Само собой.

Аноним 06/10/25 Пнд 19:19:42 #38 №325248075

>>325244431 (OP)
Ебень, ты накидал технических терминов без рассказа че ты вообще делать собираешься, как тебе помогать-то?

Аноним 06/10/25 Пнд 19:21:56 #39 №325248167

>>325248075
Мы с трудом, но поняли. Но контекст бы помог, конечно.

Аноним 06/10/25 Пнд 19:22:41 #40 №325248191

image.png

Если он расскажет, что делает, вы спиздите его идею

Аноним OP 06/10/25 Пнд 19:23:39 #41 №325248229

gettyimages-1154913635-612x612.jpg

>>325248075
>без рассказа
Короче план такой. Я собираю чемодан и еду создавать ячейку общества в Африку! Зайду издалека. Перехвачу демографический кризис так сказать. А когда африканцы доедут, уже считай русские. Как тебе такой план?

[mailto:webm] Аноним 06/10/25 Пнд 19:25:33 #42 №325248298

Гоподи как же легко получить бан на параше с ботами, я чувствую себя богом. Пойду и сломаю ебало любому. И я могу сделать это! Я пойди сделаю что ?

[mailto:webm] Аноним 06/10/25 Пнд 19:26:31 #43 №325248323

таки называемое что надобно делать с такими как ты ?

[mailto:webm] Аноним 06/10/25 Пнд 19:26:55 #44 №325248333

Я хочу крови

Аноним 06/10/25 Пнд 19:30:33 #45 №325248438

>>325247798
Ты как поп, который через айфон в инет пишет что айфоны это творение сотоны и надо от них избавляться.

Аноним 06/10/25 Пнд 19:40:37 #46 №325248801

Это бототреда какой-то, почему какая-то хуета написана полная?

Мимо SRE