24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна.
Подробности случившегося. Мы призываем всех неравнодушных
помочь нам с восстановлением утраченного контента!
СРОЧНО ПРИЗЫВАЮТСЯ В ТРЕД ML, DS И ПРОЧИЕ ИИ АНАЛЬНИКИ
Что дешевле для первых месяцев RAG с сотнями пользователей?
Serverless или сервер? Учитывая что LLM будет внешним как API?
Компоненты:
- Векторная БД (Сhroma или Pgvector для сервера так как векторов меньше 2000)
- Эмбединг модель (планирую брать те, что жрут не больше 2-2.5GB, но возьму скорее gemma embedding, что укладывается в 600мб)
- Serverless compute (если бессерверный вариант чтобы дергать RAG логику) типа Vercel Functions/Netlify functions
И еще тупой вопрос вдогонку - для эмбединг модели если она на сервере - нужна видяха или хватит CPU? Хочется экономить.