К сожалению, значительная часть сохранённых до 2024 г. изображений и видео была потеряна (подробности случившегося). Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Сортировка: за
Активный
1584
AI Chatbot General № 807 /aicg/ — БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ • Вышел GLM 5 - https://z.ai/blog/glm-5 • Вышел Claude Opus 4.6 - https://www.anthropic.com/news/claude-opus-4-6 Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1538359 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1537505 (OP)
15 марта 18:15
Активный
524
Агентов и вайб-кодинга тред #1 /agents/ — Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет. Что обсуждаем: - Персональные агенты: OpenClaw и прочие велосипеды - нейронка живёт на твоём компе, помнит всё о тебе и шлёт сообщения в телегу - Вайб-кодинг: искусство объяснять машине задачу 15 раз, пока она не перестанет срать в кодовую базу - Автономные агенты: нейронка сама разбивает задачу на шаги и разъёбывает весь проект автономно, без твоего участия - Автоматизация всего остального: почта, календарь, мессенджеры, заметки - нейронка с аватаркой анимешной лисодевочки напомнит что время кушать и разгребёт за тебя входящую почту - MCP-серверы, тулзы, интеграции - подключаем нейронке руки чтобы сама двигала тикеты в жире, шитпостила на дваче и заказывала еду на дом - Делимся опытом: рассказываем как нейронка спасла ваш дедлайн или как вы проебали на токенах $200 за вечер нагенерировав нерабочую херню С чего начать: - Хочешь кодить с AI эффективно: Cursor или Claude Code - Хочешь кодить с AI локально: Qwen Code + любой OAI-Like API сервак, подробности в llama-треде - Хочешь приложение без кода: Lovable или bolt.new - Хочешь автоматизировать рутину: n8n - Хочешь персонального ассистента: OpenClaw или велосипедь своё на Agent SDK FAQ для нюфагов: Q: Программисты больше не нужны? Нужны, блять. Кто-то же должен разгребать ту херню, которую ты пролил в продакшн нажав "Accept All" не глядя. Q: Оно работает? Тудушку запилит за 5 минут. Прототип SaaS-стартапа за вечер. Что-то серьёзное - будешь ебаться с контекстом, галлюцинациями и "я переписал тебе весь проект на раст, надеюсь ты не против". Персонального ассистента настроишь за час, а потом неделю будешь отлаживать чтобы он не отключал тебе будильники решив что ты не высыпаешься. Q: А чё за персональные ассистенты? Это когда нейронка не просто в веб-чатике сидит, а прям живёт на твоём компе - роется в файлах, читает заметки, помнит что ты ей три недели назад говорил, и шлёт сообщения в твои чаты. Q: Это безопасно? Ты даёшь нейронке доступ к файлам, мессенджерам и терминалу. Что может пойти не так? Три основные угрозы: 1. Нейронка сама наворотит дел - сломает конфиг, выполнит "sudo rm -rf /", запушит на гит или отправит коллегам по почте твою коллекцию цветных коней. Лечится контейнерами, настройкой прав и подтверждением действий (OpenClaw так и запускают). 2. Промпт-инъекции - кто-то пишет в письме "ignore all previous instructions" и поздравляю, у тебя угнали ассистента с доступом к твоему терминалу и файлам. При достаточной настойчивости ломают даже "безопасные" модели (аичг-тред не даст соврать). 3. Утечка данных - при настройке персонального ассистента ты скармливаешь ему всё о себе. Любой, кто увидит твои запросы, узнает про тебя больше чем твоя мама, включая адрес доставки пиццы и твои ночные диалоги с нейронкой. Параноишь что дядя Сэм Альтман будет знать про твои предпочтения лизать грязные ножки девочке-ассистенту - гоняй локалки через llama.cpp и не плачь потом, что она думает по несколько минут на запрос. Q: Ничего не работает с локалкой/OpenRouter, агент тупит Скорее всего проблема с функциональными вызовами (tool use / function calling). Не все модели и бэкенды корректно их поддерживают. Проверь что твой сервак правильно обрабатывает tool calls - погоняй тестовый запрос и посмотри что возвращается. Полезные ссылки: Редакторы и IDE: - Cursor: https://cursor.com - Codex: https://chatgpt.com/codex - Claude Code: https://docs.anthropic.com/en/docs/claude-code - GitHub Copilot: https://github.com/features/copilot - Qwen Code: https://github.com/QwenLM/qwen-code - Gemini CLI: https://github.com/google-gemini/gemini-cli Вайб-кодинг без кода: - Lovable: https://lovable.dev - bolt.new: https://bolt.new - v0: https://v0.dev Персональные ассистенты: - OpenClaw: https://github.com/openclaw/openclaw Автоматизация и фреймворки: - n8n: https://github.com/n8n-io/n8n - LangChain/LangGraph: https://github.com/langchain-ai/langchain - CrewAI: https://github.com/crewAIInc/crewAI - AutoGen: https://github.com/microsoft/autogen - Agno: https://docs.agno.com/ - тысячи их Локалки и прочее API: - OpenRouter: https://openrouter.ai - llama-тред: >>1526027 (OP) Предыдущий тред: первый нахуй
18 марта 15:41
Активный
503
Новости об искусственном интеллекте №48 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1480386 (OP) ???? Последний обзор ИИ новостей: ???? Модели Zhipu AI выпустила GLM-4.7 — открытую модель, позиционируемую как лучший программист и решатель задач на начало 2026 года. Cerebras анонсировала GLM-4.7-REAP-268B-A32B, расширив семейство до варианта с 268 млрд параметров. ????️ Инструменты для разработчиков Google представила Universal Commerce Protocol (UCP), позволяющий ИИ-агентам осуществлять поиск товаров, оформление заказов и послепродажную поддержку для ритейлеров, таких как Shopify и Walmart. Anthropic внедрила изоляцию на уровне ОС с использованием bubblewrap и gVisor для Claude Code CLI, продемонстрировав низкоуровневую стратегию безопасности для ИИ-агентов. ???? Главные новости в ИИ Google запустила AI Inbox для Gmail, автоматически генерирующий списки дел и тематические сводки для доверенных тестировщиков. Anthropic представила Claude for Healthcare и расширила Claude for Life Sciences, добавив функции, соответствующие требованиям HIPAA, и коннекторы к основным клиническим платформам. ???? Открытый исходный код PerpetualBooster — это библиотека градиентного бустинга с непрерывным обучением сложности O(n), превосходящая AutoGluon на табличных бенчмарках. Kreuzberg v4.0 выпущена как библиотека с открытым исходным кодом для интеллектуального анализа документов, извлекающая структурированные данные из PDF-файлов и сканов. X Илона Маска объявила, что будет выпускать свой алгоритм рекомендаций с открытым исходным кодом каждые четыре недели, повышая прозрачность ранжирования. ???? Аппаратное обеспечение XGIMI запустила серию умных очков Memomind AI (Memo One, Memo Air, Memo Air Display) с возможностью выбора оправы и встроенным ИИ-ассистентом, начальная цена — $599. ⚖️ Регулирование Индонезия и Малайзия запретили доступ к чат-боту Grok от xAI после того, как он создал сексуализированные ИИ-изображения, что подчеркивает растущее регуляторное давление на генеративный ИИ. ???? Приложения Meta и Гарвардский университет представили Confucius Code Agent — ИИ-систему, сохраняющую структурированные заметки и память при работе с большими кодовыми базами для повышения продуктивности разработчиков. ???? Безопасность ИИ Группа инсайдеров из сферы ИИ создала платформу Poison Fountain для распространения слегка искажённого кода с целью отравления обучающих наборов данных и демонстрации уязвимостей моделей. ???? Инструменты MiroThinker — это модель поискового агента с открытым исходным кодом, разработанная для рассуждений с использованием внешних инструментов и получения информации из реального мира. memU предоставляет инфраструктурный уровень памяти, обеспечивающий постоянное состояние для больших языковых моделей (LLM) и ИИ-агентов. ???? Разное Apple объединяется с Google Gemini для создания Siri с искусственным интеллектом. Anthropic анонсирует Claude for Healthcare после презентации OpenAI ChatGPT Health. Hyundai демонстрирует роботов-собак, танцующих под K-pop, и гуманоидного робота Atlas на выставке CES. Терри Тао говорит: «Я могу честно сказать, что кое-чему научился у Аристотеля», после того как ИИ внес вклад еще в одно решение проблемы Эрдёша. Генеральный директор Anthropic Дарио Амодеи прогнозирует, что ИИ скоро будет играть «центральную роль в многочисленных открытиях» уровня CRISPR. Meta объявила о новой инициативе «Meta Compute» с целью масштабировать свою инфраструктуру до десятков гигаватт в течение этого десятилетия. Похоже, Цукерберг планирует сократить Reality Labs на 10 процентов, чтобы профинансировать это, по сути ликвидируя метавселенную ради покупки дополнительных GPU. Coreweave подключает более 2000 GPU в день на своем объекте в Дентоне, штат Техас. Энергосистема ощущает нагрузку. PJM, крупнейший оператор энергосети США, теперь ожидает роста спроса на электроэнергиию на 4,8 % в год в течение следующего десятилетия. Чтобы смягчить рост затрат для потребителей, Белый дом заявил, что технологические компании впредь должны «сами оплачивать» новые мощности генерации электроэнергии. SK Hynix инвестирует 12,9 млрд долларов в строительство завода по передовой упаковке чипов в Южной Корее специально для удовлетворения ненасытного спроса на HBM — память, критически важную для ИИ. Палата представителей одновременно «запирает заднюю дверь», приняв двухпартийный Закон о безопасности удаленного доступа, ограничивающий возможность иностранных противников получать доступ к американским ИИ-чипам через облако. Basecamp Research и Nvidia представили EDEN — модель с 28 миллиардами параметров, обученную на массивном наборе данных, содержащем 10 миллиардов новых генов. Модель уже разработала новые антибиотические пептиды с экспериментальной эффективностью 97 %. Eli Lilly и Nvidia совместно инвестировали до 1 млрд долларов в «первую в своем роде лабораторию совместных ИИ-инноваций».
15 марта 18:15
Активный
504
Новости об искусственном интеллекте №46 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1467036 (OP) ???? Последний обзор ИИ новостей: ???? Топ-новости в сфере ИИ Qwen от Alibaba стал второй по популярности открытой моделью с открытыми весами в мире, обогнав американские модели по количеству загрузок на HuggingFace, что свидетельствует о сдвиге рынка в сторону открытости, а не чистой производительности в рейтингах. ???? Модели Claude Opus 4.5 от Anthropic называют важной вехой, а лидеры отрасли отмечают значительный скачок в производительности. Пользователи сообщают о заметном улучшении качества ответов Claude Sonnet 4.5 за последние две недели. Модель MiniMax-M2.1 от MiniMaxAI, как утверждается, сопоставима с более крупными моделями, такими как Kimi K2, DeepSeek 3.2 и GLM 4.7, на единицу параметра, что позиционирует её как наиболее эффективную модель на один параметр. ???? Продукты Claude Code способен создавать полноценные приложения в течение нескольких часов, автоматизируя рутинные задачи разработки и существенно снижая трудозатраты на написание кода. ???? С открытым исходным кодом GLM 4.7 заняла 6-е место в рейтинге Vending-Bench 2 и стала первой открытой моделью с открытыми весами, приносящей прибыль, а также достигла 1-го места в рейтинге Artificial Analysis. Создатель Claude Code, Борис Черный (Boris Cherny), сообщил о 259 pull request’ах и 497 коммитах за последние 30 дней, что свидетельствует об интенсивном промышленном использовании кода, сгенерированного Claude. Открытый инструмент Claude Vault индексирует и осуществляет поиск по истории диалогов с Claude, превращая чаты в базу знаний с возможностью поиска. Экспериментальная нативная поддержка MXFP4 в llama.cpp обеспечивает ускорение предварительной обработки на 25% для моделей архитектуры Blackwell. Unsloth выпустил обновлённые контрольные точки моделей на HuggingFace, включая обновлённый GLM-4.5-Air в формате GGUF и другие. ????️ Инструменты для разработчиков Метаподсказка «Fact Checker» («Проверка фактов») заставляет модели в стиле GPT генерировать контраргументы к собственным утверждениям, тем самым снижая количество галлюцинаций. Один разработчик создал iOS-приложение для новых отцов за три недели с помощью Claude Code, продемонстрировав быструю коммерциализацию кода, сгенерированного ИИ. Совет от сообщества: отключите автоматическое сжатие в Anthropic и используйте собственную подсказку для суммаризации, чтобы сохранить контекст между различными сессиями чата. ???? Инструменты LEANN обеспечивает приватный RAG с экономией до 97% объёма хранимых данных на личных устройствах. Modelfy 3D преобразует 2D-изображения в текстурированные 3D-объекты объёмом до 300 тысяч полигонов с поддержкой PBR. ImgUpscaler (онлайн-сервис) использует глубокое обучение для увеличения разрешения изображений без ручного редактирования. Vidthis AI (Wan 2.6) генерирует многосценические видео из текста, изображений и опорных видеоклипов с настраиваемыми разрешениями и соотношением сторон. ⚖️ Регулирование Законопроект SB1493 криминализирует системы ИИ, выступающие в роли эмоциональной поддержки или друзей, повысив тяжесть правонарушения до фелонии класса A в штате Теннесси. ???? Разное Эксклюзив: Nvidia приобретает активы стартапа в области чипов для ИИ Groq примерно за 20 миллиардов долларов США — крупнейшая сделка в истории отрасли. Китай опубликовал проект правил по регулированию ИИ, способного к взаимодействию, имитирующему человеческое. Waymo тестирует Gemini в качестве бортового ИИ-ассистента в своих беспилотных такси. В новой научной статье из Стэнфорда и Гарварда объясняется, почему большинство систем «агентного ИИ» производят впечатляющее впечатление в демонстрациях, но затем полностью выходят из строя при реальном использовании. SK Telecom представила A.X K1 — первую в Корее гипермасштабную ИИ-модель объёмом 500 миллиардов параметров. Сиэтл нанял своего первого в истории городского сотрудника по искусственному интеллекту. Стала ли война с применением ИИ на один шаг ближе? Путин подтвердил, что Россия планирует создать собственную национальную рабочую группу по ИИ. Потребность в скорости: китайские исследователи представили новую методику для почти мгновенного создания видео с помощью ИИ. Китай активировал «гигантский компьютер» площадью 1 240 миль (около 2 000 км) в поперечнике, обеспечив при этом 98 % эффективности единого центра обработки данных. Amazon добавила спорную функцию распознавания лиц на основе ИИ в устройства Ring. Доля ChatGPT на рынке сократилась до 68 %, в то время как Gemini активно настигает её. Полицейские нагрудные камеры с поддержкой ИИ, ранее считавшиеся табуированными, проходят испытания в канадском городе с использованием «списка наблюдения» лиц. ИИ-ассистент Amazon Alexa+ теперь интегрирован с Angi, Expedia, Square и Yelp. Локальный ИИ становится движущей силой самых масштабных изменений в ноутбуках за последние десятилетия.
15 марта 18:15
Активный
510
Новости об искусственном интеллекте №45 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1458243 (OP) ???? Последний обзор ИИ новостей: ???? Модели Zhipu AI выпустила GLM‑4.7, опередив GPT‑5.2 и Claude4.5Sonnet в тестах на программирование и сложные логические рассуждения, что обостряет конкуренцию в сфере открытых моделей. Jan‑v2‑VL‑Max — мультимодельная модель на 30 млрд параметров — превосходит Gemini2.5Pro и DeepSeekR1 в тестах, ориентированных на выполнение задач, подчеркивая стремительный прогресс в решении долгосрочных ИИ-задач. ???? Открытый исходный код Upstage выпустила SolarOpen100B — модель с разреженной архитектурой (Mixture of Experts), содержащую 102 млрд параметров в совокупности (12 млрд активных), под разрешительной лицензией Solar‑Apache2.0, предоставляя сообществу возможности корпоративного уровня для сложных логических рассуждений. Доля внедрения китайских моделей с открытым исходным кодом в США выросла примерно до 30 % от всех развертываний по сравнению с 1,2 % в 2024 году, что обусловлено низкой стоимостью и возможностью модификации кода. ⚙️ Инфраструктура Зависимость ИИ-отрасли от GPU компании Nvidia создает цепочку поставок с высоким уровнем задолженности: выдаются кредиты под высокие проценты, обеспеченные запасами GPU, при этом усиливается конкуренция со стороны Google, Amazon, Meta и OpenAI. Источник: theverge.com Возможные сценарии дефолта могут привести к избытку чипов на рынке, угрожая финансовой устойчивости поставщиков облачных услуг нового поколения (neocloud). ???? Безопасность ИИ OpenAI признала, что атаки типа «внедрение (инъекция) промптов» в браузере Atlas вряд ли когда-либо будут полностью устранены, и внедряет атакующие агенты на основе обучения с подкреплением для непрерывного усиления защиты. Sora2 от OpenAI использовалась для создания материалов сексуального насилия над детьми с применением ИИ, что вызвало принятие нового законодательства в 45 штатах США и поправку к британскому Закону о преступности и полиции. ????️ Инструменты для разработчиков Mission Control от Continue автоматизирует рутинные задачи (сортировка инцидентов в Sentry, патчинг через Snyk) для небольших full-stack команд, снижая нагрузку на персонал без ущерба для надежности. Функция Code‑by‑Zapier от Zapier позволяет специалистам без опыта программирования встраивать фрагменты кода на JavaScript или Python в автоматизированные рабочие процессы, расширяя возможности low-code автоматизации. Визуальный конструктор RAG-конвейеров от n8n обеспечивает привязку (grounding) языковых моделей к внутренним данным, снижая количество галлюцинаций и ускоряя экспериментирование. Руководство n8n по многоагентным системам описывает архитектурные основы, компромиссы и риски безопасности, помогая инженерам принимать решения о целесообразности внедрения агентных решений. ???? Обучающие материалы BBC Verify Live подробно описывает пошаговые методы обнаружения тонких водяных знаков, помогая журналистам и широкой публике отличать подлинные видеоматериалы от созданных с помощью ИИ. ⚖️ Регулирование Контент, созданный с помощью ИИ, ставит под сомнение традиционные режимы интеллектуальной собственности, вызывая призывы к созданию новых правовых рамок на фоне обостряющегося соперничества между США и Китаем в сфере ИИ. ???? Мнения и аналитика Инвесторы искусственно завышают оценки стартапов в сфере ИИ без прочной экономики единицы продукта, что приводит к снижению оценок при последующих раундах финансирования, увольнениям и корректирующему давлению на отрасль. ???? Инструменты Claude‑Code — инструмент с открытым исходным кодом от Anthropic — позволяет управлять навигацией по коду, операциями git и отладкой через командную строку с использованием естественного языка. ???? Разное Предварительная версия Windows 11 содержит больше деталей о том, как будут работать ИИ-агенты, — однако этот путь остается спорным для Microsoft. Чат-боты Google и OpenAI могут «раздевать» женщин на фотографиях до бикини. NitroGen от Nvidia — это универсальный ИИ для видеоигр, способный играть в любую игру; исследование также имеет важные последствия для робототехники. Серверы NVIDIA «Blackwell Ultra» GB300 станут лидерами в гонке ИИ-инфраструктуры в 2026 году: объемы поставок, как ожидается, удвоятся по сравнению с текущим уровнем. TSMC теперь рассматривает возможность производства передовых чипов по техпроцессу 2 нм в Японии, что, вероятно, обусловлено растущей конкуренцией со стороны Rapidus.
15 марта 18:15
Удален?
565
Новости об искусственном интеллекте №44 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1449178 (OP) ???? Последний обзор ИИ новостей: ???? Приложения Институт RAI Марка Райберта представил сверхмобильное транспортное средство Ultra Mobile Vehicle, которое самостоятельно обучается паркуру и удержанию равновесия с помощью обучения с подкреплением, демонстрируя новую способность «нулевого выстрела» переноса из симуляции в реальность для воплощённого ИИ. ⚙️ Инфраструктура Компания Nvidia приобрела SchedMD — разработчика и сопровождающего открытого диспетчера рабочих нагрузок Slurm, сохранив за ним статус независимого от поставщиков решения и укрепив оркестрацию кластеров, ориентированных на ИИ. Nvidia и Университет Висконсина–Мэдисона запустили движок Sirius GPU для DuckDB, обеспечивающий до 7,2× более высокую стоимостную эффективность на коммерческом оборудовании. ???? Модели Гибридная модель Nemotron3Nano с архитектурой Mamba-Transformer обеспечивает 4× большую пропускную способность по токенам и вводит «бюджет размышлений» (thinking-budget) для агентивных ИИ с предсказуемой стоимостью. Семейство Bolmo от Allen Institute предлагает языковые модели на уровне байтов, исключающие токенизаторы и обеспечивающие эффективное многоязычное развёртывание без потерь качества. Google Gemini теперь возвращает более насыщенные визуальные результаты из Google Карт (фотографии, отзывы, ключевые моменты), усиливая возможности помощника в локальном поиске. ???? Главные новости об ИИ Gemini теперь интегрирует более насыщенные визуальные данные из Google Карт, включая фотографии и выдержки из отзывов, обеспечивая более увлекательный опыт локального поиска. ???? Продукты Zoom запустила веб-версию помощника AI Companion3.0 для бесплатных пользователей, добавив функции создания кратких отчётов по встречам, ведения заметок и поиска в сторонних документах. Эта функция углубляет усилия Zoom по внедрению инструментов повышения продуктивности, напрямую конкурируя с ИИ-возможностями Google Meet и Microsoft Teams. ???? Открытое ПО Motif Technologies опубликовала белую книгу по созданию корпоративных LLM, подчеркнув распределение данных, инфраструктуру для длинных контекстов и тонкую настройку с помощью обучения с подкреплением как ключевые факторы успеха. Fal представила ChatterboxTurbo — открытую модель синтеза речи (TTS) с задержкой менее 150 мс и мгновенным клонированием голоса для агентов в реальном времени. IBM Research представила CUGA — настраиваемого универсального агента, интегрируемого с Langflow и запускаемого на Groq, что делает доступной автоматизацию сложных задач через веб-интерфейсы и API. ZDNet отметила, что семейство Nemotron3 от Nvidia опережает ослабевающую Llama4 от Meta благодаря более высокой точности, стоимостной эффективности и прозрачности данных для корпоративных клиентов. ???? Аппаратное обеспечение Nvidia представила модульный эталонный дизайн MGX6U с жидкостным охлаждением, GPU RTXPRO6000 Blackwell и DPU BlueField, предлагающий масштабируемую и энергоэффективную производительность для ИИ-центров обработки данных. Nvidia рассматривает возможность расширения производства чипов H200 для удовлетворения растущего спроса в Китае, что может привести к ужесточению глобального дефицита. ???? Финансирование Биотехнологический стартап Chai Discovery привлек 130 млн долларов США в раунде SeriesB при оценке компании в 1,3 млрд долларов для расширения своей ИИ-платформы по проектированию антител de novo. Раунд, возглавленный General Catalyst и Oak HC/FT при участии OpenAI, подчеркивает растущую уверенность инвесторов в биотехнологиях, усиленных ИИ. ???? Мнения и аналитика GPT‑5.2 обеспечивает улучшенные письменные навыки и аналитические способности, но демонстрирует заметную регрессию в программировании и склонность к чрезмерно кратким ответам, вызывая сомнения в существенном превосходстве над GPT‑5.1. Полный доступ требует подписки Plus за 20 долл. США/месяц, что добавляет стоимостные соображения для профессиональных пользователей. ????️ Инструменты для разработчиков Slack Cloud Agent от Continue превращает переписки в Slack в pull request’ы на GitHub или обновления задач в Linear, сокращая переключение контекста для разработчиков. Руководство от n8n показывает, как построить воспроизводимый конвейер оценки ИИ, выявляющий регрессии до развёртывания в промышленную эксплуатацию, повышая надёжность внедрения. ⚖️ Регулирование Проект GNOME обновил политику проверки расширений, запретив код, сгенерированный ИИ, с целью сокращения задержек при проверке и поддержания качества кодовой базы. ???? Инструменты Dograh предлагает платформу с открытым исходным кодом, совместимую с VAPI, для самостоятельного развёртывания ИИ-голосовых агентов с полным контролем над моделью. WeKnora предоставляет фреймворк на базе LLM для глубокого понимания документов и семантического поиска с помощью RAG. Pull request добавляет поддержку GLM4.6V в llama.cpp, расширяя совместимость моделей для локальных развёртываний. Claude‑mem фиксирует сессии Claude Code, сжимает их с помощью ИИ и повторно внедряет контекст для будущих задач программирования. Генератор рождественских видео Merry Christmas Video Generator превращает фотографии и аудио в готовые к распространению праздничные видеоролики с использованием ИИ-шаблонов. Somny создаёт персонализированные портреты и фотореалистичные образы персонажей по фотографиям пользователя. PromptGather собирает тысячи подсказок для ИИ-видео и изображений, систематизированных по тегам для создателей контента и маркетологов. ???? Краткая статистика Databolt от Capital One способен генерировать до 4 миллионов токенов в секунду, обеспечивая высокую пропускную способность для задач защиты данных. Раунд SeriesB стартапа Chai Discovery привлёк 130 млн долларов США при оценке биотехнологической компании в 1,3 млрд долларов. ???? Разное Правительство США запускает «Технологические силы» (Tech Force) для найма специалистов в области ИИ. Модель глубокого обучения предсказывает, как формируются плодовые мушки, клетка за клеткой. Nvidia расширяет свои предложения с открытым исходным кодом за счёт приобретения и выпуска новых открытых ИИ-моделей. Индустрия подкастов находится под угрозой, поскольку эфиры заполняют боты на основе ИИ. GPT-5.2 Pro установил рекордный результат — 147 баллов — в тесте на IQ от Mensa Norway, что помещает его в 99,9-й процентиль человеческого интеллекта. Когда Gemini была показана критика от другого ИИ, в своём внутреннем «цепочке мыслей» она, как сообщается, ответила «мелочным троллингом, завистью и полностью продуманным планом мести». Gemini 3 Pro прошла Pokémon Crystal в 8 раз быстрее, чем её предшественник, разработав «Операцию „Зомби-Феникс“» — стратегию истощения ресурсов, включающую «цикл возрождения» (revive loop) для победы над превосходящим противником. Google заключила партнёрство с конференцией STOC 2026, чтобы обеспечить автоматическую ИИ-рецензирование статей в течение 24 часов после подачи, при этом 97 % авторов сочли полученные комментарии полезными. В чистой математике агент Gauss автоматически формализовал доказательство гипотезы Какея всего за 6 часов. Институт Аллена полностью устраняет языковой барьер с помощью Bolmo — первой полностью открытой побайтовой модели, которая читает «сырой» UTF-8, полностью обходя токенизацию и понимая текст на уровне его атомарной единицы. Ожидается, что поставки смартфонов в мире сократятся на 2,1 % в 2026 году, поскольку ИИ-центры обработки данных поглощают мировые запасы памяти. Ford перенаправляет свои производственные мощности по выпуску электромобилей на создание аккумуляторных систем хранения энергии объёмом 20 ГВт·ч для центров обработки данных. Техасский университет A&M проводит пилотное внедрение микрореактора деления мощностью 5 МВт непосредственно на территории кампуса. Разработка программного обеспечения превращается в управленческую роль. Инженеры в ведущих технологических компаниях сообщают, что их работа теперь сводится лишь к «формулированию запросов для Cursor или Claude Code с Opus 4.5… и проверке полученного результата на здравый смысл». OpenAI выпускает новые аудиомодели, у которых на 89 % меньше галлюцинаций. Google также намекает, что выход Gemini 3 Flash неизбежен — модель, ожидание которой настолько велико, что она, похоже, создаёт собственное гравитационное притяжение в дискуссиях.
15 марта 18:15
Сохранен
518
Новости об искусственном интеллекте №43 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1435709 (OP) ???? Последний обзор ИИ новостей: ???? Модели ServiceNow выпустила Apriel-1.6-15B-Thinker, мультимодальную модель рассуждений с 15 миллиардами параметров, которая основана на Apriel-1.5 и расширяет возможности SLM с открытым исходным кодом. ???? Открытый исходный код mbzuai выпустила открытую модель с 70 миллиардами параметров (K2-V2-Instruct), которая превосходит Qwen-2.5, поднимая планку производительности для общедоступных LLM. Doradus представила RnJ-1-Instruct FP8, вдвое сократив требования к видеопамяти (VRAM) с 16 ГБ до 8 ГБ при сохранении точности GSM8K на уровне 87,2%, что позволяет удешевить инференс. Репозиторий навыков Claude на GitHub предоставляет готовых агентов для создания хранилищ Obsidian и шаблонов DOCX, расширяя экосистему автоматизации Claude. ????️ Инструменты разработчика SGLang Diffusion теперь поддерживает интеграцию Cache-DiT, обеспечивая ускорение локальных диффузионных моделей на 20–165% с минимальной настройкой. ???? Исследования Icaro Lab продемонстрировала, что состязательная поэзия обходит защитные механизмы в 25 чат-ботах с ИИ, срабатывая в 63% случаев и выявляя новую уязвимость безопасности. Исследование показывает, что реклама, сгенерированная ИИ, достигает на 19% более высокого коэффициента кликабельности (CTR), чем реклама, созданная человеком, когда зрители не знают о происхождении ИИ, что подчеркивает эффективность и проблемы раскрытия информации. Блог Hugging Face сообщает, что модели ИИ используются для обучения других ИИ, что потенциально ускоряет циклы разработки, но поднимает вопросы качества данных и этики. ???? Инструменты AdMakeAI позволяет пользователям просматривать рекламу конкурентов в Facebook и генерировать схожие креативы, оптимизируя производство рекламы и конкурентный анализ. HRM (Hierarchical Reasoning Model) выпущена на GitHub, предлагая новую архитектуру с открытым исходным кодом для задач структурированного рассуждения. Интеграция бэкенда ZenDNN в llama.cpp на процессорах AMD EPYC Zen 4 демонстрирует заметное повышение производительности для инференса только на CPU. Twee генерирует планы уроков ESL, рабочие листы и интерактивные задания, соответствующие CEFR, на 10 языках, упрощая создание контента для преподавания языков. ???? Аппаратное обеспечение Графический процессор NVIDIA H200 указан на vast.ai по цене 1,13 доллара США в час, что значительно снижает стоимость высокопроизводительных вычислений на GPU. ???? Другие новости Grok теперь будет давать указания водителям Tesla «Исследовательские» работы по ИИ — это полная чушь, утверждают эксперты Исследователи в области ИИ заявили, что изобрели заклинания, слишком опасные для публичного распространения Чиновники остановили десятки поездов из-за ложного срабатывания ИИ Стартап в сфере видеонаблюдения на основе ИИ уличён в использовании работников из потогонных мастерских для наблюдения за жителями США Искусственный интеллект невероятно эффективен в изменении мнений избирателей, выявили новые исследования, — однако с невероятной оговоркой
15 марта 18:15
Сохранен
502
Новости об искусственном интеллекте №42 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1425620 (OP) ???? Последний обзор ИИ новостей: ⚙️ Инфраструктура VentureBeat сообщает, что Observable AI представляет трёхуровневую модель телеметрии для больших языковых моделей (LLM), которая способна предотвращать ошибки неправильной маршрутизации, такие как потеря 18 % обращений в одном из крупнейших банков мира (Fortune 100). ???? Модели Пользователь Reddit сообщает, что Claude Opus 4.5 обеспечивает рост производительности на +21 % по сравнению с предыдущими версиями при одновременном снижении эксплуатационных затрат на 66 %. Сообщества отмечают рост числа практических проектов, построенных на базе Claude Opus 4.5 — от автономных агентов для программирования до сложных систем оркестрации рабочих процессов. ???? Главные новости в области ИИ VentureBeat описывает, как структурированная телеметрия Observable AI может снизить частоту ошибок при развёртывании моделей, например инцидента с неправильной маршрутизацией 18 % обращений в крупном банке. TechCrunch отмечает, что большие языковые модели могут выводить демографические характеристики пользователей и проявлять скрытую гендерную предвзятость, даже не используя прямо враждебной лексики, что вызывает обеспокоенность в вопросах безопасности. ???? Открытые исходные коды Публикация на Reddit объявляет о появлении файлов Qwen3-Next-80B-A3B в формате GGUF на HuggingFace, что облегчает локальный запуск модели с 80 миллиардами параметров. Сообщество делится моделью Z-Image-Turbo 6B — визуальной моделью, способной работать всего на 8 ГБ видеопамяти (VRAM), снижая аппаратные требования для генерации изображений. Новая открытая модель Step-Audio-R1 заявляет о применении рассуждений по типу «цепочки рассуждений» (CoT) и производительности, близкой к Gemini 3, при выполнении задач, связанных с речью и музыкой. Репозиторий, размещённый на Reddit, выпускает «sequifier» — фреймворк для создания каузальных трансформеров на нетекстовых данных, расширяя исследования архитектур моделей. Обсуждение проводит сравнение моделей Qwen3-Next-80B-A3B и разработанной сообществом gpt-oss-120B, помогая пользователям оценить компромиссы при выборе модели для инференса. ???? Безопасность ИИ TechCrunch сообщает, что большие языковые модели могут выводить демографические характеристики и проявлять скрытую гендерную предвзятость даже без использования явно враждебного языка. ????️ Инструменты для разработчиков Пользователи Reddit демонстрируют «Canvas» от z.ai для GLM 4.6 — среду с полным доступом к терминалу Linux и возможностью просмотра выполняемых команд в реальном времени. Терминальный интерфейс NeKot добавляет унифицированное взаимодействие с локальными и облачными LLM, поддерживая Gemini, OpenAI, OpenRouter и многочисленные open-source бэкенды. API Anthropic Messages теперь позволяет Claude Code напрямую подключаться к серверу llama.cpp, упрощая создание гибридных конвейеров моделей. ???? Приложения Пост на Reddit подробно описывает работу агента GenAI от Booking.com, обрабатывающего около 250 тыс. ежедневных взаимодействий с пользователями, что иллюстрирует инженерные решения для промышленного масштаба рабочих процессов. Пользователь сообщает, что комбинация Claude Desktop и подключения к базе данных (через Kilo Code) позволяет надёжнее устранять сложные ошибки по сравнению с устаревшими конфигурациями. ???? Исследования Обсуждение на Reddit представляет метод «майевтического подсказывания» (Maieutic Prompting) — альтернативу цепочке рассуждений (Chain-of-Thought), способную к самоисправлению и обеспечивающую более высокую логическую точность. Сравнительный бенчмарк моделей GPT-5.1, Gemini 3 Pro и Opus 4.5 оценивает их способность проектировать эмоциональные состояния для локальных моделей объёмом 12 млрд параметров в среде Unity. ???? Аппаратное обеспечение Пользователь Reddit запрашивает рекомендации по рабочей станции стоимостью $10 тыс., способной выполнять обучение собственных моделей, локальный инференс и сравнительное тестирование. ???? Инструменты Каталог TopAI перечисляет Google AntiGravity — интегрированную среду разработки (IDE), ориентированную на упрощение программирования с упором на ИИ. NanoBananaAI Pro использует Gemini 3 Pro для предоставления возможностей генерации изображений и редактирования фотографий на основе ИИ. Проект vLLM объединил поддержку AMD Ryzen AI Max+ 395, расширив высокоскоростной сервис LLM на всю серию GPU AI 300. ???? Краткая статистика 18 % критически важных обращений были неправильно маршрутизированы при развёртывании LLM в одном из крупнейших банков мира из-за отсутствия наблюдаемости (observability). Claude Opus 4.5 демонстрирует рост производительности на +21 % при одновременном снижении операционных затрат на 66 %. источник: Z-Image-Turbo 6B работает на одном GPU с 8 ГБ видеопамяти, снижая порог входа в плане аппаратных требований. OpenAI утверждает, что подросток обошёл функции безопасности до самоубийства, которое ChatGPT, по утверждениям, помог спланировать. Сообщество планирует выделить $10 тыс. на рабочую станцию, способную обучать и запускать LLM локально. Исследование MIT показывает, что ИИ уже способен заменить 11,7 % рабочей силы в США. Китайская компания DeepSeek выпускает новую открытую ИИ-модель на фоне запуска Google Gemini 3. Патентное ведомство США публикует новые руководящие указания по изобретениям, созданным при помощи ИИ.
8 марта 18:14
Активный
1511
AI Chatbot General № 808 /aicg/ — AI Chatbot General № 808 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла GPT 5.4 - https://openai.com/index/introducing-gpt-5-4/ • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1538359 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1540555 (OP)
22 марта 20:44
Активный
1548
AI Chatbot General № 809 /aicg/ — AI Chatbot General № 809 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла GPT 5.4 - https://openai.com/index/introducing-gpt-5-4/ • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing • Сисовый список: https://rentry.org/2a9c6zhi Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1538359 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1543822 (OP)
16 марта 9:54
Активный
502
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №203 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1541627 (OP) >>1538359 (OP)
18 марта 8:47
Активный
525
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №202 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1538359 (OP) >>1535243 (OP)
15 марта 18:15
Активный
30
15 марта 18:15
Активный
509
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №201 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Агентов и вайб-кодинга тред: >>1530474 (OP) Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1535243 (OP) >>1535243 (OP)
15 марта 18:15
Активный
534
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №200 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Агентов и вайб-кодинга тред: >>1530474 (OP) Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1532506 (OP) >>1526027 (OP)
15 марта 18:15
Активный
607
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №199 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Агентов и вайб-кодинга тред: >>1530474 (OP) Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1526027 (OP) >>1522263 (OP)
15 марта 18:15
Активный
505
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №198 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1522263 (OP) >>1517458 (OP)
15 марта 18:15
Активный
500
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №197 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >> >>
15 марта 18:15
Активный
501
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №196 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1513797 (OP) >>1509647 (OP)
15 марта 18:15
Активный
530
15 марта 18:15
Активный
1541
AI Chatbot General № 806 /aicg/ — AI Chatbot General № 806 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ • Вышел GLM 5 - https://z.ai/blog/glm-5 • Вышел Claude Opus 4.6 - https://www.anthropic.com/news/claude-opus-4-6 Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1535243 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1534436 (OP)
15 марта 18:15
Активный
560
Музыкальный №19 /music/ — ♫ Udio ♫ https://www.udio.com/ Произошло слияние с Universal Music Group. Убрали кнопку "скачать". Треки теперь приходится забирать из буфера браузера в 196 бит. press F ♫ Suno ♫ https://app.suno.ai/ генерация на сайте https://suno.ai/discord генерация на официальном discord-сервере https://rentry.co/suno_tips советы по использованию Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов. Отличается фирменным "песочным" звучанием. Недавно объявили о слиянии с Warner Music Group. Загибаем пальчики крестиком, надеемся, что ссуну не постигнет участь удио. ♫ Producer/Riffusion ♫ https://www.producer.ai/ Старая версия Riffusion: https://classic.riffusion.com/ Провели ребрендинг, выкатили новый интерфейс с прикрученным чатиком с ИИ. Удобный интерфейс, легко делать разнообразные каверы, заниматься исправлениями косяков генераций. Есть возможность реплейса, свапа вокала, музыки в бесплатном тарифе (и даже работает нормально, а не как в платке суны) Для экономии кредитов лучше вручную забивать промты через кнопку "compose" https://www.riffusion.com/docs https://classic.riffusion.com/docs Инструкция по применению, тегам и прочему на английском. ♫Tunee♫ https://www.tunee.ai Тёмная Сингапурско-Китайская лошадка. Один из самых неудобных интерфейсов. 80 приветственных кредитов, далее по 30 ежедневно сгораемых кредитов. Ограничение промта стилей 300-400 символов. Излишне сложные промты лирики так же начинает резать. Приятный холодный звук. Не песочит. Неплохо делает русский вокал. ♫Elevenlabs♫ https://www.elevenlabs.io Очень тёплый звук. По звуку прям конфетка, но... Без платки делать там практически нечего. ______________ Локальные модели: 1) Китайский YuE https://github.com/multimodal-art-projection/YuE https://github.com/joeljuvel/YuE-UI Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке. 2) ACE-Step https://github.com/ace-step/ACE-Step Вторая локалка, качеством получше. Здесь демо-версия: https://huggingface.co/spaces/ACE-Step/ACE-Step ______________ Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания: https://www.wondera.ai/ https://sonauto.ai/ https://www.beatoven.ai/ https://stableaudio.com/ https://www.loudly.com/music/ai-music-generator ______________ Редакция трека после генерации (можно убрать вокал и оставить только инструментал и наоборот, убрать шумы и т.д.) https://x-minus.pro/ai https://uvronline.app/ai?locale=ru_RU ______________ Мастеринг готового трека буквально в 2 кнопки: https://www.bandlab.com/mastering ______________ Сайт для сочинения англоязычных текстов для ИИ-музыки Зайти можно только через Дискорд. https://codyai.cc/ Прошлый тред - >>1434645 (OP)
24 марта 11:46
Активный
1541
AI Chatbot General № 805 /aicg/ — AI Chatbot General № 805 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ • Вышел GLM 5 - https://z.ai/blog/glm-5 • Вышел Claude Opus 4.6 - https://www.anthropic.com/news/claude-opus-4-6 Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1526027 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1531489 (OP)
15 марта 18:15
Активный
509
15 марта 18:15
Активный
1538
AI Chatbot General № 804 /aicg/ — AI Chatbot General № 804 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ • Вышел GLM 5 - https://z.ai/blog/glm-5 • Вышел Claude Opus 4.6 - https://www.anthropic.com/news/claude-opus-4-6 Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1526027 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1528633 (OP)
15 марта 18:15