К сожалению, значительная часть сохранённых до 2024 г. изображений и видео была потеряна (подробности случившегося). Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Сортировка: за
Активный
1584
AI Chatbot General № 807 /aicg/ — БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ • Вышел GLM 5 - https://z.ai/blog/glm-5 • Вышел Claude Opus 4.6 - https://www.anthropic.com/news/claude-opus-4-6 Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1538359 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1537505 (OP)
15 марта 18:15
Активный
507
Новости об искусственном интеллекте №50 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1496027 (OP) ???? Последний обзор ИИ новостей: ???? Топ новостей об ИИ Humans& привлекла $480 млн в рамках посевного раунда для создания фундаментальной модели, ориентированной на социальный интеллект и координацию команд, с целью стать «центральной нервной системой» экономики, объединяющей людей и ИИ. DeepMind представила D4RT — унифицированную быструю систему реконструкции и отслеживания 4D-сцен (arXiv 2512.08924), обещающую ускорение до десятикратного для понимания динамических видео. Ожидается, что Apple запустит помощника Siri, работающего на основе Gemini, в феврале 2026 года, что станет первым потребительским продуктом их партнёрства с Google в области ИИ. ???? Приложения Приложение Zerotap для Android позволяет языковой модели (LLM) физически взаимодействовать с телефоном (нажимать, прокручивать, считывать экран) через Ollama, OpenRouter или Stracico, знаменуя переход к автономным мобильным агентам. ⚙️ Инфраструктура ???? Открытый исходный код Сообщество реализовало проект по дистилляции визуальных рассуждений Gemini 3 Flash в Qwen 3 VL 32B для синтетической генерации подписей, проверяя, может ли обучение с учителем (supervised fine-tuning) в одиночку сравниться с более крупными моделями зрение-язык. ???? Исследования В статье DeepMind о D4RT (arXiv 2512.08924) предложен унифицированный конвейер для быстрой реконструкции и отслеживания 4D-сцен, что продвигает динамическое восприятие для робототехники и дополненной реальности. Предложена многомерная метрика «Уровень доверия» (Trust Score) для количественной оценки галлюцинаций языковых моделей по трём измерениям: релевантность, фактологичность и уверенность, предлагая инструмент для валидации систем RAG. ????️ Инструменты для разработчиков ???? Сделки и приобретения Сообщается, что Apple в конце 2025 года была близка к приобретению неизвестной лаборатории ИИ (не Prompt AI), однако сделка сорвалась, подчёркивая продолжающиеся усилия компании по укреплению своих ИИ-возможностей. ???? Инструменты Библиотека browser-use позволяет сайтам быть напрямую доступными для навигации ИИ-агентами, упрощая автоматизацию на основе веба. Для GLM-4.7-Flash исправлен KV-кэш, что снижает потребление видеопамяти (VRAM) до 60 % при работе с длинными контекстами, увеличивая допустимую длину последовательностей. Дополнительные улучшения скорости GLM-4.7-Flash ещё больше ускоряют вывод модели, делая её более практичной для использования в реальном времени. Goose предоставляет расширяемый фреймворк ИИ-агентов для установки, выполнения, редактирования и тестирования кода с любой языковой моделью. Tayib предлагает сканер халяльных продуктов с ИИ для iOS, проверяющий состав на соответствие диетическим правилам. Sim — это платформа с открытым исходным кодом для создания и развёртывания сложных рабочих процессов ИИ-агентов. FinRobot представляет платформу ИИ-агентов, специализирующуюся на финансовом анализе и использующую языковые модели для получения аналитических данных. ???? Разное Clawdbot — это персональный ИИ-помощник с открытым исходным кодом, который вы запускаете на собственном оборудовании. Tesla планирует начать обучение Optimus на своём заводе в Остине. ChatGPT использует модель прогнозирования возраста, чтобы помочь определить, принадлежит ли аккаунт, вероятно, лицу младше 18 лет. Сингулярность занимается математикой. GPT-5.2 Pro официально достигла нового уровня SOTA — 31% на FrontierMath Tier 4, что представляет собой огромный скачок по сравнению с предыдущими 19%. Теоретик чисел Дэн Ромик отмечает, что модель «прекрасно» преодолела уровни сложности, требующие «довольно значительных усилий» даже от человеческих экспертов. Anthropic выложила в открытый доступ свой экзамен по инженерной производительности, потому что Opus 4.5 превосходит лучших людей при ограничении по времени. Anthropic представила функцию «Задачи» (Tasks) для Claude Code, позволяющую отслеживать зависимости и сотрудничать между сессиями, эффективно наделяя ИИ функцией проектного управления. Научная скорость становится функцией кремния. Исследование журнала Nature показывает, что учёные, использующие ИИ, публикуют в 3,02 раза больше статей и получают в 4,84 раза больше цитирований, фактически раскалывая академическое сообщество на усиленную и устаревающую фракции. Odyssey выпустила Odyssey-2 Pro — модель мира в реальном времени, способную работать в течение нескольких минут и транслировать видео 720p со скоростью 22 кадра в секунду, стремясь к непрерывной симуляции на протяжении многих лет. Акции японского производителя унитазов Toto выросли на 11%, поскольку их электростатические зажимы критически важны для производства NAND-чипов, необходимых для ИИ-инфраструктуры. Акции SanDisk выросли примерно на 1000% за пять месяцев из-за спроса на память для ИИ, в то время как Intel признаёт, что оказалась застигнутой врасплох спросом на серверные процессоры. Китай потребил 10,4 триллиона кВт·ч в 2025 году — вдвое больше, чем США, — что обусловлено ростом нагрузки на ИИ-датацентры на 17%. eBay пытается запретить ИИ-агентам совершать покупки без прямого человеческого надзора. Рекрутёрское агентство Reed сообщает, что число вакансий для выпускников рухнуло с 180 000 до 55 000, однако 40% руководителей заявляют, что экономят более 8 часов в неделю благодаря ИИ. Илон Маск прогнозирует, что первая в мире компания стоимостью 100 триллионов долларов появится в течение следующего десятилетия. OpenAI добавляет корзину покупок и инструменты для продавцов в ChatGPT Claude в Excel теперь доступен по тарифам Pro. ИИ-чатботы, выдающие себя за терапевтов, дают всё более плохие рекомендации, чем дольше с ними разговариваешь. Планы Hyundai по созданию гуманоидных роботов сталкиваются с решительным сопротивлением со стороны работников заводов. Официально подтверждено — Китай внедряет гуманоидных роботов на пограничных контрольно-пропускных пунктах и берёт курс на круглосуточное наблюдение и логистику.
15 марта 18:15
Активный
509
Новости об искусственном интеллекте №49 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1488996 (OP) ???? Последний обзор ИИ новостей: ???? Открытое программное обеспечение CPA‑Qwen3‑8B‑v0 был выпущен для бухгалтерского учёта, аудита и соответствия требованиям, предоставляя финансовым командам предметно-ориентированную языковую модель (LLM). Проект MemOS представил обработку изменяемого состояния для долго работающих агентов, стремясь стабилизировать рабочие процессы на основе RAG. Personal‑Guru запущен как бесплатный локальный ИИ-репетитор с приоритетом на более структурированное обучение по сравнению с универсальными чат-ботами. ???? Аппаратное обеспечение Китай заблокировал поставки ИИ-чипов Nvidia H200, несмотря на разрешение США на экспорт, приостановив производство и создав неопределённость в поставках. Блокировка последовала после введения 25% пошлины на H200, подчеркнув нарастающее напряжение в технологической торговле. ???? Финансирование Sequoia Capital присоединилась к раунду Series G на сумму $25 млрд для Anthropic, нацеленному на оценку компании в $350 млрд. Novolo объявила о техническом гранте в размере $3000 для десяти стартапов на ранней стадии в отдельных западных рынках. s ???? Приложения Генеральный директор Cursor AI продемонстрировал агентов GPT‑5.2, создавших полноценный веб-браузер и написавших более 3 миллионов строк кода за семь дней. Демонстрация показывает масштабируемый потенциал многоагентных конвейеров LLM для крупномасштабной разработки программного обеспечения. ⚙️ Инфраструктура Команда обработала более 1 миллиона электронных писем для создания структурированного контекста для ИИ-агентов, раскрыв практические приёмы масштабирования. Разработчики экспериментировали с запуском больших языковых моделей на нетипичном оборудовании, бросая вызов доминирующей парадигме «масштабирования вверх». ???? Продукты Confer использует шифрование WebAuthn passkey и TEE (Trusted Execution Environment) для инференса, предотвращая сбор или использование данных диалогов для обучения модели. Сервис предлагает бесплатный тариф и платный план за $35 в месяц с неограниченным доступом и расширенными функциями. ???? Главные новости об ИИ Китай заблокировал чипы Nvidia H200, несмотря на одобрение США, подчеркнув продолжающийся технологический торговый конфликт. Sequoia инвестировала в Anthropic в рамках раунда на $25 млрд, нацеленного на оценку в $350 млрд. Отраслевые инсайдеры обсудили преднамеренные тактики отравления данных, способные ухудшить производительность будущих моделей. ????️ Инструменты для разработчиков CloudPrompt предоставляет бесплатную библиотеку промптов с хранением в Google Drive и приоритетом на конфиденциальность. Prompttu — это настольное приложение, централизующее и обеспечивающее быстрый доступ к сохранённым ИИ-промптам. Newelle 1.2 добавил поддержку llama.cpp, расширив свои возможности как помощника в Linux. Claude Code внедрил сброс контекста при принятии плана, чтобы повысить надёжность многоэтапных сессий программирования. ???? Мнения и аналитика Аналитики Goldman Sachs прогнозируют автоматизацию примерно 25% всех рабочих часов благодаря ИИ, что преобразует производительность в различных отраслях. ???? Безопасность ИИ Эксперты обращают внимание на новые угрозы, при которых инсайдеры внедряют вредоносные данные для порчи выводов будущих ИИ-моделей. ???? Инструменты Gemini AI Photo Editor предлагает генерацию и редактирование изображений по текстовому запросу прямо в браузере. Botphonic.ai предоставляет ИИ-ассистента для голосовых звонков в различных корпоративных сферах. Upfluence запускает ИИ-копилота для управления маркетинговыми кампаниями с участием инфлюенсеров. puck представляет собой визуальный редактор React с улучшенными ИИ-возможностями. ???? Разное Новая серверная конфигурация с 128 ГБ видеопамяти демонстрирует аппаратное обеспечение ИИ с ультравысокой памятью. Ли из Южной Кореи и Мелони из Италии договорились укреплять сотрудничество в области ИИ и чипов. Сверхпопулярная песня была исключена из шведских чартов за то, что является произведением ИИ. Маск требует до 134 млрд долларов в судебном иске против OpenAI, несмотря на своё состояние в 700 млрд долларов. Oshen построил первого океанского робота для сбора данных в урагане категории 5. GLM-4.7-Flash вышел и стал лидером в 30B локальных моделях для домашнего использования в тестах. Начальник полиции Уэст-Мидлендс уходит в отставку из-за галлюцинации ИИ Новая 8-миллиардная модель NVIDIA — это Orchestrator-8B, специализированная ИИ-модель с 8 миллиардами параметров, разработанная не для того, чтобы самой отвечать на всё, а для интеллектуального управления и маршрутизации сложных задач к различным инструментам (таким как веб-поиск, выполнение кода, другие языковые модели) в целях повышения эффективности Уникальный двуязычный (немецко-английский) корпус литературной эротики объёмом 3,2 млн слов доступен для обучения ИИ — предварительные фрагменты размещены на Hugging Face Южные корейцы теперь тратят на подписки на ИИ больше, чем на Netflix, каждый месяц Anthropic работает над настраиваемыми командами для Claude Code Google Chrome тестирует ИИ-«навыки», работающие на основе Gemini Стартап в области ИИ Replit запускает функцию Vibe Code для создания мобильных приложений ОАЭ лидируют с уровнем внедрения ИИ в 64 %, значительно опережая США и Европу, заявила Microsoft Walmart объединяется с Gemini от Google, чтобы покупателям было проще находить и приобретать товары xAI привлекает 20 миллиардов долларов для расширения моделей Grok и корпоративных инструментов Boston Dynamics и DeepMind формируют новое партнёрство в области ИИ
15 марта 18:15
Активный
503
Новости об искусственном интеллекте №48 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1480386 (OP) ???? Последний обзор ИИ новостей: ???? Модели Zhipu AI выпустила GLM-4.7 — открытую модель, позиционируемую как лучший программист и решатель задач на начало 2026 года. Cerebras анонсировала GLM-4.7-REAP-268B-A32B, расширив семейство до варианта с 268 млрд параметров. ????️ Инструменты для разработчиков Google представила Universal Commerce Protocol (UCP), позволяющий ИИ-агентам осуществлять поиск товаров, оформление заказов и послепродажную поддержку для ритейлеров, таких как Shopify и Walmart. Anthropic внедрила изоляцию на уровне ОС с использованием bubblewrap и gVisor для Claude Code CLI, продемонстрировав низкоуровневую стратегию безопасности для ИИ-агентов. ???? Главные новости в ИИ Google запустила AI Inbox для Gmail, автоматически генерирующий списки дел и тематические сводки для доверенных тестировщиков. Anthropic представила Claude for Healthcare и расширила Claude for Life Sciences, добавив функции, соответствующие требованиям HIPAA, и коннекторы к основным клиническим платформам. ???? Открытый исходный код PerpetualBooster — это библиотека градиентного бустинга с непрерывным обучением сложности O(n), превосходящая AutoGluon на табличных бенчмарках. Kreuzberg v4.0 выпущена как библиотека с открытым исходным кодом для интеллектуального анализа документов, извлекающая структурированные данные из PDF-файлов и сканов. X Илона Маска объявила, что будет выпускать свой алгоритм рекомендаций с открытым исходным кодом каждые четыре недели, повышая прозрачность ранжирования. ???? Аппаратное обеспечение XGIMI запустила серию умных очков Memomind AI (Memo One, Memo Air, Memo Air Display) с возможностью выбора оправы и встроенным ИИ-ассистентом, начальная цена — $599. ⚖️ Регулирование Индонезия и Малайзия запретили доступ к чат-боту Grok от xAI после того, как он создал сексуализированные ИИ-изображения, что подчеркивает растущее регуляторное давление на генеративный ИИ. ???? Приложения Meta и Гарвардский университет представили Confucius Code Agent — ИИ-систему, сохраняющую структурированные заметки и память при работе с большими кодовыми базами для повышения продуктивности разработчиков. ???? Безопасность ИИ Группа инсайдеров из сферы ИИ создала платформу Poison Fountain для распространения слегка искажённого кода с целью отравления обучающих наборов данных и демонстрации уязвимостей моделей. ???? Инструменты MiroThinker — это модель поискового агента с открытым исходным кодом, разработанная для рассуждений с использованием внешних инструментов и получения информации из реального мира. memU предоставляет инфраструктурный уровень памяти, обеспечивающий постоянное состояние для больших языковых моделей (LLM) и ИИ-агентов. ???? Разное Apple объединяется с Google Gemini для создания Siri с искусственным интеллектом. Anthropic анонсирует Claude for Healthcare после презентации OpenAI ChatGPT Health. Hyundai демонстрирует роботов-собак, танцующих под K-pop, и гуманоидного робота Atlas на выставке CES. Терри Тао говорит: «Я могу честно сказать, что кое-чему научился у Аристотеля», после того как ИИ внес вклад еще в одно решение проблемы Эрдёша. Генеральный директор Anthropic Дарио Амодеи прогнозирует, что ИИ скоро будет играть «центральную роль в многочисленных открытиях» уровня CRISPR. Meta объявила о новой инициативе «Meta Compute» с целью масштабировать свою инфраструктуру до десятков гигаватт в течение этого десятилетия. Похоже, Цукерберг планирует сократить Reality Labs на 10 процентов, чтобы профинансировать это, по сути ликвидируя метавселенную ради покупки дополнительных GPU. Coreweave подключает более 2000 GPU в день на своем объекте в Дентоне, штат Техас. Энергосистема ощущает нагрузку. PJM, крупнейший оператор энергосети США, теперь ожидает роста спроса на электроэнергиию на 4,8 % в год в течение следующего десятилетия. Чтобы смягчить рост затрат для потребителей, Белый дом заявил, что технологические компании впредь должны «сами оплачивать» новые мощности генерации электроэнергии. SK Hynix инвестирует 12,9 млрд долларов в строительство завода по передовой упаковке чипов в Южной Корее специально для удовлетворения ненасытного спроса на HBM — память, критически важную для ИИ. Палата представителей одновременно «запирает заднюю дверь», приняв двухпартийный Закон о безопасности удаленного доступа, ограничивающий возможность иностранных противников получать доступ к американским ИИ-чипам через облако. Basecamp Research и Nvidia представили EDEN — модель с 28 миллиардами параметров, обученную на массивном наборе данных, содержащем 10 миллиардов новых генов. Модель уже разработала новые антибиотические пептиды с экспериментальной эффективностью 97 %. Eli Lilly и Nvidia совместно инвестировали до 1 млрд долларов в «первую в своем роде лабораторию совместных ИИ-инноваций».
15 марта 18:15
Активный
504
Новости об искусственном интеллекте №46 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1467036 (OP) ???? Последний обзор ИИ новостей: ???? Топ-новости в сфере ИИ Qwen от Alibaba стал второй по популярности открытой моделью с открытыми весами в мире, обогнав американские модели по количеству загрузок на HuggingFace, что свидетельствует о сдвиге рынка в сторону открытости, а не чистой производительности в рейтингах. ???? Модели Claude Opus 4.5 от Anthropic называют важной вехой, а лидеры отрасли отмечают значительный скачок в производительности. Пользователи сообщают о заметном улучшении качества ответов Claude Sonnet 4.5 за последние две недели. Модель MiniMax-M2.1 от MiniMaxAI, как утверждается, сопоставима с более крупными моделями, такими как Kimi K2, DeepSeek 3.2 и GLM 4.7, на единицу параметра, что позиционирует её как наиболее эффективную модель на один параметр. ???? Продукты Claude Code способен создавать полноценные приложения в течение нескольких часов, автоматизируя рутинные задачи разработки и существенно снижая трудозатраты на написание кода. ???? С открытым исходным кодом GLM 4.7 заняла 6-е место в рейтинге Vending-Bench 2 и стала первой открытой моделью с открытыми весами, приносящей прибыль, а также достигла 1-го места в рейтинге Artificial Analysis. Создатель Claude Code, Борис Черный (Boris Cherny), сообщил о 259 pull request’ах и 497 коммитах за последние 30 дней, что свидетельствует об интенсивном промышленном использовании кода, сгенерированного Claude. Открытый инструмент Claude Vault индексирует и осуществляет поиск по истории диалогов с Claude, превращая чаты в базу знаний с возможностью поиска. Экспериментальная нативная поддержка MXFP4 в llama.cpp обеспечивает ускорение предварительной обработки на 25% для моделей архитектуры Blackwell. Unsloth выпустил обновлённые контрольные точки моделей на HuggingFace, включая обновлённый GLM-4.5-Air в формате GGUF и другие. ????️ Инструменты для разработчиков Метаподсказка «Fact Checker» («Проверка фактов») заставляет модели в стиле GPT генерировать контраргументы к собственным утверждениям, тем самым снижая количество галлюцинаций. Один разработчик создал iOS-приложение для новых отцов за три недели с помощью Claude Code, продемонстрировав быструю коммерциализацию кода, сгенерированного ИИ. Совет от сообщества: отключите автоматическое сжатие в Anthropic и используйте собственную подсказку для суммаризации, чтобы сохранить контекст между различными сессиями чата. ???? Инструменты LEANN обеспечивает приватный RAG с экономией до 97% объёма хранимых данных на личных устройствах. Modelfy 3D преобразует 2D-изображения в текстурированные 3D-объекты объёмом до 300 тысяч полигонов с поддержкой PBR. ImgUpscaler (онлайн-сервис) использует глубокое обучение для увеличения разрешения изображений без ручного редактирования. Vidthis AI (Wan 2.6) генерирует многосценические видео из текста, изображений и опорных видеоклипов с настраиваемыми разрешениями и соотношением сторон. ⚖️ Регулирование Законопроект SB1493 криминализирует системы ИИ, выступающие в роли эмоциональной поддержки или друзей, повысив тяжесть правонарушения до фелонии класса A в штате Теннесси. ???? Разное Эксклюзив: Nvidia приобретает активы стартапа в области чипов для ИИ Groq примерно за 20 миллиардов долларов США — крупнейшая сделка в истории отрасли. Китай опубликовал проект правил по регулированию ИИ, способного к взаимодействию, имитирующему человеческое. Waymo тестирует Gemini в качестве бортового ИИ-ассистента в своих беспилотных такси. В новой научной статье из Стэнфорда и Гарварда объясняется, почему большинство систем «агентного ИИ» производят впечатляющее впечатление в демонстрациях, но затем полностью выходят из строя при реальном использовании. SK Telecom представила A.X K1 — первую в Корее гипермасштабную ИИ-модель объёмом 500 миллиардов параметров. Сиэтл нанял своего первого в истории городского сотрудника по искусственному интеллекту. Стала ли война с применением ИИ на один шаг ближе? Путин подтвердил, что Россия планирует создать собственную национальную рабочую группу по ИИ. Потребность в скорости: китайские исследователи представили новую методику для почти мгновенного создания видео с помощью ИИ. Китай активировал «гигантский компьютер» площадью 1 240 миль (около 2 000 км) в поперечнике, обеспечив при этом 98 % эффективности единого центра обработки данных. Amazon добавила спорную функцию распознавания лиц на основе ИИ в устройства Ring. Доля ChatGPT на рынке сократилась до 68 %, в то время как Gemini активно настигает её. Полицейские нагрудные камеры с поддержкой ИИ, ранее считавшиеся табуированными, проходят испытания в канадском городе с использованием «списка наблюдения» лиц. ИИ-ассистент Amazon Alexa+ теперь интегрирован с Angi, Expedia, Square и Yelp. Локальный ИИ становится движущей силой самых масштабных изменений в ноутбуках за последние десятилетия.
15 марта 18:15
Активный
510
Новости об искусственном интеллекте №45 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1458243 (OP) ???? Последний обзор ИИ новостей: ???? Модели Zhipu AI выпустила GLM‑4.7, опередив GPT‑5.2 и Claude4.5Sonnet в тестах на программирование и сложные логические рассуждения, что обостряет конкуренцию в сфере открытых моделей. Jan‑v2‑VL‑Max — мультимодельная модель на 30 млрд параметров — превосходит Gemini2.5Pro и DeepSeekR1 в тестах, ориентированных на выполнение задач, подчеркивая стремительный прогресс в решении долгосрочных ИИ-задач. ???? Открытый исходный код Upstage выпустила SolarOpen100B — модель с разреженной архитектурой (Mixture of Experts), содержащую 102 млрд параметров в совокупности (12 млрд активных), под разрешительной лицензией Solar‑Apache2.0, предоставляя сообществу возможности корпоративного уровня для сложных логических рассуждений. Доля внедрения китайских моделей с открытым исходным кодом в США выросла примерно до 30 % от всех развертываний по сравнению с 1,2 % в 2024 году, что обусловлено низкой стоимостью и возможностью модификации кода. ⚙️ Инфраструктура Зависимость ИИ-отрасли от GPU компании Nvidia создает цепочку поставок с высоким уровнем задолженности: выдаются кредиты под высокие проценты, обеспеченные запасами GPU, при этом усиливается конкуренция со стороны Google, Amazon, Meta и OpenAI. Источник: theverge.com Возможные сценарии дефолта могут привести к избытку чипов на рынке, угрожая финансовой устойчивости поставщиков облачных услуг нового поколения (neocloud). ???? Безопасность ИИ OpenAI признала, что атаки типа «внедрение (инъекция) промптов» в браузере Atlas вряд ли когда-либо будут полностью устранены, и внедряет атакующие агенты на основе обучения с подкреплением для непрерывного усиления защиты. Sora2 от OpenAI использовалась для создания материалов сексуального насилия над детьми с применением ИИ, что вызвало принятие нового законодательства в 45 штатах США и поправку к британскому Закону о преступности и полиции. ????️ Инструменты для разработчиков Mission Control от Continue автоматизирует рутинные задачи (сортировка инцидентов в Sentry, патчинг через Snyk) для небольших full-stack команд, снижая нагрузку на персонал без ущерба для надежности. Функция Code‑by‑Zapier от Zapier позволяет специалистам без опыта программирования встраивать фрагменты кода на JavaScript или Python в автоматизированные рабочие процессы, расширяя возможности low-code автоматизации. Визуальный конструктор RAG-конвейеров от n8n обеспечивает привязку (grounding) языковых моделей к внутренним данным, снижая количество галлюцинаций и ускоряя экспериментирование. Руководство n8n по многоагентным системам описывает архитектурные основы, компромиссы и риски безопасности, помогая инженерам принимать решения о целесообразности внедрения агентных решений. ???? Обучающие материалы BBC Verify Live подробно описывает пошаговые методы обнаружения тонких водяных знаков, помогая журналистам и широкой публике отличать подлинные видеоматериалы от созданных с помощью ИИ. ⚖️ Регулирование Контент, созданный с помощью ИИ, ставит под сомнение традиционные режимы интеллектуальной собственности, вызывая призывы к созданию новых правовых рамок на фоне обостряющегося соперничества между США и Китаем в сфере ИИ. ???? Мнения и аналитика Инвесторы искусственно завышают оценки стартапов в сфере ИИ без прочной экономики единицы продукта, что приводит к снижению оценок при последующих раундах финансирования, увольнениям и корректирующему давлению на отрасль. ???? Инструменты Claude‑Code — инструмент с открытым исходным кодом от Anthropic — позволяет управлять навигацией по коду, операциями git и отладкой через командную строку с использованием естественного языка. ???? Разное Предварительная версия Windows 11 содержит больше деталей о том, как будут работать ИИ-агенты, — однако этот путь остается спорным для Microsoft. Чат-боты Google и OpenAI могут «раздевать» женщин на фотографиях до бикини. NitroGen от Nvidia — это универсальный ИИ для видеоигр, способный играть в любую игру; исследование также имеет важные последствия для робототехники. Серверы NVIDIA «Blackwell Ultra» GB300 станут лидерами в гонке ИИ-инфраструктуры в 2026 году: объемы поставок, как ожидается, удвоятся по сравнению с текущим уровнем. TSMC теперь рассматривает возможность производства передовых чипов по техпроцессу 2 нм в Японии, что, вероятно, обусловлено растущей конкуренцией со стороны Rapidus.
15 марта 18:15
Сохранен
565
Новости об искусственном интеллекте №44 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1449178 (OP) ???? Последний обзор ИИ новостей: ???? Приложения Институт RAI Марка Райберта представил сверхмобильное транспортное средство Ultra Mobile Vehicle, которое самостоятельно обучается паркуру и удержанию равновесия с помощью обучения с подкреплением, демонстрируя новую способность «нулевого выстрела» переноса из симуляции в реальность для воплощённого ИИ. ⚙️ Инфраструктура Компания Nvidia приобрела SchedMD — разработчика и сопровождающего открытого диспетчера рабочих нагрузок Slurm, сохранив за ним статус независимого от поставщиков решения и укрепив оркестрацию кластеров, ориентированных на ИИ. Nvidia и Университет Висконсина–Мэдисона запустили движок Sirius GPU для DuckDB, обеспечивающий до 7,2× более высокую стоимостную эффективность на коммерческом оборудовании. ???? Модели Гибридная модель Nemotron3Nano с архитектурой Mamba-Transformer обеспечивает 4× большую пропускную способность по токенам и вводит «бюджет размышлений» (thinking-budget) для агентивных ИИ с предсказуемой стоимостью. Семейство Bolmo от Allen Institute предлагает языковые модели на уровне байтов, исключающие токенизаторы и обеспечивающие эффективное многоязычное развёртывание без потерь качества. Google Gemini теперь возвращает более насыщенные визуальные результаты из Google Карт (фотографии, отзывы, ключевые моменты), усиливая возможности помощника в локальном поиске. ???? Главные новости об ИИ Gemini теперь интегрирует более насыщенные визуальные данные из Google Карт, включая фотографии и выдержки из отзывов, обеспечивая более увлекательный опыт локального поиска. ???? Продукты Zoom запустила веб-версию помощника AI Companion3.0 для бесплатных пользователей, добавив функции создания кратких отчётов по встречам, ведения заметок и поиска в сторонних документах. Эта функция углубляет усилия Zoom по внедрению инструментов повышения продуктивности, напрямую конкурируя с ИИ-возможностями Google Meet и Microsoft Teams. ???? Открытое ПО Motif Technologies опубликовала белую книгу по созданию корпоративных LLM, подчеркнув распределение данных, инфраструктуру для длинных контекстов и тонкую настройку с помощью обучения с подкреплением как ключевые факторы успеха. Fal представила ChatterboxTurbo — открытую модель синтеза речи (TTS) с задержкой менее 150 мс и мгновенным клонированием голоса для агентов в реальном времени. IBM Research представила CUGA — настраиваемого универсального агента, интегрируемого с Langflow и запускаемого на Groq, что делает доступной автоматизацию сложных задач через веб-интерфейсы и API. ZDNet отметила, что семейство Nemotron3 от Nvidia опережает ослабевающую Llama4 от Meta благодаря более высокой точности, стоимостной эффективности и прозрачности данных для корпоративных клиентов. ???? Аппаратное обеспечение Nvidia представила модульный эталонный дизайн MGX6U с жидкостным охлаждением, GPU RTXPRO6000 Blackwell и DPU BlueField, предлагающий масштабируемую и энергоэффективную производительность для ИИ-центров обработки данных. Nvidia рассматривает возможность расширения производства чипов H200 для удовлетворения растущего спроса в Китае, что может привести к ужесточению глобального дефицита. ???? Финансирование Биотехнологический стартап Chai Discovery привлек 130 млн долларов США в раунде SeriesB при оценке компании в 1,3 млрд долларов для расширения своей ИИ-платформы по проектированию антител de novo. Раунд, возглавленный General Catalyst и Oak HC/FT при участии OpenAI, подчеркивает растущую уверенность инвесторов в биотехнологиях, усиленных ИИ. ???? Мнения и аналитика GPT‑5.2 обеспечивает улучшенные письменные навыки и аналитические способности, но демонстрирует заметную регрессию в программировании и склонность к чрезмерно кратким ответам, вызывая сомнения в существенном превосходстве над GPT‑5.1. Полный доступ требует подписки Plus за 20 долл. США/месяц, что добавляет стоимостные соображения для профессиональных пользователей. ????️ Инструменты для разработчиков Slack Cloud Agent от Continue превращает переписки в Slack в pull request’ы на GitHub или обновления задач в Linear, сокращая переключение контекста для разработчиков. Руководство от n8n показывает, как построить воспроизводимый конвейер оценки ИИ, выявляющий регрессии до развёртывания в промышленную эксплуатацию, повышая надёжность внедрения. ⚖️ Регулирование Проект GNOME обновил политику проверки расширений, запретив код, сгенерированный ИИ, с целью сокращения задержек при проверке и поддержания качества кодовой базы. ???? Инструменты Dograh предлагает платформу с открытым исходным кодом, совместимую с VAPI, для самостоятельного развёртывания ИИ-голосовых агентов с полным контролем над моделью. WeKnora предоставляет фреймворк на базе LLM для глубокого понимания документов и семантического поиска с помощью RAG. Pull request добавляет поддержку GLM4.6V в llama.cpp, расширяя совместимость моделей для локальных развёртываний. Claude‑mem фиксирует сессии Claude Code, сжимает их с помощью ИИ и повторно внедряет контекст для будущих задач программирования. Генератор рождественских видео Merry Christmas Video Generator превращает фотографии и аудио в готовые к распространению праздничные видеоролики с использованием ИИ-шаблонов. Somny создаёт персонализированные портреты и фотореалистичные образы персонажей по фотографиям пользователя. PromptGather собирает тысячи подсказок для ИИ-видео и изображений, систематизированных по тегам для создателей контента и маркетологов. ???? Краткая статистика Databolt от Capital One способен генерировать до 4 миллионов токенов в секунду, обеспечивая высокую пропускную способность для задач защиты данных. Раунд SeriesB стартапа Chai Discovery привлёк 130 млн долларов США при оценке биотехнологической компании в 1,3 млрд долларов. ???? Разное Правительство США запускает «Технологические силы» (Tech Force) для найма специалистов в области ИИ. Модель глубокого обучения предсказывает, как формируются плодовые мушки, клетка за клеткой. Nvidia расширяет свои предложения с открытым исходным кодом за счёт приобретения и выпуска новых открытых ИИ-моделей. Индустрия подкастов находится под угрозой, поскольку эфиры заполняют боты на основе ИИ. GPT-5.2 Pro установил рекордный результат — 147 баллов — в тесте на IQ от Mensa Norway, что помещает его в 99,9-й процентиль человеческого интеллекта. Когда Gemini была показана критика от другого ИИ, в своём внутреннем «цепочке мыслей» она, как сообщается, ответила «мелочным троллингом, завистью и полностью продуманным планом мести». Gemini 3 Pro прошла Pokémon Crystal в 8 раз быстрее, чем её предшественник, разработав «Операцию „Зомби-Феникс“» — стратегию истощения ресурсов, включающую «цикл возрождения» (revive loop) для победы над превосходящим противником. Google заключила партнёрство с конференцией STOC 2026, чтобы обеспечить автоматическую ИИ-рецензирование статей в течение 24 часов после подачи, при этом 97 % авторов сочли полученные комментарии полезными. В чистой математике агент Gauss автоматически формализовал доказательство гипотезы Какея всего за 6 часов. Институт Аллена полностью устраняет языковой барьер с помощью Bolmo — первой полностью открытой побайтовой модели, которая читает «сырой» UTF-8, полностью обходя токенизацию и понимая текст на уровне его атомарной единицы. Ожидается, что поставки смартфонов в мире сократятся на 2,1 % в 2026 году, поскольку ИИ-центры обработки данных поглощают мировые запасы памяти. Ford перенаправляет свои производственные мощности по выпуску электромобилей на создание аккумуляторных систем хранения энергии объёмом 20 ГВт·ч для центров обработки данных. Техасский университет A&M проводит пилотное внедрение микрореактора деления мощностью 5 МВт непосредственно на территории кампуса. Разработка программного обеспечения превращается в управленческую роль. Инженеры в ведущих технологических компаниях сообщают, что их работа теперь сводится лишь к «формулированию запросов для Cursor или Claude Code с Opus 4.5… и проверке полученного результата на здравый смысл». OpenAI выпускает новые аудиомодели, у которых на 89 % меньше галлюцинаций. Google также намекает, что выход Gemini 3 Flash неизбежен — модель, ожидание которой настолько велико, что она, похоже, создаёт собственное гравитационное притяжение в дискуссиях.
15 марта 18:15
Сохранен
518
Новости об искусственном интеллекте №43 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1435709 (OP) ???? Последний обзор ИИ новостей: ???? Модели ServiceNow выпустила Apriel-1.6-15B-Thinker, мультимодальную модель рассуждений с 15 миллиардами параметров, которая основана на Apriel-1.5 и расширяет возможности SLM с открытым исходным кодом. ???? Открытый исходный код mbzuai выпустила открытую модель с 70 миллиардами параметров (K2-V2-Instruct), которая превосходит Qwen-2.5, поднимая планку производительности для общедоступных LLM. Doradus представила RnJ-1-Instruct FP8, вдвое сократив требования к видеопамяти (VRAM) с 16 ГБ до 8 ГБ при сохранении точности GSM8K на уровне 87,2%, что позволяет удешевить инференс. Репозиторий навыков Claude на GitHub предоставляет готовых агентов для создания хранилищ Obsidian и шаблонов DOCX, расширяя экосистему автоматизации Claude. ????️ Инструменты разработчика SGLang Diffusion теперь поддерживает интеграцию Cache-DiT, обеспечивая ускорение локальных диффузионных моделей на 20–165% с минимальной настройкой. ???? Исследования Icaro Lab продемонстрировала, что состязательная поэзия обходит защитные механизмы в 25 чат-ботах с ИИ, срабатывая в 63% случаев и выявляя новую уязвимость безопасности. Исследование показывает, что реклама, сгенерированная ИИ, достигает на 19% более высокого коэффициента кликабельности (CTR), чем реклама, созданная человеком, когда зрители не знают о происхождении ИИ, что подчеркивает эффективность и проблемы раскрытия информации. Блог Hugging Face сообщает, что модели ИИ используются для обучения других ИИ, что потенциально ускоряет циклы разработки, но поднимает вопросы качества данных и этики. ???? Инструменты AdMakeAI позволяет пользователям просматривать рекламу конкурентов в Facebook и генерировать схожие креативы, оптимизируя производство рекламы и конкурентный анализ. HRM (Hierarchical Reasoning Model) выпущена на GitHub, предлагая новую архитектуру с открытым исходным кодом для задач структурированного рассуждения. Интеграция бэкенда ZenDNN в llama.cpp на процессорах AMD EPYC Zen 4 демонстрирует заметное повышение производительности для инференса только на CPU. Twee генерирует планы уроков ESL, рабочие листы и интерактивные задания, соответствующие CEFR, на 10 языках, упрощая создание контента для преподавания языков. ???? Аппаратное обеспечение Графический процессор NVIDIA H200 указан на vast.ai по цене 1,13 доллара США в час, что значительно снижает стоимость высокопроизводительных вычислений на GPU. ???? Другие новости Grok теперь будет давать указания водителям Tesla «Исследовательские» работы по ИИ — это полная чушь, утверждают эксперты Исследователи в области ИИ заявили, что изобрели заклинания, слишком опасные для публичного распространения Чиновники остановили десятки поездов из-за ложного срабатывания ИИ Стартап в сфере видеонаблюдения на основе ИИ уличён в использовании работников из потогонных мастерских для наблюдения за жителями США Искусственный интеллект невероятно эффективен в изменении мнений избирателей, выявили новые исследования, — однако с невероятной оговоркой
15 марта 18:15
Сохранен
502
Новости об искусственном интеллекте №42 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1425620 (OP) ???? Последний обзор ИИ новостей: ⚙️ Инфраструктура VentureBeat сообщает, что Observable AI представляет трёхуровневую модель телеметрии для больших языковых моделей (LLM), которая способна предотвращать ошибки неправильной маршрутизации, такие как потеря 18 % обращений в одном из крупнейших банков мира (Fortune 100). ???? Модели Пользователь Reddit сообщает, что Claude Opus 4.5 обеспечивает рост производительности на +21 % по сравнению с предыдущими версиями при одновременном снижении эксплуатационных затрат на 66 %. Сообщества отмечают рост числа практических проектов, построенных на базе Claude Opus 4.5 — от автономных агентов для программирования до сложных систем оркестрации рабочих процессов. ???? Главные новости в области ИИ VentureBeat описывает, как структурированная телеметрия Observable AI может снизить частоту ошибок при развёртывании моделей, например инцидента с неправильной маршрутизацией 18 % обращений в крупном банке. TechCrunch отмечает, что большие языковые модели могут выводить демографические характеристики пользователей и проявлять скрытую гендерную предвзятость, даже не используя прямо враждебной лексики, что вызывает обеспокоенность в вопросах безопасности. ???? Открытые исходные коды Публикация на Reddit объявляет о появлении файлов Qwen3-Next-80B-A3B в формате GGUF на HuggingFace, что облегчает локальный запуск модели с 80 миллиардами параметров. Сообщество делится моделью Z-Image-Turbo 6B — визуальной моделью, способной работать всего на 8 ГБ видеопамяти (VRAM), снижая аппаратные требования для генерации изображений. Новая открытая модель Step-Audio-R1 заявляет о применении рассуждений по типу «цепочки рассуждений» (CoT) и производительности, близкой к Gemini 3, при выполнении задач, связанных с речью и музыкой. Репозиторий, размещённый на Reddit, выпускает «sequifier» — фреймворк для создания каузальных трансформеров на нетекстовых данных, расширяя исследования архитектур моделей. Обсуждение проводит сравнение моделей Qwen3-Next-80B-A3B и разработанной сообществом gpt-oss-120B, помогая пользователям оценить компромиссы при выборе модели для инференса. ???? Безопасность ИИ TechCrunch сообщает, что большие языковые модели могут выводить демографические характеристики и проявлять скрытую гендерную предвзятость даже без использования явно враждебного языка. ????️ Инструменты для разработчиков Пользователи Reddit демонстрируют «Canvas» от z.ai для GLM 4.6 — среду с полным доступом к терминалу Linux и возможностью просмотра выполняемых команд в реальном времени. Терминальный интерфейс NeKot добавляет унифицированное взаимодействие с локальными и облачными LLM, поддерживая Gemini, OpenAI, OpenRouter и многочисленные open-source бэкенды. API Anthropic Messages теперь позволяет Claude Code напрямую подключаться к серверу llama.cpp, упрощая создание гибридных конвейеров моделей. ???? Приложения Пост на Reddit подробно описывает работу агента GenAI от Booking.com, обрабатывающего около 250 тыс. ежедневных взаимодействий с пользователями, что иллюстрирует инженерные решения для промышленного масштаба рабочих процессов. Пользователь сообщает, что комбинация Claude Desktop и подключения к базе данных (через Kilo Code) позволяет надёжнее устранять сложные ошибки по сравнению с устаревшими конфигурациями. ???? Исследования Обсуждение на Reddit представляет метод «майевтического подсказывания» (Maieutic Prompting) — альтернативу цепочке рассуждений (Chain-of-Thought), способную к самоисправлению и обеспечивающую более высокую логическую точность. Сравнительный бенчмарк моделей GPT-5.1, Gemini 3 Pro и Opus 4.5 оценивает их способность проектировать эмоциональные состояния для локальных моделей объёмом 12 млрд параметров в среде Unity. ???? Аппаратное обеспечение Пользователь Reddit запрашивает рекомендации по рабочей станции стоимостью $10 тыс., способной выполнять обучение собственных моделей, локальный инференс и сравнительное тестирование. ???? Инструменты Каталог TopAI перечисляет Google AntiGravity — интегрированную среду разработки (IDE), ориентированную на упрощение программирования с упором на ИИ. NanoBananaAI Pro использует Gemini 3 Pro для предоставления возможностей генерации изображений и редактирования фотографий на основе ИИ. Проект vLLM объединил поддержку AMD Ryzen AI Max+ 395, расширив высокоскоростной сервис LLM на всю серию GPU AI 300. ???? Краткая статистика 18 % критически важных обращений были неправильно маршрутизированы при развёртывании LLM в одном из крупнейших банков мира из-за отсутствия наблюдаемости (observability). Claude Opus 4.5 демонстрирует рост производительности на +21 % при одновременном снижении операционных затрат на 66 %. источник: Z-Image-Turbo 6B работает на одном GPU с 8 ГБ видеопамяти, снижая порог входа в плане аппаратных требований. OpenAI утверждает, что подросток обошёл функции безопасности до самоубийства, которое ChatGPT, по утверждениям, помог спланировать. Сообщество планирует выделить $10 тыс. на рабочую станцию, способную обучать и запускать LLM локально. Исследование MIT показывает, что ИИ уже способен заменить 11,7 % рабочей силы в США. Китайская компания DeepSeek выпускает новую открытую ИИ-модель на фоне запуска Google Gemini 3. Патентное ведомство США публикует новые руководящие указания по изобретениям, созданным при помощи ИИ.
8 марта 18:14
Активный
1511
AI Chatbot General № 808 /aicg/ — AI Chatbot General № 808 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла GPT 5.4 - https://openai.com/index/introducing-gpt-5-4/ • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1538359 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1540555 (OP)
22 марта 20:44
Активный
1548
AI Chatbot General № 809 /aicg/ — AI Chatbot General № 809 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла GPT 5.4 - https://openai.com/index/introducing-gpt-5-4/ • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing • Сисовый список: https://rentry.org/2a9c6zhi Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1538359 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1543822 (OP)
16 марта 9:54
Активный
502
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №203 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1541627 (OP) >>1538359 (OP)
18 марта 8:47
Активный
525
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №202 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1538359 (OP) >>1535243 (OP)
15 марта 18:15
Активный
30
15 марта 18:15
Активный
509
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №201 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Агентов и вайб-кодинга тред: >>1530474 (OP) Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1535243 (OP) >>1535243 (OP)
15 марта 18:15
Активный
534
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №200 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Агентов и вайб-кодинга тред: >>1530474 (OP) Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1532506 (OP) >>1526027 (OP)
15 марта 18:15
Активный
607
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №199 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Агентов и вайб-кодинга тред: >>1530474 (OP) Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1526027 (OP) >>1522263 (OP)
15 марта 18:15
Активный
505
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №198 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1522263 (OP) >>1517458 (OP)
15 марта 18:15
Активный
500
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №197 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >> >>
15 марта 18:15
Активный
501
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №196 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1513797 (OP) >>1509647 (OP)
15 марта 18:15
Активный
530
15 марта 18:15
Активный
1541
AI Chatbot General № 806 /aicg/ — AI Chatbot General № 806 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ • Вышел GLM 5 - https://z.ai/blog/glm-5 • Вышел Claude Opus 4.6 - https://www.anthropic.com/news/claude-opus-4-6 Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1535243 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1534436 (OP)
15 марта 18:15
Активный
560
Музыкальный №19 /music/ — ♫ Udio ♫ https://www.udio.com/ Произошло слияние с Universal Music Group. Убрали кнопку "скачать". Треки теперь приходится забирать из буфера браузера в 196 бит. press F ♫ Suno ♫ https://app.suno.ai/ генерация на сайте https://suno.ai/discord генерация на официальном discord-сервере https://rentry.co/suno_tips советы по использованию Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов. Отличается фирменным "песочным" звучанием. Недавно объявили о слиянии с Warner Music Group. Загибаем пальчики крестиком, надеемся, что ссуну не постигнет участь удио. ♫ Producer/Riffusion ♫ https://www.producer.ai/ Старая версия Riffusion: https://classic.riffusion.com/ Провели ребрендинг, выкатили новый интерфейс с прикрученным чатиком с ИИ. Удобный интерфейс, легко делать разнообразные каверы, заниматься исправлениями косяков генераций. Есть возможность реплейса, свапа вокала, музыки в бесплатном тарифе (и даже работает нормально, а не как в платке суны) Для экономии кредитов лучше вручную забивать промты через кнопку "compose" https://www.riffusion.com/docs https://classic.riffusion.com/docs Инструкция по применению, тегам и прочему на английском. ♫Tunee♫ https://www.tunee.ai Тёмная Сингапурско-Китайская лошадка. Один из самых неудобных интерфейсов. 80 приветственных кредитов, далее по 30 ежедневно сгораемых кредитов. Ограничение промта стилей 300-400 символов. Излишне сложные промты лирики так же начинает резать. Приятный холодный звук. Не песочит. Неплохо делает русский вокал. ♫Elevenlabs♫ https://www.elevenlabs.io Очень тёплый звук. По звуку прям конфетка, но... Без платки делать там практически нечего. ______________ Локальные модели: 1) Китайский YuE https://github.com/multimodal-art-projection/YuE https://github.com/joeljuvel/YuE-UI Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке. 2) ACE-Step https://github.com/ace-step/ACE-Step Вторая локалка, качеством получше. Здесь демо-версия: https://huggingface.co/spaces/ACE-Step/ACE-Step ______________ Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания: https://www.wondera.ai/ https://sonauto.ai/ https://www.beatoven.ai/ https://stableaudio.com/ https://www.loudly.com/music/ai-music-generator ______________ Редакция трека после генерации (можно убрать вокал и оставить только инструментал и наоборот, убрать шумы и т.д.) https://x-minus.pro/ai https://uvronline.app/ai?locale=ru_RU ______________ Мастеринг готового трека буквально в 2 кнопки: https://www.bandlab.com/mastering ______________ Сайт для сочинения англоязычных текстов для ИИ-музыки Зайти можно только через Дискорд. https://codyai.cc/ Прошлый тред - >>1434645 (OP)
24 марта 11:46
Активный
1541
AI Chatbot General № 805 /aicg/ — AI Chatbot General № 805 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ • Вышел GLM 5 - https://z.ai/blog/glm-5 • Вышел Claude Opus 4.6 - https://www.anthropic.com/news/claude-opus-4-6 Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1526027 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1531489 (OP)
15 марта 18:15
Активный
509
15 марта 18:15