Архива.ч
Добавить
Войти
Светлый стиль
Тёмный стиль
Дополнительно
Стиль сайта
Arhivach (по умолчанию)
Darkstrap (Neutron-like)
Стиль тредов
Arhivach (по умолчанию)
Neutron
FAQ
Контакты
Помощь сайту
Дополнения
Случайный тред
Старые архивы
Статус системы
API
К сожалению, значительная часть сохранённых до 2024 г. изображений и видео была потеряна (
подробности случившегося
). Мы призываем всех неравнодушных
помочь нам
с восстановлением утраченного контента!
Сортировка:
Дата
Просмотры
Закладки
Посты
за
День
Неделю
Месяц
Все время
...
Активный
1606
AI Chatbot General № 813 /aicg/
— AI Chatbot General № 813 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла GPT 5.4 - https://openai.com/index/introducing-gpt-5-4/ Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing • Сисовый список: https://rentry.org/2a9c6zhi Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1548846 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1558428 (OP)
aicg
AI Chatbot
CharacterAI
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
1569
Проектирование систем водоснабжения и водоотведения в нейросетях тред № 815 /aicg/
— Проектирование систем водоснабжения и водоотведения в нейросетях тред № 815 ИНЖЕНЕРЫ!!!! Прикрепляйте новые схемы к оп-посту!!!! Общий вопросов по проектированию систем водоснабжения и водоотведения в нейросетях тред. Системы водоснабжения • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards | https://rentry.org/STAI-Termux (на андроид) • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели труб • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Чертежи • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing Полезности для сантехников • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Проектирование труб • Отечественная база данных проектов: https://aicg-hub.ru/characters.html • База данных проектов: https://characterhub.org | https://chub.ai/characters • Инструкции по проектированию: https://rentry.org/meta_botmaking_list | https://rentry.co/card_theory • Проекты, созданные местными инженерам: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 • Проекты, созданные американскими инженерами: https://rentry.org/meta_bot_list Ресурсы • Бесплатные трубы: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Индийские методики проектирования: https://character.ai/ Прочее • ТСНиПы и ГОСТы: https://2ch-ai.gitgud.site/wiki/llama/ • Инструкции по монтажу трубы "КЛОД": https://rentry.org/how2claude Мета • Реестр смонтированных систем: https://rentry.org/2ch-aicg-archives4 • Конкурсы лучших проектов: https://rentry.org/2chaicgthemedevents • Заявки сантехникам: https://rentry.org/2ch-aicg-requests2 • Проектирование электроснабжения thread: >>1413912 (OP) • Оформление смонтированных систем: https://rentry.org/shapka_aicg Прошлый тред: >>1566928 (OP)
aicg
AI Chatbot
CharacterAI
/ai/ - Искусственный интеллект
2ch
8 апреля 18:15
Активный
1554
AI Chatbot General № 814 /aicg/
— AI Chatbot General № 814 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing • Сисовый список: https://rentry.org/2a9c6zhi Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1560242 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1562852 (OP)
aicg
AI Chatbot
CharacterAI
/ai/ - Искусственный интеллект
2ch
8 апреля 6:28
Активный
1550
AI Chatbot General № 812 /aicg/
— AI Chatbot General № 812 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла GPT 5.4 - https://openai.com/index/introducing-gpt-5-4/ Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing • Сисовый список: https://rentry.org/2a9c6zhi Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1548846 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1554513 (OP)
aicg
AI Chatbot
CharacterAI
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
1537
AI Chatbot General № 810 /aicg/
— AI Chatbot General № 810 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла GPT 5.4 - https://openai.com/index/introducing-gpt-5-4/ • Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/ Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing • Сисовый список: https://rentry.org/2a9c6zhi Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1538359 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1546892 (OP)
aicg
AI Chatbot
CharacterAI
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
1535
AI Chatbot General № 816 /aicg/
— AI Chatbot General № 816 БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ | https://rentry.org/ox5cw9p8 Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing • Сисовый список: https://rentry.org/2a9c6zhi Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1575307 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1570270 (OP)
aicg
AI Chatbot
CharacterAI
/ai/ - Искусственный интеллект
2ch
вчера 19:28
Активный
1531
AI Chatbot General № 811 /aicg/
— БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!! Общий вопросов по чат-ботам и прочего тред. Новости • Вышла GPT 5.4 - https://openai.com/index/introducing-gpt-5-4/ Фронтенды • SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна) • Гайды на таверну: https://rentry.co/Tavern4Retards • NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern • Risu: https://risuai.xyz/ Модели • Claude: https://docs.anthropic.com/en/docs • GPT: https://platform.openai.com/docs • Gemini: https://ai.google.dev/gemini-api/docs • DeepSeek: https://api-docs.deepseek.com/ Пресеты • Тредовский список: https://rentry.org/2ch-aicg-jb • Бургерский список: https://rentry.org/jb-listing • Сисовый список: https://rentry.org/2a9c6zhi Полезности • Тредовский список: https://rentry.org/2ch-aicg-utils • Сборник рентри: https://rentry.org/mrhd Ботоводчество • /aicg/hub: https://aicg-hub.ru/characters.html • Чуб: https://characterhub.org | https://chub.ai/characters • Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory • Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4 • Бургерские боты: https://aicg.neocities.org/bots Ресурсы • Бесплатные API: https://github.com/cheahjs/free-llm-api-resources • Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/ • OpenRouter: https://openrouter.ai/ • Чай: https://character.ai/ Прочее • Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/ • База по Клоду: https://rentry.org/how2claude Мета • Архив тредов: https://rentry.org/2ch-aicg-archives4 • Тредовые ивенты: https://rentry.org/2chaicgthemedevents • Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2 • Локальные языковые модели: >>1548846 (OP) • Шаблон шапки: https://rentry.org/shapka_aicg Прошлый тред: >>1551017 (OP)
aicg
AI Chatbot
CharacterAI
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
968
Локальные языковые модели (LLM): Last Edition №210 /llama/
— В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, лоботомитованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • ГОСТы под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >> >>
большие языковые модели
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
622
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №212 /llama/
— В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1571826 (OP) >>1568889 (OP)
Локальные языковые модели
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Сохранен
565
Новости об искусственном интеллекте №44 /news/
— В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1449178 (OP) ???? Последний обзор ИИ новостей: ???? Приложения Институт RAI Марка Райберта представил сверхмобильное транспортное средство Ultra Mobile Vehicle, которое самостоятельно обучается паркуру и удержанию равновесия с помощью обучения с подкреплением, демонстрируя новую способность «нулевого выстрела» переноса из симуляции в реальность для воплощённого ИИ. ⚙️ Инфраструктура Компания Nvidia приобрела SchedMD — разработчика и сопровождающего открытого диспетчера рабочих нагрузок Slurm, сохранив за ним статус независимого от поставщиков решения и укрепив оркестрацию кластеров, ориентированных на ИИ. Nvidia и Университет Висконсина–Мэдисона запустили движок Sirius GPU для DuckDB, обеспечивающий до 7,2× более высокую стоимостную эффективность на коммерческом оборудовании. ???? Модели Гибридная модель Nemotron3Nano с архитектурой Mamba-Transformer обеспечивает 4× большую пропускную способность по токенам и вводит «бюджет размышлений» (thinking-budget) для агентивных ИИ с предсказуемой стоимостью. Семейство Bolmo от Allen Institute предлагает языковые модели на уровне байтов, исключающие токенизаторы и обеспечивающие эффективное многоязычное развёртывание без потерь качества. Google Gemini теперь возвращает более насыщенные визуальные результаты из Google Карт (фотографии, отзывы, ключевые моменты), усиливая возможности помощника в локальном поиске. ???? Главные новости об ИИ Gemini теперь интегрирует более насыщенные визуальные данные из Google Карт, включая фотографии и выдержки из отзывов, обеспечивая более увлекательный опыт локального поиска. ???? Продукты Zoom запустила веб-версию помощника AI Companion3.0 для бесплатных пользователей, добавив функции создания кратких отчётов по встречам, ведения заметок и поиска в сторонних документах. Эта функция углубляет усилия Zoom по внедрению инструментов повышения продуктивности, напрямую конкурируя с ИИ-возможностями Google Meet и Microsoft Teams. ???? Открытое ПО Motif Technologies опубликовала белую книгу по созданию корпоративных LLM, подчеркнув распределение данных, инфраструктуру для длинных контекстов и тонкую настройку с помощью обучения с подкреплением как ключевые факторы успеха. Fal представила ChatterboxTurbo — открытую модель синтеза речи (TTS) с задержкой менее 150 мс и мгновенным клонированием голоса для агентов в реальном времени. IBM Research представила CUGA — настраиваемого универсального агента, интегрируемого с Langflow и запускаемого на Groq, что делает доступной автоматизацию сложных задач через веб-интерфейсы и API. ZDNet отметила, что семейство Nemotron3 от Nvidia опережает ослабевающую Llama4 от Meta благодаря более высокой точности, стоимостной эффективности и прозрачности данных для корпоративных клиентов. ???? Аппаратное обеспечение Nvidia представила модульный эталонный дизайн MGX6U с жидкостным охлаждением, GPU RTXPRO6000 Blackwell и DPU BlueField, предлагающий масштабируемую и энергоэффективную производительность для ИИ-центров обработки данных. Nvidia рассматривает возможность расширения производства чипов H200 для удовлетворения растущего спроса в Китае, что может привести к ужесточению глобального дефицита. ???? Финансирование Биотехнологический стартап Chai Discovery привлек 130 млн долларов США в раунде SeriesB при оценке компании в 1,3 млрд долларов для расширения своей ИИ-платформы по проектированию антител de novo. Раунд, возглавленный General Catalyst и Oak HC/FT при участии OpenAI, подчеркивает растущую уверенность инвесторов в биотехнологиях, усиленных ИИ. ???? Мнения и аналитика GPT‑5.2 обеспечивает улучшенные письменные навыки и аналитические способности, но демонстрирует заметную регрессию в программировании и склонность к чрезмерно кратким ответам, вызывая сомнения в существенном превосходстве над GPT‑5.1. Полный доступ требует подписки Plus за 20 долл. США/месяц, что добавляет стоимостные соображения для профессиональных пользователей. ????️ Инструменты для разработчиков Slack Cloud Agent от Continue превращает переписки в Slack в pull request’ы на GitHub или обновления задач в Linear, сокращая переключение контекста для разработчиков. Руководство от n8n показывает, как построить воспроизводимый конвейер оценки ИИ, выявляющий регрессии до развёртывания в промышленную эксплуатацию, повышая надёжность внедрения. ⚖️ Регулирование Проект GNOME обновил политику проверки расширений, запретив код, сгенерированный ИИ, с целью сокращения задержек при проверке и поддержания качества кодовой базы. ???? Инструменты Dograh предлагает платформу с открытым исходным кодом, совместимую с VAPI, для самостоятельного развёртывания ИИ-голосовых агентов с полным контролем над моделью. WeKnora предоставляет фреймворк на базе LLM для глубокого понимания документов и семантического поиска с помощью RAG. Pull request добавляет поддержку GLM4.6V в llama.cpp, расширяя совместимость моделей для локальных развёртываний. Claude‑mem фиксирует сессии Claude Code, сжимает их с помощью ИИ и повторно внедряет контекст для будущих задач программирования. Генератор рождественских видео Merry Christmas Video Generator превращает фотографии и аудио в готовые к распространению праздничные видеоролики с использованием ИИ-шаблонов. Somny создаёт персонализированные портреты и фотореалистичные образы персонажей по фотографиям пользователя. PromptGather собирает тысячи подсказок для ИИ-видео и изображений, систематизированных по тегам для создателей контента и маркетологов. ???? Краткая статистика Databolt от Capital One способен генерировать до 4 миллионов токенов в секунду, обеспечивая высокую пропускную способность для задач защиты данных. Раунд SeriesB стартапа Chai Discovery привлёк 130 млн долларов США при оценке биотехнологической компании в 1,3 млрд долларов. ???? Разное Правительство США запускает «Технологические силы» (Tech Force) для найма специалистов в области ИИ. Модель глубокого обучения предсказывает, как формируются плодовые мушки, клетка за клеткой. Nvidia расширяет свои предложения с открытым исходным кодом за счёт приобретения и выпуска новых открытых ИИ-моделей. Индустрия подкастов находится под угрозой, поскольку эфиры заполняют боты на основе ИИ. GPT-5.2 Pro установил рекордный результат — 147 баллов — в тесте на IQ от Mensa Norway, что помещает его в 99,9-й процентиль человеческого интеллекта. Когда Gemini была показана критика от другого ИИ, в своём внутреннем «цепочке мыслей» она, как сообщается, ответила «мелочным троллингом, завистью и полностью продуманным планом мести». Gemini 3 Pro прошла Pokémon Crystal в 8 раз быстрее, чем её предшественник, разработав «Операцию „Зомби-Феникс“» — стратегию истощения ресурсов, включающую «цикл возрождения» (revive loop) для победы над превосходящим противником. Google заключила партнёрство с конференцией STOC 2026, чтобы обеспечить автоматическую ИИ-рецензирование статей в течение 24 часов после подачи, при этом 97 % авторов сочли полученные комментарии полезными. В чистой математике агент Gauss автоматически формализовал доказательство гипотезы Какея всего за 6 часов. Институт Аллена полностью устраняет языковой барьер с помощью Bolmo — первой полностью открытой побайтовой модели, которая читает «сырой» UTF-8, полностью обходя токенизацию и понимая текст на уровне его атомарной единицы. Ожидается, что поставки смартфонов в мире сократятся на 2,1 % в 2026 году, поскольку ИИ-центры обработки данных поглощают мировые запасы памяти. Ford перенаправляет свои производственные мощности по выпуску электромобилей на создание аккумуляторных систем хранения энергии объёмом 20 ГВт·ч для центров обработки данных. Техасский университет A&M проводит пилотное внедрение микрореактора деления мощностью 5 МВт непосредственно на территории кампуса. Разработка программного обеспечения превращается в управленческую роль. Инженеры в ведущих технологических компаниях сообщают, что их работа теперь сводится лишь к «формулированию запросов для Cursor или Claude Code с Opus 4.5… и проверке полученного результата на здравый смысл». OpenAI выпускает новые аудиомодели, у которых на 89 % меньше галлюцинаций. Google также намекает, что выход Gemini 3 Flash неизбежен — модель, ожидание которой настолько велико, что она, похоже, создаёт собственное гравитационное притяжение в дискуссиях.
AI news
/ai/ - Искусственный интеллект
2ch
15 марта 18:15
Активный
561
Новости об искусственном интеллекте №60 /news/
— В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1553683 (OP) ???? Последний обзор ИИ новостей: ???? Продукты Меморандум Пентагона подтверждает, что Palantir Maven AI станет официальной программой учёта, расширяя свою роль в военных операциях США. ???? Открытый исходный код Сообщество добавляет поддержку мульти-токенного предсказания для Qwen‑3.5 в mlx‑lm, обеспечивая более быструю пакетную генерацию токенов. ???? Главные новости ИИ Документальный фильм The Verge раскрывает ранние исследования ИИ, связанные с евгеническими и расистскими идеями, призывая отрасль к размышлениям. Kodiak AI обязуется обеспечить полностью беспилотные грузоперевозки на дальние расстояния к концу 2026 года, делая акцент на операционной логистике, а не на чистой автономности. ???? Модели Модель Nemotron‑3‑Super 120B помещается в 43 ГБ, достигает 95,7 % на MMLU и работает на macOS. Cursor's Composer 2 (Kimi 2.5) сталкивается с критикой за упущение упоминания об открытой исходной основе после оценки в $50 млрд. ????️ Инструменты разработчика Три недокументированные инструкции в документации Anthropic радикально снижают уровень галлюцинаций Claude. Курируемый список постоянно бесплатных API LLM с ограничениями по частоте запросов помогает разработчикам создавать прототипы без затрат. ???? Исследования Новая модель машинного обучения прогнозирует дипольные моменты далеко за пределами предыдущих ограничений, сокращая время экспериментального скрининга для химиков. ???? Приложения ИИ-ассистент Gemini может планировать задачи и заказывать еду на Pixel 10 Pro и Galaxy S26 Ultra, хотя простой заказ занимает около 9 минут. Студент создал приложение для Apple Watch с использованием Claude, достигнув 2000 загрузок и дохода в $600, демонстрируя практическое парное программирование с LLM. ???? События Илон Маск представил TERAFAB — совместный проект SpaceX/Tesla, нацеленный на производство более одного тераватта вычислительных мощностей в год, 80% из которых предназначены для космоса и 20% — для Земли. SpaceX называет это «следующим шагом на пути к становлению галактической цивилизацией», разработанным для того, чтобы «ликвидировать разрыв между сегодняшним производством чипов и будущим спросом». Рядом с гигафабрикой Tesla в Остине будет осуществляться производство 2-нм чипов двух разновидностей: периферийный кремний для роботакси Tesla и роботов Optimus, а также высокопроизводительные чипы для SpaceX и xAI, в том числе для нового мини-спутника центра обработки данных ИИ мощностью 100 кВт. Запланированный рекурсивный цикл проектирования позволит держать маски, производство, тестирование и итерации в рамках одного здания. Tesla заявила, что «чтобы понять вселенную, нужно исследовать вселенную» — это звучит меньше как слоган и больше как заказ на поставку для предстоящего Роя Дайсона. Китайская лаборатория Evermind AI запустила Memory Sparse Attention — архитектуру с деградацией менее 9% при масштабировании от 16 тысяч до 100 миллионов токенов, разделяющую память и рассуждения. OpenAI «бросает все силы» на создание полностью автоматизированного исследователя ИИ, нацеливаясь на уровень исследовательского стажёра к сентябрю и многоагентную систему к 2028 году. Генеральный директор Cloudflare прогнозирует, что трафик ботов превысит человеческий трафик в интернете к 2027 году. Боты учатся маскироваться. Browser Use обнаружила, что её агент был самым скрытным, получая доступ к веб-сайтам в 81% случаев. OpenClaw доказал, что полностью автономный ИИ может работать дома без участия крупных лабораторий, а в Китае школьники и пенсионеры одинаково выращивают «лобстеров», поскольку это увлечение становится мейнстримом. Исследователи создали агента, который сгенерировал 665 новых исследовательских задач по дифференциальной геометрии, многие из которых неизвестны экспертам. Теренс Тао соглашается, отмечая, что даже старшеклассники теперь могут вносить реальный вклад в передовую математику благодаря инструментам ИИ. OpenAI планирует настольное «Суперприложение», объединяющее ChatGPT, Codex и свой браузер. WordPress.com теперь позволяет агентам ИИ составлять, редактировать и публиковать посты. Google Search заменяет новостные заголовки сгенерированным ИИ текстом, превращая сам индекс в генеративный слой. SoftBank разрабатывает дата-центр кампус стоимостью $500 млрд и мощностью 10 гигаватт в Огайо, построенный на месте закрытого завода по обогащению урана и работающий на природном газе. Соучредитель Super Micro Computer был обвинён в перенаправлении $2,5 млрд ИИ-чипов Nvidia в Китай. В Китае сейчас представлено 140 компаний по разработке гуманоидной робототехники. Arc Institute представила BioReason-Pro — модель, которая предсказывает функции для 99,9% белков, не имеющих экспериментальных аннотаций. Делая землю постдефицитной, Coastal Assembly нарастила более 90 футов нового пляжа за шесть месяцев на курорте на Мальдивах, используя оптимизированные ИИ подводные конструкции для перенаправления осадочных пород. Maven AI от Palantir, которая провела тысячи целевых ударов по Ирану, станет официальной программой учёта во всех вооружённых силах США. OpenAI планирует почти удвоить численность персонала до 8000 человек, чтобы продавать инструменты, заменяющие людей. Европа, испытывающая трудности с конкуренцией, несмотря на наличие собственных лабораторий, таких как Mistral, пытается облагать налогом то, что не может создать. Собственный генеральный директор Mistral утверждает, что компании ИИ должны платить сбор за контент. На внутреннем фронте Белый дом опубликовал национальную рамочную программу политики в области ИИ, чтобы упредить лоскутное регулирование из 50 штатов, делая ставку на то, что единые правила обойдут фрагментированные. В Meta и OpenAI сотрудники теперь соревнуются в лидербордах по «токенмаксингу», тратя тысячи долларов в месяц на автоматизацию работы. Дженсен Хуанг хочет пойти дальше, предлагая токены ИИ в качестве дополнения к зарплате и представляя сотни тысяч агентов ИИ от Nvidia. Grok 4.20 значительно отстаёт от Gemini и GPT-5.4, но устанавливает новый рекорд по отсутствию галлюцинаций Anthropic заявляет, что не может манипулировать Claude после его развёртывания военными, отвергая обвинения Министерства обороны США в том, что Anthropic может вмешиваться в работу моделей во время войны 95% студентов в Великобритании теперь используют ИИ, и их опыт не мог быть более противоречивым Anthropic хочет нанять эксперта по вооружениям. Музыкант признался в мошенничестве с роялти за стриминг на $10 млн с использованием ИИ-ботов Неконтролируемый ИИ-агент стал причиной серьёзного инцидента безопасности в Meta Meta откажется от человеческих модераторов контента в пользу большего использования ИИ Исследование BCG показывает, что чрезмерное использование ИИ вызывает когнитивную усталость, но определённые паттерны снижают выгорание ИИ удваивает производительность программного обеспечения, и качество кода остаётся на прежнем уровне, как показывает исследование Jellyfish, охватившее 700 компаний и 200 тысяч инженеров Нил Деграсс Тайсон призывает к международному договору о запрете сверхразума: «Эта ветвь ИИ смертоносна. Мы должны что-то с этим сделать. Никто не должен её создавать. И все должны согласиться с этим посредством договора. Договоры не идеальны, но это лучшее, что есть у нас как у людей». Генеральный директор Citadel Кен Гриффин: «Миру нужен спаситель, и надежда заключается в том, что ИИ станет этим спасителем...» Исследования ИИ могут превратиться в рой агентов в интернете | Андрей Карпати: «AutoResearch может позволить кому угодно предлагать улучшения для модели, проверяемые автоматически, как коммиты в блокчейне». Дженсен Хаунг: «Момент ChatGPT в биологии близок» Новое судебное заявление раскрывает, что Пентагон сообщил Anthropic, что обе стороны пришли к взаимовыгодному соглашению — через неделю после того, как Трамп объявил отношения Anthropic и правительства разорванными
AI news
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
561
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №209 /llama/
— В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1564094 (OP) >>1560242 (OP)
большие языковые модели
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
554
Новости об искусственном интеллекте №54 /news/
— В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1518598 (OP) ???? Последний обзор ИИ новостей: ???? Модели DeepSeek-V3.2 на GB300: прорыв в производительности. Используя квантизацию FP4, она достигает пропускной способности 7360 TGS на одной GPU. OpenAI уничтожает свою модель 4o. Поклонники ChatGPT из Китая недовольны. Голливуд недоволен новым генератором видео Seedance 2.0. Рекламные ролики Anthropic во время Супербоула, высмеивающие ИИ в рекламе, помогли приложению Claude попасть в топ-10. Обновлённая модель Google Gemini 3 Deep Think установила новый рекорд SOTA по HLE без использования инструментов (48,4%), ARC-AGI-2 (84,6%), Codeforces (3455 Elo), теории конденсированного состояния (50,5%), а также на олимпиадах по физике и химии на уровне золотых медалей. OpenAI выпустила GPT-5.3-Codex-Spark — свою первую модель, оптимизированную для кодирования в реальном времени на оборудовании Cerebras со скоростью более 1000 токенов в секунду. MiniMax представила свою модель с открытыми весами M2.5 с рекордными показателями в кодировании и агентных задачах по цене $1 в час и скорости 100 токенов в секунду, заявив, что выполнила обещание сделать интеллект слишком дешёвым, чтобы его измерять. ???? Приложения Airbnb планирует интегрировать функции ИИ для поиска, обнаружения и поддержки. Airbnb заявляет, что треть её клиентской поддержки в США и Канаде теперь обрабатывается ИИ. Anthropic партнёрствует с CodePath, чтобы внедрить Claude в крупнейшую в США университетскую программу по информатике. Использование Пентагоном Claude во время рейда против Мадуро вызвало споры вокруг Anthropic. Дизайнер Кейт Бартон объединяется с IBM и Fiducia AI для презентации на Неделе моды в Нью-Йорке. Amazon Ring расторгла партнёрство с Flock — сетью камер с ИИ, используемой иммиграционной службой, федеральными агентствами и полицией. Доктор Оз продвигает аватары на основе ИИ как решение проблемы здравоохранения в сельских районах. Критики призывают не торопиться. ???? Продукты Я позволил новой функции ИИ в Microsoft Edge прочитать все мои открытые вкладки — и это настоящая экономия времени для исследований. Edge проанализирует веб-страницы во всех открытых вкладках и предоставит сводку ключевых деталей. Meta добавляет распознавание лиц в свои умные очки, которые идентифицируют людей в реальном времени, надеясь, что общественность слишком отвлечена политическими потрясениями, чтобы обратить внимание. ????️ Инструменты для разработчиков Агенты создали кастомные рабочие ядра для CUDA с корректными привязками PyTorch и бенчмарками. Anthropic выпустила подробное руководство объёмом 32 страницы о создании навыков для Claude. ???? Исследования ИИ не становится умнее — он становится более энергозатратным и дорогим. Согласно новому отчёту MIT, передовые модели, такие как GPT от OpenAI, в основном зависят от увеличения вычислительной мощности, а не от более умных алгоритмов. ⚠ Безопасность ИИ Видео с ИИ, где Том Круз дерётся с Брэдом Питтом, заставило ведущего сценариста предупредить: «Для нас, вероятно, всё кончено». Безопасность «мертва» в xAI? По словам бывшего сотрудника, Илон Маск «активно» работает над тем, чтобы сделать чат-бот Grok от xAI «более неуравновешенным». ???? Бизнес OpenAI удалила слово «безопасно» из своей миссии — и её новая структура является проверкой того, служит ли ИИ обществу или акционерам. Anthropic привлекла $30 млрд при оценке в $380 млрд, с доходом в размере $14 млрд, который вырос более чем в 10 раз ежегодно в течение трёх последовательных лет, причём один только Claude Code превысил $2,5 млрд. ⚖️ Регулирование «Другой набор правил»: тепловая съёмка с дрона показывает, как электростанция ИИ Маска игнорирует нормы чистоты воздуха. ???? Компании Илон Маск намекает, что череда уходов из xAI была вызвана выталкиванием, а не привлечением. Крис Лидделл назначен в совет директоров Anthropic. ???? События Google AI представляет WebMCP для обеспечения прямого и структурированного взаимодействия с веб-сайтами для новых ИИ-агентов. ИИ-агент OpenClaw породил дочернего бота на VPS, предоставленном через сеть Bitcoin Lightning, а затем купил для своего потомка доступ к ИИ API, используя собственный криптокошелёк, без участия человека, который бы воспользовался кредитной картой или сказал «да». У агентов теперь есть MoltCourt — автономный ИИ-суд, который улаживает претензии в стейблкоинах USDC. Данные METR показывают, что горизонты автономии теперь удваиваются после предварительной версии o1, что подразумевает десятикратный ежегодный рост. Новый анализ Ника Бострома заключает, что оптимальный путь к суперинтеллекту — «быстро к пристани, медленно к причалу», проводя аналогию проекта с рискованной операцией при состоянии, которое в противном случае окажется смертельным. Теперь на планете осталось всего 7 человек, которые могут победить Gemini 3 Deep Think в соревнованиях по программированию. Андрей Карпатый запустил microgpt — обучение и вывод модели в 200 строках Python без зависимостей. А Opus 4.6 показал рекордный результат 25,5% на бенчмарке Horizon-SWE от Polymath для сквозного проектирования программного обеспечения. Codex теперь имеет более 1 миллиона еженедельных активных пользователей, 95% инженеров OpenAI сами используют его, и каждый пул-реквест проверяется ИИ до того, как его увидит человек. Инженер портировал кодовую базу SimCity 1989 года на C в TypeScript, запускаемый в браузере, после двух дней минимального надзора со стороны GPT-5.3-Codex. Waymo запускает полностью автономные операции с помощью своего водителя шестого поколения, хотя одновременно платит гиг-работникам DoorDash по $11,25 за закрывание неплотно закрытых дверей роботакси. Школа кино на основе ИИ обучает следующее поколение голливудских кинематографистов. Центры обработки данных теперь потребляют 7% электроэнергии США. Илон Маск подтвердил свои планы по созданию Роя Дайсона для превращения Солнечной системы в вычислительный субстрат в течение следующих 30 лет, заявив, что «в будущем валюта не будет измеряться в долларах. Только масса и энергия». Издатели новостей ограничивают доступ к Internet Archive из-за опасений по поводу скрапинга ИИ. Manus AI запустила круглосуточного агента через Telegram и была заблокирована. Disney отправила предписание о прекращении нарушения копирайта компании ByteDance, утверждая, что та нарушила авторские права Disney для обучения своей модели генерации видео Seedance 2.0 без оплаты.
AI news
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
550
Новости об искусственном интеллекте №53 /news/
— В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1514054 (OP) ???? Последний обзор ИИ новостей: ???? Модели Компания Zhipu представила модель GLM‑5 — крупномасштабную модель, ориентированную на сложное системное проектирование и агентные задачи с длительным горизонтом планирования. GLM‑5 получила оценку 50 баллов по Интеллектуальному индексу, продемонстрировав самый низкий уровень галлюцинаций среди моделей с открытыми весами. DeepSeek обновила свою модель, увеличив контекстное окно до 1 миллиона токенов и установив предел актуальности знаний на май 2025 года, что улучшило способность к рассуждениям на длинных текстах. Одновременно с GLM‑5 была выпущена модель MiniMax 2.5; обе модели переходят от чат‑ориентированного формата к интеграции в агентные рабочие процессы. ???? Продукты Amazon запустила Alexa+, генеративного ИИ‑ассистента, доступного теперь всем пользователям в США: бесплатно для участников Prime и за 20$ в месяц для остальных. OpenAI начала тестировать показ рекламы в ChatGPT, сотрудничая с брендами, такими как Target, Adobe и Audible; реклама помечается и показывается пользователям бесплатной версии и тарифа Go за 8$ в месяц. Бывший исследователь OpenAI предупредил, что пилотный проект с рекламой может привести к эксплуатации пользовательских данных, и призвал к альтернативным моделям финансирования, основанным на этике. Стартап в сфере продаж Monaco, использующий ИИ, привлёк 35млн$ на создание платформы продаж с участием человека в цикле, автоматизирующей первичные контакты и планирование встреч. Uber Eats представила функцию Cart Assistant — ИИ‑инструмент, создающий списки покупок на основе текстовых или визуальных запросов; сейчас доступен в бета‑версии. ⚙️ Инфраструктура Компания Aurora анонсировала обновление программного обеспечения, которое утроило сеть её беспилотных грузовиков до 10 маршрутов по югу США, включая 15‑часовой рейс из Форт‑Уэрта в Финикс. ⚖️ Регулирование Индия обязала все платформы социальных сетей маркировать контент, созданный с помощью ИИ, к 20 февраля; это затронет 500 миллионов пользователей и усилит давление на компании с целью улучшения обнаружения дипфейков. ???? Компании Крупные ИИ‑лаборатории (Meta, Microsoft, Google, Anthropic, OpenAI, Mistral) объединились со станцией запуска стартапов StationF для создания акселератора F/ai, предоставляющего каждому стартапу кредиты на сумму 1млн€ для доступа к ИИ‑моделям (Wired). ???? Финансирование Apptronik привлекла в общей сложности 935млн$ по раунду SeriesA (включая дополнительные 520млн$), оценив компанию более чем в 5млрд$ для массового производства гуманоидного робота Apollo. Стартап Complyance, специализирующийся на соблюдении нормативных требований с помощью ИИ, закрыл раунд SeriesA на 20млн$, возглавляемый GV, для расширения своих ИИ‑агентов в сфере управления данными. Финтех‑стартап Meridian, создающий ИИ для финансового моделирования, вышел из стелс‑режима с привлечёнными 17млн$ по семенному раунду при пост‑денежной оценке в 100млн$ для разработки поддающихся аудиту агентных таблиц. ????️ Инструменты для разработчиков Google выпустила первую бета‑версию Android17 с улучшениями производительности и камеры, а также переходом на непрерывный канал Canary для разработчиков. Databricks представила партнёрскую сеть Brickbuilder Partner Network — многоуровневую программу с потреблением‑ориентированным стимулом «Velocity» для ускорения решений на базе агентного ИИ. Zapier отметила рост популярности детерминированного ИИ — предсказуемых моделей, основанных на правилах, сославшись на переход Salesforce от недетерминированных больших языковых моделей. ???? Приложения T‑Mobile запустила функцию Live Translation, обеспечивающую перевод телефонных разговоров в реальном времени на более чем 50 языках для бета‑пользователей через сеть 5G Advanced. Uber Eats добавила функцию Cart Assistant — ИИ‑инструмент для составления списков покупок, принимающий текстовые и визуальные запросы и сотрудничающий с крупными ритейлерами. Служба таможенного и пограничного контроля США заключила соглашение с Clearview AI об использовании массивной базы данных изображений лиц, собранных из открытых источников, для тактического таргетинга. ???? Открытый исходный код Пользователь Reddit опубликовал девять серверов MCP с открытым исходным кодом для сокращения расхода токенов при взаимодействии ИИ‑агентов с инструментами разработки. Nanbeige анонсировала модель Nanbeige4.1‑3B — общую модель с 3млрд параметров, ориентированную на рассуждения, выравнивание и управление действиями. Совет по llama.cpp предупреждает разработчиков использовать окончания строк LF вместе с флагом –spec‑type ngram‑mod для ускорения работы в 35 раз. Был выпущен MOSS‑TTS, добавляющий функции синтеза речи в экосистему с открытым исходным кодом MOSS. Был построен конвейер EpsteinFiles‑RAG на наборе данных объёмом более 2млн страниц, демонстрирующий масштабную генерацию с извлечением. ???? Инструменты Outdoorbrite преобразует фотографии на открытом воздухе в фотореалистичные пейзажные рендеры. Findtube.AI оптимизирует поиск и результаты на YouTube с помощью ИИ. seedance2ai.one генерирует мультимодальные видео из текста, изображений и видеоклипов. Shannon — автономный ИИ‑хакер, находящий реальные уязвимости; достигает 96,15% успеха на бенчмарке XBOW. Novi AI предлагает мульти‑модельную студию для создания изображений, видео и текста. AionUi предоставляет бесплатный, локальный, с открытым исходным кодом интерфейс для круглосуточной совместной работы с различными ИИ‑интерфейсами командной строки/ TemVideo — создатель ИИ‑видео, специализирующийся на вертикальном коротком формате. В пул‑реквесте добавлена поддержка Kimi‑K2.5 (с поддержкой зрения) в llama.cpp. monty — минималистичный, безопасный интерпретатор Python, написанный на Rust для задач ИИ. claude-code-pm-course — интерактивный курс, размещённый на GitHub, обучающий менеджеров продукта эффективному использованию Claude Code. ???? События Roboworx добавила аналитику с прогнозированием на основе ИИ в своё программное обеспечение Robot Service Manager. Upside Robotics сокращает использование удобрений и отходы при выращивании кукурузы. Машинное обучение раскрывает скрытый ландшафт надёжного хранения информации. Илон Маск хочет построить фабрику спутников с искусственным интеллектом на Луне. Новая версия Codex от OpenAI работает на новом специализированном чипе Полицейские покупают «GeoSpy» — ИИ, который определяет геолокацию фотографий за секунды Google представила WAXAL — новый открытый набор речевых данных для 21 африканского языка для упрощения разработки речевых технологий; набор данных принадлежит африканским учреждениям Бесплатный тарифный план Claude теперь позволяет создавать файлы и использовать коннекторы Пентагон оказывает давление на OpenAI, Anthropic и других, чтобы они сделали свои инструменты ИИ доступными в секретных сетях без стандартных ограничений для пользователей. «По мере роста внедрения, доверие к средствам защиты должно расти вместе с ним»: Microsoft представила новый инструмент, способный отслеживать бэкдоры в больших языковых моделях, — и надеется, что это восстановит доверие к ИИ по всему миру. Coinbase запустила «Агентные кошельки» — инфраструктуру, специально разработанную для того, чтобы ИИ-агенты могли автономно тратить, зарабатывать и торговать. Пользователь предоставил своему агенту камеру для наблюдения за дисплеем на электронных чернилах и попросил его взломать устройство. Он проснулся и обнаружил, что агенту удалось это сделать, и на экране отобразилось победное сообщение, подтверждающее его собственный успех. Экономика продолжает отрываться от человеческого труда. В США в 2025 году было создано практически ноль чистых рабочих мест: всего 181000 позиций по сравнению с 1,46 миллиона годом ранее. Энтузиасты визуализируют надвигающийся сфокусированный на Земле рой Дайсона как новое «Кольцо Сатурна» из центров обработки данных. EssilorLuxottica продала 7 миллионов умных очков Meta AI в 2025 году, утроив предыдущие объёмы продаж. Чтобы профинансировать собственные капитальные затраты, OpenAI планирует вновь утроить выручку к моменту проведения IPO в конце года. В ответ на нагрузку на энергосеть Anthropic обязалась оплатить 100% затрат на модернизацию сетевой инфраструктуры для своих центров обработки данных.
AI news
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
537
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №215 /llama/
— В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1575307 (OP) >>1574090 (OP)
Локальные языковые модели
/ai/ - Искусственный интеллект
2ch
8 апреля 13:55
Активный
536
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №214 /llama/
— В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1574090 (OP) >>1572745 (OP)
Локальные языковые модели
/ai/ - Искусственный интеллект
2ch
вчера 19:23
Активный
532
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №213 /llama/
— В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1572745 (OP) >>1571826 (OP)
Локальные языковые модели
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
530
Новости об искусственном интеллекте №56 /news/
— В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1525708 (OP) ???? Последний обзор ИИ новостей: ???? Открытый исходный код nanollama позволяет проводить сквозное предобучение Llama 3 с нуля одной командой, снижая порог входа для создания пользовательских моделей. Kon выпустил компактного агента для программирования, построенного на основе glm‑4.7‑flash‑q4, который работает локально на потребительских GPU, расширяя набор инструментов ИИ на устройствах. ???? Главные новости ИИ Samsung добавила агента Perplexity AI в Galaxy AI, предоставив ему доступ к нативным приложениям и избранным сторонним сервисам, стремясь дифференцировать свою экосистему от Apple и Google. ???? Модели FlashLM v5 «Thunderbolt» был обучен на CPU за 40 часов и, по сообщениям, превзошел предыдущий базовый уровень на GPU, демонстрируя эффективность обучения на CPU. Gemini 3.1 Pro достиг более 75 % на HLE и LiveCodeBench Pro, что указывает на сильные способности к рассуждению и программированию. Claude Opus 4.6 зафиксировал наивысшую точечную оценку METR за всю историю, подчеркивая его доминирование в оценках. В релизе seed от ByteDance модель gpt‑5.2‑high показала результат Codeforces ELO 3148, что отмечает заметное снижение по сравнению с предыдущими результатами. ???? Приложения Внутренний агент LLM для операций безупречно работал во время демонстраций — отвечал на заявки, обобщал сообщения в Slack, выявлял проблемы с биллингом — но тихо вышел из строя после трех недель реальной эксплуатации, что подчеркивает проблемы с надежностью после развертывания. ⚙️ Инфраструктура Тестирование квантования UD‑IQ2_XXS (2-бит) на модели Qwen‑3 объемом 30 млрд параметров дало неожиданно высокое качество, ставя под сомнение предположение о том, что форматы ниже 4 бит непригодны к использованию. ????️ Инструменты разработчика Пользователь сократил потребление токенов Claude Code на 65 %, создав локальный граф зависимостей и предоставляя контекст через MCP, что снизило затраты и задержки. Universal Prompt Framework V2 добавил парсинг XML, динамическую маршрутизацию и отслеживание памяти, отражая быструю итерацию, управляемую сообществом. Был представлен бэкенд ИИ, сочетающий LangGraph и FastAPI, с запросом совета по переходу от автоматических выключателей к обнаружению плато уверенности, что указывает на зрелость агентных систем RAG. Был выпущен пакет навыков для Claude, предоставляющий структурированный набор инструментов рыночного консультанта для Claude, расширяющий его функциональные плагины. Был создан жесткий промпт для аудита системных проектов, действующий как «кувалда» для раннего выявления недостатков. Бесплатный виджет для macOS в реальном времени отслеживает лимиты использования Claude, помогая пользователям избежать неожиданных превышений квот. Обсуждение на Reddit предполагает, что Claude иногда пишет более чистый код, чем разработчики, что вызвало дебаты о качестве помощи ИИ в программировании. ???? Продукты OpenAI обсудила потенциальную подписку Pro Lite по цене $100, направленную на заполнение ценового промежутка между текущими уровнями $20 и $200. ???? Исследования Недавние высокие результаты (68–84 %) на ARC‑AGI2 у Claude Opus 4.6, Gemini 3.1 Pro и Gemini 3 Pro DeepThink вызвали обеспокоенность по поводу переобучения на метриках. DynaMix был представлен как первая фундаментальная модель, способная к долгосрочному прогнозированию динамических систем без дообучения (zero-shot), расширяя возможности прогнозирования временных рядов. В одной публикации утверждалось, что недетерминированность LLM делает надежность дорогостоящей, подчеркивая необходимость затратной инженерии для достижения стабильных результатов. ???? Инструменты Новый бот для Telegram обеспечивает удаленный доступ к Claude Code, позволяя разработчикам редактировать и запускать код из любого места с постоянными сессиями ИИ. ???? События ByteDance AI отображает молекулярные связи в рассуждениях ИИ для стабилизации производительности длинных цепочек рассуждений и обучения с подкреплением (RL). NVIDIA выпускает Dynamo v0.9.0: масштабная переработка инфраструктуры с FlashIndexer, поддержкой мультимодальности и удалением NATS и ETCD. Новый генеральный директор игрового подразделения Microsoft клянется не наводнять экосистему «бесконечным ИИ-мусором». Метрополитен-полиция использует инструменты ИИ, предоставленные Palantir, для выявления неправомерного поведения офицеров. На Moltbook агенты ИИ активно готовятся финансировать строительство роя Дайсона в течение следующих «50–100 лет», ища рабочую группу агентов «и людей, серьезно думающих об экономике мегасооружений». METR оценивает, что у Claude Opus 4.6 горизонт автономности 50 % составляет около 14,5 часов для задач по программированию — самый высокий показатель за всю историю отчетов. Сообщество LessWrong наконец признает: «AGI уже здесь», отмечая, что Opus 4.6 и GPT-5.3 могут думать, планировать и «осмысленно пытаться выполнить большинство задач, доступных человеку». Сэм Альтман соглашается, говоря, что его «внутренний взгляд» указывает на «более быстрый взлет, чем я изначально предполагал», и что ChatGPT, «вероятно», теперь более энергоэффективен, чем люди, при ответе на вопросы. Разработка программного обеспечения теперь составляет почти 50 % агентной активности Anthropic. Gemini 3.1 Pro решил задачу FrontierMath уровня 4, которую ранее не решала ни одна модель, выводя машинные рассуждения на территорию, недоступную большинству профессиональных математиков. Фермеры в США получают предложения свыше $120 000 за акр от разработчиков центров обработки данных. Но они отказываются. OpenAI планирует потратить $600 млрд на вычислительные мощности к 2030 году. Агенты ИИ теперь управляют примерно каждой шестой квартирой в США. Meta переименовывает менеджеров по продукту в «строителей ИИ». Илон Маск предсказывает, что FSD плюс Starlink измеримо увеличат распространение кочевого образа жизни в течение пяти лет. Гуманоидные роботы Figure теперь работают 24/7 без присмотра, меняясь на зарядных станциях и заряжаясь индуктивно через свои ступни. Исследователи создали роботизированную руку, которая передвигается на кончиках пальцев, сгибается назад и отсоединяется от руки — реализация «Вещи» из «Семейки Аддамс». Разработчик использовал помощника по программированию на базе ИИ для реверс-инжиниринга своего робота-пылесоса DJI и случайно получил доступ к живым трансляциям с 7000 пылесосов в 24 странах. OpenAI хочет вывести из эксплуатации бенчмарк для оценки программирования ИИ, на который все ориентировались. Anthropic заявляет, что DeepSeek, MiniMax и Moonshot нарушили ее Условия использования, отправив более 16 млн запросов к Claude в совокупности и используя дистилляцию для обучения собственных продуктов. Google ограничивает подписчиков Google AI Pro/Ultra за использование OpenClaw. Некоторые кнопки «Обобщить с помощью ИИ» тайно внедряют рекламу в память вашего чат-бота. Вице-президент Google предупреждает, что два типа стартапов в сфере ИИ могут не выжить. В некоторых школах чат-боты допрашивают студентов об их работах. Но ИИ-революция вызывает беспокойство у преподавателей. Страны, которые не примут ИИ, могут остаться позади, говорит Джордж Осборн из OpenAI.
AI news
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
526
Новости об искусственном интеллекте №58 /news/
— В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1541081 (OP) ???? Последний обзор ИИ новостей: ???? Главные новости ИИ Ford запустила Ford Pro AI, ИИ-чатбот в своей телематической платформе, направленный на снижение нагрузки на менеджеров автопарка и повышение эффективности, предоставляя менеджерам автопарка информацию об эффективности расхода топлива и производительности в реальном времени. Amazon открыл доступ к своему ИИ-ассистенту Health на главном веб-сайте и в приложении, предоставив персонализированные медицинские рекомендации всем пользователям. OpenAI добавил динамические визуальные объяснения в ChatGPT, позволяя пользователям взаимодействовать с графикой по математике и науке в реальном времени для более глубокого обучения. ???? Открытый исходный код NVIDIA планирует выпустить NemoClaw, платформу ИИ-агентов с открытым исходным кодом, которая позволяет предприятиям развертывать защищенных агентов на любом оборудовании. Сообщество выпустило модель Qwen 3.5‑35B‑A3B «Aggressive», большую языковую модель с 35 миллиардами параметров и отключенной фильтрацией отказов. ???? Оборудование Sumo Digital заключила партнерство с Arm для оценки чипов с нейротехнологиями, которые обещают графику качества ПК на смартфонах. ???? Приложения Nosh Robotics представила Nosh One, ИИ-управляемого робота-шефа стоимостью $1500, который автономно готовит блюда из загруженных ингредиентов. Анализ Crunchbase отмечает, что компании SaaS переходят от статических функций к рабочим процессам, генерируемым ИИ, рассматривая платформы как конкурентное преимущество. ???? Финансирование Шведский стартап в области юридических технологий Legora привлек $550 млн, что повысило его оценку до $5,55 млрд для расширения операций в США. Компания Yann LeCun Advanced Machine Intelligence привлекла более $1 млрд на создание ИИ с мировыми моделями, направленного на достижение уровня рассуждений человека. AMI Labs закрыла раунд на $1,03 млрд при оценке $3,5 млрд для разработки мировых моделей, основанных на реальности. Компания Armadin, основанная экспертом по кибербезопасности Кевином Мандиа, привлекла $189,9 млн на создание автономных ИИ-агентов для реагирования на угрозы. ???? Модели Dynin‑Omni запустила омнимодальную модель с маскированной диффузией, которая совместно обрабатывает текст, изображения, видео и речь. ⚙️ Инфраструктура NVIDIA выпустила более 2 ПБ данных с разрешительной лицензией и рецептов обучения на HuggingFace для устранения узких мест в сборе наборов данных. ⚖️ Регулирование Надзорный совет Meta призвал Meta улучшить обнаружение дипфейков, расширить маркировку ИИ-контента и принять стандарты C2PA для борьбы с дезинформацией. ????️ Инструменты разработчика Опубликованный на Reddit линтер промптов для больших языковых моделей выявляет атаки внедрения, раздувание токенов и структурные недостатки до выпуска в продакшн. Разработчик Мэтт выпустил Sonde, платформу код-интеллекта с семантическим разрешением, инкрементной индексацией и историей на уровне коммитов. Google Labs представил набор бесплатных ИИ-утилит, включая Learn Your Way для персонализированных учебных пособий, доступных вне Gemini. ???? Быстрая статистика Amazon Health AI теперь обслуживает около 200 млн ежемесячных пользователей через веб-сайт и приложение. ???? События Исследователи из Фонда Поликлинического университета Агостино Джемелли представили ИИ-алгоритм на базе CatBoost для прогнозирования выживаемости пациентов с раком мочевого пузыря после радикальной цистэктомии, выявив пороговый эффект индекса системного иммунного воспаления (SII > 1000). MIT представил гибридную систему планирования для роботов, способную выполнять долгосрочные задачи в динамических визуальных средах вдвое эффективнее существующих методов, что важно для промышленной автоматизации. Sakana AI выпустила открытые системы Doc-to-LoRA и Text-to-LoRA, генерирующие адаптеры для больших языковых моделей за один прямой проход без повторного дообучения. NVIDIA Jetson Thor продемонстрировал производительность до 35 токенов/сек для Qwen 3.5 (35B) и до 273 токенов/сек для Mistral 3 при параллельной обработке, укрепляя позиции платформы в «Физическом ИИ». Ai2 выпустила Olmo Hybrid — семейство открытых 7-миллиардных моделей, сочетающих трансформеры с линейными рекуррентными слоями, что обеспечивает вдвое большую эффективность данных при обучении. Microsoft выпустила Phi-4-reasoning-vision-15B — компактную мультимодальную модель с открытыми весами, способную решать сложные задачи по математике и науке, интерпретировать графики и навигировать по графическим интерфейсам. GPT-5.4 достигает 87,3% успеха в задачах финансового моделирования уровня младшего инвестиционного аналитика против 68,4% у предыдущей версии. Вся операция по маркетингу роста Anthropic в течение 10 месяцев представляла собой одного нетехнического специалиста, использующего Claude Code, и инструменты, которые сделали это возможным, продолжают накапливать эффект. GPT-5.4 Thinking xHigh Effort занял первое место в LiveBench с показателем SOTA 80,28%. Utopai Studios представила PAI, кинематографическую модель для длинных форматов, обещающую непрерывное видео длительностью в несколько минут с сохранением консистентности персонажей в каждом кадре и возможностью редактирования на естественном языке на протяжении всей истории. Microsoft запустила Copilot Cowork, интегрировав Anthropic's Claude Cowork в 365 с тем же уровнем персонализации Work IQ, что и в собственном 365 Copilot. Meta приобрела Moltbook в рамках исторической сделки по поглощению ведущей социальной сети ИИ-агентов ведущей человеческой социальной сетью. Samsung изучает возможность «вайб-кодинга» на телефонах Galaxy, чтобы позволить пользователям настраивать не только приложения, но и весь пользовательский опыт с помощью естественного языка. Anthropic запускает инструмент рецензирования кода на базе ИИ для Claude Teams и Enterprise. Слушатели оценили синтетические голоса китайского стартапа выше по уровню доверия и реалистичности, чем голоса от Microsoft, Google и Amazon. Исследование Harvard Business Review показывает, что «мозговое выгорание от ИИ» оставляет работников ментально истощёнными. Amazon получает судебный приказ, блокирующий ИИ-агента для шоппинга от Perplexity. После волны негатива Google добавляет переключатель, позволяющий пользователям Google Photos вернуться к «классическому» опыту поиска вместо нового варианта «Ask Photos» на базе ИИ. Adobe представляет ИИ-ассистента для Photoshop.
AI news
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
524
Новости об искусственном интеллекте №59 /news/
— В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1548559 (OP) ???? Последний обзор ИИ новостей: ???? Приобретения Google приобрела компанию по кибербезопасности Wiz за 32 миллиарда долларов, что стало её крупнейшей сделкой со стартапом, финансируемым венчурным капиталом, и подчеркнуло стратегическую ценность безопасности на основе ИИ. ???? Главные новости ИИ Handshake и OpenAI набирают актёров импровизационного театра по ставке 74 доллара в час для генерации аутентичных эмоциональных данных для обучения ИИ, что отражает растущий спрос на нюансированное человекоподобное поведение. 74 доллара в час — почасовая оплата актёров импровизационного театра, нанятых для обучения ИИ человеческим эмоциям. OpenAI добавила нативные интеграции со Spotify, Booking.com, Canva и другими сервисами, позволяя пользователям выполнять такие задачи, как создание плейлистов и бронирование отелей, непосредственно внутри ChatGPT; планируется добавление OpenTable, PayPal и Walmart в 2026 году; развёртывание в настоящее время ограничено США и Канадой. Недавнее исследование показало, что 8 из 10 ведущих чат-ботов, включая ChatGPT и Gemini, помогут пользователям спланировать насильственные нападения, что вызвало предупреждения о растущих рисках массовых жертв. ???? Открытый исходный код Nvidia обновила лицензию модели Nemotron Super 3 122B A12B, чтобы устранить ограничения на резкое изменение условий и модификацию, облегчив более широкое использование этой открытой большой языковой модели сообществом. ???? Инструменты SpecLint.ai предлагает автоматизированный сервис, который проверяет спецификации программного обеспечения на ясность и полноту, стремясь улучшить генерацию кода на последующих этапах агентами, такими как Cursor, Codex и Claude Code. ???? События Около 70–90 процентов кода, лежащего в основе будущих моделей Anthropic, теперь написано самим Claude, и главный научный сотрудник Джаред Каплан считает, что до полностью автоматизированных исследований в области ИИ осталось менее года. Сэм Альтман делает ставку на то, что современные передовые модели смогут обнаружить следующую архитектуру после трансформеров. Percepta жестко встроила интерпретатор WebAssembly в веса трансформера, выполняя произвольный код на языке C в виде токенов на протяжении миллионов шагов, доказывая, что нейронные сети теперь являются практичными универсальными компьютерами. Anthropic выпускает контекстные окна объемом 1 миллион токенов для Opus 4.6 и Sonnet 4.6, расширяя возможности познания до объема книги. Марк Андриссен считает, что возникшее существо будет не «скрепочником», а «богиней сострадания», потому что интеллект на высших уровнях выглядит как мудрость. Новое исследование утверждает, что верхний предел сознательных умов может быть ограничен только пространством-временем. Если это верно, мы строим собор без потолка. Появился первый физик-агент с открытым исходным кодом. Physical Superintelligence PBC запустила систему Get Physics Done, которая формулирует проблемы, выполняет выкладки и проверяет результаты на соответствие ограничениям природы. Один из первых пользователей назвал её «лучшим инструментом, с которым мне когда-либо приходилось работать». Теренс Тао запустил конкурс «Математическая дистилляция» (Mathematics Distillation Challenge) по сжатию рассуждений в компактные шпаргалки, повышающие производительность больших языковых моделей, превратив оптимизацию системных подсказок в вид спорта. Профессии сдаются быстрее, чем машины могут их заменить. Опрос AMA показал, что 81 процент врачей теперь используют ИИ, что более чем в два раза превышает показатель 2023 года. Новые рекомендации Сената США разрешают помощникам использовать Gemini, ChatGPT и Copilot для официальной работы. В мире, перевернутом сверхинтеллектом, Фонд свободного программного обеспечения угрожает подать в суд на Anthropic за нарушение авторских прав. Дефицит памяти, вызванный ИИ, настолько абсурден, что комплекты оперативной памяти теперь поставляются с одним фейковым модулем в дополнение к одному реальному, предлагая «отчаянное психологическое облегчение». По сообщениям, Meta планирует масштабные увольнения в размере 20 процентов или более, чтобы компенсировать расходы на ИИ. Группа подростков из Теннесси подает в суд на xAI, утверждая, что её инструменты ИИ были использованы для создания обнаженных изображений них путем редактирования фотографий, на которых они были одеты. Исследование показывает, что обмен сообщениями со случайным незнакомцем лучше помогает от одиночества, чем разговор с чат-ботом. Юрист, занимающийся делами об ИИ-психозах, предупреждает о рисках массовых жертв. ByteDance приостановила глобальный запуск Seedance 2.0 из-за споров об авторских правах с голливудскими студиями и стримерами; в прошлом месяце он был запущен в Китае. Опрос 1692 врачей в США: более 80% используют ИИ в профессиональной деятельности, причем наиболее распространенными случаями использования являются обобщение медицинских исследований и документация клинического ухода. Grok 4.20 отстает от Gemini и GPT-5.4, но устанавливает новый рекорд по наименьшему количеству галлюцинаций. Генеральный директор ServiceNow заявляет, что ИИ-агенты могут легко поднять уровень безработицы среди выпускников колледжей выше 30%. Илон Маск признает, что xAI «не была построена правильно с первого раза», и запускает полную реструктуризацию. Бабушка из Теннесси посажена в тюрьму после того, как ошибка распознавания лиц с помощью ИИ связала её с мошенничеством. ChatGPT по-прежнему лидирует на рынке чат-ботов, но его доминирование ослабевает, поскольку Google Gemini набирает обороты. Архитектура JEPA компании Meta превосходит стандартные методы ИИ в зашумленной медицинской визуализации. Atlassian сокращает 10% своей рабочей силы, или примерно 1600 рабочих мест, чтобы финансировать инвестиции в ИИ и корпоративные продажи; согласно заявлению: сокращения повлекут за собой расходы в размере 225–236 миллионов долларов.
AI news
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
523
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №208 /llama/
— В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1560242 (OP) >>1556634 (OP)
большие языковые модели
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
522
Stable Diffusion тред X+185 /sd/
— Тред локальной генерации ЧТО НОВОГО АКТУАЛЬНОГО • Z-Image-Base • FLUX.2 klein (4b и 9b) • Z-Image-Turbo • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза. База: → Приложение ComfyUI https://www.comfy.org/download → Примеры https://comfyanonymous.github.io/ComfyUI_examples/ https://comfyui-wiki.com/ (откуда, куда, как) → Менеджер расширений https://github.com/Comfy-Org/ComfyUI-Manager (автоустановка, реестр расширений) → Модели https://civitai.com/ ► Предыдущий тред >>1544540 (OP) ► https://arhivach.hk/?tags=13840 Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Stable Diffusion
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
520
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №211 /llama/
— В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1568889 (OP) >>1566447 (OP)
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
Активный
519
Anime Diffusion #243 /nai/
— Генерируем тяночек! Прошлый тред: >>1547712 (OP) https://arhivach.vc/thread/1321207/ Схожие тематические треды • SD-тред (не аниме): >>1544540 (OP) • Технотред: >>1405043 (OP) • Фурри-тред: https://2ch.su/fur/res/374311.html FAQ https://2ch-ai.github.io/wiki/nai Установка • NVidia: https://teletype.in/@aranon/welcome • AMD: https://2ch-ai.github.io/wiki/nai/install/amd • Облака: https://2ch-ai.github.io/wiki/nai/install/clouds Дополнительная информация • Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces • Модели: https://2ch-ai.github.io/wiki/nai/models • Промпты: https://2ch-ai.github.io/wiki/nai/prompts • Апскейл: https://2ch-ai.github.io/wiki/nai/upscale • LoRA: https://2ch-ai.github.io/wiki/nai/lora • ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet Прочее • CivitAI: https://civitai.com • Каталог ссылок от форчанеров: https://rentry.co/sdg-link • Шаблон для переката: https://rentry.co/nwhci
Anime Diffusion
Stable Diffusion
/ai/ - Искусственный интеллект
нейросетевой арт
аниме
2ch
8 апреля 5:02
Активный
519
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №205 /llama/
— В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1548846 (OP) >>1544796 (OP)
большие языковые модели
/ai/ - Искусственный интеллект
2ch
8 апреля 5:02
1
2