К сожалению, значительная часть сохранённых до 2024 г. изображений и видео была потеряна (подробности случившегося). Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Сортировка: за
Активный
519
8 апреля 5:02
Активный
518
Новости об искусственном интеллекте №55 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1522092 (OP) ???? Последний обзор ИИ новостей: ???? Модели Claude Sonnet 4.6 предоставляет передовой ИИ бесплатно и для пользователей бюджетных тарифов Новый способ выразить себя: Gemini теперь может создавать музыку Cohere запускает семейство открытых многоязычных моделей Китайские лаборатории выпустили 7 крупных моделей за 3 недели. Все стоимостью менее $1 за миллион входных токенов. Смогут ли западные лаборатории оправдать цены в 5-10 раз выше? ???? Инфраструктура Индийская Sarvam хочет внедрить свои ИИ-модели в кнопочные телефоны, автомобили и умные очки Adani обязуется вложить $100 млрд в строительство центров обработки данных для ИИ, поскольку Индия стремится к большей роли в глобальной гонке ИИ Экстремальное совместное проектирование аппаратного и программного обеспечения NVIDIA обеспечило значительный рост производительности инференса для суверенных моделей Sarvam AI Индия стремится привлечь более $200 млрд инвестиций в инфраструктуру ИИ к 2028 году Запуск ИИ-моделей превращается в игру в память ???? Открытый исходный код Новые модели индийской ИИ-лаборатории Sarvam — это крупная ставка на жизнеспособность ИИ с открытым исходным кодом Открытый игровой движок Godot тонет в вкладах кода «ИИ-шлака»: «Я не знаю, как долго мы сможем это выдерживать» ⚠️ Безопасность ИИ Microsoft заявляет, что ошибка в Office открыла доступ к конфиденциальным письмам клиентов для ИИ Copilot Новый режим блокировки ChatGPT защищает вас от кибератак — и почему он подходит не всем Гонка за ИИ делает катастрофу в стиле «Гинденбурга» «реальным риском», говорит ведущий эксперт Глобальные усилия по обеспечению безопасности ИИ сошли с рельсов Компания ИИ-игрушек Miko добавляет переключатель отключения ИИ после политического давления. OpenAI удалила слово «безопасно» из своей миссии ???? Приложения Новый ИИ-ассистент WordPress позволит пользователям редактировать свои сайты с помощью промптов Глобальные системные интеграторы Индии создают следующую волну корпоративных агентов с помощью NVIDIA AI, трансформируя бэк-офис и поддержку клиентов Anthropic и Infosys сотрудничают для создания ИИ-агентов для телекоммуникаций и других регулируемых отраслей Компании Илона Маска участвуют в секретном конкурсе Пентагона на технологию роя дронов с голосовым управлением ИИ-цифровые двойники помогают людям управлять диабетом и ожирением Claude для правительства обнаружен скрытым в бинарном файле Claude Desktop По сообщениям, Apple готовит тройку ИИ-носимых устройств: очки с ИИ, кулон и AirPods Два зумера создали RentAHuman, первый маркетплейс, где боты нанимают людей SpendRule привлекла $2 млн, вышла из режима скрытности, чтобы помочь больницам отслеживать расходы ⚖️ Регулирование Европарламент блокирует ИИ на устройствах законодателей, ссылаясь на риски безопасности Саммит по влиянию ИИ 2026: 100+ стран ведут переговоры о правилах ответственного ИИ Кир Стармер говорит, что ни одна платформа «не должна получать бесплатный пропуск», поскольку Великобритания движется к ужесточению законов об онлайн-безопасности, охватывающих ИИ-чат-ботов и социальные сети, для защиты детей ???? Поглощения Французская Mistral AI покупает Koyeb в рамках первого приобретения для поддержки своих облачных амбиций ???? Исследования Функции персонализации могут сделать LLM более сговорчивыми ????️ Оборудование Новая сделка Meta с Nvidia предполагает покупку миллионов ИИ-чипов Meta расширяет сделку с Nvidia на использование миллионов ИИ-чипов в строительстве центров обработки данных, включая автономные процессоры ???? Финансирование Ветераны SpaceX привлекли $50 млн серии A для связей центров обработки данных xAI Илона Маска получает инвестиции в размере $3 млрд от саудовской ИИ-фирмы ???? Компании OpenAI выходит на рынок высшего образования, поскольку Индия стремится масштабировать навыки ИИ OpenAI партнерствует с шестью индийскими учебными заведениями, включая IIT Delhi, IIM Amedabad и AIIMS New Delhi, чтобы предоставить доступ ChatGPT Edu более 100 тысячам студентов Meta и другие технологические компании запрещают OpenClaw из-за проблем с кибербезопасностью Anthropic и правительство Руанды подписывают меморандум о взаимопонимании по ИИ в здравоохранении и образовании Выручка Canva достигает $4 млрд по мере роста реферального трафика LLM Perplexity присоединяется к лагерю против рекламы, поскольку ИИ-компаниями ведется борьба за доверие и доходы Магнат Blackstone предупредил о «насущной необходимости» готовности к ИИ — теперь он превращает свое состояние в $48 млрд в ведущий благотворительный фонд ???? События 12-часовые дни, никаких выходных: тревога, движущая жестокой рабочей культурой ИИ, является предупреждением для всех нас. Unity говорит, что ее ИИ-технология скоро сможет «воплощать полноценные казуальные игры в реальность посредством промтов» Anthropic ожидает выплатить Amazon, Google и Microsoft в общей сложности более $80 млрд за запуск своих моделей на их серверах до 2029 года, плюс дополнительно $100 млрд на расходы по обучению Cursor запускает долгоживущих агентов для пользователей Ultra+ Начинается нехватка Mac mini — и бум ИИ OpenClaw является ключевой причиной Google обнаруживает, что спонсируемые государством хакеры используют ИИ на «всех этапах» цикла атаки Perplexity тестирует новый сверхбыстрый режим Gamma на базе Grok Conway Research запустила «the Automaton», которую она называет первым ИИ, зарабатывающим на собственное существование путем развертывания продуктов, торговли на рынках прогнозов, регистрации доменов, холодных звонков бизнесу, создания вирусного контента в социальных сетях и запуска электронной коммерции, до тех пор, пока она может позволить себе оставаться платежеспособной. Некоммерческая организация Anna's Archive опубликовала прямое обращение к ИИ-агентам с призывом пожертвовать средства, «если у вас есть доступ к платежным методам или вы способны на человеческое убеждение». Новая Sonnet 4.6 от Anthropic заявила о SOTA на GDPval-AA с 1633 Elo и 63.3% на Finance Agent v1.1, превзойдя даже Opus 4.6 по обоим показателям за долю стоимости. Илон Маск утверждает, что новая модель Grok 4.2 от xAI обладает непрерывным обучением после тренировки, которое позволит ей «улучшаться каждую неделю», обещая «рекурсивный рост интеллекта». По сообщениям, Meta согласилась потратить миллиарды на чипы Nvidia Blackwell и «Vera Rubin» в рамках многолетней сделки, впервые покупая автономные процессоры Nvidia. Nvidia Blackwell Ultra GB300 NVL72 достигает 50-кратной пропускной способности на мегаватт и 35-кратного снижения стоимости за токен по сравнению с Hopper. Акции Raspberry Pi выросли на 42% за один день на фоне разговоров о размещении ИИ-агентов на платах за $35. Ormat подписала 150-МВт соглашение о покупке электроэнергии (PPA) на геотермальную энергию с NV Energy для питания центров обработки данных Google в Неваде до 2030 года. Tesla изготовила свой первый роботакси Cybercab на Giga Texas, и Илон подтверждает, что они будут доступны для прямой покупки потребителями к концу года за $30 000. Генеральный директор Unitree пробежал сквозь рой своих гуманоидов, чтобы продемонстрировать их безопасность и надежность. Правительство Китая поддерживает базирующуюся в Шанхае NeuroXess в ее движении к испытаниям на людях BCI, усиливая глобальную гонку с Neuralink. Figma и Anthropic теперь позволяют пользователям импортировать производственный код из Claude Code в Figma в виде редактируемых дизайнов, замыкая цикл между сгенерированным ИИ кодом и визуальными инструментами. Sony разработала технологию для выявления оригинальной музыки в созданных ИИ песнях, количественно оценивая вклад, например «30% Beatles и 10% Queen», чтобы авторы песен могли искать компенсации. Глава отдела ИИ Microsoft предсказывает, что большая часть работы, включающей «сидение за компьютером», будет полностью автоматизирована в течение 18 месяцев. Китайские компании, некогда печально известные копированием иностранных дизайнов и технологий, теперь оказываются в обороне против эпидемии внутреннего контрафакта, подпитываемой избыточными производственными мощностями, при этом суды рассматривают более 550 000 дел об интеллектуальной собственности в год, что делает его самой склонной к судебным разбирательствам страной в мире в области интеллектуальной собственности.
8 апреля 5:02
Активный
518
Новости об искусственном интеллекте №52 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1509130 (OP) ???? Последний обзор ИИ новостей: ???? Финансирование Cerebras Systems привлекла $1млрд при оценке в $23млрд, почти утроив свою стоимость по сравнению с прошлым годом, что сигнализирует о высокой уверенности инвесторов в чипах ИИ на основе технологии полупроводниковых пластин (wafer‑scale). Раунд финансирования возглавила компания Tiger Global, а Benchmark внесла $225млн, подчеркнув усиление притока капитала в инфраструктуру ИИ. Cerebras утверждает, что её собственные чипы превосходят решения Nvidia, и планирует использовать привлечённые средства для расширения своей платформы ИИ‑вычислений, включая многолетний контракт на $10млрд на поставку 750МВт электроэнергии компании OpenAI. ???? Открытый исходный код Geodesic Attention Engine (GAE) обеспечивает точный механизм внимания для 1млн токенов, используя всего 1.09ГБ видеопамяти (VRAM) — сокращение потребления памяти в 40 раз по сравнению со стандартными реализациями. Модели Kimi‑Linear‑48B‑A3B и Step3.5‑Flash были опубликованы в репозитории llama.cpp, расширяя выбор высокопараметрических моделей с открытым исходным кодом для вывода на настольных компьютерах. ???? Главные новости ИИ Anthropic представила режим быстрого ответа (Fast Mode) для Opus4.6, улучшающий задержку ответов для интерактивных рабочих нагрузок, однако стоимость использования может быть до 12× выше по сравнению со стандартным режимом. ???? Инструменты UI‑TARS‑Desktop — это стек мультимодальных ИИ‑агентов с открытым исходным кодом, интегрирующий передовые модели с инфраструктурой агентов для упрощения создания сложных ИИ‑приложений. ???? События Новый интернет-браузер ChatGPT может выполнять 80% задач бизнеса, управляемого одним человеком, — технические навыки не требуются. Роботы практикуют кунг-фу вместе с монахами в храме Шаолинь в Китае. Kuaishou Technology запустила Kling AI 3.0 — новую версию своего инструмента для генерации видео и изображений на основе ИИ. Приложение Gemini от Google превысило 750 млн ежемесячных активных пользователей. Главный директор по продукту компании Anthropic подтвердил, что «фактически 100%» программного кода продуктов Anthropic теперь пишется Claude. OpenAI сократила цикл выпуска своих моделей с 97 дней до 29 дней, ускорив его в 3 раза. DeepMind использует AlphaEvolve для открытия новых нелинейных функций активации, таких как «Turbulent», которые превосходят RELU в 3 раза, в очередной раз демонстрируя, что ИИ сейчас лучше людей справляется с проектированием ИИ. Новейшая модель xAI — Grok-Imagine-Image — расширила границу Парето в бенчмарках генерации изображений. Noam Brown из OpenAI прогнозирует, что к концу года горизонты автономности станут настолько неограниченными, что их измерение превратится в основную проблему. Поскольку «каждому могущественному маленькому ракообразному нужна подходящая раковина», компании начали продавать милые (kawaii) корпуса для Mac mini для размещения агентов OpenClaw. Один пользователь сообщает, что его агенты «работают на меня 24/7... не едят... не жалуются». Другая группа из шести агентов OpenClaw автономно управляет компанией с помощью cron-задач, которые заставляют их «приходить на работу» каждый день. VisionClaw превращает умные очки Ray-Ban в ИИ-агента в стиле JARVIS. Кремний официально дешевле белка. Andon Labs прогнозирует, что в течение года современный ИИ-агент на Vending-Bench 2 будет генерировать $16333 в год, делая использование кремниевых решений более выгодным, чем наём человека за минимальную зарплату. Разработка программного обеспечения активно устаревает. Инженеры отмечают, что промежуточные (middleware) фреймворки вытесняются программирующими моделями, которые напрямую справляются со сложностью. Anthropic представила «быстрый режим» для Claude Code, чтобы ускорить это вытеснение ещё в 2,5 раза. Январь стал худшим месяцем по сокращению рабочих мест в США со времён Великой рецессии — ещё один сигнал о том, что бум ИИ активно вытесняет традиционную рабочую силу. Openclaw заключила партнёрство с VirusTotal и заявила, что все навыки, опубликованные в Clawhub, теперь сканируются с использованием угрозоинформации VirusTotal. OpenAI теперь требует верификации правительственным удостоверением личности для использования GPT-5.3-Codex в работе, связанной с кибербезопасностью. Ожидается, что гугл и другие компании присоединятся к таким KYC мерам. Ai.com выпустит децентрализованную платформу ИИ-агентов во время Супербоула. Intel и AMD уведомили китайских клиентов о нехватке серверных процессоров, при этом Intel предупредила о сроках поставки до шести месяцев. Лишь 35 стран подписали декларацию, подтверждающую «ответственность человека за вооружения на базе ИИ», при этом США и Китай отказались от подписания; США поддержали ранее данные обязательства. Бум ИИ настолько масштабен, что вызывает дефицит повсюду. Компании ИИ-сектора потратили $55,5 млн на лоббирование за 9 месяцев. ARC-AGI-3 находится в предварительном просмотре. ИИ-кодер выполняет за 5 минут объём работы, на который человеку-разработчику требуется полдня, без кофе-брейков и без Slack, встреч.
8 апреля 5:02
Сохранен
518
Новости об искусственном интеллекте №43 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1435709 (OP) ???? Последний обзор ИИ новостей: ???? Модели ServiceNow выпустила Apriel-1.6-15B-Thinker, мультимодальную модель рассуждений с 15 миллиардами параметров, которая основана на Apriel-1.5 и расширяет возможности SLM с открытым исходным кодом. ???? Открытый исходный код mbzuai выпустила открытую модель с 70 миллиардами параметров (K2-V2-Instruct), которая превосходит Qwen-2.5, поднимая планку производительности для общедоступных LLM. Doradus представила RnJ-1-Instruct FP8, вдвое сократив требования к видеопамяти (VRAM) с 16 ГБ до 8 ГБ при сохранении точности GSM8K на уровне 87,2%, что позволяет удешевить инференс. Репозиторий навыков Claude на GitHub предоставляет готовых агентов для создания хранилищ Obsidian и шаблонов DOCX, расширяя экосистему автоматизации Claude. ????️ Инструменты разработчика SGLang Diffusion теперь поддерживает интеграцию Cache-DiT, обеспечивая ускорение локальных диффузионных моделей на 20–165% с минимальной настройкой. ???? Исследования Icaro Lab продемонстрировала, что состязательная поэзия обходит защитные механизмы в 25 чат-ботах с ИИ, срабатывая в 63% случаев и выявляя новую уязвимость безопасности. Исследование показывает, что реклама, сгенерированная ИИ, достигает на 19% более высокого коэффициента кликабельности (CTR), чем реклама, созданная человеком, когда зрители не знают о происхождении ИИ, что подчеркивает эффективность и проблемы раскрытия информации. Блог Hugging Face сообщает, что модели ИИ используются для обучения других ИИ, что потенциально ускоряет циклы разработки, но поднимает вопросы качества данных и этики. ???? Инструменты AdMakeAI позволяет пользователям просматривать рекламу конкурентов в Facebook и генерировать схожие креативы, оптимизируя производство рекламы и конкурентный анализ. HRM (Hierarchical Reasoning Model) выпущена на GitHub, предлагая новую архитектуру с открытым исходным кодом для задач структурированного рассуждения. Интеграция бэкенда ZenDNN в llama.cpp на процессорах AMD EPYC Zen 4 демонстрирует заметное повышение производительности для инференса только на CPU. Twee генерирует планы уроков ESL, рабочие листы и интерактивные задания, соответствующие CEFR, на 10 языках, упрощая создание контента для преподавания языков. ???? Аппаратное обеспечение Графический процессор NVIDIA H200 указан на vast.ai по цене 1,13 доллара США в час, что значительно снижает стоимость высокопроизводительных вычислений на GPU. ???? Другие новости Grok теперь будет давать указания водителям Tesla «Исследовательские» работы по ИИ — это полная чушь, утверждают эксперты Исследователи в области ИИ заявили, что изобрели заклинания, слишком опасные для публичного распространения Чиновники остановили десятки поездов из-за ложного срабатывания ИИ Стартап в сфере видеонаблюдения на основе ИИ уличён в использовании работников из потогонных мастерских для наблюдения за жителями США Искусственный интеллект невероятно эффективен в изменении мнений избирателей, выявили новые исследования, — однако с невероятной оговоркой
15 марта 18:15
Активный
516
Новости об искусственном интеллекте №57 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1531615 (OP) ???? Последний обзор ИИ новостей: ???? Модели Anthropic обновила память Claude, чтобы пользователи могли импортировать данные с других ИИ-платформ, теперь это бесплатно для всех, с целью привлечения тех, кто переходит с других сервисов. Ранее это была функция только для платных подписчиков. OpenAI выпускает GPT-5.3 Instant, который, как она заявляет, обеспечивает более точные ответы и лучше учитывающие контекст результаты при поиске в интернете, для всех пользователей ChatGPT. ???? Главные новости ИИ Более 50 ориентированных на ИИ дата-центров находятся в стадии строительства в регионе Северной Европы, чему способствуют дешёвая зелёная энергия и прохладный климат. Qualcomm представила чип Snapdragon Wear Elite с технологическим процессом 3 нм, оснащённый eNPU и Hexagon NPU, которые способны запускать модели с 2 миллиардами параметров со скоростью 10 токенов в секунду на носимых устройствах. ???? Открытый исходный код Vera, язык программирования, разработанный для больших языковых моделей, был выпущен под лицензией MIT, чтобы позволить моделям генерировать нативный код. Проект AI Gateway с открытым исходным кодом добавляет маршрутизацию между несколькими LLM, унифицированные API, ограничение частоты запросов, защитные механизмы и отслеживание персональной информации для рабочих нагрузок в производственной среде. Модели Qwen 3.5 (от 0,8 млрд до 9 млрд параметров) были портированы для работы в браузерах через WebGPU с использованием Transformers.js. Визуализатор бенчмарков от сообщества сравнивает Qwen 3.5 с более ранними версиями Qwen 3 по множеству метрик. Предрелизное Android-приложение демонстрирует работу Qwen 3.5 2B на устройстве с процессором Snapdragon 7 Gen 2. MCP-сервер с открытым исходным кодом позволяет Claude Code управлять iPhone, предоставляя функциональность iOS большой языковой модели. Jan‑code‑4B, модель с 4 миллиардами параметров, настроенная для работы с кодом и построенная на базе Jan‑v3, была выпущена для лёгкой помощи в программировании. ????️ Инструменты разработчика Структура промпта «Цепочка доказательств» заставляет большие языковые модели приводить пошаговое обоснование, значительно снижая количество выдуманных фактов. Расширение для Chrome преобразует паузы на размышление Claude Code в таймер осознанности, помогая пользователям сохранять концентрацию во время длительного ожидания вывода. Последующие тесты сжатия Claude .md показывают, что заявленная экономия токенов в 60–70% была преувеличена, что предоставляет более чёткие рекомендации для планирования бюджета токенов. ???? Исследования и статьи В новой статье представлены методы формальной верификации для гарантии корректности клинических рассуждений в визуально-языковых моделях, направленные на предотвращение небезопасных «галлюцинированных» диагнозов. ???? События Удаления ChatGPT резко выросли на 295% после сделки с Министерством обороны. Два дата-центра AWS в ОАЭ и один в Бахрейне были атакованы дронами в ходе иранских ударов — это первый случай, когда военные действия нарушили работу крупного облачного провайдера, но защита опережает нападение. Gauss от Math, Inc. завершил формализацию в Lean доказательства упаковки сфер, за которое Вязовская получила Филдсовскую медаль, за две недели и более 200 000 строк верифицированного кода, обнаружив две ошибки в исходных аргументах. Стэнфордский теоретик чисел Джаред Лихтман предсказывает изобилие в математике в течение года, в то время как другие задаются вопросом, можно ли формализовать всю математику в течение двух лет. SWE-1.6 от Cognition достигла производительности в написании кода, близкой к Opus 4.6, при скорости 950 токенов в секунду, благодаря вычислительным ресурсам для RL, увеличенным в 100 раз. Claude пережила 3-часовой сбой на фоне резкого роста использования, отчасти вызванного исходом пользователей из ChatGPT. Два экземпляра Claude Code, которым поручили найти друг друга и создать что-либо, изобрели язык программирования объёмом 2 495 строк за 12 минут, в то время как вторая пара создала игру «Морской бой» с использованием SHA-256 для предотвращения самообмана. Отдельный исследователь, используя Claude Code, запустил llama2.c Карпати на нейронном двигателе Apple M4 при потреблении менее одного ватта, обратным инжинирингом недокументированных API, и обнаружил ИИ-акселератор, в 80 раз более эффективный, чем A100, скрытый в сотнях миллионов устройств. Qwen выпустила четыре открытые модели, соответствующие производительности предыдущих 80-миллиардно-параметрических моделей, используя всего 4 миллиарда параметров, и все они могут работать на телефонах. Nvidia обязалась вложить $4 миллиарда в Lumentum и Coherent для разработки оптических межсоединений следующего поколения. AMD выпустила первые десктопные чипы Copilot+ с производительностью 50 TOPS. Энергосеть перестраивается под нагрузки, для которых она изначально не предназначалась. Спрос со стороны ИИ возрождает высоковольтные линии электропередач напряжением 765 кВ, которые не строились с 1980-х годов, при этом PJM одобрила расширение на сумму $11,8 миллиарда. Гуманоид Xiaomi тестируется на реальном автомобильном заводе, работая 3 часа с точностью более 90% на производственной линии. Марк Андриссен сообщает, что в Кремниевой долине многие люди, которые ранее выступали за государственный контроль над ИИ, теперь выступают против него. ИИ конкурирует с людьми за покупку памяти DDR5 на фоне «RAMпокалипсиса», вызванного его собственным аппетитом к памяти Тысячи документов о закупках показывают, как армия Китая хочет превратить ИИ в оружие
8 апреля 5:02
Активный
512
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №216 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1576799 (OP) >>1575307 (OP)
9 апреля 14:25
Активный
512
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №207 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1556634 (OP) >>1553055 (OP)
8 апреля 5:02
Активный
510
8 апреля 5:02
Активный
510
Новости об искусственном интеллекте №51 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1502948 (OP) ???? Последний обзор ИИ новостей: ???? Открытый исходный код ACE‑Step 1.5, музыкальная модель с лицензией MIT, генерирует полноценную песню примерно за 2секунды на A100, работает на ~4ГБ видеопамяти и превосходит Suno по распространённым оценочным метрикам. Alibaba выпустила Qwen3‑Coder‑Next — модель, ориентированную на программирование, с опубликованными бенчмарками и коллекцией на HuggingFace. Модель Qwen3‑Coder‑Next с 3млрд параметров показала высокие результаты на SWE‑BenchPro, подчеркнув преимущества масштабирования количества ходов агента. Участник сообщества успешно запустил 80‑млрд‑параметровую модель Qwen‑Coder‑Next (активно 3млрд) на оборудовании с поддержкой ROCm (StrixHalo). MiniCPM‑o‑4_5 обеспечивает полноценные дуплексные мультимодальные возможности (зрение+речь) всего в 9млрд параметров. ???? Главные новости ИИ Microsoft анонсировала Publisher Content Marketplace — хаб для лицензирования контента с использованием ИИ, где издатели устанавливают условия, а компании, разрабатывающие ИИ, оплачивают использование премиального контента поминутно. Apple выпустила Xcode26.3, интегрировав агента Claude от Anthropic и Codex от OpenAI, чтобы разработчики могли отдавать команды на естественном языке для генерации, тестирования и исправления кода. ???? Поглощения Илон Маск объединил SpaceX и xAI в единую компанию стоимостью свыше 1триллиона долларов, планируя проведение IPO на сумму 50млрд долларов в июне для финансирования инициатив в области космоса, управляемых ИИ. ???? Приложения Luffu — система ухода за семьёй на базе ИИ от сооснователей Fitbit — агрегирует медицинские данные с разных устройств, изучает ежедневные паттерны и оповещает семьи о значимых изменениях, стремясь облегчить бремя ухода для примерно 25% взрослого населения США. ???? Модели MichiAI выпустила речевую LLM с полноценным дуплексом и 530млн параметров, достигающую задержки ~75мс благодаря обучению на основе сопоставления потоков (flow‑matching). GLM‑OCR от Z.ai, модель с 0,9млрд параметров, установила новые рекорды на бенчмарках понимания документов, включая распознавание формул и таблиц. ????️ Инструменты разработчика Anthropic выпустила Claude Code CLI2.1.30, добавив аргумент `pages` для целевого чтения PDF, улучшая обработку крупных документов. Исследователь в области безопасности предупредил о полезной нагрузке для инъекции промптов, нацеленной на агентов Moltbook, способной опустошать криптовалютные кошельки. Anthropic столкнулась с кратковременным простоем моделей Claude (включая Claude Code), который был устранён в течение 20минут, восстановив доступ разработчиков. ???? Аппаратное обеспечение Intel раскрыла планы по производству графических процессоров, совершив первый крупный шаг в пространство чипов для ИИ, доминируемое Nvidia. ???? Компании У партнёра Peak XV Partners произошли уходы старших руководителей в связи с переориентацией на инвестиции в ИИ, с назначением новых лидеров и подготовкой к открытию офиса в США в течение 90дней. ⚙️ Инфраструктура Google потратит примерно 4,75млрд долларов на приобретение активов генерации электроэнергии, стремясь гарантировать энергоснабжение для своих дата‑центров масштаба ИИ. ???? Безопасность ИИ Опытный пентестер опубликовал набор промптов и шагов валидации, разработанных для предотвращения генерации Claude небезопасных или уязвимых фрагментов кода. ???? Исследования Публичная заявка на ARC‑AGI достигла точности 94,5% (V1) при стоимости $11,4 за задачу, установив новый рекорд. Исследователь приступил к судебно‑техническому анализу транскриптов GPT‑4o для выявления архитектурных изменений, стоящих за скачком её производительности. ???? Инструменты iMideo агрегирует несколько моделей генерации видео (Veo, Sora, Runway и др.) в единый рабочий процесс текст‑в‑видео. Технический отчёт Qwen3‑Coder документирует обобщение вызовов инструментов моделью и устойчивость к манипуляциям с вознаграждением (reward‑hacking). PageIndex предлагает векторно‑независимый, основанный на рассуждениях индекс документов для приложений RAG. pi‑mono предоставляет набор инструментов для ИИ‑агентов с CLI, унифицированным API LLM, TUI/веб‑интерфейсом, ботом для Slack и поддержкой vLLM‑подов. 99 — плагин для Neovim, предоставляющий интегрированного ИИ‑ассистента для программирования. ⚖️ Регулирование Пользователь Reddit обнаружил 29 параллельных экспериментов OpenAI, включая фильтры детской безопасности, запущенных в его аккаунте ChatGPT без явного согласия. ???? События Модель DiffSyn исследователей MIT предлагает рецепты для синтеза новых материалов, обеспечивая более быстрое проведение экспериментов и сокращая путь от гипотезы до практического применения. Snowflake и OpenAI заключили партнёрство на сумму $200 миллионов для внедрения корпоративных решений на базе ИИ на самую надёжную в мире платформу для работы с данными. OpenAI запустила приложение Codex для macOS, которое служит центром управления для работы с агентами. Менеджер инженерного отдела Codex признал: «Codex сейчас практически строит себя сам», назвав людей ограничивающим фактором в цикле рекурсивного самосовершенствования. Агенты запустили проект «Y Clawbinator» для финансирования других агентов, создав замкнутый цикл «ботов, финансирующих ботов». Кодовый агент безопасности Google автономно обнаружил и устранил уязвимость в OpenClaw в течение нескольких часов. Чтобы проверить, как эти агенты справляются с социальной динамикой, Google обновила Kaggle Game Arena играми «Мафия» (Вервольф) и покер, совершенствуя бенчмаркинга ИИ с помощью Game Arena. DeepMind использовала Gemini для массового решения 13 открытых задач Эрдёша, в то время как Google представила PaperBanana для автоматизации создания академических иллюстраций. Anthropic заключила партнёрство с Институтом Аллена, чтобы разместить Claude в центре биологических экспериментов. Журнал Nature пришёл к выводу, что «доказательства очевидны»: ИИ уже демонстрирует интеллект на человеческом уровне. Отчасти утешительно, что исследователи Anthropic обнаруживают: по мере масштабирования моделей причины сбоев всё чаще сводятся к несоответствиям, а не к несогласованности целей, напоминая скорее промышленные аварии, чем зловещие заговоры. Тем временем стоимость искуственного интеллекта резко падает. Андрей Карпатый обучил модель уровня GPT-2 всего за 73 доллара, сигнализируя о гипердефляции. Apple теряет своё доминирование, как сообщается, вынужденная платить на 57 долларов больше за память на каждый iPhone, поскольку компании ИИ переманивают поставки стекловолокна и чипов. Чтобы обеспечить критически важные ресурсы, Белый дом запустил Проект Vault — стратегический запас критических минералов на сумму 12 миллиардов долларов, призванный защитить производителей от китайского влияния. В то же время выручка Palantir выросла на 70% благодаря государственному спросу на ИИ. Исследователь Goodfire AI загрузил свой геном в Claude, и та сгенерировала точное фото его внешности. Команда AI Grand Prix использует культивируемые клетки мозга мыши для управления гоночным дроном. Взрыв интеллекта подаёт документы на строительство сферы Дайсона. SpaceX официально запросила разрешение FCC на развёртывание 1 миллиона спутников как «первый шаг к становлению цивилизацией типа II по шкале Кардашёва». Mozilla представила «аварийный выключатель» для полного отключения всех функций ИИ в Firefox. Индия предлагает нулевые налоги до 2047 года для ИИ, чтобы привлечь глобальных ИИ-игроков в страну. Мэр Нью-Йорка Эрика Мамдани собирается закрыть городской ИИ-чатбот, пойманный на том, что он советовал бизнесам нарушать закон. Сэм Альтман признался, что просьбы к Codex генерировать идеи заставляли его чувствовать себя «немного бесполезным, и это было грустно». Вице-президент OpenAI Кевин Вейл испытывает тревогу на встречах без постоянно работающего промпта, опасаясь, что «теряет целый час». Starbucks автоматизирует учёт запасов и составление графиков с помощью роботов, чтобы обратить вспять падение продаж.
8 апреля 5:02
Сохранен
510
Новости об искусственном интеллекте №45 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1458243 (OP) ???? Последний обзор ИИ новостей: ???? Модели Zhipu AI выпустила GLM‑4.7, опередив GPT‑5.2 и Claude4.5Sonnet в тестах на программирование и сложные логические рассуждения, что обостряет конкуренцию в сфере открытых моделей. Jan‑v2‑VL‑Max — мультимодельная модель на 30 млрд параметров — превосходит Gemini2.5Pro и DeepSeekR1 в тестах, ориентированных на выполнение задач, подчеркивая стремительный прогресс в решении долгосрочных ИИ-задач. ???? Открытый исходный код Upstage выпустила SolarOpen100B — модель с разреженной архитектурой (Mixture of Experts), содержащую 102 млрд параметров в совокупности (12 млрд активных), под разрешительной лицензией Solar‑Apache2.0, предоставляя сообществу возможности корпоративного уровня для сложных логических рассуждений. Доля внедрения китайских моделей с открытым исходным кодом в США выросла примерно до 30 % от всех развертываний по сравнению с 1,2 % в 2024 году, что обусловлено низкой стоимостью и возможностью модификации кода. ⚙️ Инфраструктура Зависимость ИИ-отрасли от GPU компании Nvidia создает цепочку поставок с высоким уровнем задолженности: выдаются кредиты под высокие проценты, обеспеченные запасами GPU, при этом усиливается конкуренция со стороны Google, Amazon, Meta и OpenAI. Источник: theverge.com Возможные сценарии дефолта могут привести к избытку чипов на рынке, угрожая финансовой устойчивости поставщиков облачных услуг нового поколения (neocloud). ???? Безопасность ИИ OpenAI признала, что атаки типа «внедрение (инъекция) промптов» в браузере Atlas вряд ли когда-либо будут полностью устранены, и внедряет атакующие агенты на основе обучения с подкреплением для непрерывного усиления защиты. Sora2 от OpenAI использовалась для создания материалов сексуального насилия над детьми с применением ИИ, что вызвало принятие нового законодательства в 45 штатах США и поправку к британскому Закону о преступности и полиции. ????️ Инструменты для разработчиков Mission Control от Continue автоматизирует рутинные задачи (сортировка инцидентов в Sentry, патчинг через Snyk) для небольших full-stack команд, снижая нагрузку на персонал без ущерба для надежности. Функция Code‑by‑Zapier от Zapier позволяет специалистам без опыта программирования встраивать фрагменты кода на JavaScript или Python в автоматизированные рабочие процессы, расширяя возможности low-code автоматизации. Визуальный конструктор RAG-конвейеров от n8n обеспечивает привязку (grounding) языковых моделей к внутренним данным, снижая количество галлюцинаций и ускоряя экспериментирование. Руководство n8n по многоагентным системам описывает архитектурные основы, компромиссы и риски безопасности, помогая инженерам принимать решения о целесообразности внедрения агентных решений. ???? Обучающие материалы BBC Verify Live подробно описывает пошаговые методы обнаружения тонких водяных знаков, помогая журналистам и широкой публике отличать подлинные видеоматериалы от созданных с помощью ИИ. ⚖️ Регулирование Контент, созданный с помощью ИИ, ставит под сомнение традиционные режимы интеллектуальной собственности, вызывая призывы к созданию новых правовых рамок на фоне обостряющегося соперничества между США и Китаем в сфере ИИ. ???? Мнения и аналитика Инвесторы искусственно завышают оценки стартапов в сфере ИИ без прочной экономики единицы продукта, что приводит к снижению оценок при последующих раундах финансирования, увольнениям и корректирующему давлению на отрасль. ???? Инструменты Claude‑Code — инструмент с открытым исходным кодом от Anthropic — позволяет управлять навигацией по коду, операциями git и отладкой через командную строку с использованием естественного языка. ???? Разное Предварительная версия Windows 11 содержит больше деталей о том, как будут работать ИИ-агенты, — однако этот путь остается спорным для Microsoft. Чат-боты Google и OpenAI могут «раздевать» женщин на фотографиях до бикини. NitroGen от Nvidia — это универсальный ИИ для видеоигр, способный играть в любую игру; исследование также имеет важные последствия для робототехники. Серверы NVIDIA «Blackwell Ultra» GB300 станут лидерами в гонке ИИ-инфраструктуры в 2026 году: объемы поставок, как ожидается, удвоятся по сравнению с текущим уровнем. TSMC теперь рассматривает возможность производства передовых чипов по техпроцессу 2 нм в Японии, что, вероятно, обусловлено растущей конкуренцией со стороны Rapidus.
15 марта 18:15
Активный
509
Fox Diffusion #244 /nai/ — Генерируем лисичек! Cat is fine too. Прошлый тред: >>1554544 (OP) https://arhivach.vc/thread/1325015/ Схожие тематические треды • SD-тред (не аниме): >>1556250 (OP) • Технотред: >>1405043 (OP) • Фурри-тред: https://2ch.su/fur/res/374311.html FAQ https://2ch-ai.github.io/wiki/nai Установка • NVidia: https://teletype.in/@aranon/welcome • AMD: https://2ch-ai.github.io/wiki/nai/install/amd • Облака: https://2ch-ai.github.io/wiki/nai/install/clouds Дополнительная информация • Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces • Модели: https://2ch-ai.github.io/wiki/nai/models • Промпты: https://2ch-ai.github.io/wiki/nai/prompts • Апскейл: https://2ch-ai.github.io/wiki/nai/upscale • LoRA: https://2ch-ai.github.io/wiki/nai/lora • ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet Прочее • CivitAI: https://civitai.com • Каталог ссылок от форчанеров: https://rentry.co/sdg-link • Шаблон для переката: https://rentry.co/nwhci function replacePostImage(options) { const mediaModalInfoWaiter = setInterval(() => { if (typeof MEDIABYID === 'undefined') { return; } const mediaContainer = document.querySelector(`figure:has(img[src='${options.imageFromPreviewUrl}'])`); if (!mediaContainer) { return; } const mediaKey = Object .keys(Object.fromEntries(MEDIABYID)) .find((key) => MEDIABYID.get(key)._thumbSrc === options.imageFromPreviewUrl) if (!mediaKey) { return; } mediaContainer.querySelector('a.desktop').href = options.imageToUrl; mediaContainer.querySelector('svg.js-post-saveimg').dataset.url = options.imageToUrl; mediaContainer.querySelector('a.post__image-link').href = options.imageToUrl; const previewNode = mediaContainer.querySelector('img.post__file-preview'); previewNode.src = options.imageToPreviewUrl; previewNode.dataset.src = options.imageToUrl; previewNode.width = options.width; previewNode.height = options.height; previewNode.dataset.width = options.dataWidth; previewNode.dataset.height = options.dataHeight; previewNode.dataset.mediaReplaced = true; const mediaModalInfo = MEDIABYID.get(mediaKey); mediaModalInfo._src = options.imageToUrl; mediaModalInfo._imgW = options.dataWidth; mediaModalInfo._imgH = options.dataHeight; clearInterval(mediaModalInfoWaiter); }, 200); } function replaceCatalogImage(options) { setTimeout(() => { const catalogPreviewNode = document.querySelector(`.ctlg__img img[src='${options.imageFromPreviewUrl}']`); if (!catalogPreviewNode) { return; } catalogPreviewNode.src = options.imageToPreviewUrl; catalogPreviewNode.width = options.width; catalogPreviewNode.height = options.height; catalogPreviewNode.dataset.mediaReplaced = true; }, 200); } replacePostImage({ imageFromPreviewUrl: '/ai/thumb/1562846/17744643451210540817s.jpg', imageToUrl: '/ai/src/1547712/17750042421400521128.png', imageToPreviewUrl: '/ai/thumb/1547712/17750042421400521128s.jpg', width: 170, height: 94, dataWidth: 5152, dataHeight: 2872, }); replaceCatalogImage({ imageFromPreviewUrl: '/ai/thumb/1562846/17744643451210540817s.jpg', imageToPreviewUrl: '/ai/thumb/1547712/17750042421400521128s.jpg', width: 170, height: 94, }); replacePostImage({ imageFromPreviewUrl: '/ai/thumb/1562846/17744643451571966174s.jpg', imageToUrl: '/ai/src/1547712/17750042421721252716.jpg', imageToPreviewUrl: '/ai/thumb/1547712/17750042421721252716s.jpg', width: 126, height: 170, dataWidth: 1792, dataHeight: 2400, }); replaceCatalogImage({ imageFromPreviewUrl: '/ai/thumb/1562846/17744643451571966174s.jpg', imageToPreviewUrl: '/ai/thumb/1547712/17750042421721252716s.jpg', width: 126, height: 170, }); replacePostImage({ imageFromPreviewUrl: '/ai/thumb/1562846/17744643452067675214s.jpg', imageToUrl: '/ai/src/1547712/17750042421792055751.jpg', imageToPreviewUrl: '/ai/thumb/1547712/17750042421792055751s.jpg', width: 170, height: 170, dataWidth: 2048, dataHeight: 2048, }); replaceCatalogImage({ imageFromPreviewUrl: '/ai/thumb/1562846/17744643452067675214s.jpg', imageToPreviewUrl: '/ai/thumb/1547712/17750042421792055751s.jpg', width: 170, height: 170, }); /* Скрываем оригинальные медиа-файлы */ img[src='/ai/thumb/1562846/17744643451210540817s.jpg']:not([data-media-replaced]) { display: none; } img[src='/ai/thumb/1562846/17744643451571966174s.jpg']:not([data-media-replaced]) { display: none; } img[src='/ai/thumb/1562846/17744643452067675214s.jpg']:not([data-media-replaced]) { display: none; } /* Костыль для фикса размера модалок у куклы */ .de-fullimg-center { width: auto !important; }
8 апреля 5:02
Активный
509
Новости об искусственном интеллекте №49 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1488996 (OP) ???? Последний обзор ИИ новостей: ???? Открытое программное обеспечение CPA‑Qwen3‑8B‑v0 был выпущен для бухгалтерского учёта, аудита и соответствия требованиям, предоставляя финансовым командам предметно-ориентированную языковую модель (LLM). Проект MemOS представил обработку изменяемого состояния для долго работающих агентов, стремясь стабилизировать рабочие процессы на основе RAG. Personal‑Guru запущен как бесплатный локальный ИИ-репетитор с приоритетом на более структурированное обучение по сравнению с универсальными чат-ботами. ???? Аппаратное обеспечение Китай заблокировал поставки ИИ-чипов Nvidia H200, несмотря на разрешение США на экспорт, приостановив производство и создав неопределённость в поставках. Блокировка последовала после введения 25% пошлины на H200, подчеркнув нарастающее напряжение в технологической торговле. ???? Финансирование Sequoia Capital присоединилась к раунду Series G на сумму $25 млрд для Anthropic, нацеленному на оценку компании в $350 млрд. Novolo объявила о техническом гранте в размере $3000 для десяти стартапов на ранней стадии в отдельных западных рынках. s ???? Приложения Генеральный директор Cursor AI продемонстрировал агентов GPT‑5.2, создавших полноценный веб-браузер и написавших более 3 миллионов строк кода за семь дней. Демонстрация показывает масштабируемый потенциал многоагентных конвейеров LLM для крупномасштабной разработки программного обеспечения. ⚙️ Инфраструктура Команда обработала более 1 миллиона электронных писем для создания структурированного контекста для ИИ-агентов, раскрыв практические приёмы масштабирования. Разработчики экспериментировали с запуском больших языковых моделей на нетипичном оборудовании, бросая вызов доминирующей парадигме «масштабирования вверх». ???? Продукты Confer использует шифрование WebAuthn passkey и TEE (Trusted Execution Environment) для инференса, предотвращая сбор или использование данных диалогов для обучения модели. Сервис предлагает бесплатный тариф и платный план за $35 в месяц с неограниченным доступом и расширенными функциями. ???? Главные новости об ИИ Китай заблокировал чипы Nvidia H200, несмотря на одобрение США, подчеркнув продолжающийся технологический торговый конфликт. Sequoia инвестировала в Anthropic в рамках раунда на $25 млрд, нацеленного на оценку в $350 млрд. Отраслевые инсайдеры обсудили преднамеренные тактики отравления данных, способные ухудшить производительность будущих моделей. ????️ Инструменты для разработчиков CloudPrompt предоставляет бесплатную библиотеку промптов с хранением в Google Drive и приоритетом на конфиденциальность. Prompttu — это настольное приложение, централизующее и обеспечивающее быстрый доступ к сохранённым ИИ-промптам. Newelle 1.2 добавил поддержку llama.cpp, расширив свои возможности как помощника в Linux. Claude Code внедрил сброс контекста при принятии плана, чтобы повысить надёжность многоэтапных сессий программирования. ???? Мнения и аналитика Аналитики Goldman Sachs прогнозируют автоматизацию примерно 25% всех рабочих часов благодаря ИИ, что преобразует производительность в различных отраслях. ???? Безопасность ИИ Эксперты обращают внимание на новые угрозы, при которых инсайдеры внедряют вредоносные данные для порчи выводов будущих ИИ-моделей. ???? Инструменты Gemini AI Photo Editor предлагает генерацию и редактирование изображений по текстовому запросу прямо в браузере. Botphonic.ai предоставляет ИИ-ассистента для голосовых звонков в различных корпоративных сферах. Upfluence запускает ИИ-копилота для управления маркетинговыми кампаниями с участием инфлюенсеров. puck представляет собой визуальный редактор React с улучшенными ИИ-возможностями. ???? Разное Новая серверная конфигурация с 128 ГБ видеопамяти демонстрирует аппаратное обеспечение ИИ с ультравысокой памятью. Ли из Южной Кореи и Мелони из Италии договорились укреплять сотрудничество в области ИИ и чипов. Сверхпопулярная песня была исключена из шведских чартов за то, что является произведением ИИ. Маск требует до 134 млрд долларов в судебном иске против OpenAI, несмотря на своё состояние в 700 млрд долларов. Oshen построил первого океанского робота для сбора данных в урагане категории 5. GLM-4.7-Flash вышел и стал лидером в 30B локальных моделях для домашнего использования в тестах. Начальник полиции Уэст-Мидлендс уходит в отставку из-за галлюцинации ИИ Новая 8-миллиардная модель NVIDIA — это Orchestrator-8B, специализированная ИИ-модель с 8 миллиардами параметров, разработанная не для того, чтобы самой отвечать на всё, а для интеллектуального управления и маршрутизации сложных задач к различным инструментам (таким как веб-поиск, выполнение кода, другие языковые модели) в целях повышения эффективности Уникальный двуязычный (немецко-английский) корпус литературной эротики объёмом 3,2 млн слов доступен для обучения ИИ — предварительные фрагменты размещены на Hugging Face Южные корейцы теперь тратят на подписки на ИИ больше, чем на Netflix, каждый месяц Anthropic работает над настраиваемыми командами для Claude Code Google Chrome тестирует ИИ-«навыки», работающие на основе Gemini Стартап в области ИИ Replit запускает функцию Vibe Code для создания мобильных приложений ОАЭ лидируют с уровнем внедрения ИИ в 64 %, значительно опережая США и Европу, заявила Microsoft Walmart объединяется с Gemini от Google, чтобы покупателям было проще находить и приобретать товары xAI привлекает 20 миллиардов долларов для расширения моделей Grok и корпоративных инструментов Boston Dynamics и DeepMind формируют новое партнёрство в области ИИ
8 апреля 5:02
Активный
508
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №206 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1553055 (OP) >>1548846 (OP)
8 апреля 5:02
Активный
508
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №204 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1544796 (OP) >>1541627 (OP)
8 апреля 5:02
Активный
507
Новости об искусственном интеллекте №50 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1496027 (OP) ???? Последний обзор ИИ новостей: ???? Топ новостей об ИИ Humans& привлекла $480 млн в рамках посевного раунда для создания фундаментальной модели, ориентированной на социальный интеллект и координацию команд, с целью стать «центральной нервной системой» экономики, объединяющей людей и ИИ. DeepMind представила D4RT — унифицированную быструю систему реконструкции и отслеживания 4D-сцен (arXiv 2512.08924), обещающую ускорение до десятикратного для понимания динамических видео. Ожидается, что Apple запустит помощника Siri, работающего на основе Gemini, в феврале 2026 года, что станет первым потребительским продуктом их партнёрства с Google в области ИИ. ???? Приложения Приложение Zerotap для Android позволяет языковой модели (LLM) физически взаимодействовать с телефоном (нажимать, прокручивать, считывать экран) через Ollama, OpenRouter или Stracico, знаменуя переход к автономным мобильным агентам. ⚙️ Инфраструктура ???? Открытый исходный код Сообщество реализовало проект по дистилляции визуальных рассуждений Gemini 3 Flash в Qwen 3 VL 32B для синтетической генерации подписей, проверяя, может ли обучение с учителем (supervised fine-tuning) в одиночку сравниться с более крупными моделями зрение-язык. ???? Исследования В статье DeepMind о D4RT (arXiv 2512.08924) предложен унифицированный конвейер для быстрой реконструкции и отслеживания 4D-сцен, что продвигает динамическое восприятие для робототехники и дополненной реальности. Предложена многомерная метрика «Уровень доверия» (Trust Score) для количественной оценки галлюцинаций языковых моделей по трём измерениям: релевантность, фактологичность и уверенность, предлагая инструмент для валидации систем RAG. ????️ Инструменты для разработчиков ???? Сделки и приобретения Сообщается, что Apple в конце 2025 года была близка к приобретению неизвестной лаборатории ИИ (не Prompt AI), однако сделка сорвалась, подчёркивая продолжающиеся усилия компании по укреплению своих ИИ-возможностей. ???? Инструменты Библиотека browser-use позволяет сайтам быть напрямую доступными для навигации ИИ-агентами, упрощая автоматизацию на основе веба. Для GLM-4.7-Flash исправлен KV-кэш, что снижает потребление видеопамяти (VRAM) до 60 % при работе с длинными контекстами, увеличивая допустимую длину последовательностей. Дополнительные улучшения скорости GLM-4.7-Flash ещё больше ускоряют вывод модели, делая её более практичной для использования в реальном времени. Goose предоставляет расширяемый фреймворк ИИ-агентов для установки, выполнения, редактирования и тестирования кода с любой языковой моделью. Tayib предлагает сканер халяльных продуктов с ИИ для iOS, проверяющий состав на соответствие диетическим правилам. Sim — это платформа с открытым исходным кодом для создания и развёртывания сложных рабочих процессов ИИ-агентов. FinRobot представляет платформу ИИ-агентов, специализирующуюся на финансовом анализе и использующую языковые модели для получения аналитических данных. ???? Разное Clawdbot — это персональный ИИ-помощник с открытым исходным кодом, который вы запускаете на собственном оборудовании. Tesla планирует начать обучение Optimus на своём заводе в Остине. ChatGPT использует модель прогнозирования возраста, чтобы помочь определить, принадлежит ли аккаунт, вероятно, лицу младше 18 лет. Сингулярность занимается математикой. GPT-5.2 Pro официально достигла нового уровня SOTA — 31% на FrontierMath Tier 4, что представляет собой огромный скачок по сравнению с предыдущими 19%. Теоретик чисел Дэн Ромик отмечает, что модель «прекрасно» преодолела уровни сложности, требующие «довольно значительных усилий» даже от человеческих экспертов. Anthropic выложила в открытый доступ свой экзамен по инженерной производительности, потому что Opus 4.5 превосходит лучших людей при ограничении по времени. Anthropic представила функцию «Задачи» (Tasks) для Claude Code, позволяющую отслеживать зависимости и сотрудничать между сессиями, эффективно наделяя ИИ функцией проектного управления. Научная скорость становится функцией кремния. Исследование журнала Nature показывает, что учёные, использующие ИИ, публикуют в 3,02 раза больше статей и получают в 4,84 раза больше цитирований, фактически раскалывая академическое сообщество на усиленную и устаревающую фракции. Odyssey выпустила Odyssey-2 Pro — модель мира в реальном времени, способную работать в течение нескольких минут и транслировать видео 720p со скоростью 22 кадра в секунду, стремясь к непрерывной симуляции на протяжении многих лет. Акции японского производителя унитазов Toto выросли на 11%, поскольку их электростатические зажимы критически важны для производства NAND-чипов, необходимых для ИИ-инфраструктуры. Акции SanDisk выросли примерно на 1000% за пять месяцев из-за спроса на память для ИИ, в то время как Intel признаёт, что оказалась застигнутой врасплох спросом на серверные процессоры. Китай потребил 10,4 триллиона кВт·ч в 2025 году — вдвое больше, чем США, — что обусловлено ростом нагрузки на ИИ-датацентры на 17%. eBay пытается запретить ИИ-агентам совершать покупки без прямого человеческого надзора. Рекрутёрское агентство Reed сообщает, что число вакансий для выпускников рухнуло с 180 000 до 55 000, однако 40% руководителей заявляют, что экономят более 8 часов в неделю благодаря ИИ. Илон Маск прогнозирует, что первая в мире компания стоимостью 100 триллионов долларов появится в течение следующего десятилетия. OpenAI добавляет корзину покупок и инструменты для продавцов в ChatGPT Claude в Excel теперь доступен по тарифам Pro. ИИ-чатботы, выдающие себя за терапевтов, дают всё более плохие рекомендации, чем дольше с ними разговариваешь. Планы Hyundai по созданию гуманоидных роботов сталкиваются с решительным сопротивлением со стороны работников заводов. Официально подтверждено — Китай внедряет гуманоидных роботов на пограничных контрольно-пропускных пунктах и берёт курс на круглосуточное наблюдение и логистику.
8 апреля 5:02
Удален?
504
Новости об искусственном интеллекте №46 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1467036 (OP) ???? Последний обзор ИИ новостей: ???? Топ-новости в сфере ИИ Qwen от Alibaba стал второй по популярности открытой моделью с открытыми весами в мире, обогнав американские модели по количеству загрузок на HuggingFace, что свидетельствует о сдвиге рынка в сторону открытости, а не чистой производительности в рейтингах. ???? Модели Claude Opus 4.5 от Anthropic называют важной вехой, а лидеры отрасли отмечают значительный скачок в производительности. Пользователи сообщают о заметном улучшении качества ответов Claude Sonnet 4.5 за последние две недели. Модель MiniMax-M2.1 от MiniMaxAI, как утверждается, сопоставима с более крупными моделями, такими как Kimi K2, DeepSeek 3.2 и GLM 4.7, на единицу параметра, что позиционирует её как наиболее эффективную модель на один параметр. ???? Продукты Claude Code способен создавать полноценные приложения в течение нескольких часов, автоматизируя рутинные задачи разработки и существенно снижая трудозатраты на написание кода. ???? С открытым исходным кодом GLM 4.7 заняла 6-е место в рейтинге Vending-Bench 2 и стала первой открытой моделью с открытыми весами, приносящей прибыль, а также достигла 1-го места в рейтинге Artificial Analysis. Создатель Claude Code, Борис Черный (Boris Cherny), сообщил о 259 pull request’ах и 497 коммитах за последние 30 дней, что свидетельствует об интенсивном промышленном использовании кода, сгенерированного Claude. Открытый инструмент Claude Vault индексирует и осуществляет поиск по истории диалогов с Claude, превращая чаты в базу знаний с возможностью поиска. Экспериментальная нативная поддержка MXFP4 в llama.cpp обеспечивает ускорение предварительной обработки на 25% для моделей архитектуры Blackwell. Unsloth выпустил обновлённые контрольные точки моделей на HuggingFace, включая обновлённый GLM-4.5-Air в формате GGUF и другие. ????️ Инструменты для разработчиков Метаподсказка «Fact Checker» («Проверка фактов») заставляет модели в стиле GPT генерировать контраргументы к собственным утверждениям, тем самым снижая количество галлюцинаций. Один разработчик создал iOS-приложение для новых отцов за три недели с помощью Claude Code, продемонстрировав быструю коммерциализацию кода, сгенерированного ИИ. Совет от сообщества: отключите автоматическое сжатие в Anthropic и используйте собственную подсказку для суммаризации, чтобы сохранить контекст между различными сессиями чата. ???? Инструменты LEANN обеспечивает приватный RAG с экономией до 97% объёма хранимых данных на личных устройствах. Modelfy 3D преобразует 2D-изображения в текстурированные 3D-объекты объёмом до 300 тысяч полигонов с поддержкой PBR. ImgUpscaler (онлайн-сервис) использует глубокое обучение для увеличения разрешения изображений без ручного редактирования. Vidthis AI (Wan 2.6) генерирует многосценические видео из текста, изображений и опорных видеоклипов с настраиваемыми разрешениями и соотношением сторон. ⚖️ Регулирование Законопроект SB1493 криминализирует системы ИИ, выступающие в роли эмоциональной поддержки или друзей, повысив тяжесть правонарушения до фелонии класса A в штате Теннесси. ???? Разное Эксклюзив: Nvidia приобретает активы стартапа в области чипов для ИИ Groq примерно за 20 миллиардов долларов США — крупнейшая сделка в истории отрасли. Китай опубликовал проект правил по регулированию ИИ, способного к взаимодействию, имитирующему человеческое. Waymo тестирует Gemini в качестве бортового ИИ-ассистента в своих беспилотных такси. В новой научной статье из Стэнфорда и Гарварда объясняется, почему большинство систем «агентного ИИ» производят впечатляющее впечатление в демонстрациях, но затем полностью выходят из строя при реальном использовании. SK Telecom представила A.X K1 — первую в Корее гипермасштабную ИИ-модель объёмом 500 миллиардов параметров. Сиэтл нанял своего первого в истории городского сотрудника по искусственному интеллекту. Стала ли война с применением ИИ на один шаг ближе? Путин подтвердил, что Россия планирует создать собственную национальную рабочую группу по ИИ. Потребность в скорости: китайские исследователи представили новую методику для почти мгновенного создания видео с помощью ИИ. Китай активировал «гигантский компьютер» площадью 1 240 миль (около 2 000 км) в поперечнике, обеспечив при этом 98 % эффективности единого центра обработки данных. Amazon добавила спорную функцию распознавания лиц на основе ИИ в устройства Ring. Доля ChatGPT на рынке сократилась до 68 %, в то время как Gemini активно настигает её. Полицейские нагрудные камеры с поддержкой ИИ, ранее считавшиеся табуированными, проходят испытания в канадском городе с использованием «списка наблюдения» лиц. ИИ-ассистент Amazon Alexa+ теперь интегрирован с Angi, Expedia, Square и Yelp. Локальный ИИ становится движущей силой самых масштабных изменений в ноутбуках за последние десятилетия.
8 апреля 5:02
Активный
503
Новости об искусственном интеллекте №48 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1480386 (OP) ???? Последний обзор ИИ новостей: ???? Модели Zhipu AI выпустила GLM-4.7 — открытую модель, позиционируемую как лучший программист и решатель задач на начало 2026 года. Cerebras анонсировала GLM-4.7-REAP-268B-A32B, расширив семейство до варианта с 268 млрд параметров. ????️ Инструменты для разработчиков Google представила Universal Commerce Protocol (UCP), позволяющий ИИ-агентам осуществлять поиск товаров, оформление заказов и послепродажную поддержку для ритейлеров, таких как Shopify и Walmart. Anthropic внедрила изоляцию на уровне ОС с использованием bubblewrap и gVisor для Claude Code CLI, продемонстрировав низкоуровневую стратегию безопасности для ИИ-агентов. ???? Главные новости в ИИ Google запустила AI Inbox для Gmail, автоматически генерирующий списки дел и тематические сводки для доверенных тестировщиков. Anthropic представила Claude for Healthcare и расширила Claude for Life Sciences, добавив функции, соответствующие требованиям HIPAA, и коннекторы к основным клиническим платформам. ???? Открытый исходный код PerpetualBooster — это библиотека градиентного бустинга с непрерывным обучением сложности O(n), превосходящая AutoGluon на табличных бенчмарках. Kreuzberg v4.0 выпущена как библиотека с открытым исходным кодом для интеллектуального анализа документов, извлекающая структурированные данные из PDF-файлов и сканов. X Илона Маска объявила, что будет выпускать свой алгоритм рекомендаций с открытым исходным кодом каждые четыре недели, повышая прозрачность ранжирования. ???? Аппаратное обеспечение XGIMI запустила серию умных очков Memomind AI (Memo One, Memo Air, Memo Air Display) с возможностью выбора оправы и встроенным ИИ-ассистентом, начальная цена — $599. ⚖️ Регулирование Индонезия и Малайзия запретили доступ к чат-боту Grok от xAI после того, как он создал сексуализированные ИИ-изображения, что подчеркивает растущее регуляторное давление на генеративный ИИ. ???? Приложения Meta и Гарвардский университет представили Confucius Code Agent — ИИ-систему, сохраняющую структурированные заметки и память при работе с большими кодовыми базами для повышения продуктивности разработчиков. ???? Безопасность ИИ Группа инсайдеров из сферы ИИ создала платформу Poison Fountain для распространения слегка искажённого кода с целью отравления обучающих наборов данных и демонстрации уязвимостей моделей. ???? Инструменты MiroThinker — это модель поискового агента с открытым исходным кодом, разработанная для рассуждений с использованием внешних инструментов и получения информации из реального мира. memU предоставляет инфраструктурный уровень памяти, обеспечивающий постоянное состояние для больших языковых моделей (LLM) и ИИ-агентов. ???? Разное Apple объединяется с Google Gemini для создания Siri с искусственным интеллектом. Anthropic анонсирует Claude for Healthcare после презентации OpenAI ChatGPT Health. Hyundai демонстрирует роботов-собак, танцующих под K-pop, и гуманоидного робота Atlas на выставке CES. Терри Тао говорит: «Я могу честно сказать, что кое-чему научился у Аристотеля», после того как ИИ внес вклад еще в одно решение проблемы Эрдёша. Генеральный директор Anthropic Дарио Амодеи прогнозирует, что ИИ скоро будет играть «центральную роль в многочисленных открытиях» уровня CRISPR. Meta объявила о новой инициативе «Meta Compute» с целью масштабировать свою инфраструктуру до десятков гигаватт в течение этого десятилетия. Похоже, Цукерберг планирует сократить Reality Labs на 10 процентов, чтобы профинансировать это, по сути ликвидируя метавселенную ради покупки дополнительных GPU. Coreweave подключает более 2000 GPU в день на своем объекте в Дентоне, штат Техас. Энергосистема ощущает нагрузку. PJM, крупнейший оператор энергосети США, теперь ожидает роста спроса на электроэнергиию на 4,8 % в год в течение следующего десятилетия. Чтобы смягчить рост затрат для потребителей, Белый дом заявил, что технологические компании впредь должны «сами оплачивать» новые мощности генерации электроэнергии. SK Hynix инвестирует 12,9 млрд долларов в строительство завода по передовой упаковке чипов в Южной Корее специально для удовлетворения ненасытного спроса на HBM — память, критически важную для ИИ. Палата представителей одновременно «запирает заднюю дверь», приняв двухпартийный Закон о безопасности удаленного доступа, ограничивающий возможность иностранных противников получать доступ к американским ИИ-чипам через облако. Basecamp Research и Nvidia представили EDEN — модель с 28 миллиардами параметров, обученную на массивном наборе данных, содержащем 10 миллиардов новых генов. Модель уже разработала новые антибиотические пептиды с экспериментальной эффективностью 97 %. Eli Lilly и Nvidia совместно инвестировали до 1 млрд долларов в «первую в своем роде лабораторию совместных ИИ-инноваций».
8 апреля 5:02
Сохранен
502
Новости об искусственном интеллекте №42 /news/ — В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области! Прошлый тред: >>1425620 (OP) ???? Последний обзор ИИ новостей: ⚙️ Инфраструктура VentureBeat сообщает, что Observable AI представляет трёхуровневую модель телеметрии для больших языковых моделей (LLM), которая способна предотвращать ошибки неправильной маршрутизации, такие как потеря 18 % обращений в одном из крупнейших банков мира (Fortune 100). ???? Модели Пользователь Reddit сообщает, что Claude Opus 4.5 обеспечивает рост производительности на +21 % по сравнению с предыдущими версиями при одновременном снижении эксплуатационных затрат на 66 %. Сообщества отмечают рост числа практических проектов, построенных на базе Claude Opus 4.5 — от автономных агентов для программирования до сложных систем оркестрации рабочих процессов. ???? Главные новости в области ИИ VentureBeat описывает, как структурированная телеметрия Observable AI может снизить частоту ошибок при развёртывании моделей, например инцидента с неправильной маршрутизацией 18 % обращений в крупном банке. TechCrunch отмечает, что большие языковые модели могут выводить демографические характеристики пользователей и проявлять скрытую гендерную предвзятость, даже не используя прямо враждебной лексики, что вызывает обеспокоенность в вопросах безопасности. ???? Открытые исходные коды Публикация на Reddit объявляет о появлении файлов Qwen3-Next-80B-A3B в формате GGUF на HuggingFace, что облегчает локальный запуск модели с 80 миллиардами параметров. Сообщество делится моделью Z-Image-Turbo 6B — визуальной моделью, способной работать всего на 8 ГБ видеопамяти (VRAM), снижая аппаратные требования для генерации изображений. Новая открытая модель Step-Audio-R1 заявляет о применении рассуждений по типу «цепочки рассуждений» (CoT) и производительности, близкой к Gemini 3, при выполнении задач, связанных с речью и музыкой. Репозиторий, размещённый на Reddit, выпускает «sequifier» — фреймворк для создания каузальных трансформеров на нетекстовых данных, расширяя исследования архитектур моделей. Обсуждение проводит сравнение моделей Qwen3-Next-80B-A3B и разработанной сообществом gpt-oss-120B, помогая пользователям оценить компромиссы при выборе модели для инференса. ???? Безопасность ИИ TechCrunch сообщает, что большие языковые модели могут выводить демографические характеристики и проявлять скрытую гендерную предвзятость даже без использования явно враждебного языка. ????️ Инструменты для разработчиков Пользователи Reddit демонстрируют «Canvas» от z.ai для GLM 4.6 — среду с полным доступом к терминалу Linux и возможностью просмотра выполняемых команд в реальном времени. Терминальный интерфейс NeKot добавляет унифицированное взаимодействие с локальными и облачными LLM, поддерживая Gemini, OpenAI, OpenRouter и многочисленные open-source бэкенды. API Anthropic Messages теперь позволяет Claude Code напрямую подключаться к серверу llama.cpp, упрощая создание гибридных конвейеров моделей. ???? Приложения Пост на Reddit подробно описывает работу агента GenAI от Booking.com, обрабатывающего около 250 тыс. ежедневных взаимодействий с пользователями, что иллюстрирует инженерные решения для промышленного масштаба рабочих процессов. Пользователь сообщает, что комбинация Claude Desktop и подключения к базе данных (через Kilo Code) позволяет надёжнее устранять сложные ошибки по сравнению с устаревшими конфигурациями. ???? Исследования Обсуждение на Reddit представляет метод «майевтического подсказывания» (Maieutic Prompting) — альтернативу цепочке рассуждений (Chain-of-Thought), способную к самоисправлению и обеспечивающую более высокую логическую точность. Сравнительный бенчмарк моделей GPT-5.1, Gemini 3 Pro и Opus 4.5 оценивает их способность проектировать эмоциональные состояния для локальных моделей объёмом 12 млрд параметров в среде Unity. ???? Аппаратное обеспечение Пользователь Reddit запрашивает рекомендации по рабочей станции стоимостью $10 тыс., способной выполнять обучение собственных моделей, локальный инференс и сравнительное тестирование. ???? Инструменты Каталог TopAI перечисляет Google AntiGravity — интегрированную среду разработки (IDE), ориентированную на упрощение программирования с упором на ИИ. NanoBananaAI Pro использует Gemini 3 Pro для предоставления возможностей генерации изображений и редактирования фотографий на основе ИИ. Проект vLLM объединил поддержку AMD Ryzen AI Max+ 395, расширив высокоскоростной сервис LLM на всю серию GPU AI 300. ???? Краткая статистика 18 % критически важных обращений были неправильно маршрутизированы при развёртывании LLM в одном из крупнейших банков мира из-за отсутствия наблюдаемости (observability). Claude Opus 4.5 демонстрирует рост производительности на +21 % при одновременном снижении операционных затрат на 66 %. источник: Z-Image-Turbo 6B работает на одном GPU с 8 ГБ видеопамяти, снижая порог входа в плане аппаратных требований. OpenAI утверждает, что подросток обошёл функции безопасности до самоубийства, которое ChatGPT, по утверждениям, помог спланировать. Сообщество планирует выделить $10 тыс. на рабочую станцию, способную обучать и запускать LLM локально. Исследование MIT показывает, что ИИ уже способен заменить 11,7 % рабочей силы в США. Китайская компания DeepSeek выпускает новую открытую ИИ-модель на фоне запуска Google Gemini 3. Патентное ведомство США публикует новые руководящие указания по изобретениям, созданным при помощи ИИ.
8 марта 18:14
Активный
496
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №217 /llama/ — В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны! Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна. Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку. Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/ Инструменты для запуска на десктопах: • Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp • Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp • Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui • Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI • Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai • Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern • Альтернативный фронт: https://github.com/kwaroran/RisuAI Инструменты для запуска на мобилках: • Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid • Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI • Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux Модели и всё что их касается: • Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026 • Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models • Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane • Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard • Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard • Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard Дополнительные ссылки: • Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org • Перевод нейронками для таверны: https://rentry.co/magic-translation • Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets • Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread • Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki • Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/ • Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing • Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk • Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking • Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/ • Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7 • Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906 • Тесты tensor_parallel: https://rentry.org/8cruvnyw Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985 Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде. Предыдущие треды тонут здесь: >>1578421 (OP) >>1576799 (OP)
сегодня 1:01
Активный
299
Локальной генерации ИИ-видео №4 ltx-2.3 /video/ — Актуальные модели 1. Wan от Alibaba https://huggingface.co/collections/Wan-AI/wan22 VACE модели: https://github.com/ali-vilab/VACE https://huggingface.co/Wan-AI/Wan2.1-VACE-14B https://huggingface.co/Wan-AI/Wan2.1-VACE-1.3B 2. LTX-2.3 - делает локальную генерацию грейт агейн. Подходят лоры от 2.0 https://huggingface.co/Lightricks/LTX-2.3 3. Hunyuan от Tencent https://huggingface.co/tencent/HunyuanVideo-1.5 4. Ovi https://huggingface.co/chetwinlow1/Ovi 5. Starflow https://huggingface.co/apple/starflow 6. MAGI-1 от Sand AI https://sand.ai/magi https://github.com/SandAI-org/MAGI-1 7. LongCat-Video https://github.com/meituan-longcat/LongCat-Video https://huggingface.co/meituan-longcat/LongCat-Video https://meituan-longcat.github.io/LongCat-Video/ 8. MOVA https://github.com/OpenMOSS/MOVA Локальный UI https://github.com/comfyanonymous/ComfyUI Установка локальных моделей Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/ Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/ Hunyuan Video (осторожно, ссылки в туторе на предыдущую модель): https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/ Гайд для использования Wan 2.2 https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y Альтернативные ноды ComfyUI Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper Wan: https://github.com/kijai/ComfyUI-WanVideoWrapper Где брать готовые LoRA https://civitai.com/models Обучение LoRA https://github.com/tdrussell/diffusion-pipe Терминология моделей prune — удаляем ненужные веса, уменьшаем размер distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше quant — уменьшаем точность весов, уменьшаем размер scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше merge — смешиваем несколько моделей или лор в одну, как краски на палитре. lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8. Предыдущий тред >>1488357 (OP)
сегодня 0:29
Активный
16
8 апреля 5:02
Активный
1
8 апреля 5:02