К сожалению, значительная часть сохранённых до 2024 г. изображений и видео была потеряна (подробности случившегося). Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!
Сортировка: за
Сохранен
9
☝️☝️ Anthropic выпустил любопытный текст: "Когда ИИ развивает сам себя" https://www.anthropic.com/in — ☝️☝️ Anthropic выпустил любопытный текст: "Когда ИИ развивает сам себя" https://www.anthropic.com/institute/recursive-self-improvement По их оценке, ИИ уже заметно ускоряет разработку самого ИИ, а до "рекурсивного самосовершенствования" - когда модель будет строить своих преемников без людей - мы подошли практически вплотную. При этом сами Антропики честно оговариваются: этого пока нет, и это не неизбежно - но может случиться раньше, чем большинство институтов вообще будет готово. Что особенно бросается в глаза по цифрам: - инженеры Anthropic сейчас в среднем выпускают примерно в 8 раз больше кода за квартал, чем в 2021–2025 - длина задач, которые ИИ может надёжно делать, удваивается примерно раз в 4 месяца, а не раз в 7 (прогресс ускоряется) - Opus 3 в марте 2024 тянул задачи примерно на 4 минуты, Sonnet 3.7 через год - уже на 90 минут, а Opus 4.6 ещё год спустя - на 12 часов - SWE-bench за два года ушёл от низких однозначных значений к насыщению, CORE-bench в задачах воспроизведения исследований - с ~20% до насыщения за 15 месяцев - METR обнаружили, что Claude Mythos Preview может работать "как минимум" 16 часов подряд, то есть уже на верхней границе того, что они могут измерять - к маю 2026 Claude писал уже 80%+ кода, который попадает в кодовую базу Anthropic; до запуска Claude Code в феврале 2025 там были низкие однозначные проценты - в опросе исследователей за март 2026 медианный ответ был: с Mythos Preview производительность вырастает примерно в 4 раза - один пример из апреля 2026: Claude выкатил 800+ фиксов, которые урезали класс API-ошибок в 1000 раз; инженер оценил бы такую работу в 4 года для человека - качество кода, написанного Claude, в конце 2025 было хуже человеческого, сейчас примерно сравнялось, а в течение года ожидается уже выше человеческого - на самых трудных open-ended задачах успех Claude вырос до 76% к маю 2026, то есть на 50 пунктов за полгода - в тесте на ускорение кодинга Opus 4 дал около 3x, Mythos Preview - уже ~52x; человеку на 4x обычно нужно 4–8 часов - в проекте по AI safety Claude-агенты вернули 97% разрыва в результате, против ~23% у двух исследователей-людей за неделю - в выборе "лучшего следующего шага" в рамках research-сессии лучшая модель обогнала человека: 51% в ноябре 2025 против 64% в апреле 2026 Но пока у людей сохраняется ключевое преимущество: research taste и judgment - то есть умение выбрать важную проблему и понять, когда подход зашёл в тупик. Сами Антропики считают, что ключевое здесь именно это "пока". Антропики рассматривают дальше три сценария: 1) всё упрётся в S-образную кривую и замедлится; 2) пойдёт компаундное ускорение, но люди ещё будут задавать направление; 3) случится полное рекурсивное самосовершенствование, где ИИ полностью уберёт человеческий фактор из контура исследований и начнёт строить своих преемников сам, а темп будет упираться только в вычислительные ресурсы (по сути речь идёт про AGI или ASI). Именно третий сценарий, по их же словам, - самый туманный и самый опасный, но не самый невероятный.
вчера 18:02
Сохранен
123
вчера 9:33
Активный
120
вчера 19:22
Сохранен
5
1 июня 19:51