По их оценке, ИИ уже заметно ускоряет разработку самого ИИ, а до "рекурсивного самосовершенствования" - когда модель будет строить своих преемников без людей - мы подошли практически вплотную. При этом сами Антропики честно оговариваются: этого пока нет, и это не неизбежно - но может случиться раньше, чем большинство институтов вообще будет готово.
Что особенно бросается в глаза по цифрам:
- инженеры Anthropic сейчас в среднем выпускают примерно в 8 раз больше кода за квартал, чем в 2021–2025 - длина задач, которые ИИ может надёжно делать, удваивается примерно раз в 4 месяца, а не раз в 7 (прогресс ускоряется) - Opus 3 в марте 2024 тянул задачи примерно на 4 минуты, Sonnet 3.7 через год - уже на 90 минут, а Opus 4.6 ещё год спустя - на 12 часов - SWE-bench за два года ушёл от низких однозначных значений к насыщению, CORE-bench в задачах воспроизведения исследований - с ~20% до насыщения за 15 месяцев - METR обнаружили, что Claude Mythos Preview может работать "как минимум" 16 часов подряд, то есть уже на верхней границе того, что они могут измерять - к маю 2026 Claude писал уже 80%+ кода, который попадает в кодовую базу Anthropic; до запуска Claude Code в феврале 2025 там были низкие однозначные проценты - в опросе исследователей за март 2026 медианный ответ был: с Mythos Preview производительность вырастает примерно в 4 раза - один пример из апреля 2026: Claude выкатил 800+ фиксов, которые урезали класс API-ошибок в 1000 раз; инженер оценил бы такую работу в 4 года для человека - качество кода, написанного Claude, в конце 2025 было хуже человеческого, сейчас примерно сравнялось, а в течение года ожидается уже выше человеческого - на самых трудных open-ended задачах успех Claude вырос до 76% к маю 2026, то есть на 50 пунктов за полгода - в тесте на ускорение кодинга Opus 4 дал около 3x, Mythos Preview - уже ~52x; человеку на 4x обычно нужно 4–8 часов - в проекте по AI safety Claude-агенты вернули 97% разрыва в результате, против ~23% у двух исследователей-людей за неделю - в выборе "лучшего следующего шага" в рамках research-сессии лучшая модель обогнала человека: 51% в ноябре 2025 против 64% в апреле 2026
Но пока у людей сохраняется ключевое преимущество: research taste и judgment - то есть умение выбрать важную проблему и понять, когда подход зашёл в тупик. Сами Антропики считают, что ключевое здесь именно это "пока".
Антропики рассматривают дальше три сценария: 1) всё упрётся в S-образную кривую и замедлится; 2) пойдёт компаундное ускорение, но люди ещё будут задавать направление; 3) случится полное рекурсивное самосовершенствование, где ИИ полностью уберёт человеческий фактор из контура исследований и начнёт строить своих преемников сам, а темп будет упираться только в вычислительные ресурсы (по сути речь идёт про AGI или ASI). Именно третий сценарий, по их же словам, - самый туманный и самый опасный, но не самый невероятный.
Поздравляю антропиков с прогрессом и всё такое, ананасы шито за хуйня происходит на арене? Агент в рандомный момент крвшится и если ты не отменяешь это действие, то чат идёт по пизде с вероятностью в сто процентов
https://www.anthropic.com/institute/recursive-self-improvement
По их оценке, ИИ уже заметно ускоряет разработку самого ИИ, а до "рекурсивного самосовершенствования" - когда модель будет строить своих преемников без людей - мы подошли практически вплотную. При этом сами Антропики честно оговариваются: этого пока нет, и это не неизбежно - но может случиться раньше, чем большинство институтов вообще будет готово.
Что особенно бросается в глаза по цифрам:
- инженеры Anthropic сейчас в среднем выпускают примерно в 8 раз больше кода за квартал, чем в 2021–2025
- длина задач, которые ИИ может надёжно делать, удваивается примерно раз в 4 месяца, а не раз в 7 (прогресс ускоряется)
- Opus 3 в марте 2024 тянул задачи примерно на 4 минуты, Sonnet 3.7 через год - уже на 90 минут, а Opus 4.6 ещё год спустя - на 12 часов
- SWE-bench за два года ушёл от низких однозначных значений к насыщению, CORE-bench в задачах воспроизведения исследований - с ~20% до насыщения за 15 месяцев
- METR обнаружили, что Claude Mythos Preview может работать "как минимум" 16 часов подряд, то есть уже на верхней границе того, что они могут измерять
- к маю 2026 Claude писал уже 80%+ кода, который попадает в кодовую базу Anthropic; до запуска Claude Code в феврале 2025 там были низкие однозначные проценты
- в опросе исследователей за март 2026 медианный ответ был: с Mythos Preview производительность вырастает примерно в 4 раза
- один пример из апреля 2026: Claude выкатил 800+ фиксов, которые урезали класс API-ошибок в 1000 раз; инженер оценил бы такую работу в 4 года для человека
- качество кода, написанного Claude, в конце 2025 было хуже человеческого, сейчас примерно сравнялось, а в течение года ожидается уже выше человеческого
- на самых трудных open-ended задачах успех Claude вырос до 76% к маю 2026, то есть на 50 пунктов за полгода
- в тесте на ускорение кодинга Opus 4 дал около 3x, Mythos Preview - уже ~52x; человеку на 4x обычно нужно 4–8 часов
- в проекте по AI safety Claude-агенты вернули 97% разрыва в результате, против ~23% у двух исследователей-людей за неделю
- в выборе "лучшего следующего шага" в рамках research-сессии лучшая модель обогнала человека: 51% в ноябре 2025 против 64% в апреле 2026
Но пока у людей сохраняется ключевое преимущество: research taste и judgment - то есть умение выбрать важную проблему и понять, когда подход зашёл в тупик. Сами Антропики считают, что ключевое здесь именно это "пока".
Антропики рассматривают дальше три сценария: 1) всё упрётся в S-образную кривую и замедлится; 2) пойдёт компаундное ускорение, но люди ещё будут задавать направление; 3) случится полное рекурсивное самосовершенствование, где ИИ полностью уберёт человеческий фактор из контура исследований и начнёт строить своих преемников сам, а темп будет упираться только в вычислительные ресурсы (по сути речь идёт про AGI или ASI). Именно третий сценарий, по их же словам, - самый туманный и самый опасный, но не самый невероятный.