☝️☝️ Anthropic выпустил любопытный текст: "Когда ИИ развивает сам себя" https://www.anthropic.com/in

Аноним OP 04/06/26 Чтв 20:19:05 #1 №333708864

image.png

☝️☝️ Anthropic выпустил любопытный текст: "Когда ИИ развивает сам себя"
https://www.anthropic.com/institute/recursive-self-improvement

По их оценке, ИИ уже заметно ускоряет разработку самого ИИ, а до "рекурсивного самосовершенствования" - когда модель будет строить своих преемников без людей - мы подошли практически вплотную. При этом сами Антропики честно оговариваются: этого пока нет, и это не неизбежно - но может случиться раньше, чем большинство институтов вообще будет готово.

Что особенно бросается в глаза по цифрам:

- инженеры Anthropic сейчас в среднем выпускают примерно в 8 раз больше кода за квартал, чем в 2021–2025
- длина задач, которые ИИ может надёжно делать, удваивается примерно раз в 4 месяца, а не раз в 7 (прогресс ускоряется)
- Opus 3 в марте 2024 тянул задачи примерно на 4 минуты, Sonnet 3.7 через год - уже на 90 минут, а Opus 4.6 ещё год спустя - на 12 часов
- SWE-bench за два года ушёл от низких однозначных значений к насыщению, CORE-bench в задачах воспроизведения исследований - с ~20% до насыщения за 15 месяцев
- METR обнаружили, что Claude Mythos Preview может работать "как минимум" 16 часов подряд, то есть уже на верхней границе того, что они могут измерять
- к маю 2026 Claude писал уже 80%+ кода, который попадает в кодовую базу Anthropic; до запуска Claude Code в феврале 2025 там были низкие однозначные проценты
- в опросе исследователей за март 2026 медианный ответ был: с Mythos Preview производительность вырастает примерно в 4 раза
- один пример из апреля 2026: Claude выкатил 800+ фиксов, которые урезали класс API-ошибок в 1000 раз; инженер оценил бы такую работу в 4 года для человека
- качество кода, написанного Claude, в конце 2025 было хуже человеческого, сейчас примерно сравнялось, а в течение года ожидается уже выше человеческого
- на самых трудных open-ended задачах успех Claude вырос до 76% к маю 2026, то есть на 50 пунктов за полгода
- в тесте на ускорение кодинга Opus 4 дал около 3x, Mythos Preview - уже ~52x; человеку на 4x обычно нужно 4–8 часов
- в проекте по AI safety Claude-агенты вернули 97% разрыва в результате, против ~23% у двух исследователей-людей за неделю
- в выборе "лучшего следующего шага" в рамках research-сессии лучшая модель обогнала человека: 51% в ноябре 2025 против 64% в апреле 2026

Но пока у людей сохраняется ключевое преимущество: research taste и judgment - то есть умение выбрать важную проблему и понять, когда подход зашёл в тупик. Сами Антропики считают, что ключевое здесь именно это "пока".

Антропики рассматривают дальше три сценария: 1) всё упрётся в S-образную кривую и замедлится; 2) пойдёт компаундное ускорение, но люди ещё будут задавать направление; 3) случится полное рекурсивное самосовершенствование, где ИИ полностью уберёт человеческий фактор из контура исследований и начнёт строить своих преемников сам, а темп будет упираться только в вычислительные ресурсы (по сути речь идёт про AGI или ASI). Именно третий сценарий, по их же словам, - самый туманный и самый опасный, но не самый невероятный.

Аноним 04/06/26 Чтв 20:28:32 #2 №333709113

image.png

bump

Аноним 04/06/26 Чтв 20:40:30 #3 №333709425

image.png

bump

Аноним 04/06/26 Чтв 20:45:55 #4 №333709560

>>333708864 (OP)
"Терминатор" был предпреждением, а не руководством к действию, долбоёбы

Аноним 04/06/26 Чтв 20:48:01 #5 №333709626

> продавец уверяет, что его продукт это революция
Ок вау.... Энивей.

Аноним 04/06/26 Чтв 20:48:38 #6 №333709643

"Развивает сам себя" = учится на собственных троекратно высраных галлюцинациях?

Аноним 04/06/26 Чтв 20:53:22 #7 №333709771

>>333709643
Блядь, ты оп пост вообще читал, даун?

Аноним 04/06/26 Чтв 20:54:42 #8 №333709806

>>333708864 (OP)
>дайте шекелей, гои.

Аноним 04/06/26 Чтв 21:02:20 #9 №333709996

Screenshot20260604-215745.jpg

Screenshot20260604-215809.jpg

Поздравляю антропиков с прогрессом и всё такое, ананасы шито за хуйня происходит на арене? Агент в рандомный момент крвшится и если ты не отменяешь это действие, то чат идёт по пизде с вероятностью в сто процентов