Прошлые домены не функционирует! Используйте адрес
ARHIVACH.VC.
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна.
Подробности случившегося. Мы призываем всех неравнодушных
помочь нам с восстановлением утраченного контента!
По словам президента ARC Prize Foundation Грега Камрадта, тесты вроде ARC важны потому, что они проверяют не только точность, но и гибкость мышления. Модели вроде Grok могут успешно сдавать экзамены и решать сложные задачи, но они не умеют по-настоящему адаптироваться, как это делает обычный человек. Если ИИ не может пройти задания, с которыми справляется большинство людей, значит, он ещё далёк от статуса универсального разума.
В отличие от многих других тестов, задачи ARC изначально создаются с расчётом на то, чтобы быть посильными для людей. Например, на втором тесте ARC-AGI-2 средний человек набирает около 66 процентов, а группа из пяти человек может совместными усилиями решить все задачи. У моделей ИИ пока нет ни такой эффективности, ни такой гибкости. ARC-AGI-3 должен усилить это различие, так как новая форма проверки требует активного взаимодействия с цифровой средой, а не просто ответа на вопрос.
Сейчас тестируется сотня новых игр, в которых нет обучающего датасета и нельзя применить заранее запрограммированные приёмы. Задача ИИ — понять, что происходит в мире, где он раньше никогда не был, и научиться действовать осмысленно. Пока ни одна из моделей не прошла даже первый уровень. Это и есть наглядная граница между текущими достижениями ИИ и подлинным искусственным интеллектом , который способен к самостоятельному обучению, исследованию и принятию решений в реальном времени.
Попробовать себя в роли тестируемого можно самому: ссылки на открытые версии ARC-AGI-1 , ARC-AGI-2 и экспериментального ARC-AGI-3.