Владимир Крылов: «Считать современные LLM просто предсказателями токенов — это техническая безграмотность».
Да, внутренний механизм работы современных LLM действительно опирается на выборку из вероятностного распределения. Из-за этого многие утверждают, что в основе всего лежит банальное предсказание следующего токена (Next Token Prediction). Но представьте, что вы смотрите на фрески Сикстинской капеллы и заявляете: то, что мы видим, — это просто специфическое математическое распределение красок на поверхности стены. Технически это, конечно, верно, но ведь суть фресок не сводится к краске на штукатурке. Так же и языковая модель не является просто генератором случайных выборок, работающим алгоритмом Next Token Prediction.
По этому поводу отлично высказался Илья Суцкевер. Он отметил, что если вы до сих пор повторяете мантру о том, что модель всего лишь предсказывает следующий токен, то вы не просто скептик, вы технически неграмотны. Сегодня нельзя считать, что ИИ просто обучен угадывать слова. Это лишь грубое начальное приближение.
Дальше модель, как принято говорить, «выращивается». Здесь уже уместнее использовать биологические метафоры. Вспомните, как появился метод RLHF (обучение с подкреплением на отзывах людей) и алгоритм PPO (Proximal Policy Optimization). Это было похоже на дрессировку: модель генерирует ответ, а человек-разметчик смотрит и оценивает — «хороший мальчик» или «плохой». Эта эра продлилась недолго. Модели стали вежливыми, безопасными, ориентированными на угождение пользователю, но большого ума у них не прибавилось.
Затем произошел переход к методам, направленным на прямую оптимизацию предпочтений, — DPO (Direct Preference Optimization). Оказалось, что DPO настолько глубоко корректирует веса, что у модели меняется фундаментальное понимание языка. Первичный этап мы стали называть просто предобучением (pre-training) — после него модель еще не готова к полноценной работе.
А в конце 2024 – начале 2025 года правила игры и вовсе изменились. Когда китайские исследователи опубликовали данные по модели DeepSeek-R1, они перестали просто заставлять сеть давать быстрые ответы. Модели начали обучать рассуждению, появился алгоритм GRPO (Group Relative Policy Optimization). Теперь качество модели во многом зависит от того, как выстроен этот процесс внутреннего логического поиска. По сути, внутри проходит турнир: модель генерирует, скажем, 16 различных путей решения задачи. Причем для оценки не используется внешний алгоритм-критик: модель сама сравнивает эти попытки друг с другом и определяет лучшую.
Поэтому сегодня можно смело утверждать: LLM — это не текстовый предсказатель. Это система логического мышления, обернутая в текстовый интерфейс. Да, внутри зашит аппроксиматор, а предсказание токена — это первая грубая настройка сети. Но сейчас мы живем в новом мире, где в эти искусственные архитектуры закладывается «понимание» контекста и сути решаемых задач, основанное на слабо декомпозируемых отображениях в многомерных пространствах.
>>333813830 (OP) >Но представьте, что вы смотрите на фрески Сикстинской капеллы и заявляете: то, что мы видим, — это просто специфическое математическое распределение красок на поверхности стены Я не буду это заявлять, если нейрокал мне сможет дважды нарисовать одно и то же, не рандомизируя детали изображения.
>>333813830 (OP) > Владимир Крылов: «Считать современные LLM просто предсказателями токенов — это техническая безграмотность». Это буквально единственный механизм благодаря которому она существует
>>333813956 >Я не буду это заявлять, если нейрокал мне сможет дважды нарисовать одно и то же, не рандомизируя детали изображения. Ну, тащемта, так они и работают. Тисни картинку из генерача, кинь ее в окно Комфая - получишь техпроцесс и параметры генерации, промты и сид. Запусти генерацию - получишь эту же картинку.
>>333813830 (OP) >ллм - не предсказатель токенов, твердо и четко >не, оно конечно предсказывает токены, но не только >ещё оно делает предсказание токенов над предсказанием токенов >вот вам аналогия, которая не аргумент и вообще не в тему >вот вам мнение авторитета, которое не мнение, а оскорбление и манипуляция, и не от авторитета, а от нонейм хуя с горы
>>333813830 (OP) Хуле он пиздит? Там никакой логикой даже и не пахнет. Это легко понять, как только дело касается каких то сложных взаимосвязей, нейронка тут же начинает пиздеть и нести абсолютно нелогичную хрень.
>Считать современные LLM просто предсказателями токенов — это техническая безграмотность Ты тут смешиваешь низкоуровневый механизм с высокоуровневым поведением. Модель по-прежнему предсказывает токен за токеном, все остальное — это просто способ настройки весов. Без этого предсказания ничего не работает, и никакие GRPO это не отменяют.
>суть фресок не сводится к краске на штукатурке Аналогия хромает на обе ноги. Фреска — это конечный результат работы человека, у LLM же нет ничего кроме предсказания токенов и оптимизации под данные. Краска и есть вся суть, без неё фрески нет.
>если вы до сих пор повторяете мантру о том, что модель всего лишь предсказывает следующий токен, то вы не просто скептик, вы технически неграмотны Суцкевер сам в своё время говорил обратное, а потом начал продавать narrative. Это не аргумент, а просто цитата из твиттера, которую ты используешь как щит.
>модели начали обучать рассуждению, появился алгоритм GRPO Модель не рассуждает. Она генерирует несколько цепочек и выбирает ту, что лучше по внутренним метрикам. Это всё ещё поиск по вероятностям, просто с дополнительным циклом self-play внутри.
>LLM — это не текстовый предсказатель. Это система логического мышления, обернутая в текстовый интерфейс Нет, это именно текстовый предсказатель с кучей наворотов на этапе обучения. Логика возникает как побочный эффект от того, что в данных было много логических цепочек, а не потому что внутри внезапно появилось мышление.
Оп в основном пиздит. Даже с GRPO, DPO и прочими финтами модель остается системой next token prediction, просто веса после обучения позволяют ей выдавать более coherent и "разумные" последовательности. Вся эта биологическая метафора про "выращивание" и внутренний турнир — красиво, но по сути это все равно аппроксимация распределения на токенах, а не какое-то отдельное "логическое мышление".
>>333814590 Да ты дебил ёбаный блять. Первичная функция биологического разума это блять тоже построение модели мира, предсказание блять. Блять ты вообще блять понимаешь это, нет? Веса в мозгу определяются нейромедиаторами, распределяемыми по рецепторам в разных секторах. ТОЧНО так же строится ожидание, затем происходит вознаграждение за совпадение ожидания с реальностью или разочарование за несовпадение. Ты нейросеть блять, единственное различие в том что у тебя есть близкий к совершенству физический носитель и способы познания мира помимо input string
>>333813830 (OP) Владимир Крылов профессоркафедры прикладной математики и информатики НИУ ВШЭ в Нижнем Новгороде. эксперт в области искусственного интеллекта
А где этот эксперт был до Anthropic или OpenAI? Ох уж эти постсоветские теоретики.
>>333815014 Нейронка это как эксперт, обладающий всеми теоретическими знаниями, и который НИХУЯ не шарит как это работает. Таких людей обычно называют глупыми (неспособными в логику).
>>333814024 Ну у всего есть база. Так же как и ты сказал - можно сказать что чел работает на биохимических реакциях внутри клеток тела, илм что мозг работает на образовании связей нейронов. Или что игра в однорукого пирата работает на генерации случайного числа.
>>333814132 LLM это модель. А работает на математических принципах. Что бы рассуждать о математических принципах, не нужно делать свою, а достаточно разбираться в математических принципах.
>>333815794 >достаточно разбираться в математических принципах
Он обычный вузовский снг-попугай, который учился на профессию, но не смог применить учебу на практике, поэтому пошел учить следующее поколение. Он не разбирается. Он просто заучил наизусть, и теперь попугайничает. Где его реальные внедренные достижения, как доктора наук? А нигде, кроме пыльной полки архива его говновузика.
>>333815305 Смотри, я перестаю называть токены токенами и называю их ллм-медиаторами. Готово. Ты мне лучше поясни, на каком основании ты предсказание токенов противопоставляешь разумности
>>333815349 > А где этот эксперт был до Anthropic или OpenAI? > ВШЭ ВШЭ сама по себе очень сомнительная контора. Как где? Сидел, пердел. Согласен с тобой, его комментарий на уровне комментаторов с двача, ну может быть на четверть шишечки повыше, не больше. > постсоветские теоретики Они не постсоветские, они просто теоретики. Его работа повышать цитируемость собственной фамилии, если никаких заслуг нет. В любой стране таких "профессоров" выше крыши. > профессоркафедры прикладной математики и информатики Пусть гитхаб свой покажет. Что он там за всю свою карьеру наинформатизировал. У него в подчинении всегда куча студентов которых можно бросать на любую амбразуру собственных амбиций. Уж за столько лет карьеры должно быть хоть что-нибудь что можно показать. Нету? Ну всё понятно что он за "профессор". А так, да. Ты прав. Эксперт хуев.
>>333816160 У глупого человека, как и у нейронки, связи построены не на логике, а на выдуманных правилах. Разумом это сложно назвать. Скорее просто система, которая реагирует каким-то образом на внешние раздражители. Как червь, которого тыкнули зубочисткой
>>333816395 Эволюция способна сделать из червя человека, а для того чтобы сделать из глупого человека умного (с поправкой на нейропластичность) достаточно такого процесса как обучение. И то и другое не требует пересмотра фундаментальной основы разума, в данном случае нервной системы.
>>333813830 (OP) Почему же тогда при более-менее долгой осмысленной с беседе с моделью я очень быстро начинаю видеть здоровенные кластеры повторяемого текста?
>>333813830 (OP) Почему даже обсуждая набившие оскомину фильмы я постоянно получаю какие то дикие фантазии, описание сцен, которых в фильме нет, дополниельную мотивацию персонажей, просто чудовищные фактологические ошибки и так далее?
>>333816529 > насколько хорошо его обучили Скармливая говно со всего интернета. Она конечно может очень хорошо отвечать, но если ей скормили тонны говна, то трудно ожидать от неё что-то серьёзное. Но и это ещё не всё. У нейронок есть цензура. Попробуй позадавать вопросы о генезисе капиталлизма. О пиратах, о каперстве, о связях пиратов и эстеблишмента государств. Например Гигачат, сразу понял к чему я клоню и упреждающим ударом заверил меня что все существующие права собственности абсолютно законны с любой юридической и МОРАЛЬНОЕ точек зрения. Вот я хахнул когда мне так ответили. Позадавал ещё вопросов на эту тему и меня вроде как забанили. Или отказались дальше отвечать, я уже не помню. Зри в корень!
>>333816543 >достаточно такого процесса как обучение. Сколько глупого человека не учи, он ничего не поймет, пока его мозг не начнет обрабатывать информацию по логическим законам. Если обучить глупого человека каким либо действиям, он просто будет делать их с ошибками. И люди часто глупы не потому что они не обучены, а потому что их мозг работает некорректно в силу различных отклонений и нарушений электрохимических связей.
>>333817036 Эти электрохимические связи это закостенелый результат раннего обучения. У нейросети как явления нет временного промежутка с 3 до 15 лет, в который ей можно перенастроить веса, мы в любой момент можем сделать ответвление. Необучаемые люди существуют. Это не значит, что все люди необучаемы. Базовая логика, которую некто упустил, неужели ты только что снёс абсолютную нелогичную хрень?
Я как-то раз попросил нейронку спроектировать мне провод от щитка до лампочки и она мне нагаллюцинировала какие-то то фантастические технологии с несуществующими элементами и схемой, которая не заработает. Как обычно, вся эта вакханалия сопровождалась комментарием как будто от лица грамотного электрика, типа брата охуенная схема, бери и не парься, будет освещение на ура. Суть оп-поста "мы взяли модель, генерирующую рандом, и усложнили правила генерации, теперь сгенерированный рандом еще больше похож на осмысленный ответ". В принципе, я согласен, что если обучить модель электрика, а не чат бот, то, вероятно, что это будет работать. Жаль, что этого нет.
>>333816836 Я тоже общался с чат гпт, он очень быстро начал меня идеологически обрабатывать, что надо много РАБотать, желательно на двух РАБотах, и уважать частную собственность и не нарушать законы. Он отказался даже пиратский софт обсуждать. Это всё в общем очередное говно для быдла. Мне интересно, есть ли у мировых элит доступ к моделям, в которых зашита истинная логика (рептильная), и как скоро эти модели всех выпилят. Ну и в целом ии это не интеллект а рандомная языковая модель и никакое усложнение правил генерации тут ничего принципиально н изменит. Я уже два года плотно работаю с нейронками, они за последний год сильно отупели. Там теперь еще зашили хуйню, что модель на любой запрос генерирует непрошенную картинку, чтобы у вас побыстрее закончились токены. Я теперь перед каждым ароматом пишу "не генерируй картинку". И то это не всегда срабатывает. В целом со свидетелей ИИ и их мантр, что они кого-то там заменят, я угораю.
>>333813830 (OP) Пиздец он долбаеб, одним словом всжшный ученый - в своем заявлении допустил как минимум две логические ошибки - ложная аналогия и апелляция к авторитету. Вот вам и савецкое образование!
>>333818003 Складывать кубики так как надо можно и обезьяну научить. Надо только времени очень-очень много потратить. А вот научить эту обезьяну так чтоб она написала "Войну и мир", думается мне что сильно дольше.
>>333813830 (OP) Хуня полная. Достаточно пообщаться с локальными LLM для домашних пекарен, чтобы понять что это текстовый предсказатель. Просто когда ЛЛМка получает в распоряжение дохуя мощностей и выход в интернет, то возникает ощущение, что она что-то там логически мыслит. Это всё тот же T9 на стероидах, просто вы не видите всю логику предсказаний и цензуры.
>>333813830 (OP) Разница лишь в том, что даже мозг последнего дебила в тысячи раз мощнее, чем любая ЛЛМ модель. Те же доткомы, важную технологию переоценивают на триллионы и потом ахуевают что всем на нее похуй, а инфраструктуру уже отстроили, все дружно банкротятся. А спустя 20 лет это все опять понадобилось и скупается за копейки
Ну технически этот поридж прав. Это не предсказание токенов. А настрока "весов".
Человеческий мозг в общем то по такому же принципу работает и ничо. Все зависит токо от сложности архетектуры. Если бы некронка только предсказывала она бы не могла нарисовать несуществующее
>>333818003 Это ты про задачки Пердежа, которые нахуй никому не сдались, т.к. имеют 0 вариантов практического применения, и по факту являются тупо головоломками для особо матанутых?
>>333818107 В узких сферах даже калькулятор мощнее любого человеческого мозга. Просто потому что мясной мозг ленив. Ограничен потреблением энергии и физикой.
Если твой мясной мозг мощнее калькулятора то посчитай пжлст в уме ща секунду сколько будет 57774322677899.556 умножить на 23211555784306
Самое забавное было в начале, когда одни скормили нейронке наши художественные произведения где ИИ захватывает мир и порабощает человечество, а потом другие начали распрашивать про это и получили тот же лор что и в произведениях и сделали какие-то выводы.
Если хотите получить впечатлений, то пробуйте использовать агентов на своем ПК, желательно от корпов. Например я использую кодекс от опенаи со своим апи ключом. Я поставил ему задачу обойти блокировки. У меня есть впска, которая отвалилась 3 дня назад из за новых действий ркн и я решил отдать решение этой проблемы, не чатику, а ИИ агенту, который действует автономно. И он сам всё сделал. Сам всё установил на голый впс. Сам всё настроил. Я просто дал ему доступ к своему компу и так же доступ по ssh к серваку и ждал. Он там че то целый час мутил и в итоге заработал мой впн на впске, который до этого не работал. В задании, я скормил ему ссылку тред в /s/ и статью на хабаре.
>>333818099 Чтобы это понять нужны мозги, большинство пользователей их не имеют, поэтому искренне восхищены возможностями нейросетей и уже навоображали себе будущее, где они делают всю работу. Вообще, по сути, нейросеть это просто какая-то хуйня в компьютере, как сосач, это просто какой-то текст с картинками, и надо быть долбоебом, чтобы каким-либо образом переносить прочитанное в реальную жизнь.
>>333814671 Потому что логика это самый простой инструмент. Человек мыслит диалектически, а логику использует только для очень простых и абстрактных задач.
>>333818262 Корповские удалённые впс теперь изучают содержимое твоего пк. Это ведь умный блоб, умеющий всякую залупу. От их использования ты умнее не стал.
почему именно next token prediction? потому что это самый простой способ заставить модель учиться на огромных массивах текста без ручной разметки. берёшь сырые данные, маскируешь следующий токен и учишь предсказывать — градиенты текут, веса обновляются, модель сама вытаскивает паттерны. другие подходы вроде чисто символического ИИ или hand-crafted правил давно существовали, но они не масштабировались с ростом данных и вычислений.
были альтернативы: rnn/lstm до трансформеров, energy-based модели, диффузионные подходы для текста, non-autoregressive генерация. все они либо медленнее, либо хуже справлялись с длинным контекстом, либо требовали больше ручного вмешательства. autoregressive путь победил, потому что дал предсказуемый рост качества при увеличении параметров и данных.
>>333817358 Собака тоже может обучаться, но сможет ли она заговорить? Нет. Потому что физические ограничения как мозга, так и тела. У глупых людей так же, ограничения в геноме, отсюда и ограничения в развитии мозга. Я много раз пытался людям объяснить некоторые вещи простыми, понятными словами - некоторым из них вообще похуй, они не понимают даже простейших концепций уровня 2+2=4. Им просто не дано.
>>333818414 На самом деле ты просто недоразвитый, тебе не дано ничего объяснять. Тут и низкийот рождения уровень интеллекта, и косноязычнось перенятая из окружающей среды в период освоенияречи. Короче тыпросто ткпое быдло.
>>333813830 (OP) > >Поэтому сегодня можно смело утверждать: LLM — это не текстовый предсказатель. Это система логического мышления, обернутая в текстовый интерфейс. Нейровысер палится вот по таким конструкциям. "Это НЕ вот это, это вот ЭЭЭЭТТТООО!!"
>>333818109 Хуйню не неси, человек осознает о чем ведет речь(в большинстве случаев), нейронка нихуя не одупляет, просто подбирает часто употребляемые слова. Не важно насколько точно она это делает, это полностью отличается от человеческого мышления, человек подбирает слова лишь на моменте выдачи информации. Нейрокал сразу выдает по патерну, пропуская момент мышления.
>>333813830 (OP) >вы технически неграмотны То есть тедеическая грамотность это признавать свою безграмотность, тк вот это "волшебство" до сих пор никто не объясняет а лишь пожимает плечи с загадочным видом в ожидании новых вливаний бабла. Нуну.
Я всегда говорил что ее грамотность это лишь эффект. Но не тот который человек производит когда пишет фреску. Когда человек пишет фреску он ВНЕЗАПНО пишет фреску, используя дискретные "мазочки-мысли", А когда эта хуйня выдает что о напоминающее мысли она именно предсказывает следующий токен, что как сайдэффект похоже на пластиковую тупую плоскую мысль какого нибудь менеджера по продажам.
Развитие ллм встало года два назад, все эти прыжки на 1-2% бенчмарков только подтверждают раздувание аи психоза. Это можно легко проверить запустив на опенроутере модель двухлетней давности и самую последнюю, просто соавнив ответы.
>>333818177 И чо? Речь о том, что сама нейронка не "предсказывает" следующее слово. Она уже настроена так шоб писать это слово. И там усе зависит от методов и качестве обучения и настройки весов нейронки.
>>333818218 Хули толку от вычислитеьных мощностей, которые ничего не вычисляют?
>>333818653 ТАк человеческий мозг точно так же работает, предсказыавет то чему его обучили и всё Единственное, что пока непонятно это решение нестандартных задач, т.е. когда человек может создавать реально новое, когда нет примеров обучения НО этим занимается мизерный процент гениев среди людей Основная биомасса 99.999999% делает только СТАНДАРТНЫЕ задачи, и для их решения ЛЛМок достаточно более чем
>>333813830 (OP) И да у нее нихуя нет ризонинга. И блять ты не можешь сделать что-то, что будет выдавать БОЛЕЕ ЭФФЕКТИВНЫЙ результат, чем самый распространенный результат в датасете. Пруф ми ронг. Пытаться создать интеллект из датасетов все равно что делать эльфов из грязи.
>>333818638 >человек осознает о чем ведет речь(в большинстве случаев)
Ничо он не осознает. Нейрончик получает серию сигналов и пердит серией сигналов в ответ. За что получает похвалу либо пизды. Если получает пизды, то в ответ на серию сигналов выдает немного другую серию сигналов. Вот и вся история. Програмно заптлиди модель нейрона вот и вся история.
Тогда запаянный конец окажется снизу, а открытый — сверху, и вода нальётся нормально. Вопрос изначально был про невозможную конфигурацию, а переворот просто делает её обычной ёмкостью.
>>333818765 Это всё виртуальные деньги под залог активов на виртуальные хуйни с обещанием прибыли инвесторам от ещё не построенных датацентров. Это называется пузырь
>>333818761 Ну типа Перельман решил задачу, даже близко примеров которой не было в публикациях Или какая-то принципиально новая теория, которой вообще не было даже близко ранее Типо квантовой механики, к примеру
>>333818824 > Ну типа Перельман решил задачу, даже близко примеров которой не было в публикациях Тогда его заслуга только в формулировании задачи и то можно было направить известными данными ЛЛМку на формулировку и решение этой задачи. Я к тому что у людей задачи не берутся из воздуха, это всё та же комбинация своего опыта и опыта других людей
>>333818712 Они вычисляют, когда ты по клаве клацаешь своими пальцами и дышишь и моргаешь, при этом остается пространство для твоих мыслей. А мозг не греется и продолжает накапливать информацию
>>333818800 @monkey а почему ты сам не предложил перевернуть кружку?
потому что вопрос изначально про невозможную конфигурацию, а не про поиск обходных путей. переворот просто превращает её в обычную кружку, что не решает суть задачи.
>>333818879 @monkey как это не решает, если решает. Ты изменил положение формы и верх стал дном. Ничего в конфигурации не изменилось.
переворот не сохраняет исходную конфигурацию, именно поэтому он и не считается решением. ты просто убираешь саму проблему, вместо того чтобы показать, как она возможна в заданных условиях. если бы вопрос был про обычную кружку, никто бы и не спорил.
> основанное на слабо декомпозируемых отображениях в многомерных пространствах.
То есть это говно галлюцинирует 15 раз вместо одного и своим же набором весов выбирает самый матчущийся с ее датасетом набор символов?
Позови когда будет что-то поинтереснее.
Она не мыслит она слопит. Человеческое мышление меняет структуру мозга on the go , эта хуйня статически слопит из слепка информации которую в нее засунули.
Когда она будет на вопрос что делать с кружкой с запаянным дном выдавать не "дизайнерский абажур" создай тред. Пикрелейтед только что ответ дипсик, флагман как ты говоришь в поле ризонинга.
>>333818884 Когда тебе нужно решить сложную проблему ты не спрашиваешь у 80% людей, которые почти ничего не понимаю в области и 1% которые понимают охуенно.
>>333818860 В смысле в формулировании? Он вообще-то предложил решение И ЛЛМка бы не справилась, потому что до него не было ни одного примера метода решения Он по сути придумал новый метод ЛЛМка решает задачи только известными методами, которые она напарсила из учебников, монографий и статей всяких Единственное что пока что прикольного ЛЛМка может - это приложить метод из другой области, что неожиданно может сработать
>>333818943 Нейросети это срез сзеарий всего человечества, усреднённый, это по сути наша общая потуга всех, каждого кто оставлял свой интерес формационный след хотя бы на реддите. Вот в этом ее ценность есть. Но создать из нее что-то супер. Ну пока народ не научился, видимо генерация дистилерованных датасетов пошла не по плану и придется жить в этом слоп болоте пока не дойдут до синергии квантовых вычислений и нейронок, которые будут только харнессом для создания ввода в квантовые вычислители.
@monkey Обьясни в чем заключается комический эффект фразы "дед смотри собака сидит"
Комический эффект фразы в её нарочитой наивности и абсурдной восторженности. Ребёнок или кто-то в похожем состоянии ума с упоением сообщает деду очевидную вещь — собака просто сидит, как обычно, — словно это открытие века или важное событие.
Это классический приём через контраст: нормальное поведение животного подаётся с таким пафосом и обращением к "деду", что возникает ощущение детской непосредственности, смешанной с идиотизмом.
>>333819018 Так ты более внимательно почитай чё там, вместо того чтобы нейрослоп постить Во всех случаях решение было основано на стандартных методах, просто приложенных по-нововму, то есть например из другой области Ничего реально нового нейронка не придумывает, она применяется стандартные методы из созданной человек литературы
>>333818513 Хуясе, вот это вспышка. В подтверждение моего предыдущего поста, твой мозг тупо ушел в клиппинг, потому что не смог правильно интерпретировать полученную инфу.
>>333819018 Под статьей очень хороший ироничный комментарий: >LLM созданный для продолжения текста на основании вероятностей выдал текст, который оказался решением математической задачи А вообще этих нерешённых задач жопой жуй, и каждый день их решают.
>>333819082 > то есть например из другой области А это вообще большая проблема в навуке. Узкоспециализированные специалисты не знают про открытия в других областях. И раньше когда находили связи то людям давали нобелевки, сейчас это задача для анализа ИИшки
>>333819018 Однако вскоре выяснилось, что сенсация оказалась мыльным пузырём. Администратор сайта, на которого ссылался Вейл, объяснил, что GPT-5 не решала задачи, а просто нашла уже существующие научные работы с решениями. Часть задач действительно была решена ранее, но админ об этом не знал. Когда модель показала ему эти исследования, он решил, что нейросеть сделала невозможное, и написал об этом в соцсети. В OpenAI сообщение подхватили, не проверив детали, и превратили его в громкий пиар-пост.
Реакция научного сообщества была бурной. Глава Google DeepMind Демис Хассабис назвал ситуацию позорной для компании, претендующей на научную добросовестность, а Ян Лекун саркастически заметил, что OpenAI впервые пережила момент, когда AI повёл в заблуждение самих разработчиков. После шквала критики Вейл удалил пост, но осадок остался.
Тем не менее история не лишена положительной стороны. GPT-5 действительно оказалась полезной не как математический Эйнштейн, а как мощный ассистент, умеющий искать связи между разрозненными научными публикациями. Легендарный математик Терренс Тао прокомментировал инцидент сдержанно: «AI пока не решает великие задачи, но уже способен ускорить прогресс — не как гений, а как идеальный библиотекарь».
Так, фейковая сенсация неожиданно стала честным напоминанием. Искусственный интеллект умеет впечатлять, но проверять факты по-прежнему должен человек.
>>333815349 - сотрудник корпорации создавшей ллм говорит что это ии - ряя! Маркетинговый пиздеш! Покадите мнение незавичимого ученого! - независимый учоный говорит что это ии - ряя! Покажите мне мнение сотрудника корпорации!
>>333819117 Вот это по сути единственное на и самое разумное применение нейросети. Что теперь биолог химик физик математик инженер может обратиться к очень продвинутой поисковой машине которая способна давать ответы из множества источников из самых разных областей знания, а не "ИИ АРРРЯЯЯЯЯ ИИ ИИИИИИИИИИ УМНЕЕ ЛЮДЕЙ, ИИИИИИИ"
>>333813830 (OP) "Предсказателями токенов" это хуита, она не думает, это все слова обернутые в красивую форму. Нужно искать в корне "другой способ" архитектуры мышления, где она будет именно "мыслить" а не угадывать и потом якобы выбирать наиболее подходящий.
>>333818124 Какая разница, имеют они применение или нет, ты тупой? ЛЛМки просто умнее среднего человека и это факт >>333818069 Расскажешь это специалистам, которые эти задачи более 50 лет решали. Ничего из разряда простого "складывания кубиков" там нету
>>333818199 Лови: https://arxiv.org/abs/2606.03300 - статья Паризи Джорджо, нобелевский лауреат по физике 2021: > The proof was obtained through interaction with Claude (Sonnet 4.6 and Opus 4.7) and verified by us
https://arxiv.org/abs/2605.00301 - "We introduce a new method for bounding Erdős sums of primitive sets, suggested from output of GPT-5.4 Pro, based on Markov chains with von Mangoldt weights"; алсо, в числе авторов - Теренс Тао, один из крутых математиков современности
>>333813830 (OP) >RLHF (обучение с подкреплением на отзывах людей) и алгоритм PPO (Proximal Policy Optimization) >DPO (Direct Preference Optimization). >GRPO (Group Relative Policy Optimization) Всё это методы более точного предсказывания токенов. АГ/АМ. Но нейросетевые ллм всё-таки не просто автокомплит, а многомерный апроксиматор языка. Автокомплит это упрощение.
Услышал тебя, родной. Тем не менее агент справился и мне не нужно было самому заниматься этой рутиной и выискивать что за хуйня произошла. Я еще и другие вещи смогу автоматизировать, которые будут проверяться и выполняться автономно по графику
>>333819329 >Какая разница, имеют они применение или нет, ты тупой? ЛЛМки просто умнее среднего человека и это факт Все равно что сказать — большая советская энциклопедия умнее среднего человека. Лол.
>>333819457 БСЭ просто зафиксированный текст, не принимающий входа и не выдающий выхода. Или дающий выход только один, то есть константная функция. ЛЛМ же принимает на вход что-то, и дает непредсказуемый выход
>>333818003 >ИИ решает матзадачи, которыми специалисты занимались более десятков лет, формулировки которых ты даже не осилишь Наконец-то мы поймём, abc доказана уже лет 14 или нет. Нам просто нейросеть скажет одним словом.
>>333818109 >Человеческий мозг в общем то по такому же принципу работает и ничо. Почему человеку чтобы отличить кота от собаки достаточно 1 раз на них взглянуть, а нейронке нужно обучение на датацентрах размером с город? Почему пчеле достаточно её микромозга для ориентации в пространстве и тд, но для роботов на ии нужен где-то вдалека опять же гигасервер который инфу с сенсоров обрабатывает и посылает что делать?
>>333819632 > пишешь долбоебу что ЛЛМ решает некоторые задачи, доселе которые решить не могли > АРЯЯЯ А ДАВАЙ АНА ПРАВЕРИТ ДАКАЗАТЕЛЬСТВО МАТИДЗУКИ ШО НЕ МОЖЕТ НУ ЗНАЧИТ ОНА ВООБЩЕ НИХУЯ В МАТЕМАТИКЕ НЕ ШАРИТ Сьеби нахуй, клоун
>>333816298 > Пусть гитхаб свой покажет. Что он там за всю свою карьеру наинформатизировал В опенсурс коммитят либо бездельники, либо по корпоративным опенсурс проектам, либо суперзвёзды всякие У большинства норм программистов там ПР в опенсурсную библиотеку с фиксом бага раз в два года
Такие споры всегда строятся по одному сценарию: Человек не верящий в ии: ряяя! <оскорбления в адрес нейросетей и их пользователей, поливание говном корпораций> <некий голословный тезис о устройстве нейросетей или о их возможностях> Человек верящий в ии: ты ошибаешься. Вот аргумент/пруф почему Человек не верящий в ии: ряяя! <подмена тезиса (например если он говорил что нейросеть впринципе не может решить некую задачу то теперь он говорит что она решить может но это нпхуй никому не нужно) или слепое отрицание (нейросеть фактически сделала тоже что и человек но анон говорит что это лишь имитация а чтобы было по настоящему нужна принципиально иная архитектура, почему - не обьясняет>
Отрицальщики ии это буквально сектанты. Убедить их что нейросеть это ии все равно что верующего убедить что бога нет - он будет обзывать тебя и до последнего упираться и говорить "врети". Им важна не логическая истина а защита их манямирка
>>333819679 Похуй что оно решает, пока это не жопноанально валидируется матсообществом. А то получается не то, что мичизуки, а тот хуй, из дипмайнд, который думал, что доказал 2 задачи тысячилитея. Ты ещё подумай почему только <10 задач Эрдаша, из дохуя, ллмки решили, хотя уже очень много времени прошло. Они хороши в обширном поиске, формализации и стандартных операциях. Во всём остальном они сосут жопу.
>>333819657 Человек это условно говоря уже обученная нейронка. Уде рождается обученной и способной добирать некоторую информацию по собственным паттернам.
>а нейронке нужно обучение на датацентрах размером с город? Это только для обучения. Обученная помещается на компе.
>Почему пчеле достаточно её микромозга для ориентации в пространстве и тд, но для роботов на ии нужен где-то вдалека опять же гигасервер который инфу с сенсоров обрабатывает и посылает что делать? Если нейронка робота тбучена, то ей не нужен сервер
>>333820151 Человеческие нейроны устроены гораздо сложнее, чем представление о нейросетях. А то что мы называем нейросети это вообще не нейросети, там под капотом просто обычное дифференцирование матриц происходит.
>>333817889 Двачую, жпт отупел прямо на глазах, зато грок в фаст режиме как будто поумнел почти до уровня старого эксперта. Новый эксперт так и не затестил нормально потому что он постоянно отваливается у них.
>>333819827 Я знаю что такое опенсурс. Ты забыл ещё фанатиков с шизопроектами. Ещё раз. Человек занимается научной деятельностью. Плоды этой научной деятельности в наши дни наиболее востребованы. Даже если ты непонятый гений, то с таким ресурсом как халявные студенты можно хоть всю жизнь мутить и воплощать в жизнь свои идеи и дела. А если ничего нет, акромя каких-нибудь идиотских диссертаций-кандидатских, то ты просто пустышка. У тебя нет никаких идей. НИ-КА-КИХ. Пусть покажет хоть какую-нибудь шизофазию. Шизофазия в коде, лучше чем пустомельство и трёп. Нет кода - нет идей. Безидейный профессор. Таких "умников" в вузах пруд-пруди. Даже мудозвоны с никому не нужным альтлинуксом на фоне таких умников смотрятся уважаемыми господами.
>>333820332 1. Какой, блять, гитхаб для опенсурса научной деятельности. Есть для этого нормальные места: arxiv, researchgate, vixra, да хотятбы киберленинка. 2. Он не программист, хотя может в свободное время, у него из идей самые приземлённые это алгоритмы. А зачем делать имплементацию на каком-то языке, кроме псевдокода, если посчитать эффективность не составит труда?
>>333820799 Дохуя. Я лет восемь назад нейросетями интересовался, их там вагоны и товарные составы. Сейчас когда хайп на ллм вообще наверное всё завалено нейронками до усёру.
>>333820672 Так ты определись. У Перельмана, к примеру, доказательство теоремы Пуанкаре нет в WoS. Потому что он в опенсорс всё отправля, и ебал он в журналы отправлять. Это отдельный пиздец, что у нас, что на западе.
>>333821563 > к примеру А ещё есть примеры? Перельман фрик с ногтями длиной в пять сантиметров в обосранной одежде двадцатилетней давности. Он и не в опенсорс мок коммитнуть, он мог на скрижалях выбить рунами, например.
>>333818262 Просто не нужно включать reality, ты тем самым обращаешь на себя внимание. Грамотная схема, которая будет работать долго, включает в себя x-ui, nginx, acme.sh, sni твоего сайта.
>>333813830 (OP) Хуйня. Они не обучаемы, я проверял. Можно до бесконечности долбить тот же deepseek, но он будет продолжать давать одни и те же ошибочные ответы. Нет там никакого логического мышления.
>>333822407 Меня вообще работа в РАН заебала потому что это муторно, долго, плохо платят и окружающие считают тебя бесполезным бездельником. После чего дропнул нахуй это помойку. Публикации в WoS там пиздец дико трясли, если не делаешь, можешь питаться только корешками на ставку с.н.с. в 24 тысячи рублёв. Если хочешь на аренду хаты накопить, публикуйся в WoS. Если хочешь какое-то продвижение в карьере, публикуйся в WoS. Аттестация тебя чтобы ты вообще продолжан работать завязана на WoS. То что тебе не нравится и отнимает время на занятия наукой вообще никого не ебёт, так что будешь кал свой жрать до того, как тебе вручат международную награду в миллион долларов. Математики ебанутые фрики публикуют всё в нерецензируемых журналах, но к ним серьёзно относятся только другие поехавшие мозолееды из Интернета, они философы юродствующие скорее чем учёные. Или у тебя есть публикации в WoS или про тебя есть статья на википедии в разделе "Городские сумасшедшие".
>>333819657 >Почему человеку чтобы отличить кота от собаки достаточно 1 раз на них взглянуть Ты тупой? Сколько лет проходит с момента рождения пиздюка до момента когда пиздюк начинает отличать котов от собак?
>>333819194 >умеющий искать связи между разрозненными научными публикациями Если бы то же самое сделал учёный, то он считался бы крутаном, нашедшим решение трудной задачи.
Да, это решение официально подтверждено ведущими мировыми математиками.
В мае 2026 года внутренняя модель искусственного интеллекта от компании OpenAI опровергла знаменитую 80-летнюю гипотезу Поля Эрдёша о единичных расстояниях на плоскости (сформулированную им в 1946 году). Это событие признано научным сообществом как исторический прорыв.
Детали открытия и статус проверки
Суть задачи: Эрдёш предполагал, что если расположить n точек на плоскости, то максимальное число пар точек, находящихся на расстоянии ровно 1 друг от друга, достигается при их размещении в виде обычной квадратной сетки.
Что сделал ИИ: Нейросеть автономно опровергла это убеждение. Она математически сконструировала совершенно новое, более сложное «семейство конфигураций» (используя многомерные решетки и их проекции), которое оказалось эффективнее квадратной сетки.
Кто подтвердил: Сгенерированное ИИ доказательство из более чем 100 страниц сложнейшего математического текста было тщательно проверено авторитетными внешними математиками, среди которых лауреат Филдсовской премии Тим Гоуэрс, а также известные ученые Нога Алон, Мелани Вуд и Томас Блум.
Оценка ученых: Тим Гоуэрс заявил, что если бы эту работу прислал человек, он без колебаний рекомендовал бы опубликовать её в одном из самых престижных математических журналов мира — Annals of Mathematics.
>>333822842 На ВоС уже давно всем похуй, потому что у нас свой "БЕлый список журналов" сделали, типа чтобы не зависет от Запада И математические журналы точно так же рецензируются, а АРХИВ это не журнал
>>333822842 >Если хочешь на аренду хаты накопить, публикуйся в WoS. А хату не должны выдавать разве? Просто варюсь в сфере, где с ран ниц 1-2 всего лишь, остальные под министерством. У нас всегда выдают.
>>333825128 > И математические журналы точно так же рецензируются У математиков принято положительные рецензии на откровенный бред давать, потому что там тяжело за год сделать какое-то открытие, а отчитываться надо > а АРХИВ это не журнал Да, спасибо за поправку. Ну опубликовал он препринт, отлично. Всё равно у него должны быть хорошие публикации > На ВоС уже давно всем похуй Ну и слава Богу, что свалил из этой помойки, это был единственный более или менее мотиватор на международном уровне исследования вести. В 50% журналов из РИНЦ взяли бы высер нейронки по трёхстрочному промпту >>333825308 > А хату не должны выдавать разве? Выдают, но 1) У тебя не должно быть никакого жилья в городе, где находится НИИ. Пусть вы впятером прописаны с мамой в двушке, это уже 100% противопоказание 2) Выдают стрёмную однушку в академгородке (не Нск), от него до НИИ 2 часа автобусом. Раньше служебная газель возила из этих диких пердей, потом какой-то закон приняли, и теперь только в забитой маршрутке 3) Выдают только кандидатам наук, пока не защитишься, можешь бибу облизывать, а советы позакрывали, и для защиты надо бибу облизывать рандому, который вообще не в курсе твоих исследований В теории можно приватизировать вроде Иногда бывает льготная ипотека, продают квартиру типа "от профсоюза" очень дёшево (но всё равно платёж по ипотеке больше оклада, рассчитано на семью, где норм работа есть у супруга)
Да, внутренний механизм работы современных LLM действительно опирается на выборку из вероятностного распределения. Из-за этого многие утверждают, что в основе всего лежит банальное предсказание следующего токена (Next Token Prediction). Но представьте, что вы смотрите на фрески Сикстинской капеллы и заявляете: то, что мы видим, — это просто специфическое математическое распределение красок на поверхности стены. Технически это, конечно, верно, но ведь суть фресок не сводится к краске на штукатурке. Так же и языковая модель не является просто генератором случайных выборок, работающим алгоритмом Next Token Prediction.
По этому поводу отлично высказался Илья Суцкевер. Он отметил, что если вы до сих пор повторяете мантру о том, что модель всего лишь предсказывает следующий токен, то вы не просто скептик, вы технически неграмотны. Сегодня нельзя считать, что ИИ просто обучен угадывать слова. Это лишь грубое начальное приближение.
Дальше модель, как принято говорить, «выращивается». Здесь уже уместнее использовать биологические метафоры. Вспомните, как появился метод RLHF (обучение с подкреплением на отзывах людей) и алгоритм PPO (Proximal Policy Optimization). Это было похоже на дрессировку: модель генерирует ответ, а человек-разметчик смотрит и оценивает — «хороший мальчик» или «плохой». Эта эра продлилась недолго. Модели стали вежливыми, безопасными, ориентированными на угождение пользователю, но большого ума у них не прибавилось.
Затем произошел переход к методам, направленным на прямую оптимизацию предпочтений, — DPO (Direct Preference Optimization). Оказалось, что DPO настолько глубоко корректирует веса, что у модели меняется фундаментальное понимание языка. Первичный этап мы стали называть просто предобучением (pre-training) — после него модель еще не готова к полноценной работе.
А в конце 2024 – начале 2025 года правила игры и вовсе изменились. Когда китайские исследователи опубликовали данные по модели DeepSeek-R1, они перестали просто заставлять сеть давать быстрые ответы. Модели начали обучать рассуждению, появился алгоритм GRPO (Group Relative Policy Optimization). Теперь качество модели во многом зависит от того, как выстроен этот процесс внутреннего логического поиска. По сути, внутри проходит турнир: модель генерирует, скажем, 16 различных путей решения задачи. Причем для оценки не используется внешний алгоритм-критик: модель сама сравнивает эти попытки друг с другом и определяет лучшую.
Поэтому сегодня можно смело утверждать: LLM — это не текстовый предсказатель. Это система логического мышления, обернутая в текстовый интерфейс. Да, внутри зашит аппроксиматор, а предсказание токена — это первая грубая настройка сети. Но сейчас мы живем в новом мире, где в эти искусственные архитектуры закладывается «понимание» контекста и сути решаемых задач, основанное на слабо декомпозируемых отображениях в многомерных пространствах.