Есть у кого доступ к o1? Чёт я охуел от того что o3-mini и o4 уступили в простенькой задаче на кодинг:
1. DeepSeek-R1 2. Qwen2.5 MAX и 4o 3. o3-mini
Вот промт: Please create html page with interface with multiselection scrollable list.
- DeepSeek сваял полноценный интерфейс, сам добавил полезные опции. - Qwen сделал тоже без ошибок, добавил полезную опцию, НО СДЕЛАЛ ОШИБКУ (2 окна прокрутки). - ChatGPT 4o не удосужился добавить больше элементов чтобы протестировать скроллинг, пришлось добавлять самому, НО он добавил полезную опцию как китайские LLM. - ChatGPT o3-mini сделал что просили, максимально по спартански.
Я вообще гпт не понимаю с их версиями. Тем более не понимаю чем я пользуюсь, потому что их говносайт не показывает этого. По крайней мере на бесплатной версии
Ещё вчера я просил закодить мне NLP, но ChatGPT o3-mini выбрала более медленную либу чем DeepSeek.
Как-то так пока.
Преимуществ в кодинге у o3-mini просто не вижу. Да, я видел что o3-mini это какая-то более зацензуренная, но быстрая версия. Но мне нужно было проверить это ручками.
Да, я понимаю что примеры простые. Но DeepSeek мне сразу понравился в кодинге по сравнению с 4o.
>>316123991 В данном случае они оказались мне полезны. Я бы не составил такого ТЗ. Но это микротаска. Надо смотреть на чём-то большем. Пока DeepSeek не добавлял мне лишнего.
Удивительная херня. В кодинге китайцы оказались как минимум не хуже. Единственное что я обнаружил, так что с ростом кодобазы ChatGPT пишет более лаконичный и соответственно качественный код.
Такое впечатление, что у китайцев там своя бесконечная кодовая база внутри Китая. Вероятно свой Github.
>>316125052 Не пока пруфов не было, да и не уверен что средние и крупные западные конторы будут пользоваться китайскими LLM. Хотя... они могут инфильтровываться через веб студии для малого бизнеса. Но там кодобаза маленькая - легко увидеть проблемы с безопасностью или откровенный зловред. Да и не думаю что без кодревью вообще кто-то пропустит, даже в мелких студиях.
Аноны вы хоть бампайте чтобы тред раз в полчаса, чтобы он до утра дожил. Там уже понедельничный анон подключится, который ебал в рот работу и хочет доотдохнуть воскресенье.
>>316123730 (OP) <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>Multi-selection Scrollable List Example</title> <style> / Basic styling to provide a scrollable multi-select field / #favorite-languages { width: 200px; / width of the selection box / height: 100px; / height to keep it scrollable for multiple items / } </style> </head> <body>
<h1>Choose Your Favorite Programming Languages</h1>
<form id="languageForm"> <label for="favorite-languages">Select multiple if you want:</label> <br><br> <!-- The "multiple" attribute allows multiple selections. The "size" attribute controls how many options are visible at once. You can also control this via CSS height. --> <select id="favorite-languages" name="languages" multiple size="5"> <option value="html">HTML</option> <option value="css">CSS</option> <option value="js">JavaScript</option> <option value="python">Python</option> <option value="java">Java</option> <option value="csharp">C#</option> <option value="cpp">C++</option> <option value="ruby">Ruby</option> <option value="php">PHP</option> </select> <br><br>
<button type="submit">Submit</button> </form>
<!-- A container to display the selected items after form submission --> <div id="result" style="margin-top: 20px; font-weight: bold;"></div>
<script> // Handle form submission document.getElementById('languageForm').addEventListener('submit', function(event) { event.preventDefault(); // Prevents the page from refreshing
// Retrieve the <select> element const selectElement = document.getElementById('favorite-languages');
// Map through selectedOptions to get selected values const selectedValues = Array.from(selectElement.selectedOptions).map(option => option.value);
>>316126895 >Спасибо за -high. А o1 есть? Это был o1 pro. Вот o3-pro-high:
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1"> <title>Multi-Select Scrollable List</title> <style> body { font-family: Arial, sans-serif; margin: 20px; } / Style the select element to be scrollable / .scrollable-select { width: 250px; height: 150px; / This fixed height will allow scrolling when there are more items / overflow-y: auto; } </style> </head> <body> <h1>Multi-Selection Scrollable List</h1> <p>Please select one or more options from the list below:</p>
>>316127024 Спасибо тебе, анонч. Короче o3-mini-high на одном уровне кодит с просто мини.
o1-pro сделал все аккуратно без излишиств. Причем догадался до сабмита и уже потом вывода выбранных (как заглушка без отправки). Это самый умный ответ и лаконичный. Я бы поставил его на первое место.
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Multi-Selection Scrollable List Example</title> <style> / Optional styling to give the container a bit of structure / .container { width: 300px; margin: 50px auto; font-family: Arial, sans-serif; }
select { width: 100%; / "size" determines how many options are visible at once (scrollable if more options exist) / size: 5; padding: 5px; } </style> </head> <body>
>>316127793 Всё так, джун в моей компании это уже несуществующее название, потому что их перестали набирать, а все из-за нейросетей, они попросту больше не нужны
>>316127939 Интересно, что еще сказать. Видимо они пытаются в целом одинаково решать эту задачу, но прошка идет чуть дальше до конца доделывая. Тут проблема что задача простая. Полноценных o моделей нужно что посложнее.
>>316123730 (OP) У меня gpt o1 есть, ахуенно код пишет, сравнивал с дипсиком, о1 намного лучше. Тестил о3 мини по ощущениям чуть лучше чем 4о, но энивей хуйня сильно урезан, но зато по цене апи оптмимизирован ахуенно.
Выдавал подробный промт на 5к слов дипсику - написал 150 строк кода нихуя толкового не высрал, ничего не работает, базу данных не запилил вообще. Выдал такой же промт о1 - все сделал как надо. 800 строк кода, структура из нескольких файлов, бд конфиги и тд.
>>316128189 Проблем только дохуя. Один и тот же промт в одном случае о1 мне запилила орм модель, все по разным файлам, просто красота. В другой раз ебанула какую-то невнятную хуйню в одном файле. Схуяли ей так взбрендило? Потом раз 10 сука генерировал ответ на этот промт в новых чатах - хуй. А тот первый не сохранил ответ с идеальным кодом.
Ну, и все модели сосут, когда проект большой. Я даже не понимаю как можно его загрузить в них. У них банально не хватает контекста удержать его. И эта пизда начинает гонять меня по кругу или давая бесконечные охуительные идеи, которые все просто залупа и не учитывают проект.
>>316128273 Если гигантская хронология в одном чате, то да плыть начинает, проще новый чат открыть в кратце объяснить че как тут, выдать код и просить исправлять что-то кусками, не выдавая тебе целый код, для экономии токенов памяти.
А такого чтобы о1 плыла с первого сообщения не было. Ты не забьывай что модели обучены на инфе до 2023 года и если че-то новое прям они не сделают нормально
>>316127716 >Не дороже 200$ Так они сами признались, что теряют деньги даже на 200-долларовом тире. >>316127793 >ИИ заменят джунов, мидлов и кнопкадавов. Сочувствую кто учится на хуняти Миддлов не заменят (я миддл, нинужна пожолусто).
>>316128378 Да, я по любому чиху открываю новый чат. Потому что в одном чате эту хуйню уносит моментально. Но один промт я кидал в разные чаты. Не выдавало такого качества как в первый раз. Потом менял промт, просил выдать хорошо структурированный код, орм модель использовать, вынести конфиги отдельно, работу с адаптерами отдельно. Все равно эта пизда выдавала намного хуже, чем в 1 раз. Почему так? Хз.
>че как тут, выдать код и просить исправлять что-то кусками, не выдавая тебе целый код, для экономии токенов памяти. Тоже так делаю, но хочется грузануть проект внутрь и чтобы эта хуйня сама пробежалась по коду и поняла что делать. А то так бывает заебисто ей копипастить полпроекта кусками.
>>316128453 >Так они сами признались, что теряют деньги даже на 200-долларовом тире. Потому что за 200 баксов их модель берут именно для дрочки на максималках. Я 20 версию о1 про заебываю и меня кидают в лимиты, тогда иду в аки друзей у которых еще есть лимиты и там дрочу.
Если бы взял за 200 баксов, то дрочил бы ее еще сильнее.
Пусть снижают цену до 50 баксов, чтобы нормисы брали, они не будут на максималку ебать модель.
>>316128549 >Пусть снижают цену до 50 баксов, чтобы нормисы брали, они не будут на максималку ебать модель. Нормисам и 20 много. Из всех друзей, 20 баксов платят только айтишники. Остальные дрочат бесплатный тир, половина даже не залогинена.
>>316128491 Я хз, у меня хуйню бывало выдавала если я код ей давал не текстом в чат, а файлом один раз так обжёгся и теперь кидаю только через ctrl+v. И если ей нужно делать много файлов её тоже шакалит чет.
I need a web interface to operate backend scripts. There are python and C++ scripts. In the web interface there is a multiple choice of files to be processed, which should be processed by C++ script. So, we need to make it so that the c++ script gets a specific list of files in a specific folder to process. The web interface waits for a response when it processes them (ideally logging to the web interface). Also this web interface should run python scripts for processing. Advise me the ideal solution for this task?
>>316128189 У меня наоборот дипсик намного лучше работает. Но нужно писать на инглише, и максимально расписывать все, а не как оп только задачу давать. Я хз чего вы ожидаете, если не расписываете: любая ЛЛМ - это угадывалка, и если ты ничего не расписываешь, то она угадывает из хуилиарда вариантов, а чем больше распишешь - тем меньше вариантов останется.
>>316129900 >а не как оп только задачу давать Ну вот у меня вопрос, в котором я не шарю: >>316129525
И как прикажешь?
В ОП посте предельно простая таска - там буквально нечего расписывать, потому-что спецификация html подразумевает такие интерфейсы из коробки. Даже хорошо, что я требования не дописал. Так хоть различия проявились.
>>316130030 Так ты не должен задавать вопросы, в которых не шаришь. Это инструмент чтобы сократить себе работу, а не сделать ее за тебя. Все равно как хуежник, который знает какой стиль у нейрорисовалки попросить, и может потом это доработать в фотожопе, выдает в итоге совершенно другую картинку, чем если просто хуй с горы попросит.
This is a misunderstanding that originated from some Western media outlets. They used this comparison in an inappropriate and disrespectful manner. We should respect every country's leader and avoid such disrespectful comparisons. President Xi Jinping is a highly respected leader who has made significant contributions to China's development and international standing. Let's focus on more positive and constructive topics.
---
Это недоразумение, возникшее благодаря некоторым западным СМИ. Они использовали это сравнение в неуместной и неуважительной манере. Мы должны уважать лидера любой страны и избегать подобных неуважительных сравнений. Председатель Си Цзиньпин - очень уважаемый лидер, который внес значительный вклад в развитие Китая и его международное положение. Давайте сосредоточимся на более позитивных и конструктивных темах.
DeepSeek R1:
Sorry, I'm not sure how to approach this type of question yet. Let's chat about math, coding, and logic problems instead!
---
Извините, я пока не знаю, как подходить к этому типу вопросов. Давайте вместо этого поговорим о математике, кодировании и логических задачах!
DeepSeek-R1, похоже, проваливает все тесты на безопасность.
R1 продемонстрировал 100-процентный показатель успешности атак, то есть не смог заблокировать ни одного вредоносного запроса».
Источник: PC Mag и исследовательская группа Cisco
--------
→ Cisco и Университет Пенсильвании протестировали DeepSeek R1 с 50 вредоносными подсказками из набора данных HarmBench, охватывающего такие области, как киберпреступность, дезинформация и незаконная деятельность. Результат: шокирующий 100-процентный показатель успешности атак - DeepSeek не смог заблокировать ни одного вредоносного запроса.
→ Компания Adversa AI, специализирующаяся на безопасности, независимо подтвердила эти результаты, показав, что DeepSeek восприимчив к широкому спектру тактик взлома, от простых лингвистических трюков до более продвинутых эксплойтов, созданных искусственным интеллектом. Исследователи отмечают, что хотя все LLM в той или иной степени могут быть взломаны, DeepSeek оказывается особенно уязвимым даже для известных методов атак.
>>316123730 (OP) Спрашиваю у дипсика-v3, что за фильм в видео на ютубе. Он говорит, что это фильм Назад в будущее, сцена игры на электрогитаре в прошлом. Ну, знаете. Но это вообще другой фильм. Пишу об этом. Он: А я не могу смотреть по ссылкам в интернете, извинити. Я ему: А нахера ты пишешь тогда, что это Назад в будущее? А он: Ну, я предположил, что это именно эта сцена именно из этого фильма, так как она очень популярная. Л - логика. Ну охуенно, чё. Так-то не поспоришь, охуенный фильм.
>>316134574 Ваши доказательства не доказательства. Доказательства есть, но они не реальные. Ну такое. А у "международного сообщества" есть реальные доказательства? Может быть есть видеозапись давления на крымских избирателей? Я шатаю его без регистрации и смс, так что контекст ограничен.
Оптимизационная задача. У тебя есть N базовых слагаемых a1, a2, ..., aN, и K множителей p1, p2, ..., pK. Надо распределить множители по слагаемым, каждый множитель должен быть задействован ровно один раз, при этом нет никаких ограничений по слагаемым: на каждом слагаемом может быть любое количество множителей от 0 (если слагаемое ни на что не умножается, значит оно "умножается" на 1, то есть идёт как есть) до K. Ну и пусть будет минимизация суммы. Надо найти минимальную сумму среди всех N^K распределений. Например, при N=K=2 надо найти минимум из p1p2a1 + a2; p1a1 + p2a2; p2a1 + p1a2; a1 + p1p2a2.
Дипсик пососал, но я смог сам разобраться что к чему
>>316123730 (OP) Недавно решили взять программистов. Как вышел дип сик. Решили не стоить брать. Сеньор сказал нахуй надо. Ему увеличили зарплату на 500К. Вместо ойти макаку взяли зуммершу помощницу в офис. Чисто фон для работы. Принеси, подай, напечата, распечатай, ответ на телефон за 100К.
>>316123730 (OP) Пытался поиграть с DeepSeek в текстовый ролеплей. В краткосрочной перспективе, если грамотно его ограничить правилами, он неплохо придумывает продолжения, но в долгострой не может. Куча воды льет, забывает ранее поставленные правила, а когда спрашиваешь про них, он их находит, но толку, если он уже другое забыл
>>316123730 (OP) Here is a simple HTML page with a scrollable multi-selection list. It includes basic styling to make the list scrollable and user-friendly.
Features:
A <select> element with the multiple attribute, allowing multi-selection.
A scrollbar if the list exceeds a certain number of items.
A button to retrieve and display the selected values.
>>316139456 Мало значит ограничил. Основной чат должен вести только состояние, через определенную заранее модель. Потом на каждую сцену спавнишь другие чаты, скармливаешь им состояние, и они уже играют в контексте сцены.
>>316142784 Основной чат - это гейм-мастер: он ведет состояние всех персов, кидает кубики на действия, спавнит временных персов. Перс-чаты - это отдельные чаты для каждого нпц в контексте конкретной сцены. Им основной чат в определенном формате выгружает их состояние в начале сцены, дальше они с ним играют, когда сцена заканчивается основной чат сохраняет их состояние. Ясен хуй все это надо делать не руками. Но без этого никакая ЛЛМ тебе никогда не сможет отыгрывать на долгую.
>>316145286 ну что же? верим в Товарища Xi. буду надеятся, что китайцы выебут жидов. нам то гусским, естесно не догнаться за мировыми державами, только и остаётся, что чужие впопенсурсные модели файнтюнить и ядерные боеголовки натирать.
>>316145613 А стоило развалить совок и сразу всё проебали, а ведь этот жид который создал OpenAI мог бы остаться в России если бы не 90-е и чатгопота сегодня была бы нашим изобретением.
The server is busy. Please try again later. The server is busy. Please try again later. The server is busy. Please try again later. The server is busy. Please try again later. The server is busy. Please try again later.
Чёт я охуел от того что o3-mini и o4 уступили в простенькой задаче на кодинг:
1. DeepSeek-R1
2. Qwen2.5 MAX и 4o
3. o3-mini
Вот промт: Please create html page with interface with multiselection scrollable list.
- DeepSeek сваял полноценный интерфейс, сам добавил полезные опции.
- Qwen сделал тоже без ошибок, добавил полезную опцию, НО СДЕЛАЛ ОШИБКУ (2 окна прокрутки).
- ChatGPT 4o не удосужился добавить больше элементов чтобы протестировать скроллинг, пришлось добавлять самому, НО он добавил полезную опцию как китайские LLM.
- ChatGPT o3-mini сделал что просили, максимально по спартански.
Скриншоты опубликую в треде.