Расчехляем свои веги\нави\теслы\квадры и печи и прочие девайсы. В этот раз меримся жезезками с помощью бенчмарка от стенфордских ботаников изучающих протеины. Последняя версия 2.2 оного полное говно с ненужными настройками и отсутствием пресетов.
Берем FAHbench v1.2.0 со старым ядром от сюда https://dropmefiles.com/e8OwO . Распаковываем, отмечаем галочками как на пикрелетед, тестим, скрин результата заливаем сюда. FAQ: Q: Нахуй оно надо? А: Анону - прост. Мне - для работы, быстро определить какой девайс быстрее в OpenCL. Q: Почему именно этот бенч? А: А ничего нормального и нет. На работе столкнулся с задачей узать crarck для взлома старых паролей в архиве. Задался поиском быстрого средства диагностики производительности разного железа в OpenCL, ибо этого говна у меня полный склад. Был удивлен что на сегодня кроме хитрожопого\ проплаченного Geekbench, раздутого SiSoft Sandra и кривых с анальной телеметрией LuxMark с CompuBench нету нихуя. Хотелось что-то простого, работающего из коробки, без установки и выдающий однозначный результат. Я вспомнил что лет 5-6 назад я дрочил на "Folding at Home". И что у них был свой бенчмарк с тем ядром которое они юзали в соей программе расчетов. Текущий оказался ботанским говном, с кучей настроек, а вот старый, что валялся у меня в архиве, самое то - простой, маленький, но весьма точный. Данные пункта "implicit" хорошо коррелируют с показателями crarck.
>>4081953 Ух мля, неожидал, думал будет не хуже 2060. Хотя с другой стороны Navi задрочен только под игори, а вот вега и под то и другое. Думаю Radeon 590 выдаст побольше.
>>4079579 (OP) >анальной телеметрией LuxMark с CompuBench нету нихуя. Хотелось что-то простого, работающего из коробки, без установки и выдающий однозначный результат. Бенчмарк фурмарка чем не устроил? Там кол-во очей в опенгл...
>>4082900 >>4082920 >>4082951 Ну и как тут блять сравнивать результаты?? Говорю же 2.3 раздутое говно, с однобокими тестами, причем кривыми. Легитимный бенчмарк треда - FAHbench v1.2.0
>>4082900 Загрузись Live сборкой какой нибудь что ли, очень интересно узнать результат веги. Где то у меня был линуксовский v1.2.0 без GUI, но сейчас не вижу, поищу, может найду.
>>4083005 >Ну и как тут блять сравнивать результаты?? Как и везде, смотреть цифры в одинкаовых тестах. Мне все понятно.
>Говорю же 2.3 раздутое говно, с однобокими тестами, причем кривыми. Бенч не бенч. На форуме та же версия.
>Легитимный бенчмарк треда - FAHbench v1.2.0 Некроговно с древними либами. Ты еще в 3dmark2001 потести.
>>4083005 >Загрузись Live сборкой какой нибудь что ли, очень интересно узнать результат веги. Все результаты на скринах, в треде по ссылке полно скринов актуальной версии. А масдай я сносил не для того, чтобы на него возвращаться. в лайв версии радеонские дрова не встанут
>Где то у меня был линуксовский v1.2.0 без GUI, но сейчас не вижу, поищу, может найду. Вишмастер от анона с файлопомойки? Спасибо, вернул мне мой 2007й.
>>4084814 > Vega 64 > скрины гуёвого бенча > Это небось ты ОП тредов про жизнь без GUI?
А ты не очень-то умён.
Биомеханизм класс A-128/11/19 Чтв 01:12:28#32№4085401
Долбоёб на опе, ты ещё блять предложи сустем тестером из доса процы тестить. Некробенчмарк с либами времён первой мировой. Небось там и опенсл 1.0, да? Если да то офиициально долбоёб года.
>>4085219 >А ты не очень-то умён. Ты просто не был в тех тредах. >>4085422 >А вабще что вы тут тестируете, вы ебанутые? Что показывает этот бенч? Скорость расчетов. А именно сколько наносекунд моделирования процесса сворачиваемости белка ты осилишь на своем девайсе за сутки. >>4085421 Мда, мало, остается надежда только на Radeon VII
>>4085401 >Долбоёб на опе, ты ещё блять предложи сустем тестером из доса процы тестить. Некробенчмарк с либами времён первой мировой. Небось там и опенсл 1.0, да? Если да то офиициально долбоёб года. OpenCL 2.1. Ты думаешь что если старый значит плохой?? Тест дает хорошую нагрузку на карты, приближенную к реальной производительности в разношерстных программах юзающих OpenCL.
>>4085536 > А именно сколько наносекунд моделирования процесса сворачиваемости белка ты осилишь на своем девайсе за сутки. Пиздец сложности, я ебал, со струнами и то проще.
>>4094243 Хм, наглядно, то есть для рабочих станций в качестве универсальной числодробилки переплачивать за 1080\1080 Ti >>4093391>>4081849 нет смыла? Тут скорее всего фишка не только в архитектуре, а еще в тех самых тензорных ядрах, которые OpenCL драйвер от кожанки и юзает. У кого 2080\2080 Ti пацаны?
>>4102117 Ну во первых это не затычка, а нормальная ноутбучная паскаль дискретка с не маленьким кулером. Во вторых нормальные studio whql драва 441.28, а не кривые от АМД. И да во время теста ноут орал как не в себя, думал соседей разбужу.
Да и вообще, сколько лет твоему полярису?? Еще в 2016 эти rx480 были, от него мало чем 580 отличается.
>>4119434 Скорости конечно впечатляют. В имплиците заслуженно быстрее 2070S, больше шейдеров. Но вот в эксплиците совсем нет. Первый тест очень чувствителен к частотам. У того хрена >>4082654 видать частоты под 2 GHz, если не выше. Ну общем в имплицит тесте, Вы сэр, на данный момент король.
>>4119509 Не сдохнет. Фишка бенча в том, что он не работает на прямую с железкой, а только по средством OpenCL драйвера. Потому такой разброс в результатах. И все зависит от дров смогут ли нормально работать GTX690 и HD5970 для расчетов. Кстати в SLI\Crossfire тоже было бы интересно взглянуть на карты.
Где тот пидарас создававший на днях треды про свою Radeon VII??? Что то он так скромно обошел этот тред, хотя анон просил его потестить карту, в том числе и этим тестом. Видимо протестил и затих, карта для "расчетов" небось сливает той же 2070S. я знаю что ты петух ходишь тут вокруг да около, покажись!
>>4143929 >>4143987 Нет тут дело больше в том, что эксплицит является весьма не тривиальным тестом для расчета, его сложнее параллелить, от этого он более чувствителен к архитектурным особенностям. Скорее подходит как тест на стабильность. Имплицит же более алгоритмически простой, очень хорошо параллелиться и более менее отражает реальную производительность средней OpenCL софтины. Но тем нее менее оба теста универсальны, и к примеру на CPU выполняются с одинаковой скоростью.
>>4152051 >Это что? 3400g с vega11 >Какая частота? 2055 чип, 8100 память. Эта хуета не грузит гпу полностью, пришлось запускать игру и сворачивать, чтобы активировать буст, а не стоковые 1515мгц.
>>4153078 > Эта хуета не грузит гпу полностью Проблема в нвидие. Нужно отключить принудительный P2-стейт для куды, иначе она занижает частоты памяти для чистых куда/опенцл приложений. Делается это в нвидияинспекторе, пикрил.
Интересно, почему поя распердоленная по ядру 2080ti@2205МГц/7900МГц выдаёт результат в эксплисит на уровне 2080 из этого поста >>4151997 (без разгона выдаёт ещё меньше). Неужели эти 200МГц по памяти так важны для теста?
>>4094342 > а еще в тех самых тензорных ядрах Тензорные ядра в OpenCL использовать по-моему вообще невозможно. Их можно использовать только из CUDA и из вулкана (используя проприетарные расширения) и при этом для них надо писать код ручками, компилятор автоматом тензорные ядра не задействует.
Скорее всего дело в асинхронных вычислениях (это когда целочисленные и с плавающей точкой могут в рамках одного потока выполняться одновременно не мешая друг-другу) плюс гигантские кеши по сравнению с паскалём.
>>4153123 >Неужели эти 200МГц по памяти так важны для теста? Да, эксплицит капризный тест. И потому меримся по иплициту. Я таки понимаю, что быстрее этого может быть только Tesla V100 и Quadroo GV100. Интересно, насколько вольта лучше для этого как архитектура?
> Я таки понимаю, что быстрее этого может быть только Tesla V100 и Quadroo GV100. С одной стороны там быстрая HBM2 память, а с другой асинхронных вычислений (под которые компилятор в драйвере оптимизирует автоматом) нету. И смотря на тред я вижу что 1080ти как раз находится на уровне ~2060 (прям как РДР2).
Думаю наследник вольты на тюринговской архитектуре с HBM2 будет бомбой.
>>4153242 Если принудительный P2 не отключал для куды, то память будет ниже (насколько - зависит от биоса). Попробуй отключить через инспектор как в первом пике: >>4153123 и протестируй снова (после применения настройки при помощи кнопки "apply" справа вверху требуется перезапуск приложения). Тот анон при помощи игры в фоне заставил карту работать в режиме P0.
>>4153245 > то память будет ниже Алсо, сам ГПУ тоже может быть с более низкой частотой. Но обычно вендоры в прошивке биоса занижают только частоту памяти для P2.
>>4153203 >Думаю наследник вольты на тюринговской архитектуре с HBM2 будет бомбой. Так что получается что вольта это не сильно ушедшая вперед и подшаманенная с учетом большего масштаба архитектура паскаля?? >Думаю наследник вольты на тюринговской архитектуре с HBM2 будет бомбой. А вот кстати вопрос, а почему куртка уже второй год выпускает монструозный GV100 с просто безумной площадью в 815 мм2 и не особо спешит перекатываться с улучшенного 16нм (12 нм) тех процесса на вполне уже обкатанный 7 нм от TSMC? Конечно он и так получает сверхприбыли ввиду дохлости основного конкурента, но прибыль была бы еще больше? Или куртка посрался с тайваньцами и собирается уйти к корейцам?..... После вольты ампер? >>4153133 >Тензорные ядра в OpenCL использовать по-моему вообще невозможно А я то думал что реальный буст относительно паскаля был благодаря тензерникам, а тут оказывается что архитектура тащит. Почему красные не умеют также? Помнится раньше говорили что в играх карты мол проигрывают немного, а вот в расчетах лучше, а что сейчас получается, совсем сдулись? Где тесты Radeon VII??
>>4153446 > Почему красные не умеют также? У красных асинхронные вычисления появились гораздо раньше (да и не зря же их так любили в майнинге и прочих вычислительных алгоритмах). Просто в тюринге хуня реально что-то так нашаманил, что даже в вычислениях АМД выигрывает только за счёт HBM2-памяти, а новая архитектура нави сосёт уже и там.
>>4153446 >а тут оказывается что архитектура тащит. Тащит за счет параллельного расчета float и int. >Почему красные не умеют также? Это появилось у амуде в Веге, конкуренте Паскаля. А Хуанга только в следующем - Тюринге. В моем N-Body 1050Ti сосет у Вега11. Есть тайловый метод, где 1050Ti ускоряется в 2 раза, а на Веге не работает, наверное из-за втройкопроблем.
>>4153900 О боги! ну почему так медленно?, у тебя транзисторного бюджета хоть отбавляй. Ты не сильно должен просаживаться относительно RTX2060, как и NAVI как и Vega. Что это блять?? >>4153900 >>4085421 >>4081941
>>4178105 Во первых убери масштабирование с 125% на 100, ибо дрисятка сама кушает ресурс. Во вторых отключи P2 режим CUDA, в третьих проверь не стоят ли в настройках материнки всякие функции энергосбережения. В четвертых Почему не рязань?. Алсо может куртка специально занижает производительность паскаля дабы продавать тюринг? На старые драва откатывался?
В этот раз меримся жезезками с помощью бенчмарка от стенфордских ботаников изучающих протеины. Последняя версия 2.2 оного полное говно с ненужными настройками и отсутствием пресетов.
Берем FAHbench v1.2.0 со старым ядром от сюда https://dropmefiles.com/e8OwO .
Распаковываем, отмечаем галочками как на пикрелетед, тестим, скрин результата заливаем сюда.
FAQ:
Q: Нахуй оно надо?
А: Анону - прост. Мне - для работы, быстро определить какой девайс быстрее в OpenCL.
Q: Почему именно этот бенч?
А: А ничего нормального и нет. На работе столкнулся с задачей узать crarck для взлома старых паролей в архиве. Задался поиском быстрого средства диагностики производительности разного железа в OpenCL, ибо этого говна у меня полный склад. Был удивлен что на сегодня кроме хитрожопого\ проплаченного Geekbench, раздутого SiSoft Sandra и кривых с анальной телеметрией LuxMark с CompuBench нету нихуя. Хотелось что-то простого, работающего из коробки, без установки и выдающий однозначный результат. Я вспомнил что лет 5-6 назад я дрочил на "Folding at Home". И что у них был свой бенчмарк с тем ядром которое они юзали в соей программе расчетов. Текущий оказался ботанским говном, с кучей настроек, а вот старый, что валялся у меня в архиве, самое то - простой, маленький, но весьма точный. Данные пункта "implicit" хорошо коррелируют с показателями crarck.