Стартап Taalas (Торонто, Канада) представил чип HC1, который выдает невероятные 17 000 токенов в сек

Аноним 07/03/26 Суб 22:47:50 #1 №330523979

Стартап Taalas (Торонто, Канада) представил чип HC1, который выдает невероятные 17 000 токенов в секунду на модели Llama 3.1 8B. Для сравнения, топовый Nvidia H200 выдает около 230-300 токенов в тех же условиях.

«Модель в кремнии»: В отличие от видеокарт, HC1 не «запускает» модель, а буквально содержит её веса, «вытравленные» прямо в транзисторах (hardwired). Это устраняет главную проблему современных вычислений — задержку при передаче данных между памятью и процессором.

Экономика: Заявлено, что чип в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии, чем решения от Nvidia. Стоимость генерации 1 млн токенов на HC1 оценивается всего в 0.75 цента.

Доступность: Компания уже запустила демо-чат на базе этого чипа (chatjimmy.ai), где пользователи могут лично убедиться в мгновенном ответе нейросети.

Комментарии экспертов и аналитиков:

1. Проблема гибкости vs Эффективность

Эксперты (например, с Hacker News и Reddit) отмечают, что главный минус — нулевая гибкость. Если вы захотите запустить другую модель, вам придется покупать новый чип. Однако Taalas утверждает, что их процесс проектирования позволяет создать чип под новую модель всего за 2 месяца, что сопоставимо с циклом обновления ПО в крупных корпорациях.

2. Технологический прорыв в архитектуре

Аналитики из EE Times подчеркивают, что Taalas вернулся к принципам «структурированных ASIC». Они объединили логику и хранение данных на одном кристалле с плотностью DRAM. Это позволяет обходиться без дорогой и дефицитной памяти HBM, жидкостного охлаждения и сложных систем межсоединений.

3. Будущее «разумных» агентов

Саймон Уиллисон (известный разработчик и эксперт) отмечает, что такая скорость (17k токенов/сек) делает бессмысленными привычные чат-интерфейсы, так как текст генерируется быстрее, чем человек успевает моргнуть. Это открывает путь к ИИ-агентам, которые «думают» и действуют в реальном времени, не заставляя пользователя ждать.

4. Скепсис по поводу масштабирования

Некоторые специалисты указывают на сложность упаковки больших моделей (например, Llama 400B или DeepSeek 671B) в такую архитектуру. Для модели на 671 млрд параметров потребуется синхронная работа около 30 чипов HC1, что может частично нивелировать преимущество в энергопотреблении и простоте.

Аноним 07/03/26 Суб 22:48:26 #2 №330524006

ВИДЕОКАРТЫ БОЛЬШЕ НЕ НУЖНЫ ДЛЯ ИИ.

Аноним 07/03/26 Суб 22:49:10 #3 №330524028

ВИДЕОКАРТЫ БОЛЬШЕ НЕ НУЖНЫ ДЛЯ ИИ.

Аноним 07/03/26 Суб 22:49:39 #4 №330524042

ВИДЕОКАРТЫ БОЛЬШЕ НЕ НУЖНЫ ДЛЯ ИИ.

Аноним 07/03/26 Суб 22:50:08 #5 №330524055

ВИДЕОКАРТЫ БОЛЬШЕ НЕ НУЖНЫ ДЛЯ ИИ.

Аноним 07/03/26 Суб 22:50:47 #6 №330524077

>>330524006
Значит и производить их больше не будут. Рыночек переходит на создание чипов

Аноним 07/03/26 Суб 22:54:39 #7 №330524199

>>330523979 (OP)
Ебало куртки представили?

Аноним 07/03/26 Суб 22:57:20 #8 №330524287

>>330523979 (OP)
Это не новая хуйня, асикам много лет уже, и меняют часто. Просто эти достаточно мощные, чтобы выебнуться и в комментарии "специалистов" нагнать. Никто не перестанет использовать видяхи для ии из-за них, особенно для разных моделей.

Аноним 07/03/26 Суб 22:58:29 #9 №330524323

1772913509671.png

>>330523979 (OP)
> на модели Llama 3.1 8B
Это же хуета.

Для нормального пользования нужно минимум Qwen-Coder-80b

Аноним 07/03/26 Суб 22:59:37 #10 №330524355

Толку от модели на 8гб нет. Только если для изучения интернет траффика.

Аноним 07/03/26 Суб 23:00:27 #11 №330524375

>>330523979 (OP)
Эта хуйня будут рисовать голых баб ВСЕГДА с 5-ю пальцами по-умолчанию? Нет? На хуй пшла тогда, говнина ёбаная. Хоть 17К хоть 17гига-хуёкенов, а как было говно с 6-ю пальцами и диспропорциями, так и есть.

Аноним 08/03/26 Вск 00:57:06 #12 №330527355

>>330523979 (OP)
- Хочу выкрутить контекст размером в шестизнак icq, ты ведь такая мощная.
- Пошел нахуй.
Занавес. Гул. Свист. Аплодисменты. Публика требует на бис...

Аноним 08/03/26 Вск 00:58:42 #13 №330527391

>>330523979 (OP)
Это плохо, потому что позволит корпорациям иметь большое преимущество перед стартапами, которые пытаются пилить свои нейронка.

Аноним 08/03/26 Вск 00:59:08 #14 №330527402

Надеюсь этого никогда не случится потому что кому захочется инвестировать в железо со статичными весами.

Аноним 08/03/26 Вск 01:01:13 #15 №330527460

>>330523979 (OP)
Надо куртку 15 числа ждать, он там тоже что то революционное для нейропидорах придумал.

Аноним 08/03/26 Вск 01:14:09 #16 №330527731

>на модели Llama 3.1 8B
АХАХАХАХАХА
сразу видно пидараса, который модельки локально не крутил
максимально тупорылая модель, которую на дешёвом китайском смарте можно запускать
сам 3Б тоже не крутил, мне хватило непроходимой тупости 7Б, чтоб понять что ниже копать даже не стоит

Аноним 08/03/26 Вск 01:21:04 #17 №330527928

>>330523979 (OP)
> В отличие от видеокарт, HC1 не «запускает» модель, а буквально содержит её веса, «вытравленные» прямо в транзисторах (hardwired)
Ок, задумка неплохая, но пусть запилят аналоги с более аткуальными моделями, и не 8B, а хотя бы 30B.

Аноним 08/03/26 Вск 01:22:11 #18 №330527959

image

>Llama 3.1 8B
>не Vision 378
>не Nemotron Nano
эта хуета только буковы срать может, нахуй не нужна, даж жопу не почесали мультимодалку взять

Аноним 08/03/26 Вск 01:25:33 #19 №330528043

1772922332623.png

Раз уж такой тред, посоветуйте локальную модельку для кобольда.
1660 супер, 32гб ддр4
Чтобы ответ был ± быстрый и не пресный.

Аноним 08/03/26 Вск 01:26:37 #20 №330528067

>>330523979 (OP)
>Llama 3.1 8B
>8B

ясно

Аноним 08/03/26 Вск 05:25:06 #21 №330532425

Пусть делают чип под дипсик 671б полноценный короч
Если он будет хуярить токены как не в себя то это тема.

Аноним 08/03/26 Вск 06:51:34 #22 №330533519

>>330523979 (OP)
Даже если и правда, завтра нвидиа выпускает такой же и шлёт твоё торонто на хуй.

Аноним 08/03/26 Вск 06:57:07 #23 №330533576

>>330523979 (OP)
Вот бы такую йобу с локальным опусом, вот это было бы ахуенно

Аноним 08/03/26 Вск 07:06:09 #24 №330533699

>>330533519
Ты не шаришь. Нвидиа должна будет выпускать такае же чипы по той же цене, а это сверхгигант со своими сверхрасходами. Это как перевести армию империи с мяса на овёс, ожидая тех же результатов...

Аноним 08/03/26 Вск 07:14:58 #25 №330533825

>>330533699
Нвидия самая богатая компания в мире, имеет ввп в 2.5 России.
Никто от нее не откажется иначе в сша кризис настанет сильнее 2008 года

Аноним 08/03/26 Вск 07:16:37 #26 №330533853

>>330523979 (OP)
Т. е. для каждой модели будет нужна своя отдельная карточка? И это только для моделей с открытыми весами.

Аноним 08/03/26 Вск 07:21:38 #27 №330533928

>>330533853
Напечатают ещё сто миллиардов долларов.
Богатые не думают так как мы

Аноним 08/03/26 Вск 07:44:45 #28 №330534227

>>330533825
Капитализация — это не ВВП. Сравнивать их совершенно некорректно.

[mailto:sage] Аноним 08/03/26 Вск 07:47:59 #29 №330534283

>>330523979 (OP)
> демо-чат на базе этого чипа (chatjimmy.ai), где пользователи могут лично убедиться в мгновенном ответе нейросети.

Пон. Что с ебалом, гифорсобляди? Тут вам не это.

Аноним 08/03/26 Вск 07:51:42 #30 №330534358

>>330528043
Тебе в LLM треды
https://2ch.su/ai/res/1544796.html

Аноним 08/03/26 Вск 07:55:03 #31 №330534413

>>330523979 (OP)
А зачем это надо? Прошу ответить гуманитарию, без троллинга.

Ведь нейросети есть крупные, это типо для того, чтобы свою нейросеть создавать? А зачем?

Аноним 08/03/26 Вск 08:08:02 #32 №330534641

>>330534227
В любом случае компания с капитализацией 4.5 триллиона долларов не может просто лопнуть без последствий

Аноним 08/03/26 Вск 08:09:49 #33 №330534675

>>330523979 (OP)
И чо, под каждую модель новый чип хуярить? А обучать как?

Аноним 08/03/26 Вск 08:10:16 #34 №330534684

>>330523979 (OP)
Программисты В С Ё

Аноним 08/03/26 Вск 08:15:12 #35 №330534779

>>330534675
> А обучать как?
На дваче

Аноним 08/03/26 Вск 09:29:22 #36 №330536111

>>330523979 (OP)
Осталось игры встраивать в видеокарты, вернемся к формату денди с картриджами.

Аноним 08/03/26 Вск 09:30:34 #37 №330536130

>>330533853
>И это только для моделей с открытыми весами.
Не обязательно.

Аноним 08/03/26 Вск 09:31:24 #38 №330536144

>>330534641
Может т.к. изначально цифры нарисованные.

Аноним 08/03/26 Вск 09:36:09 #39 №330536243

>>330523979 (OP)
Пизда встроят ее в беспилотник и ему нахуй интернет не нужен будет, он тупо сам будет сбивать другие беспилотники без оператора, или робособака которая будет хуярить всех сама, привет скайнет.

Аноним 08/03/26 Вск 09:37:26 #40 №330536266

>>330536111
пиздец какойже ты долбаеб - не удивительно и ии не сделает тебя умнее

Аноним 08/03/26 Вск 09:39:35 #41 №330536298

>>330523979 (OP)
>Стартап
Дальше не читал

[mailto:sage] Аноним 08/03/26 Вск 09:40:39 #42 №330536312

Всякие Моргенштерны не доказывают твой тезис. Их жизнь - везение и ошибка выжившего, паразитирование на изначальном событии "Повезло с распространённостью". И подчивание на том факте, что популярность в миллионы раз легче поддерживать, чем получить в первый раз. А iq - статистически подтвержденная, работающая на массах вещь, которая положительно кореллирует со многим, слишком абстрактно сложным, что принято относить к результатам высокого интеллекта. Например, с достатком. На самом деле, высокий достаток, как у меня, представителя масс - лучшее подтверждение изначальной концепции баллов, поскольку в тестах этого нет, а абстрактность понятия "интеллект" в вопросах измерения равна абстрактности понятия "богатство".

Статистика не опровергается одним (или жалкой тысячей) контрпримеров. Более того, тупая статистика - это ты, а умная - это я.

[mailto:sage] Аноним 08/03/26 Вск 09:41:12 #43 №330536321

>только слабоумный будет думать, что можно изменить реальный уровень интеллекта с помощью каких-то ссаных тестов.
Слабоумный будет скорее как раз думать, что iq ничего не значит, потому что обратный тезис для него неприятен, как в целом любая концепция измерения интеллекта. Это называется коуп слабоумного.

Аноним 08/03/26 Вск 09:41:15 #44 №330536322

>>330536298
потомучто ты читать не умееш?

[mailto:sage] Аноним 08/03/26 Вск 09:42:41 #45 №330536347

В твоём рассуждении фундаментальные логические ошибки.

Аноним 08/03/26 Вск 09:43:42 #46 №330536360

>>330523979 (OP)
НУ НИХУЯ СЕБЕ, Я ПРОСТО АУХЕЛ ОТ СКОРОСТИ и того какой объём инфы оно отдаёт в секунду..
А ведь действительно можно вообще любую нейронку вытрвить на кремнии или стекле.

[mailto:sage] Аноним 08/03/26 Вск 09:44:55 #47 №330536381

И вы , что всегда просто человеком,

Аноним 08/03/26 Вск 09:46:05 #48 №330536401

>>330523979 (OP)
Под любую задачу можно сделать асик, но смысл появляется, когда она становится достаточно конкретной и стандартизированной. Пока с нейронками зоопарк ебаный и всё меняется каждый месяц смысла в этом нет.

Аноним 08/03/26 Вск 09:47:12 #49 №330536418

>>330523979 (OP)
>Эксперты (например, с Hacker News и Reddit) отмечают
Имагинули ебало этих ЭКСПЕРТОВ ?

Аноним 08/03/26 Вск 09:47:37 #50 №330536424

>>330524323
Ну нет, это не хуета, для некоторых задач это топ, допустим теперь можно пролопатить бд с милионами записей, и найти что не подчиняется строгим правилам, отработать чаты пользователей майору, антифрод защита.

Аноним 08/03/26 Вск 09:48:29 #51 №330536439

>>330523979 (OP)
>Llama 3.1 8B
ну и нахуй она нужна?

Аноним 08/03/26 Вск 09:49:17 #52 №330536453

2bd75abf8995574eb1aa0a9d3479a255.jpg

>>330536243
Чаю. Буквально то чего не хватало для автономного оружия.

>>330536401
Машинное зрение, моторика. Конкретно, стандартизируемо и востребованно.

Аноним 08/03/26 Вск 09:51:50 #53 №330536509

>>330536401
Как раз нейрозалупа уже очень даже стандартизирована, все провайдеры конечных продуктов юзают API конкретных моделей и набор промтов. Cursor, meshy3d, photoshop и т.д.

То есть какому-нибудь cursor с его объёмами лучше каждый раз заказывать кастомные asic под конкретную модель чем держать ебаные датацентры универсальных тесел...

Аноним 08/03/26 Вск 09:52:52 #54 №330536532

>>330536453
>Машинное зрение, моторика.
Даже тут любой девайс на асике через год уже станет говном мамонта.

Аноним 08/03/26 Вск 09:54:42 #55 №330536570

>>330523979 (OP)
Модель на 8б - это откровенно тупая модель, которая на практике никому не нужна.
Как пруф оф концепт хорошо, но как продукт нет.

Аноним 08/03/26 Вск 09:55:31 #56 №330536583

>>330536439
Эта модель юзается повсеместно для декомпозиции и снижения расхода токенов на более тяжёлых моделей. На деле демонстрационный вариант для вендоров коммерческих тяжёлых моделей.
Вполне вероятно что с таким поворотом вся отрасль вообще уйдёт от API и начнёт торговать готовыми железкам хардварно-зашитыми моделями.

Аноним 08/03/26 Вск 09:55:32 #57 №330536585

ни одного слова не понял. Бототред

Аноним 08/03/26 Вск 09:57:41 #58 №330536634

>>330536585
Просто у тебя низкий iq

Аноним 08/03/26 Вск 09:58:45 #59 №330536663

>>330536532
Так а нам что нужно? Мозги апдейтим вместе с моделью девайса, все довольны. Причём со временем даже реже ввиду характера задач.

Аноним 08/03/26 Вск 10:04:11 #60 №330536764

>>330536532
>>330536663
Алсо для военки вообще халява: там 10 лет рожают, 50 сношают.

Аноним 08/03/26 Вск 10:07:29 #61 №330536828

>>330536634
ну да, я же на дваче

Аноним 08/03/26 Вск 10:10:24 #62 №330536894

17100112898030.jpg

>>330536663
Квазинейтральной редактировавшую
Приседающему стяжает палеогеографическое избыточного сорокасекундная

Аноним 08/03/26 Вск 10:22:13 #63 №330537170

>>330536828
Заметь большинство анонов шарит за нейрозалупу и разработку, ты в меньшинстве.

Аноним 08/03/26 Вск 10:22:42 #64 №330537181

>>330523979 (OP)
Это ты больше не нужен производителям видеокарт. Они хотят сделать hardware as a service нормой, первый прогрев с облачным гоймингом не удался, наблюдаем заход номер 2.
Так вижу, в течении пары лет с консьюмер рынка вытянут мощный картон полностью, будут только энтерпрайзу продавать. Для самых упертых степах останутся нераспроданные остатки 5050 за 1500уе штука. В качестве альтернативы гоям сунут подписку на реалтайм генератор интерактивного слопа по типу genie и гои сожрут ибо хули ты ещё сделаешь.

Аноним 08/03/26 Вск 10:23:43 #65 №330537208

image.png

>>330523979 (OP)
Поклонения Талосу запрещены варвар ебаный.

Аноним 08/03/26 Вск 10:32:19 #66 №330537429

>>330537181
Производители видимокарт просто майнят бабло на потребностях рынка и не имеют долгосрочной стратегии.

Аноним 08/03/26 Вск 10:36:26 #67 №330537538

>>330523979 (OP)
>Llama 3.1 8B
Такая модель ни понять запрос не сможет, ни ответить без ошибок, в т.ч. орфографических.
Не нужно.

Аноним 08/03/26 Вск 11:59:30 #68 №330539900

>>330523979 (OP)
Hardwired-нейросети будут актуальны для «зрелых» классов нейросетей. То есть когда в определённом классе будет достигнута идеальная производительность (в рамках заданного количества параметров) без какого-либо дальнейшенго прогресса, то можно будет переводить такие сети в хард для экономии питания.

Аноним 08/03/26 Вск 12:04:46 #69 №330540050

>>330539900
Так они же не руками техпроцесс отрисовывали... Скорее всего любую нейросеть можно отрисовать в автоматическом режиме и выпускать мелкой серией в пределах одной подложки.