ElKornacio логотип
Подписаться
Опубликовано

всё ещё не выздоровел, но эту новость не могу...

Автор
Фотография поста

всё ещё не выздоровел, но эту новость не могу обойти стороной. я очень люблю Cerebras - и про Cerebras Code писал, и много их юзал через Cline, и в целом, это мой самый популярный провайдер на OpenRouter. и вот, сегодня OpenAI объявили о партнерстве с ними. анонс очень расплывчатый, "какую-то часть каких-то фаз инференса" переведут на Cerebras, и это будет идти по-тихоньку, вплоть до 2028. и что именно переведут - не очень понятно, одна из проблем (и основа их преимуществ) Cerebras, это то, что они делают огромные монолитные чипы (aka гипер-вафли), и модели помещаются на эти чипы целиком.

беда в том, что иногда Cerebras приходится квантовать даже условно-небольшие модели (~500b) ради того, чтобы они влезли на вафлю, а флагманские модели OpenAI - это триллионы параметров.

но мне очень легко поверить в то, что какие-нибудь gpt-5-nano/gpt-5-mini могут туда улететь, хотя бы потому, что gpt-120b-oss Cerebras гоняют давно на безумных 1000-2000 токенах в секунду (скрин приложен).

(btw, GLM-4.6 на Cerebras тоже есть, правда, уже deprecated, видимо, переходят на 4.7).

11113 подписчиков
370 постов

Свежие посты