Подписаться
Опубликовано

всё ещё не выздоровел, но эту новость не могу...

Автор
  • Имя
    ElKornacio
    Telegram

всё ещё не выздоровел, но эту новость не могу обойти стороной. я очень люблю Cerebras - и про Cerebras Code писал, и много их юзал через Cline, и в целом, это мой самый популярный провайдер на OpenRouter. и вот, сегодня OpenAI объявили о партнерстве с ними. анонс очень расплывчатый, "какую-то часть каких-то фаз инференса" переведут на Cerebras, и это будет идти по-тихоньку, вплоть до 2028. и что именно переведут - не очень понятно, одна из проблем (и основа их преимуществ) Cerebras, это то, что они делают огромные монолитные чипы (aka гипер-вафли), и модели помещаются на эти чипы целиком.

беда в том, что иногда Cerebras приходится квантовать даже условно-небольшие модели (~500b) ради того, чтобы они влезли на вафлю, а флагманские модели OpenAI - это триллионы параметров.

но мне очень легко поверить в то, что какие-нибудь gpt-5-nano/gpt-5-mini могут туда улететь, хотя бы потому, что gpt-120b-oss Cerebras гоняют давно на безумных 1000-2000 токенах в секунду (скрин приложен).

(btw, GLM-4.6 на Cerebras тоже есть, правда, уже deprecated, видимо, переходят на 4.7).

14983 подписчика
408 постов

Из подборки ai

Свежие посты

Опубликовано

давайте коротко пробежимся по новостям 😼

новости AI: Kimi K2.5 agent swarm, OpenAI Prism редактор, DeepSeek OCR-2 модель