Подписаться
Опубликовано

Релиз Llama 4 с 400 млрд параметров

Автор
  • Имя
    ElKornacio
    Telegram

🌸Релизим Llama 4🌸

OSS на уровне Gemini и Deepseek

Сегодня мы релизим модели из семейства Llama 4 — Llama 4 17Bx16 experts (Scout) и 128 experts (Maverick)

🌸Что интересного:

— 10 миллионов токенов контекстного окна с отличным качеством у модели Scout — полный размер модели 16 экспертов — 108 млрд параметров, 128 экспертов — 400 млрд — модель мультимодальная, инпут — текст, изображения, видео. Картинок в контексте может быть до 5 штук, чтобы сохранялся контекст — 12 основных языков (английский, французский, немецкий, арабский ,хинди, индонезийский, итальянский, португальский, испанский, тагальский, тайский и вьетнамский), но более 200 в претрейне (из No Language Left Behind)

Где посмотреть: Чекпоинты HF Блогпост

14983 подписчика
408 постов

Из подборки #chatgpt

Опубликовано

OpenAI Nano Banana Pro: быстрее генерирует

OpenAI выпустили Nano Banana Pro, генерация изображений в 4 раза быстрее, но аниме‑стили убраны
Опубликовано

чтоб вы понимали, я отчаялся настолько, что

Как Cursor AI лучше справляется с редактированием кода по сравнению с ChatGPT
Опубликовано

как люди используют ChatGPT

сравнение качества instruction-following и агентского поведения моделей ChatGPT, Gemini и Anthropic
Опубликовано

GPT-5 пишет ответы в комментариях к коду

GPT-5 отвечает в комментариях к коду, почему происходит такой баг

Свежие посты

Опубликовано

давайте коротко пробежимся по новостям 😼

новости AI: Kimi K2.5 agent swarm, OpenAI Prism редактор, DeepSeek OCR-2 модель