- Опубликовано
Вышел новый апдейт DeepSeek V3-2403 с улучшенными показателями
- Автор
- Имя
- ElKornacio
- Telegram
- ElKornacio14983 подписчика408 постов
а вот и финалочка по апдейту, о котором я писал, подъехала
теперь уже полноценно вышел DeepSeek V3-2403.
значительно подрос в бенчах:
MMLU-Pro: 75,9 → 81,2 (+5,3)
GPQA: 59,1 → 68,4 (+9,3)
AIME: 39,6 → 59,4 (+19,8)
LiveCodeBench: 39,2 → 49,2 (+10,0)
на задачках по программированию тащит бешено, говорят, сильно лучше Claude 3.5, если верить бенчам со страницы модели - то лучше 3.7.
при этом его вполне тянет Mac Studio на 20t/сек, что очень круто - полноценная локальная модель (для бахатых) уровня Claude.
в общем, в интересное время живём.
P.S. бахнул по горячим следам на Хабр: https://habr.com/ru/news/894252/
ElKornacio
14983 подписчика
408 постов
Предыдущий пост
- Опубликовано
Cursor Early Access: как создавать свои моды
как в Cursor Early Access создавать свои моды
Закрепленные
Из подборки ai
- Опубликовано
ai
+1
https://openai.com/codex/
OpenAI Codex тест: работает ли как Codex CLI?
- Опубликовано
ai
+1
давно я не смеялся от ответа ИИ в голос
ответ ИИ в голос вызывает смех
- Опубликовано
ai
+1
мысли о влиянии AI‑агентов на качество кода
как AI‑агенты повышают качество кода и ускоряют разработку
- Опубликовано
ai
+1
Qwen3 Max Thinking: сравнение с ведущими моделями
Qwen3 Max Thinking сравнение с GPT-5.2, Claude-Opus-4.5 и Gemini 3 Pro
- Опубликовано
ai
+1
и сейчас ещё будет очень смелый прогноз:...
прогноз развития AI в 2024: сравнение Anthropic, Google и OpenAI
- Опубликовано
ai
+1
сорри, чёт я то болел, то был в завале, всё...
AI теперь решает почти все задачи: почему человек возвращается к работе и как изменился шитпостинг?
Свежие посты
- Опубликовано
в один вечер, лол 🙂
Сравнение Opus 4.6 и GPT-5.3-codex в тестах SWE Verified и Terminal Bench
- Опубликовано
чет неделя философских дум, посты в голову не...
философские размышления недели, обзор Codex app, ссылка на статью Astral Codex
- Опубликовано
ai
+1
https://openai.com/codex/
OpenAI Codex тест: работает ли как Codex CLI?
- Опубликовано
ai
+1
давно я не смеялся от ответа ИИ в голос
ответ ИИ в голос вызывает смех
- Опубликовано
ai
+1
мысли о влиянии AI‑агентов на качество кода
как AI‑агенты повышают качество кода и ускоряют разработку
- Опубликовано
виб начало 2025 на лютых стероидах
влияние настроек среды и архитектуры на автономные AI‑агенты в 2025 г., рост эффективности и предсказания будущих революций
- Опубликовано
gpt-5.2-codex автоматический рефакторинг кода
gpt-5.2-codex автоматический рефакторинг кода и устранение технического долга
- Опубликовано
давайте коротко пробежимся по новостям 😼
новости AI: Kimi K2.5 agent swarm, OpenAI Prism редактор, DeepSeek OCR-2 модель





