Подписаться

Опубликовано: вторник, 25 марта 2025 г.

Вышел новый апдейт DeepSeek V3-2403 с улучшенными показателями

Автор

Имя
ElKornacio
Telegram
telegram

ElKornacio

14845 подписчиков

408 постов

а вот и финалочка по апдейту, о котором я писал, подъехала

теперь уже полноценно вышел DeepSeek V3-2403.

значительно подрос в бенчах: MMLU-Pro: 75,9 → 81,2 (+5,3) GPQA: 59,1 → 68,4 (+9,3) AIME: 39,6 → 59,4 (+19,8) LiveCodeBench: 39,2 → 49,2 (+10,0)

на задачках по программированию тащит бешено, говорят, сильно лучше Claude 3.5, если верить бенчам со страницы модели - то лучше 3.7.

при этом его вполне тянет Mac Studio на 20t/сек, что очень круто - полноценная локальная модель (для бахатых) уровня Claude.

в общем, в интересное время живём.

P.S. бахнул по горячим следам на Хабр: https://habr.com/ru/news/894252/

Обсудить в Telegram

ElKornacio

14845 подписчиков

408 постов

Предыдущий пост

Опубликовано: 25 мар. 2025 г.

Cursor Early Access: как создавать свои моды

как в Cursor Early Access создавать свои моды

Следующий пост

Опубликовано: 26 мар. 2025 г.

пока что мне очень нравится, играюсь с...

как реализовать Architect mode для собственного агента с extended thinking

Закрепленные

ну и раз уж в этом канале начали появляться...

Данила разработчик, CTO, AI и криптовалютные проекты, медиа‑каналы

Из подборки ai

Опубликовано: 3 февр. 2026 г.

+1

https://openai.com/codex/

OpenAI Codex тест: работает ли как Codex CLI?

Опубликовано: 30 янв. 2026 г.

+1

давно я не смеялся от ответа ИИ в голос

ответ ИИ в голос вызывает смех

Опубликовано: 30 янв. 2026 г.

+1

мысли о влиянии AI‑агентов на качество кода

как AI‑агенты повышают качество кода и ускоряют разработку

Опубликовано: 26 янв. 2026 г.

+1

Qwen3 Max Thinking: сравнение с ведущими моделями

Qwen3 Max Thinking сравнение с GPT-5.2, Claude-Opus-4.5 и Gemini 3 Pro

Опубликовано: 24 янв. 2026 г.

+1

и сейчас ещё будет очень смелый прогноз:...

прогноз развития AI в 2024: сравнение Anthropic, Google и OpenAI

Опубликовано: 19 янв. 2026 г.

+1

сорри, чёт я то болел, то был в завале, всё...

AI теперь решает почти все задачи: почему человек возвращается к работе и как изменился шитпостинг?

Все посты из подборки →

Свежие посты

Опубликовано: 5 февр. 2026 г.

+1

в один вечер, лол 🙂

Сравнение Opus 4.6 и GPT-5.3-codex в тестах SWE Verified и Terminal Bench

Опубликовано: 5 февр. 2026 г.

+1

чет неделя философских дум, посты в голову не...

философские размышления недели, обзор Codex app, ссылка на статью Astral Codex

Опубликовано: 3 февр. 2026 г.

+1

https://openai.com/codex/

OpenAI Codex тест: работает ли как Codex CLI?

Опубликовано: 30 янв. 2026 г.

+1

давно я не смеялся от ответа ИИ в голос

ответ ИИ в голос вызывает смех

Опубликовано: 30 янв. 2026 г.

+1

мысли о влиянии AI‑агентов на качество кода

как AI‑агенты повышают качество кода и ускоряют разработку

Опубликовано: 28 янв. 2026 г.

+1

виб начало 2025 на лютых стероидах

влияние настроек среды и архитектуры на автономные AI‑агенты в 2025 г., рост эффективности и предсказания будущих революций

Опубликовано: 27 янв. 2026 г.

+1

gpt-5.2-codex автоматический рефакторинг кода

gpt-5.2-codex автоматический рефакторинг кода и устранение технического долга

Опубликовано: 27 янв. 2026 г.

+1

давайте коротко пробежимся по новостям 😼

новости AI: Kimi K2.5 agent swarm, OpenAI Prism редактор, DeepSeek OCR-2 модель

Следующие посты →