ElKornacio логотип
Подписаться
Опубликовано

в один вечер, лол 🙂

Автор

в один вечер, лол

Opus 4.6 https://www.anthropic.com/news/claude-opus-4-6

GPT-5.3-codex https://openai.com/index/introducing-gpt-5-3-codex/

P.S. для контекста - Opus 4.6 проигрывает в SWE Verified Opus 4.5, но побеждает в Terminal Bench с лёгким отрывом (65.4% против 59.8%). В то же время GPT-5.3-codex доминирует и там и там, причем в terminal bench с диким отрывом - 77.3%

11113 подписчиков
379 постов

Свежие посты