- Опубликовано
swe-bench verified это, конечно, кладезь...
- Автор
- Имя
- ElKornacio
- Telegram
- ElKornacio14983 подписчика408 постов
swe-bench verified это, конечно, кладезь интересной инфы про AI-агентов для разработки.
где ещё можно встретить opensource репу с 49 звёздами, которая рвёт почти всех существующих платных агентов.
или где чувак just-for-fun тестирует разные концепты, улучшающие работу агентов для разработки, и занимает 4 место в мире среди опенсорсных агентов (кстати, имплементация SWE-Search в moatless это прям имба, вагную что мы увидим это во всех агентах в ближайший год).
вообще в последние дни делал большое исследование текущего state-of-art в агентах для разработки, и там много всего забавного можно нарыть.
нередко проприетарные решения вырываются в лидеры (и отстраивают весь свой moat вокруг) с использованием буквально 1 улучшения по сравнению с аналогами. тот же Augment, который юзает code-tailored эмбеддинги, и очень крутые индексы, и строит всё вокруг этого (кстати, в оригинале этот концепт был впервые успешно обкатан в nemotron-cortexa, которая тоже есть на скрине)
Закрепленные
Из подборки #ai
- Опубликовано
в один вечер, лол 🙂
- Опубликовано
чет неделя философских дум, посты в голову не...
- Опубликовано
виб начало 2025 на лютых стероидах
- Опубликовано
gpt-5.2-codex автоматический рефакторинг кода
- Опубликовано
давайте коротко пробежимся по новостям 😼
- Опубликовано
что-то неделька безумная, режим сломался...
Свежие посты
- Опубликовано
в один вечер, лол 🙂
- Опубликовано
чет неделя философских дум, посты в голову не...
- Опубликовано
https://openai.com/codex/
- Опубликовано
давно я не смеялся от ответа ИИ в голос
- Опубликовано
мысли о влиянии AI‑агентов на качество кода
- Опубликовано
виб начало 2025 на лютых стероидах
- Опубликовано
gpt-5.2-codex автоматический рефакторинг кода
- Опубликовано



