Подписаться

Опубликовано: среда, 5 февраля 2025 г.

Daily Papers: обучение ИИ без RLHF 2025

Автор

Имя
ElKornacio
Telegram
telegram

ElKornacio

14845 подписчиков

408 постов

вчера первое место в Daily Papers на Hugging Face долго держала работа российских ребят про алгоритмы прямого обучения ИИ (без предварительного обучения reward модели), и как они их тюнили. я хотел про неё написать, но так и не смог придумать, как перевести её на простой человеческий язык.

а вот сегодня в топе Daily Papers работа, которую легко перевсти на человеческий язык, и которая понравилась мне лично, как разработчику. и она в очередной раз подтверила мою мысль, которую я уже озвучивал раз пять: в 2025 году главный хит - обучение моделей без ручного человеческого труда (SFT/RLHF).

поэтому я бахнул про неё небольшую новость на Хабр: https://habr.com/ru/news/879826/

Обсудить в Telegram

ElKornacio

14845 подписчиков

408 постов

Предыдущий пост

Опубликовано: 5 февр. 2025 г.

fun fact: Cursor – самый быстрорастущий SaaS

Cursor – самый быстрорастущий SaaS: от $1 млн ARR до $100 млн за год

Следующий пост

Опубликовано: 5 февр. 2025 г.

понравилась прикидка размера рынка. а в...

оценка рынка GPT wrappers и потенциал Deep Research в решении экономически значимых задач

Закрепленные

ну и раз уж в этом канале начали появляться...

Данила разработчик, CTO, AI и криптовалютные проекты, медиа‑каналы

Из подборки #ai

Опубликовано: 5 февр. 2026 г.

+1

в один вечер, лол 🙂

Сравнение Opus 4.6 и GPT-5.3-codex в тестах SWE Verified и Terminal Bench

Опубликовано: 5 февр. 2026 г.

+1

чет неделя философских дум, посты в голову не...

философские размышления недели, обзор Codex app, ссылка на статью Astral Codex

Опубликовано: 28 янв. 2026 г.

+1

виб начало 2025 на лютых стероидах

влияние настроек среды и архитектуры на автономные AI‑агенты в 2025 г., рост эффективности и предсказания будущих революций

Опубликовано: 27 янв. 2026 г.

+1

gpt-5.2-codex автоматический рефакторинг кода

gpt-5.2-codex автоматический рефакторинг кода и устранение технического долга

Опубликовано: 27 янв. 2026 г.

+1

давайте коротко пробежимся по новостям 😼

новости AI: Kimi K2.5 agent swarm, OpenAI Prism редактор, DeepSeek OCR-2 модель

Опубликовано: 24 янв. 2026 г.

+1

что-то неделька безумная, режим сломался...

обзор моделей Claude Code, GPT‑5.2 и сравнение с Opus, перспективы AGI и ASI 2027‑2028

Все посты из подборки →

Свежие посты

Опубликовано: 5 февр. 2026 г.

+1

в один вечер, лол 🙂

Сравнение Opus 4.6 и GPT-5.3-codex в тестах SWE Verified и Terminal Bench

Опубликовано: 5 февр. 2026 г.

+1

чет неделя философских дум, посты в голову не...

философские размышления недели, обзор Codex app, ссылка на статью Astral Codex

Опубликовано: 3 февр. 2026 г.

+1

https://openai.com/codex/

OpenAI Codex тест: работает ли как Codex CLI?

Опубликовано: 30 янв. 2026 г.

+1

давно я не смеялся от ответа ИИ в голос

ответ ИИ в голос вызывает смех

Опубликовано: 30 янв. 2026 г.

+1

мысли о влиянии AI‑агентов на качество кода

как AI‑агенты повышают качество кода и ускоряют разработку

Опубликовано: 28 янв. 2026 г.

+1

виб начало 2025 на лютых стероидах

влияние настроек среды и архитектуры на автономные AI‑агенты в 2025 г., рост эффективности и предсказания будущих революций

Опубликовано: 27 янв. 2026 г.

+1

gpt-5.2-codex автоматический рефакторинг кода

gpt-5.2-codex автоматический рефакторинг кода и устранение технического долга

Опубликовано: 27 янв. 2026 г.

+1

давайте коротко пробежимся по новостям 😼

новости AI: Kimi K2.5 agent swarm, OpenAI Prism редактор, DeepSeek OCR-2 модель

Следующие посты →