Почему Gemini 3.5 Flash на деле глупее, чем на графиках: разбор агентного файнтюна и закона Гудхарта
Разоблачение: Gemini 3.5 Flash блестяще сдаёт бенчмарки, но тупит в реальных задачах. Разбираемся, как файнтюн под метрики и закон Гудхарта убивают агентный инт
Читать →