AI coding в российском финтехе: ускорение в 15 раз, сокращение команды | Кейс 2026 | AiManual
AiManual Logo Ai / Manual.
09 Фев 2026 Новости

Финтех на стероидах: как AI coding сжал команду с 40 до 10 человек и ускорил разработку в 15 раз

Реальный кейс: как российский финтех-проект внедрил локальные LLM, сократил команду с 40 до 10 разработчиков и ускорил выпуск фич в 15 раз. Подробности от CTO.

Цифры, от которых сводит челюсть

Когда CTO одного из крупнейших российских финтех-проектов (назовем его «Проект Х» – они просили об анонимности) показал мне дашборд за февраль 2026 года, я не поверил глазам. Команда бэкенда: 10 человек вместо прежних 40. Скорость выпуска новых API-эндпоинтов: 15 дней против 8 месяцев год назад. Доля кода, сгенерированного или серьезно отрефакторенного нейросетями: стабильные 30%.

«Это не будущее. Это наше настоящее с прошлого квартала», – сухо комментирует CTO. И начинает рассказывать историю, которая звучит как инструкция по выживанию в новой эре, где разработчиков AI-инструменты не столько пугают, сколько заменяют.

Контекст: «Проект Х» – это высоконагруженная платежная экосистема с миллионами пользователей. Жесткие требования 152-ФЗ о локализации данных, собственные стандарты безопасности, кодовая база на 2+ миллиона строк. Классический случай, где «просто взять GPT-5» нельзя.

Первый шаг: похоронить копипасту и устаревшие библиотеки

Все началось не с хайповых агентов, а со скучной рутины. «У нас были тонны легаси-кода, – вспоминает тимлид. – Обновления фреймворков откладывались годами. Каждый новый разработчик первую неделю изучал наши 50 страниц внутреннего Code Style Confluence, а потом все равно делал ошибки».

Решение оказалось на поверхности, но потребовало смелости. Вместо того чтобы подключаться к облачным API, они развернули локальные инстансы двух моделей: YaLM 2.0 100B (для общего кодинга и рефакторинга) и дообученную на своем коде GigaCode 34B (для специфичных платежных паттернов).

💡
Почему именно эти модели? YaLM 2.0, выпущенный в конце 2025 года, показал лучшие результаты на русскоязычных технических текстах и понимании доменных ограничений. GigaCode 34B – одна из немногих моделей, изначально заточенных под генерацию кода, которую можно было дообучить на закрытых данных, не нарушая 152-ФЗ. Подробнее о скрытых чемпионах российского AI-рынка.

Второй шаг: перестать писать код, начать его ревьюить

Здесь произошла самая болезненная трансформация. Роль senior-разработчиков кардинально изменилась. «Раньше они 70% времени писали код, 30% – ревьюили. Сейчас – 10% на написание сложнейшей бизнес-логики, 90% – на постановку задач AI, валидацию результата и глубокий анализ сгенерированного кода», – объясняет CTO.

Процесс выглядит так: разработчик пишет промпт в специальном IDE-плагине (кастомная сборка на основе инфраструктуры, похожей на Modelence). Промпт – это не «напиши функцию», а детальное ТЗ: требования к безопасности, ссылки на смежные модули, ограничения по производительности, примеры из существующего кода.

Модель выдает черновик. Дальше – магия. Senior запускает автоматизированные тесты, статический анализ (SonarQube с кастомными правилами), проверку на уязвимости (OWASP Top-10 для 2026 года). И только потом смотрит на саму логику.

Метрика До внедрения (2024) После внедрения (Q4 2025) Изменение
Время на фичу (среднее) 240 дней 16 дней -93%
Размер команды бэкенда 40 чел. 10 чел. -75%
Количество багов в проде (месяц) ~45 ~12 -73%
Доля AI-генерируемого кода 0% 30-35% +30% п.п.

Третий шаг: переучить или уволить

Это самая неприятная часть истории. Из 40 человек в бэкенд-команде остались 10. «Мы предложили всем пройти переобучение, – говорит CTO. – Курсы по prompt engineering, углубленному анализу кода, рефакторингу с помощью AI. Из 30 ушедших только 5 согласились. Остальные предпочли найти работу в компаниях, где еще пишут код вручную».

Оставшиеся 10 – это не просто senior-ы. Это архитекторы, способные мыслить на уровне системы, и при этом дотошные инспекторы, которые могут за 10 минут найти скрытую уязвимость в 200 строках сгенерированного кода. Их зарплаты выросли в среднем на 40%.

Предупреждение: Такой переход – это не техническая задача, а управленческий кризис. Без четкой программы переобучения, психологической поддержки и прозрачной коммуникации вы получите саботаж и массовый уход лучших кадров. История выгорания при работе с AI-агентами – обязательное чтение для любого CTO.

Что работает, а что – нет? Честно от инженеров

Я поговорил с двумя оставшимися разработчиками анонимно. Их отзывы – глоток реальности среди хайпа.

  • Работает отлично: Генерация шаблонного кода (CRUD, DTO, базовые валидации), рефакторинг по четким правилам (например, замена устаревших методов безопасности), написание юнит-тестов, документация.
  • Работает средне: Генерация сложной бизнес-логики (платежные маршрутизации, алгоритмы скоринга). Требует 3-5 итераций и жесткого контроля.
  • Не работает вообще: Архитектурные решения, оптимизация высоконагруженных участков, работа с race condition в распределенных системах. «Здесь AI выдает красивый, но наивный код. Будто студент-отличник, который никогда не видел продакшн-инцидентов».

Ключевой навык теперь – умение задавать вопросы. Не «напиши функцию», а «проанализируй этот модуль, найди все места, где не соблюдается паттерн X, предложи рефакторинг, учти, что здесь критична задержка менее 10 мс, и приведи три варианта с trade-offs».

А что с Agile, спринтами и прочей методологией?

«Agile умер. Во всяком случае, в том виде, в котором мы его знали», – заявляет CTO. Двухнедельные спринты потеряли смысл, когда фичу можно сделать за два дня. Вместо этого они перешли на гибридную модель: недельные микро-циклы для мелких задач и свободное планирование для крупных инициатив.

Планирование теперь выглядит так: архитектор разбивает эпик на промпты. Оценивает не «часы разработчика», а «часы ревью + сложность промпта». Это другая математика. Подробнее о том, как AI заставляет забыть старые методологии.

Что дальше? Агенты, а не ассистенты

Следующий шаг «Проекта Х» – переход от генерации кода по запросу к автономным агентам. Они экспериментируют со связкой YaLM 2.0 + архитектурой агентов, где одна нейросеть ставит задачи другой, запускает тесты, анализирует результаты и вносит правки.

«Цель – к концу 2026 года довести долю кода, который проходит полный цикл от ТЗ до тестов без человека, до 15%. Но здесь главный риск – потеря контроля. Агент может сделать логичную, но катастрофическую с бизнес-точки зрения вещь».

💡
Если ваш стек – это не изолированный финтех, а что-то более открытое, стоит изучить опыт использования инструментов вроде Google Antigravity в open-source. Там подходы и проблемы другие.

Итог: новая арифметика разработки

История «Проекта Х» – не про то, как AI отнял работу. Она про то, как AI переписал правила игры. Теперь один senior-разработчик, вооруженный правильными промптами и локальными LLM, делает работу шести mid-level инженеров. Но он должен быть в 10 раз внимательнее и мыслить на уровень выше.

Бизнес-результат очевиден: скорость и снижение затрат. Человеческая цена – болезненная трансформация и радикальное перераспределение ролей. Те, кто научился не писать, а думать и ставить задачи машинам, – остались и процветают. Остальные ищут компании, которые еще не проснулись.

Мой совет, основанный на этом кейсе? Не ждите, пока ваши конкуренты сделают это первыми. Начните с малого: внедрите AI-инструмент для рефакторинга или генерации тестов. Но сразу готовьте команду к тому, что дорожная карта разработчика в 2026 году ведет не к большему количеству кода, а к полному переосмыслению того, что значит «быть программистом».

А тем, кто все еще пишет каждый символ вручную, я бы посоветовал срочно пройти курс по prompt engineering. Потому что через год спрос на таких «рукоделов» упадет так же резко, как когда-то спрос на наборщиков текста после изобретения клавиатуры.