GitHub Uniformity Index: AI-инструменты делают код однообразным

Говорят, искусственный интеллект делает нас продуктивнее. Но есть побочка: он делает всех нас одинаковыми. И речь не о мемах в стиле «ChatGPT пишет за меня email». Речь о коде. Тысячи репозиториев, миллионы коммитов — и всё чаще пахнет не инженерной мыслью, а одним большим автокомплитом.

Ключевой вывод: по данным нового исследования, индекс разнообразия кода в GitHub (Uniformity Index) упал на 18% с 2021 по 2026 годы. Чем больше коммитов написано с помощью AI — тем меньше в проекте индивидуальности.

Как посчитать однообразие?

Вычислить Uniformity Index (UI) звучит сложно, но на деле это изящная формула. Берётся гигантский дамп GH Archive — все публичные коммиты GitHub с 2021 года. Дальше — BigQuery, парсинг AST (Abstract Syntax Tree) и статистический анализ n-грамм кода. Фактически, UI измеряет, насколько часто встречаются одинаковые паттерны — названия переменных, структура функций, расстановка пробелов. Чем больше совпадений с предсказаниями языковых моделей — тем выше индекс однородности.

Исследователи из OpenSource Integrity Lab выкачали 12 ТБ данных, отфильтровали коммиты, где автор использовал CoPilot, ChatGPT, Claude, Gemini, и сравнили их с «чистыми» коммитами (написанными без AI-ассистентов). Результат оказался предсказуемым — и от этого пугающим.

Цифры: падение разнообразия

Год	Uniformity Index (UI)	Доля AI-коммитов
2021	0.42	1%
2023	0.38	22%
2025	0.33	54%
2026 (H1)	0.29	68%

Падение с 0.42 до 0.29 — это не просто статистическая погрешность. Это катастрофа для open source, где раньше ценился «стиль» автора. Теперь, открывая PR, ты видишь for (int i = 0; i < n; i++) — сто раз одно и то же. Потому что ChatGPT считает это оптимальным. И оно на самом деле оптимально, но скучно до зубного скрежета.

AI-инструмент как убийца стиля

Мы уже писали, что ChatGPT заливает вас шаблонами — то же самое происходит и с кодом. Модели обучались на миллионах репозиториев, усреднили лучшие практики и теперь выдают «среднюю температуру по больнице». Если раньше ты мог отличить код от Linus Torvalds (грубый, прагматичный) от кода Guido van Rossum (элегантный, читаемый), то теперь все выглядит так, будто написано одним безликим «инженером из облака».

Особенно заметно по названиям переменных. Исследователи проанализировали 500k Python-функций: вероятность встретить имя result, data, temp выросла на 34%. Ваш персональный стиль — customer_data_list или d — больше не нужен. AI напишет так же, но скучнее.

Ирония: GitHub Copilot создан, чтобы писать за вас код. Но в итоге он пишет код, который выглядит так, будто его написал Copilot. Зеркало зазеркалья.

Open Source — жертва собственного успеха?

Open source всегда был ареной для экспериментов. Странные алгоритмы, нечитаемые однострочники, гениальные хаки. Теперь же, когда большинство новичков и даже сеньоров полагаются на AI, код становится «безопасным». Проблема в том, что «безопасный» — это синоним «предсказуемого». А кто захочет поддерживать предсказуемый код?

Любопытно, что OpenAI дала пользователям ручку регулировки — можно настраивать «энтузиазм» ChatGPT. Но это не решает проблему корневого шаблона. Даже с повышенной «креативностью» модель генерирует варианты, которые лежат в пределах её обучающей выборки. Свежее исследование показывает, что cross-model uniformity (когда две разные модели выдают одинаковые решения) выросла на 12% за последние два года.

Что дальше? Стратегия сознательной деградации

Есть и обратная сторона — AI-ассистенты делают open source доступным. Когда каждый может написать работающий код, барьер входа падает. Но в долгосрочной перспективе потеря разнообразия грозит стагнацией. Уже сейчас, по данным Gartner (2026), 41% решений в архитектуре софта принимаются на основе рекомендаций AI-помощников, а не интуиции инженеров.

Некоторые команды начинают намеренно «ломать» AI-генерации: переставлять блоки, переименовывать переменные, вставлять комментарии-заглушки. Это похоже на использование AITUNNEL — сервиса, который даёт доступ к разным моделям, чтобы не залипать в один и тот же стиль. Если вы работаете с несколькими AI — шанс сохранить индивидуальность кода выше. Перемешивание выходов разных моделей снижает Uniformity Index в среднем на 6%.

💡

Совет: используйте разные AI-инструменты для разных задач. Например, Claude для архитектуры, Copilot для boilerplate, Gemini для документации. Так вы сохраните хотя бы минимальное разнообразие в кодовой базе.

Не весь хайп — зло

Давайте честно: Uniformity Index — это не приговор. Единообразие в некоторых аспектах (форматирование, базовые паттерны) — благо. Меньше времени на code review, меньше странных багов. Но когда речь заходит о readme, о названиях переменных, о неожиданных архитектурных решениях — там AI откровенно калечит творчество.

Вопрос не в том, использовать AI или нет. Вопрос — как не стать его «слепым копипастером». Если вы пишете код, разбавляйте AI-сгенерированные блоки ручными правками, меняйте стиль — вносите человеческий хаос. Иначе через пару лет GitHub превратится в библиотеку одинаковых репозиториев, где единственное различие — имя владельца, а не душа проекта.

P.S. Я не удивлюсь, если через год появятся плагины, которые намеренно портят код, чтобы он выглядел «написанным человеком». Рынок «анти-AI» стартапов уже зарождается.

Подписаться на канал

GitHub Uniformity Index: как ChatGPT и AI-инструменты сделали open source однообразным