Инфраструктура искусственного интеллекта напоминает перегруженный сервер во время черной пятницы — только ставки выше. Пока мир обсуждает, когда AGI заменит программистов, инженеры втихаря решают, где взять энергию для очередного кластера, как охладить тысячи GPU и как уместить фотонный чип в стойку. На этой неделе CEO ASML, Google Cloud и Perplexity синхронно заговорили о том, что система трещит по швам.
Дело не в отсутствии идей — их, как раз, переизбыток. Дело в железе, проводах и законе Мура, который окончательно превратился в насмешку. Вот три горячих точки, где AI-инфраструктура сейчас реально болит.
Чипы: физика против литографии
«Мы подошли к пределу того, что можно выжать из кремния», — сухо констатирует CEO ASML. И это не ритуальная жалоба производителя литографических машин — это констатация факта. ASML продолжает штамповать EUV-сканеры, но каждый следующий шаг в нанометры обходится в десятки миллиардов. High-NA EUV еще не вышел на полную мощность, а TSMC уже намекает: транзисторы дальше некуда сжимать.
Забавный факт: современный AI-чип (например, NVIDIA B300) потребляет столько же, сколько небольшой европейский город. Производительность растет, но цена ватта — еще быстрее.
Результат? Спрос на AI-чипы, по словам TSMC, «бесконечен», а предложение упирается в физику. Выход видят в новых архитектурах — оптических, фотонных, даже нейроморфных. Но до серийного производства таким решениям еще пахать и пахать.
Электричество: сети на пределе, Google Cloud в панике
Второй фронт — энергия. Американские электросети трещат под натиском дата-центров, и это не метафора. CEO Google Cloud признался в закрытом разговоре: «Мы не можем найти площадку для нового кластера, где есть свободные 500 МВт. Нигде». Стройка атомных станций для AI — уже не шутка, а реальная повестка Microsoft, Google и Amazon.
Инсайд: Perplexity тестирует «ленивый» режим вывода — модель использует в 10 раз меньше энергии, но выдает ответ на секунду дольше. Юзеры не заметили разницы, а счет за электричество упал на 40%. Иногда медленнее — значит устойчивее.
Орбитальные дата-центры, которые еще вчера казались фантастикой, сегодня обсуждаются на уровне советов директоров. Идея: вынести серверы на орбиту, где солнечная энергия доступна 24/7, а охлаждение космосом бесплатно. Звучит безумно, но триллионные инвестиции в инфраструктуру заставляют рассматривать любые варианты. Проблема: задержка (latency) и стоимость запуска. Но если на Земле энергия кончится раньше, чем идеи — космос станет не роскошью, а необходимостью.
Архитектура: когда HBM не хватает, а сеть душит
Узкое место №3 — интерконнекты. Стартапы вроде Mesh Optical пытаются заменить медные соединения оптикой, но фабрики оптических трансиверов работают на пределе. Лазерные чипы Tower Semiconductor и технология DWDM — попытка решить проблему «сетевого удушья», когда GPU простаивают в ожидании данных. Параллельно оптические метаматериалы обещают революцию в коммутации, но до коммерческого внедрения — годы.
Архитекторы Google Cloud признают: 80% времени обучения большой модели уходит на ожидание данных, а не на вычисления. Мы строим суперкомпьютеры, которые половину времени просто ждут. Битва между метаматериалами и кремниевой фотоникой — это битва за то, кто первый уберет это «бутылочное горлышко».
Инсайты: что говорят CEO (и почему это не сценарий для пресс-релиза)
CEO Perplexity (да, той самой поисковой системы) сказал вещь, от которой у венчурных капиталистов дернулся глаз: «Мы перегреваем планету, чтобы показать рекламу быстрее. Может, стоит спросить пользователя, готов ли он подождать лишнюю секунду ради экологии?» Вопрос риторический, но он бьет в самое сердце current AI-культуры — культуры «больше, быстрее, мощнее».
CEO ASML, напротив, более технократичен: «Квантовые и фотонные компьютеры не заменят кремний в ближайшие 10 лет, но они снимут часть нагрузки. Проблема в том, что мы не можем одновременно развивать 5 разных архитектур — это слишком дорого». А a16z уже распределяет $1.7 млрд между фотоникой, новыми материалами и… да, орбитальными дата-центрами.
Google Cloud же пошел ва-банк: они строят собственные подводные кабели, скупают оптоволоконные заводы и разрабатывают TPU седьмого поколения. Но даже они признают: мы инвестируем триллионы вслепую, потому что не знаем, какие модели понадобятся через 3 года.
Пока мы спорим, изменит ли ИИ всё, инженеры уже знают ответ: только если мы сначала изменим всё, что находится ниже уровня софта. Физика, электричество, оптика — вот настоящий фронт. И, возможно, придется отказаться от идеи бесконечного масштабирования. Или строить дата-центры на Луне. Шутка ли? Судя по серьезности лиц CEO — нисколько.