Облако стоит денег. Много денег
В 2026 году это уже не новость, а финансовый факт, который заставляет разработчиков искать альтернативы. Каждый запрос к GPT-5, каждое изображение от Stable Diffusion 4.0, каждый анализ видео - все это отправляется в облако и возвращается обратно. Счет за это растет быстрее, чем кадры в генеративном видео.
Калифорнийский стартап Quadric нашел простой ответ: а что если вообще не отправлять?
По данным на январь 2026, Quadric показывает доход $15-20 млн при оценке компании в $300 млн после раунда Series C на $30 млн. Их чипы уже работают в автомобильных системах ADAS, промышленных камерах и умных камерах наблюдения.
Что внутри черного ящика Quadric?
Не пытайтесь найти спецификации в открытом доступе - их там нет. Это коммерческая тайна, которую стартап охраняет ревнее, чем OpenAI охраняет веса GPT-5. Но из утечек и патентов известно: чип Quadric Q80 (последняя версия на 2026 год) работает с моделями до 7 миллиардов параметров.
Для сравнения: современные ноутбуки с NPU едва справляются с 3-миллиардными моделями без серьезного квантования.
Секрет не в архитектуре - там обычные матричные умножения и внимание. Секрет в энергоэффективности: 15 TOPS (тераопераций в секунду) при потреблении меньше 5 ватт. Для промышленных систем это разница между "работает от батареи" и "нужно тянуть кабель".
Почему рынок готов платить?
Ответ в трех цифрах:
- Снижение стоимости инференса на 60-80% по сравнению с облачными решениями
- Задержка сокращается с 100-300 мс до 5-20 мс
- Полная независимость от интернет-соединения
Возьмите автономный складской робот. Он делает 1000 распознаваний объектов в час. В облаке это $0.0001 за запрос x 1000 x 24 часа = $2.4 в день. На чипе Quadric - $0 после покупки железа. За год экономия покрывает стоимость оборудования дважды.
А что с большими моделями?
Здесь Quadric сталкивается с физикой. GPT-5 с ее 1.7 триллионами параметров не поместится ни на один edge-чип в ближайшие годы. Но стартап не пытается ее запустить.
Вместо этого они предлагают другое: запускать маленькие, специализированные модели. Детектор аномалий на производственной линии (200 млн параметров). Распознавание жестов для AR-очков (500 млн). Анализ голоса на умных колонках (300 млн).
Эти модели работают быстрее, точнее для конкретной задачи и - что важно - не отправляют ваши данные в облако Google или Microsoft.
Важный нюанс: Quadric не продает модели. Они продают железо и компилятор, который превращает PyTorch или TensorFlow граф в код для их чипа. Модели вы обучаете сами или берете готовые из Hugging Face.
Кто конкурирует за этот кусок пирога?
Рынок on-device AI в 2026 году напоминает Калифорнию времен золотой лихорадки. Все хотят добывать золото, но настоящие деньги делают те, кто продает кирки.
| Игрок | Фокус | Цена за чип |
|---|---|---|
| Quadric | Промышленность, автомобили | $50-200 |
| Qualcomm AI250 | Смартфоны, ноутбуки | $30-80 |
| Huawei Ascend 910C | Китайский рынок, surveillance | $40-120 |
| NVIDIA Jetson Orin Nano | Разработчики, прототипы | $150-400 |
Quadric выбрал нишу, где цена не главное. Надежность, энергоэффективность и поддержка длительного жизненного цикла (10+ лет) важнее для заводов, чем скидка в $20.
Где спрятаны подводные камни?
Первый камень - разработка моделей. Не каждая нейросеть сойдет за edge-ready. Нужно квантование, призматизация, оптимизация под конкретное железо. Методы вроде AETHER-X от NVIDIA помогают, но это дополнительный этап в пайплайне.
Второй - обновление моделей. Выпустили чип в камеру наблюдения на заводе. Через год появилась более точная модель для обнаружения дефектов. Как ее загрузить? По воздуху? Через кабель? Quadric решает это проприетарными системами OTA-обновлений, но это добавляет сложности.
Третий - экосистема. У NVIDIA есть CUDA, у Qualcomm - Snapdragon, у Huawei - собственный стек. У Quadric есть... компилятор. И все. Интеграция с популярными фреймворками работает, но не идеально.
Что будет дальше с on-device AI?
Прогноз на 2027-2028 годы прост: все, что можно запустить локально, будет запускаться локально. Облако останется для тренировки гигантских моделей и сверхсложных вычислений.
TSMC уже заявляет о бесконечном спросе на AI-чипы, но это не только серверные H100. Это миллиарды маленьких чипов для умных устройств.
Quadric находится в идеальной позиции: они не конкурируют с NVIDIA за дата-центры. Они захватывают рынок, который большие игроки считают слишком маленьким - до тех пор, пока он не станет огромным.
Финансовый итог: Quadric показывает, что можно зарабатывать на AI, не строя дата-центры размером с футбольное поле. Достаточно сделать чип размером с ноготь и продавать его тем, кто устал платить Amazon за каждое предсказание.
Ирония в том, что чем успешнее становятся облачные AI-сервисы вроде Google Cloud с его AI-агентами, тем дороже становится инференс. Тем выгоднее выглядит альтернатива в виде железа на устройстве.
Последний совет: следите не за стартапами, которые создают новые модели. Следите за теми, кто создает железо для их запуска. Как показывает Quadric с его $20 млн дохода - именно они могут оказаться настоящими победителями в гонке AI.