Bare metal supply chain 2026: сроки, вендоры, deploy-окно

Команда планирует свою инфраструктуру, рисует график на квартал и упускает одно: железо не приходит тогда, когда его заказали. В 2026-м сроки поставки на GPU и на часть серверных комплектующих такие, что они не строка в смете, а ограничение архитектуры. Мы планируем вокруг supply chain на каждом deploy-контракте, и дальше разбираем, как это выглядит на практике.

Срок поставки это часть архитектуры

Стандартное планирование считает железо мгновенно доступным: выбрали конфигурацию, заложили цену, дальше «закупка разберётся». Но если deploy завязан на железо, которое едет 8-12 недель, то срок поставки определяет дату запуска сильнее, чем любое инженерное решение. Архитектура, которую нельзя получить вовремя, это не архитектура, а пожелание.

Поэтому мы считаем срок поставки наравне с производительностью и ценой. Иногда правильный выбор это не лучшая по спеке карта, а та, что есть в наличии в нужном регионе на нужный срок. Лучшая конфигурация, которая приедет после окна возможности, проигрывает средней, которая готова сейчас.

Что в 2026-м со сроками

Картина по классам железа разная:

GPU под AI и ZK остаются самым узким местом. Свежие карты идут по аллокации, сроки скачут, дефицит на пиках спроса прямой. Планировать GPU-деплой «закажем, когда понадобится» в 2026-м означает регулярно не попадать в окно.
Серверные CPU и память. EPYC-классовые платформы и DDR5 в нужных объёмах это уже не «со склада завтра», а недели. Не катастрофа, но в график закладывать обязательно.
Коло и стойки. Контракт на колокацию в новой стране это 4-6 недель согласований в спокойном случае, и юридически в части юрисдикций дольше. Само место в стойке и кросс-коннекты тоже не появляются мгновенно.

Складывается это в простую вещь: deploy на собственном железе в новой географии это не дни, а месяцы, и большую часть этих месяцев занимает не монтаж, а ожидание.

Почему мы держим часть в облаке именно из-за этого

Дефицит и сроки поставки это одна из главных причин, по которой мы сознательно держим часть мощностей в облаке, даже зная, что долгосрочно оно дороже железа по cost-per-token и по slot-month. Облако это способ стартовать сейчас, пока железо едет, и закрыть горящее окно, на которое поставка физически не успевает. Когда нужна нода или карта «вчера», региональный edge провайдера решает задачу за минуты, и это правильный выбор, несмотря на премию за час.

Гибрид здесь не компромисс, а ответ на supply chain: ровная база на железе, которое заказано заранее под предсказуемую нагрузку, и облако под то, что нужно быстрее, чем едет железо.

Диверсификация вендоров и RMA

Срок поставки бьёт не только на старте, но и в эксплуатации. Если весь парк на одном вендоре с одной платформой, то его задержки поставки и его очередь на RMA становятся вашими. Один проблемный вендор тормозит и расширение, и замену вышедшего из строя железа.

Поэтому мы держим несколько вендоров и платформ и заранее знаем, у кого что доступно и с каким сроком. Замена сгоревшего железа это тоже supply chain: запас на полке у хостера и его очередь на RMA определяют, как быстро мёртвый диск перестаёт стоить вам пропущенных слотов.

Как это влияет на ваш план

На полигоне мы держим актуальную картину доступности и сроков по вендорам и регионам, потому что проверяем её на собственных закупках. На клиентском контракте это превращается в честный график: что заказываем заранее, что стартуем в облаке, пока железо едет, где переезжаем на железо, когда оно приехало.

Если вы планируете собственную инфру и хотите график, который учитывает реальные сроки поставки, а не предполагает мгновенное железо, это часть того, что мы закрываем через deploy на нашей инфраструктуре. Хотите свести план деплоя со сроками под вашу географию: напишите нам.