Команда планирует свою инфраструктуру, рисует график на квартал и упускает одно: железо не приходит тогда, когда его заказали. В 2026-м сроки поставки на GPU и на часть серверных комплектующих такие, что они не строка в смете, а ограничение архитектуры. Мы планируем вокруг supply chain на каждом deploy-контракте, и дальше разбираем, как это выглядит на практике.
Срок поставки это часть архитектуры
Стандартное планирование считает железо мгновенно доступным: выбрали конфигурацию, заложили цену, дальше «закупка разберётся». Но если deploy завязан на железо, которое едет 8-12 недель, то срок поставки определяет дату запуска сильнее, чем любое инженерное решение. Архитектура, которую нельзя получить вовремя, это не архитектура, а пожелание.
Поэтому мы считаем срок поставки наравне с производительностью и ценой. Иногда правильный выбор это не лучшая по спеке карта, а та, что есть в наличии в нужном регионе на нужный срок. Лучшая конфигурация, которая приедет после окна возможности, проигрывает средней, которая готова сейчас.
Что в 2026-м со сроками
Картина по классам железа разная:
- GPU под AI и ZK остаются самым узким местом. Свежие карты идут по аллокации, сроки скачут, дефицит на пиках спроса прямой. Планировать GPU-деплой «закажем, когда понадобится» в 2026-м означает регулярно не попадать в окно.
- Серверные CPU и память. EPYC-классовые платформы и DDR5 в нужных объёмах это уже не «со склада завтра», а недели. Не катастрофа, но в график закладывать обязательно.
- Коло и стойки. Контракт на колокацию в новой стране это 4-6 недель согласований в спокойном случае, и юридически в части юрисдикций дольше. Само место в стойке и кросс-коннекты тоже не появляются мгновенно.
Складывается это в простую вещь: deploy на собственном железе в новой географии это не дни, а месяцы, и большую часть этих месяцев занимает не монтаж, а ожидание.
Почему мы держим часть в облаке именно из-за этого
Дефицит и сроки поставки это одна из главных причин, по которой мы сознательно держим часть мощностей в облаке, даже зная, что долгосрочно оно дороже железа по cost-per-token и по slot-month. Облако это способ стартовать сейчас, пока железо едет, и закрыть горящее окно, на которое поставка физически не успевает. Когда нужна нода или карта «вчера», региональный edge провайдера решает задачу за минуты, и это правильный выбор, несмотря на премию за час.
Гибрид здесь не компромисс, а ответ на supply chain: ровная база на железе, которое заказано заранее под предсказуемую нагрузку, и облако под то, что нужно быстрее, чем едет железо.
Диверсификация вендоров и RMA
Срок поставки бьёт не только на старте, но и в эксплуатации. Если весь парк на одном вендоре с одной платформой, то его задержки поставки и его очередь на RMA становятся вашими. Один проблемный вендор тормозит и расширение, и замену вышедшего из строя железа.
Поэтому мы держим несколько вендоров и платформ и заранее знаем, у кого что доступно и с каким сроком. Замена сгоревшего железа это тоже supply chain: запас на полке у хостера и его очередь на RMA определяют, как быстро мёртвый диск перестаёт стоить вам пропущенных слотов.
Как это влияет на ваш план
На полигоне мы держим актуальную картину доступности и сроков по вендорам и регионам, потому что проверяем её на собственных закупках. На клиентском контракте это превращается в честный график: что заказываем заранее, что стартуем в облаке, пока железо едет, где переезжаем на железо, когда оно приехало.
Если вы планируете собственную инфру и хотите график, который учитывает реальные сроки поставки, а не предполагает мгновенное железо, это часть того, что мы закрываем через deploy на нашей инфраструктуре. Хотите свести план деплоя со сроками под вашу географию: напишите нам.