[ Валидатор-сет в 3 регионах ] →
Cosmos SDK / Geth / Reth, key isolation на HSM/KMS, distributed lock против double-sign, slashing-алерты, миссед-блок дашборды, плейбук фейловера.
> solutions / web3
Запуск тестнета в следующем квартале. Найти SRE с Cosmos SDK: 4 месяца поиска, опционы в придачу. Мы поднимем валидаторов в 3 регионах за 5 дней с алертами на slashing и подписанным SLA по аптайму.
Приходим с готовым стеком: Cosmos SDK, Geth, Reth, OP Stack, Arbitrum Orbit, Polygon CDK, EigenDA, Celestia. Под каждый клиентский протокол собираем наблюдаемость подписей, distributed lock для double-sign, HSM/KMS workflow и runbook'и под Sev-1 (slashing trigger, peer drop, fork choice mismatch).
Whitespace, на котором стоим: эксплуатация L2 после развёртывания. Conduit, Caldera и Altlayer владеют ramp-up'ом sequencer'а; ops после запуска (мониторинг, ребут, миграции, hard-fork cutovers) остаётся открытой позицией. Мы её занимаем.
Подсет под Web3. Платформенный слой везде одинаковый.
Конкретные deliverables под Web3-команды. Каждый - под ключ, с репозиторием, IaC и раннбуками.
Cosmos SDK / Geth / Reth, key isolation на HSM/KMS, distributed lock против double-sign, slashing-алерты, миссед-блок дашборды, плейбук фейловера.
Geth / Reth read-replicas с per-method rate-limit'ом, кеш горячих запросов, p95 latency SLO, гео-роутинг для глобального трафика.
Sequencer + batcher + proposer как отдельные процессы, наблюдение L1 finality, плейбук переключения, hot-standby в другом регионе.
Burst-поставка под программу incentives: сорсинг bare-metal, авто-онбординг, equal-load распределение по регионам, дашборд позиции в leaderboard.
Light node-ы с подписанным аптаймом, retrieval-латенси, плейбук на пропущенный header, синхронизация с консенсус-слоем.
После hand-off pager уходит к нам. Покрытие, настроенное под валидаторов и роллапы:
Что переносим без даунтайма и без потери ключевого материала.
Cutover validator-сета на mainnet с key-церемонией, синхронизацией стейта, контрольной точкой и rollback-планом.
Перенос валидаторов с AWS/GCP на Latitude.sh / OpenMetal: -40% costs на ноду в типовом сценарии, latency не страдает.
Координированный апгрейд клиента под known fork height: pre-flight checks, canary-нода, rolling restart по регионам.
Перенос L2 sequencer'а на другую юрисдикцию или провайдера без drop'а блоков: hot-standby promote + DNS-cutover.
Разнос RPC по регионам под рост трафика: anycast / гео-DNS, cache warm-up, per-region rate-limit'ы.
Параллельная синхронизация, контроль чек-сумм по блокам, плавный switch без missed slot'ов.
Анонимизированные. По NDA не раскрываем имена; цифры реальные.
Три уровня покрытия. Для валидаторов и sequencer'ов рекомендуем Silver и выше: slashing-риски не терпят 5×8.
| Tier | Response p95 (Sev-1) | Coverage | Incident report | Engineer hours / мес |
|---|---|---|---|---|
| Bronze | 30 мин | Business hours, 5×8 | В течение 48ч | 40 |
| Silver | 15 мин | 24/7 on-call ротация | В течение 24ч | 80 |
| Gold | 5 мин | 24/7 с выделенным инженером | В течение 12ч | 160+ |
Вы. HSM/KMS workflow, где ключи не покидают ваш контроль. Мы подписываем процессом через signer-демон с distributed lock, материал не кастодируем. Опционально: MPC-сетап (CGGMP-21 / FROST), если протокол поддерживает.
Архитектурно исключаем double-sign через distributed lock: signing key уходит в read-only, если consensus с другим инстансом не достигнут. Финансовая ответственность зависит от тира: в Gold обсуждается slashing-страховка, в Bronze/Silver - shared model. За 3 года ops в текущей команде: 0 slashing-инцидентов.
Supply window: 72ч от подписи до первой ноды live. Регионально-распределённое поднятие закрываем за 5-7 дней. Пришлите спецификацию протокола + регионы, ответим с конкретным окном за 24ч.
Да. Это один из основных стеков, с которым работаем. Включает кастомные модули, IBC-релэи, governance-голоса, миграции upgrade-handler'ов между major-версиями. CometBFT, CosmWasm, IBC v2 - в работе.
Да. Onboarding: 1 неделя на инвентаризацию, импорт IaC (если есть) или peregenерацию через Terraform, перенос ключей через ceremony, передачу pager'а. Если что-то критично сломано до старта - сначала фиксим, потом подписываем SLA.