> solutions / zk

Операции ZK prover-ферм и роллапов на контракте

Генерация пруфов: GPU-зависимая, дедлайн-зависимая, параллельная. Шедулер теряет джобы - теряете блок. Мы собираем ферму, очередь, ретраи и per-circuit бенчмарки на SP1, RISC Zero, Boundless, Brevis.

Стек, который приносим: SP1 и RISC Zero как baseline RISC-V zkVM, Boundless и Brevis как децентрализованные prover-маркетплейсы, Jolt и Halo2 для кастомных схем. Под каждую ферму - GPU-шедулер с deadline-aware приоритизацией, kv-cache сегментов схемы, retry-очередь с экспоненциальным backoff и алертами на missed proof window.

Whitespace, на котором стоим: «оператор операторов» на prover-маркетплейсах. Succinct, Boundless и Brevis запустились как marketplace в конце 2025; никто не занимает позицию «мы держим вашу GPU-ферму на этих маркетплейсах под подписанный SLA». Мы её занимаем.

> стек, которым оперируем

Подсет под ZK. Платформенный слой везде одинаковый.

ZK: SP1 RISC Zero Boundless Brevis Jolt Halo2
Platform: Kubernetes Terraform Ansible Prometheus Grafana Loki OpenTelemetry PagerDuty

> что разворачиваем

Конкретные deliverables под ZK-команды. Каждый - под ключ, с репозиторием, IaC и раннбуками.

[ Prover-ферма с GPU-шедулером ]

H100 / A100 / 4090 пул, deadline-aware приоритизация джобов, NUMA-aware placement, утилизация по карте 75%+ в типовом сценарии.

[ Retry-очередь proof-job'ов ]

Идемпотентный submit, экспоненциальный backoff, dead-letter queue с per-circuit анализом, алерт на pre-deadline ETA-промах.

[ Per-circuit бенчмарк-каталог ]

Замеры на SP1 / RISC Zero / Jolt по каждой схеме: time-to-prove, peak memory, optimal GPU type. Артефакт-кеш для precompiles.

[ Operator на Boundless / Brevis / Succinct ]

Регистрация в marketplace, bidding-стратегия по типам схем, репутация-трекинг, реконсиляция выплат, switching между маркетплейсами по marginal cost.

[ ZK rollup ops: prover + sequencer + DA ]

Сборка proving stack для собственного роллапа: координация sequencer'а, batcher'а и prover'ов, наблюдение L1 finality, плейбук при stall'е.

> что держим 24/7

После hand-off pager уходит к нам. Покрытие, настроенное под ZK-фермы:

  • Liveness-проверки prover'ов под дедлайны сети: alert если ETA пруфа превышает 70% от proof window.
  • GPU health watchdog: ECC errors, thermal throttling, xid - триггер на preempt и переезд джоба.
  • Queue depth / lag метрики per-circuit: alert при отклонении >20% от baseline.
  • Auto-retry на failed proof generation с deterministic seed для воспроизводимости.
  • Версионированные runbook'и: prover crash, OOM на witness gen, marketplace bid stuck, fork-choice на L1 в proof window.
  • Ежемесячный perf-ревью: новые precompiles, обновлённые бенчмарки, перераспределение нагрузки между маркетплейсами.

> сценарии миграции

Что переносим без потери выплат и без skipped proof'ов.

один маркетплейс → mix

Переход с одного prover-marketplace на портфель из 2-3: дифференциация по типу схемы, hedge против простоя одной площадки.

cloud GPU → bare-metal

Перенос фермы с AWS / GCP на dedicated GPU у Latitude.sh / DataPacket: cost-per-proof -50% в типовом сценарии, без потери дедлайнов.

SP1 → RISC Zero (или наоборот)

Параллельный shadow-proving для контроля корректности, постепенный cutover по типам схем, фиксация baseline по latency.

scale-up под season инсентивов

Мощности prover'ов ×5 за 7-10 дней: burst-сорсинг H100, авто-онбординг в marketplace, плейбук свертки после сезона.

FP32 → FP16 / mixed precision

Quantization-aware proof generation там, где схема позволяет: -30% time-to-prove, контрольный re-verify на каждом батче.

в свою proving stack

Переход с external prover service на собственную ферму: расчёт breakeven, gradual cutover, аудит ключевого материала и precompiles.

> кейсы

Анонимизированные. По NDA не раскрываем имена; цифры реальные.

ZK rollup · 6 мес · validator ops + prover farm · slashing: 0 · missed proof window: 0
SP1 marketplace operator · 4 мес · 32 H100 · top-3 по win-rate · cost-per-proof -45%
RISC Zero proving service · 8 мес · 16 H100 + 24 4090 · ETA accuracy ±8%
Brevis incentivized season · 8 недель · burst x5 capacity · 99.4% on-time delivery

> SLA tiers

Три уровня покрытия. Для production proving с подписанным SLA по дедлайнам рекомендуем Silver и выше.

Tier Response p95 (Sev-1) Coverage Incident report Engineer hours / мес
Bronze 30 мин Business hours, 5×8 В течение 48ч 40
Silver 15 мин 24/7 on-call ротация В течение 24ч 80
Gold 5 мин 24/7 с выделенным инженером В течение 12ч 160+

> FAQ

Поверх всех. SP1 и RISC Zero для RISC-V zkVM подхода, Jolt и Halo2 для custom-схем, Boundless / Brevis / Succinct как marketplace-слой. Если у вас collab с конкретным provider'ом - подключаемся к их toolchain.

Это Sev-1. Эскалация в течение 5-15 мин (по tier'у), root cause за 12-24ч, разбор инцидента со списком исправлений и владельцами. Архитектурно стараемся ловить до промаха: alert на ETA >70% от proof window триггерит pre-emptive миграцию на свободный GPU.

Зависит от схемы и throughput target'а. Baseline под одну production-схему: 4-8 H100 или 16-24 RTX 4090. Под marketplace-бид: начинаем с 8-16 H100 и масштабируем по win-rate. Пришлите тип схемы и target proof / hour - дадим точный расчёт за 24ч.

Да. Это одна из наших whitespace-ставок. Регистрируемся как ваш оператор в Boundless / Brevis / Succinct, держим bid-стратегию, мониторим репутацию, реконсилируем выплаты. Ключи staking-материала и payout-кошельки остаются у вас.

Да. Это включает sequencer + batcher + prover как координированный пайплайн, L1 finality observability, плейбук при stall'е. Можем собрать stack с нуля или взять на эксплуатацию existing setup.

> готовы развернуть инфру?

Опишите задачу: ответим в течение 24 часов.