@drxim

· AI / LLM ops lead UTC+3

Основатель XIMTRX. 12 лет SRE и DevOps. Веду команду, держу руку на on-call ротации, отвечаю за архитектуру клиентских деплоев. Дежурю по GPU-инференсу и LLM-сервингу.

vLLM GPU ops Triton CUDA Ray Kubernetes

GitHub → ← Вся команда

что делаю в XIMTRX

GPU-инференс и LLM-сервинг: on-call по vLLM и Triton, автоскейл и ревью costs на prod. Дежурство в смене UTC+3 (00:00 → 08:00 UTC). На discovery-созвонах работаю напрямую с CTO/фаундерами, без sales-прослойки.

С чем больше всего работаю последние годы: vLLM и Triton инференс на A100/H100, мульти-GPU автоскейл, тюнинг KV-cache и батчинга, оптимизация GPU-costs.

бэкграунд

12 лет в инфре. Начинал классическим sysadmin'ом, дальше SRE в высоконагруженных бэкенд-сервисах, потом ушёл в Web3- и AI-инфраструктуру. С 2024 года собираю XIMTRX как команду на контракте.

Профиль расширим позже: добавим публикации, доклады, public-конфиги. Пока что самый быстрый путь поговорить про техдетали: GitHub или Telegram через страницу контактов.