@drxim
· AI / LLM ops lead UTC+3Основатель XIMTRX. 12 лет SRE и DevOps. Веду команду, держу руку на on-call ротации, отвечаю за архитектуру клиентских деплоев. Дежурю по GPU-инференсу и LLM-сервингу.
что делаю в XIMTRX
GPU-инференс и LLM-сервинг: on-call по vLLM и Triton, автоскейл и ревью costs на prod. Дежурство в смене UTC+3 (00:00 → 08:00 UTC). На discovery-созвонах работаю напрямую с CTO/фаундерами, без sales-прослойки.
С чем больше всего работаю последние годы: vLLM и Triton инференс на A100/H100, мульти-GPU автоскейл, тюнинг KV-cache и батчинга, оптимизация GPU-costs.
бэкграунд
12 лет в инфре. Начинал классическим sysadmin'ом, дальше SRE в высоконагруженных бэкенд-сервисах, потом ушёл в Web3- и AI-инфраструктуру. С 2024 года собираю XIMTRX как команду на контракте.
Профиль расширим позже: добавим публикации, доклады, public-конфиги. Пока что самый быстрый путь поговорить про техдетали: GitHub или Telegram через страницу контактов.