Доклад
Москва, 5 декабря, 12:00 (GMT +3)

Эволюция ML-платформы на базе Kubernetes

ML-платформа — повседневный инструмент ML-инженера в Тинькофф. Под капотом это большой и сложный инфраструктурный проект. Команда разработки прошла большой путь переезда со Slurm на Kubernetes. В докладе Никита расскажет, как они учились запускать задачи в Kubernetes и какие подводные камни встретили на пути. Поделится, как в итоге внедрили open source решение в процесс оркестрации в платформе и решили часть проблем.