Der Fokus der Rolle liegt auf Platform Engineering an der Schnittstelle von , MLOps und LLMOps: Sie verbinden Build-&-Run (CI/CD, IaC, Kubernetes-Betrieb), Model-Lifecycle (Training/Pipelines, Versionierung, Promotion) und LLM-Lifecycle (Serving, Guardrails, Evaluierung, Monitoring) zu zuverlässigen, skalierbaren und sicher betreibbaren Services. * Aufbau von Monitoring, Logging und Observability für AI-Systeme * Erfahrung im Aufbau oder Betrieb von Cloud-, Plattform- oder Infrastruktur-Systemen * Erfahrung mit Microservices, APIs und verteilten Systemen * Erfahrung in MLOps/LLMOps (Model-/Prompt-Lifecycle, Serving, Evaluierung, Monitoring) sowie an produktiven AI-Systemen * Erfahrung mit GPU-Workloads oder High-Performance-Systemen von Vorteil * Strukturierte, selbstständige Arbeitsweise und Freude daran, komplexe Systeme zu betreiben und zu verbessern
mehr