Site Reliability Engineer (m/w) (80-100%)
Zürich
Zürich
Die Lexian AG ist ein junges Unternehmen und Softwarelösungsanbieter für Rechtsanwaltskanzleien in der Schweiz. Unser Produkt wächst stark, und damit steigen auch die Anforderungen an unsere Infrastruktur, insbesondere in den Bereichen Skalierung und Automatisierung.
Für unser dynamisches stark wachsendes Team suchen wir ab sofort oder nach Vereinbarung eine erfahrene und engagierte Persönlichkeit als Site Reliability Engineer (m/w).
Deine Mission
Als Site Reliability Engineer verantwortest du die Verfügbarkeit, Stabilität und Skalierbarkeit unserer Kundeninstanzen – von der ersten Inbetriebnahme bis zum laufenden Betrieb. Du bewegst dich in einer Umgebung ohne zentrale Plattform und mit heterogenen Infrastrukturen.
Dein Ziel: eine skalierbare, automatisierte Betriebsplattform aufbauen, die auch bei vielen Kunden beherrschbar bleibt. Bringe unser DevOps auf den nächsten Level!
Deine Aufgaben
- Aufbau und Betrieb von Deployments über verschiedene Infrastrukturen hinweg (on-prem, Private Cloud, Hyperscaler)
- Automatisierung von Provisionierung, Deployment und Updates
- Monitoring, Logging und Alerting für verteilte Einzelinstanzen
- Incident Management und Fehleranalyse in produktiven Systemen
- Verbesserung von Verfügbarkeit, Performance und Recovery-Zeiten
- Enge Zusammenarbeit mit Entwicklung zur Verbesserung der Systemarchitektur
- Definition und Umsetzung von Betriebsstandards für externe IT-Partner
Onboarding & Inbetriebnahme
- Technische Durchführung von Kunden-Onboardings
- Schrittweise Automatisierung des Onboarding-Prozesses (Ziel: Infrastructure as Code)
Betrieb & Maintenance
- Rollout von Applikations-Updates über alle Instanzen
- OS- und Library-Updates
Second-Level Support & Incident Response
- Analyse und Behebung von Incidents (Log-Auswertung, DB-Queries)
- Anpassungen in Datenbank und Konfiguration
- Enge Zusammenarbeit mit dem Entwicklungsteam bei technischen Eskalationen
- Erarbeitung nachhaltiger Lösungen statt Quick Fixes – "Toil" systematisch reduzieren
Monitoring & Reliability
- Aufbau und Betrieb eines proaktiven Monitoring-Systems
- Definition und Tracking von SLIs/SLOs je Instanz
- Alerting, Dashboards und Incident-Playbooks etablieren
Automatisierung & Effizienz
- Automatisierung von Onboarding, Maintenance und Monitoring
- Reduktion manueller Arbeit als explizites Qualitätsziel
- Aufbau einer internen Wissensbasis und Dokumentation
- Stellvertreterregelung und Wissenstransfer sicherstellen
Herausforderungen der Rolle
- Kein zentralisierter Betrieb, sondern viele isolierte Kundeninstanzen
- Unterschiedliche Infrastruktur-Setups pro Kunde
- Notwendigkeit, Standards in einer nicht standardisierten Umgebung zu etablieren
Dein Profil
- Entwicklungserfahrung mit Kotlin/Java, Python, React
- Linux & Shell – du fühlst dich auf der Kommandozeile zu Hause
- Docker – Container sind für dich kein Fremdwort
- SQL – Queries lesen und schreiben, um Incidents zu analysieren
- Netzwerk-Grundlagen – DNS, TLS, Firewalls, Routing
- Ansible oder vergleichbare Automatisierungstools
- Strukturierte Denkweise: du dokumentierst, was du tust
- SRE-Mindset: Vertrautheit mit Konzepten wie SLOs, Error Budgets, Toil Reduction
- Deutsch: C1
Was wir bieten
- Hohe Gestaltungsmöglichkeiten in einem jungen, wachsenden Unternehmen
- Offene, transparente Zusammenarbeit auf Augenhöhe
- Selbständiges Arbeiten mit kurzen Entscheidungswegen
- echte Ownership, mit direktem Einfluss auf Architektur- und Prozess-Entscheidungen
- kleines fokussiertes Team
- technisches Mitprägen eines stark wachsenden Produkts
- Flexibles Arbeitsmodell mit Bürostandort Zürich
- Pensum 80–100%
Verantwortlichkeiten
- Verfügabrkeit und Stabilität der Kunden-Instanzen
- Skalierung unsere Betriebsprozesse
- Verantwortung für das Deployment- und Betriebsmodell
Must-have
- Mehrjährige Docker und Linux-Erfahrung
- SRE-Mindset
Software-Entwicklungserfahrung
- Selbständige Arbeitsweise
- Deutsch: C1
Wünschenswert
- Erfahrung in einem Startup oder mit schnell wachsender Infrastruktur
- Erfahrung mit containerbasierter Multi-Instance-Landschaften
Was ist das Tolle an dem Job?
- Grossartiges Team von intelligenten Leuten, in einer freundlichen und offenen Kultur
- Kurze und schnelle Entscheidungswege
- An vorderster Front mit dabei
- Hohe Gestaltungsmöglichkeiten
- Echte Verantwortung und Herausforderungen in einem sich schnell entwickelnden Unternehmen