Site Reliability Engineer (m/w) (80-100%)

Zürich

Jetzt bewerben!

Die Lexian AG ist ein junges Unternehmen und Softwarelösungsanbieter für Rechtsanwaltskanzleien in der Schweiz. Unser Produkt wächst stark, und damit steigen auch die Anforderungen an unsere Infrastruktur, insbesondere in den Bereichen Skalierung und Automatisierung.

Für unser dynamisches stark wachsendes Team suchen wir ab sofort oder nach Vereinbarung eine erfahrene und engagierte Persönlichkeit als Site Reliability Engineer (m/w).

Deine Mission

Als Site Reliability Engineer verantwortest du die Verfügbarkeit, Stabilität und Skalierbarkeit unserer Kundeninstanzen – von der ersten Inbetriebnahme bis zum laufenden Betrieb. Du bewegst dich in einer Umgebung ohne zentrale Plattform und mit heterogenen Infrastrukturen.

Dein Ziel: eine skalierbare, automatisierte Betriebsplattform aufbauen, die auch bei vielen Kunden beherrschbar bleibt. Bringe unser DevOps auf den nächsten Level!

Deine Aufgaben

Aufbau und Betrieb von Deployments über verschiedene Infrastrukturen hinweg (on-prem, Private Cloud, Hyperscaler)
Automatisierung von Provisionierung, Deployment und Updates
Monitoring, Logging und Alerting für verteilte Einzelinstanzen
Incident Management und Fehleranalyse in produktiven Systemen
Verbesserung von Verfügbarkeit, Performance und Recovery-Zeiten
Enge Zusammenarbeit mit Entwicklung zur Verbesserung der Systemarchitektur
Definition und Umsetzung von Betriebsstandards für externe IT-Partner

Onboarding & Inbetriebnahme

Technische Durchführung von Kunden-Onboardings
Schrittweise Automatisierung des Onboarding-Prozesses (Ziel: Infrastructure as Code)

Betrieb & Maintenance

Rollout von Applikations-Updates über alle Instanzen
OS- und Library-Updates

Second-Level Support & Incident Response

Analyse und Behebung von Incidents (Log-Auswertung, DB-Queries)
Anpassungen in Datenbank und Konfiguration
Enge Zusammenarbeit mit dem Entwicklungsteam bei technischen Eskalationen
Erarbeitung nachhaltiger Lösungen statt Quick Fixes – "Toil" systematisch reduzieren

Monitoring & Reliability

Aufbau und Betrieb eines proaktiven Monitoring-Systems
Definition und Tracking von SLIs/SLOs je Instanz
Alerting, Dashboards und Incident-Playbooks etablieren

Automatisierung & Effizienz

Automatisierung von Onboarding, Maintenance und Monitoring
Reduktion manueller Arbeit als explizites Qualitätsziel
Aufbau einer internen Wissensbasis und Dokumentation
Stellvertreterregelung und Wissenstransfer sicherstellen

Herausforderungen der Rolle

Kein zentralisierter Betrieb, sondern viele isolierte Kundeninstanzen
Unterschiedliche Infrastruktur-Setups pro Kunde
Notwendigkeit, Standards in einer nicht standardisierten Umgebung zu etablieren

Dein Profil

Entwicklungserfahrung mit Kotlin/Java, Python, React
Linux & Shell – du fühlst dich auf der Kommandozeile zu Hause
Docker – Container sind für dich kein Fremdwort
SQL – Queries lesen und schreiben, um Incidents zu analysieren
Netzwerk-Grundlagen – DNS, TLS, Firewalls, Routing
Ansible oder vergleichbare Automatisierungstools
Strukturierte Denkweise: du dokumentierst, was du tust
SRE-Mindset: Vertrautheit mit Konzepten wie SLOs, Error Budgets, Toil Reduction
Deutsch: C1

Was wir bieten

Hohe Gestaltungsmöglichkeiten in einem jungen, wachsenden Unternehmen
Offene, transparente Zusammenarbeit auf Augenhöhe
Selbständiges Arbeiten mit kurzen Entscheidungswegen
echte Ownership, mit direktem Einfluss auf Architektur- und Prozess-Entscheidungen
kleines fokussiertes Team
technisches Mitprägen eines stark wachsenden Produkts
Flexibles Arbeitsmodell mit Bürostandort Zürich
Pensum 80–100%

DevOps

Software Entwicklung

Autonomie

Administrative Arbeit

Kundenkontakt

Verantwortlichkeiten

Verfügabrkeit und Stabilität der Kunden-Instanzen
Skalierung unsere Betriebsprozesse
Verantwortung für das Deployment- und Betriebsmodell

Must-have

Mehrjährige Docker und Linux-Erfahrung
SRE-Mindset
Software-Entwicklungserfahrung
Selbständige Arbeitsweise
Deutsch: C1

Wünschenswert

Erfahrung in einem Startup oder mit schnell wachsender Infrastruktur
Erfahrung mit containerbasierter Multi-Instance-Landschaften

Was ist das Tolle an dem Job?

Grossartiges Team von intelligenten Leuten, in einer freundlichen und offenen Kultur
Kurze und schnelle Entscheidungswege
An vorderster Front mit dabei
Hohe Gestaltungsmöglichkeiten
Echte Verantwortung und Herausforderungen in einem sich schnell entwickelnden Unternehmen

Jetzt bewerben!