*Wir wissen, dass jedes Team seine eigenen Bedürfnisse und Anforderungen hat. Deshalb können wir den Schulungsplan je nach Bedarf anpassen.
Modul 1: Datenfundamente und Ingestion Muster im Finanzumfeld
- Quelllandschaft Kernbank, Handel, Police, ERP, CRM, Marktdaten
- Ingestion Varianten Batch, Micro Batch, Streaming und passende Einsätze
- Dateien, APIs und Message Queues praktische Connectoren und Formate CSV, Parquet, JSON
- Landing Zones, Namensstandards und Basis Metadaten
Modul 2: ELT oder ETL für Analytics
- Staging, Core und Präsentationsschicht im Lakehouse oder Warehouse
- Dimensionale und Wide Table Muster für Finanzanalysen
- Slowly Changing Dimensions für Produkte, Kunden, Konten
- Schlüssel, Deduplizierung und Umgang mit spät eintreffenden Daten
Modul 3: Datenqualität und Validierung
- Geschäftsregeln Vollständigkeit, Gültigkeit, Konsistenz, Aktualität
- Automatische Checks in SQL oder Python mit Schwellen und Alerts
- Abgleichsmuster Summen, Salden und Kontrollkonten
- Erfassung und Behebung von Data Quality Incidents mit Lineage Kontext
Modul 4: Governance, Sicherheit und Lineage Grundlagen
- Zugriffskontrolle Rollen, Row Level, Spaltenmaskierung
- PII und sensible Felder Tokenisierung und selektive Verschlüsselung
- Lineage Erfassung aus Jobs und Queries für Nachvollziehbarkeit
- Dokumentation, der Auditoren folgen können Fakten, Regeln, Verantwortliche
Modul 5: Zuverlässige Workflows orchestrieren
- Scheduling Konzepte Abhängigkeiten, Retries, SLAs, Backfill
- Muster mit Airflow, Prefect oder Cloud Schedulern
- Idempotenz und Exactly Once Verhalten für wiederholbare Läufe
- Parametrisierung für Umgebungen und Datumspartitionen
Modul 6: Performance und Kostenbewusstsein
- Partitionierung, Clustering und Pruning für große Faktentabellen
- Caching, inkrementelle Modelle und Materialisierungsoptionen
- Effiziente Joins und Window Functions für Finanzmetriken
- Kostensignale Storage, Compute, Egress und einfache Leitplanken
Modul 7: Automatisierung mit Python und SQL
- Wiederverwendbare Utilities für Dateien, APIs und Schema Drift
- Query Templating und Makros für konsistente Berechnungen
- Automatisierte Tests für Transformationen und Metriken
- Packaging und Versionsverwaltung für reproduzierbare Deployments
Modul 8: Monitoring und Alarmierung
- Gesundheitsindikatoren Frische, Volumen, Fehlläufe und Anomalien
- Zentrales Logging und Run History für Analysen
- Alarmrouting und On Call Grundlagen für Datenteams
- Post Incident Review und Playbooks
Modul 9: Zentrale Finanzdatensätze und Kennzahlen
- Umsatz und Gebührenereignisse, Positionen und Trades, Prämien und Schäden
- Salden, GuV, Abgrenzungen und FX Effekte
- Stammdaten Produkte, Hierarchien, Kalender und Feiertage
- KPI Definitionen mit fachlich abgestimmter Logik
Modul 10: Integration in BI und Forecasting
- Serving Schichten Views, Extracts und semantische Modelle
- Anbindung an Power BI oder Tableau und Pflege der Aktualisierung
- Time Series Features und modellreife Datensätze
- Self Service Muster und Leitplanken für Fachbereiche
Modul 11: Kontrollen, Compliance und Change Management
- Aufsichtserwartungen Audit Trail, Reproduzierbarkeit, Zugriffsreviews
- Change Control Versionierung, Freigaben und Promotion Flows
- Aufbewahrungs- und Löschrichtlinien mit Ausnahmen
- Steuerung von Drittanbietern Verträge und SLAs
Modul 12: Fahrplan und Übergabe
- Inventar von Quick Wins und Lücken mit hohem Wertbeitrag
- Standard Checkliste Naming, Coding, Tests, Dokumentation
- Operating Rhythmen tägliche Checks, wöchentliche Reviews, Monatsabschluss Support
- Neunzig Tage Plan mit Verantwortlichen und Meilensteinen