Für jedes Experiment werden drei Gruppen definiert und parallel bespielt:
Wichtig: Beide Selektionen werden unabhängig erstellt — KI weiß nicht was die bisherige Methode gewählt hat und umgekehrt.
Ein einzelner Test mit +40% könnte Zufall sein. 50+ Tests mit konsistent 6–12% sind ein echter Effekt. Wir zeigen den Durchschnitt, nicht den Peak.
Innerhalb der 50+ Tests zeigt die Reaktivierungs-Selektion den höchsten Uplift (+47% Response). Andere Segmente liegen im 6–12% Bereich.
Tests mit unbereinigten Daten (fehlendes Kanal-Tracking, inkonsistente Zahlungswege) zeigen keinen Uplift. Das Modell braucht saubere Inputs.
Nur KI vs. bisherige Methode reicht nicht. Die Schnittmenge (A∩B) zeigt oft welcher Teil des Uplifts auf die Datenauswahl zurückgeht und welcher auf das Modell.
Dieses Experiment hat uns weitergebracht. Welches Problem willst du als nächstes lösen?
Gespräch buchen → Alle Experimente