Tennis-Modell v3: Datenleck geschlossen und mit den Saisons 2025–2026 aktualisiert
Gutes Modellieren besteht genauso aus dem, was man entfernt, wie aus dem, was man hinzufügt. Dieses Update für unser Tennis-Modell ist ein gutes Beispiel dafür: Wir haben ein subtiles, aber bedeutsames Datenleck gefunden, behoben, das Modell auf zwei neue Saisons nachtrainiert und Features gestrichen, die mehr Rauschen als Signal brachten. Das Ergebnis ist Tennis v3 — kein dramatischer Genauigkeitssprung, aber ein ehrlicheres Modell, dem wir gerade in Grenzfällen mehr vertrauen. Es ist jetzt live für ATP- und WTA-Märkte.
Das Leck: Saisonabschluss-Statistiken mitten in der Saison
Unser Modell nutzt spielerspezifische Aufschlag- und Return-Statistiken — Gewinnquote beim ersten Aufschlag, Return-Gewinnquote — als Features. Das sind echte Fähigkeits-Signale: die Fähigkeit eines Spielers, das Aufschlagspiel zu halten oder das des Gegners zu brechen, ist stabil und aussagekräftig. Das Problem lag darin, wie wir diese Zahlen gespeichert und abgerufen haben.
Wir haben Aufschlagstatistiken als vollständige Saisonabschluss-Aggregate gespeichert. Wenn das Modell auf einem Spiel vom Juni trainierte, las es die Aufschlagquote des Spielers für die gesamte Saison — inklusive Spiele aus Juli, August und danach. Das Modell hat still und heimlich in die Zukunft gelinst. In der Fachwelt nennt man das einen Look-ahead-Leak. Er ist einer der heimtückischsten Bugs im Sportmodellieren, weil er nichts sichtbar kaputtmacht — er lässt das Modell auf historischen Daten nur minimal besser aussehen als es wirklich ist, auf eine Art und Weise, die sich nur durch sorgfältige Prüfung entdecken lässt.
Die Lösung: nur Statistiken der Vorsaison
Die Lösung ist im Prinzip geradlinig: In-Saison-Aggregate werden durch die Aufschlagstatistiken der abgeschlossenen Vorsaison ersetzt. Vor einem Spiel im Juni 2025 sieht das Modell jetzt nur, was der Spieler in der gesamten Saison 2024 erreicht hat — Daten, die fest abgeschlossen waren, bevor die Saison 2025 überhaupt begann. Strikt punktgenau, keine Zukunftsinformationen.
Das ist auch ein sinnvoller Prior. Aufschlagqualität gehört zu den stabilsten Fähigkeiten im Tennis von Jahr zu Jahr: Ein Spieler, der 2024 68 % seiner ersten Aufschläge gewann, liegt 2025 mit großer Wahrscheinlichkeit in einer ähnlichen Größenordnung. Die Vorsaison zu nutzen ist sowohl ehrlich als auch präzise genug, um das Signal zu erhalten. Wenn überhaupt, sind In-Saison-Aggregate früh in einer Saison verrauschter (kleine Stichproben) als ein vollständiger Jahreswert — der Fix ist also kein Kompromiss, sondern schlicht die bessere Datenpraxis.
Ehrliches Ergebnis: zuerst Integrität, dann kleiner Genauigkeitsgewinn
Da Elo — die Gesamtstärke-Bewertung — das dominante Signal bei Tennisvorhersagen ist und Aufschlagstatistiken ein ergänzendes, Elo-korreliertes Feature darstellen, ergibt das Schließen des Lecks keinen dramatischen Genauigkeitssprung. Was es ergibt, ist eine Genauigkeit, der wir wirklich vertrauen können. Der Head-to-Head-Brier-Score verbesserte sich von 0,1746 → 0,1726 (ATP) und 0,1523 → 0,1508 (WTA). Niedriger ist besser — beide sind bedeutsame Verbesserungen, aber keine großen Schritte. Wir werden einen Datenintegritäts-Fix nicht als Leistungssprung vermarkten.
Wir haben auch eine ambitioniertere Idee getestet: Aufschlagstatistiken zur Anpassung unserer Totals-Prognosen (Spiele) zu nutzen, nicht nur für den Head-to-Head-Sieger. Die Aufschlagdominanz eines Spielers sollte theoretisch die Gesamtzahl der gespielten Spiele beeinflussen. Auf den fehlerhaften historischen Daten sah die Anpassung vielversprechend aus. Als wir den Test mit den korrigierten, punktgenauen Daten wiederholten, verschwand der scheinbare Vorteil — das Signal war ein Artefakt des Lecks. Wir haben die Idee gestrichen, anstatt etwas zu liefern, das nur auf kompromittierten Daten gut aussah. Das ist die richtige Entscheidung, auch wenn es ein Feature weniger bedeutet.
Frische Daten und tourenspezifisches Feature-Pruning
Neben dem Leck-Fix enthält v3 auch zwei vollständige Saisons, die im vorherigen Trainingsset fehlten: die komplette Saison 2025 und die bisherigen 2026-Daten. Sowohl ATP- als auch WTA-Elo-Bewertungen und Aufschlagstatistiken wurden von Grund auf neu auf dem aktualisierten Datensatz berechnet, sodass jede historische Bewertung jetzt die korrekte Informationsreihenfolge widerspiegelt.
Außerdem haben wir eine systematische Feature-Pruning-Übung durchgeführt — getrennt für ATP und WTA. Nicht jedes Feature, das einer Tour hilft, hilft der anderen — Tennis ist für Männer und Frauen in Bezug auf Untergrundeffekte, Aufschlags-dominanz und die Gewichtung verschiedener Spielkontexte ein bedeutsam anderer Sport. Features, die auf einer Tour statistisch Rauschen waren, wurden nur für diese Tour gestrichen:
- ATP: von 30 auf 18 Features reduziert — zwölf Feature-Gruppen entfernt, damit das Modell kein Rauschen more fitted, das ATP-spezifisch war.
- WTA: von 30 auf 28 reduziert — ein leichterer Eingriff, der nur eine wörtliche Duplikat-Feature entfernt. Breiteres Pruning verschlechterte die WTA-Genauigkeit, daher haben wir den vollen Satz beibehalten.
- Beide Touren: Als Kernsignale validierte Features umfassen Tage seit dem letzten Spiel, aktuelle Spielbelastung, Return-Gewinnquote, Erste-Aufschlag-Gewinnquote und untergrundspezifische Form.
Diese tourenspezifische Disziplin ist wichtig: Ein Feature, das im ATP-Training Rauschen erzeugt, ist nicht einfach harmlos — es beeinträchtigt aktiv die Fähigkeit des Modells, die echten Signale zu finden. Weniger, sauberere Features schlagen mehr verrauschte bei gleicher Stichprobengröße.
Was das für Value Bets bedeutet
Das Ziel jedes Modell-Updates ist nicht, auf einem Benchmark zu glänzen — es ist, unsere Wahrscheinlichkeitsschätzungen verlässlicher zu machen, damit der Closing Line Value, den wir bei Live-Wetten erzielen, echten Vorteil widerspiegelt und keine Artefakte. Ein Modell mit einem subtilen Leck findet möglicherweise scheinbaren Value, den ein korrigiertes Modell nicht findet. Wir verlieren lieber ein paar marginale Wetten, als systematisch auf eine Fata Morgana zu setzen.
In der Praxis ist der Markteinfluss gering — v3-Wahrscheinlichkeiten liegen bei den meisten Spielen nahe an v2. Aber an den Rändern, insbesondere bei Spielen mit Spielern, deren Aufschlagqualität sich zwischen den Saisons stark verändert hat, summieren sich die Korrekturen. Die Live-Modellleistung ist auf der Modellseite einsehbar.
Tennis v3 ist live für ATP- und WTA-Head-to-Head-Märkte. WTA-Totals bleiben mit der Shrink-to-Pinnacle-Anpassung verfügbar, die wir Anfang des Jahres geliefert haben und die ein separates Kalibrierungsproblem im Spieltotals-Modell behebt. Vergangene Ergebnisse garantieren keine zukünftigen; bitte verantwortungsvoll wetten, ab 18 Jahren.