Hockey-Modell v2: Datenleck behoben und Saison 2025 eingebaut
Wir haben soeben Hockey v2 veröffentlicht — ein Upgrade, das nicht durch einen auffälligen Genauigkeitssprung motiviert war, sondern durch etwas Grundlegenderes: Wir haben ein Datenleck in der Trainings-Pipeline gefunden, behoben und das Modell mit der abgeschlossenen NHL-Saison 2025 aufgefrischt. Die Zielvorhersagegenauigkeit ist im Wesentlichen unverändert. Genau dieses Ergebnis haben wir angestrebt.
Was ist ein Datenleck?
Ein Datenleck bedeutet, dass das Modell beim Training Informationen gesehen hat, die es zum Zeitpunkt der Vorhersage unmöglich kennen kann. In der Praxis produziert das ein Modell, das auf dem Papier besser aussieht als es wirklich ist — weil es im Grunde auf der Zukunft trainiert wurde. Für ein Wettmodell ist das ein ernsthaftes Integritätsproblem, auch wenn die Live-Vorhersagen anders berechnet werden.
Das konkrete Leck betraf die Teamstärke-Bewertungen (Elo). Elo ist eine weit verbreitete Methode zur Messung der Teamqualität: Jedes Spiel verschiebt die Bewertung leicht, basierend auf dem Ergebnis und der Stärke des Gegners. Ein höheres Elo bedeutet ein stärkeres Team, und über viele Spiele nähern sich die Bewertungen einem fairen Ranking an. Mehr dazu, wie wir Elo einsetzen und wie Wettmodelle funktionieren, findet ihr in unseren Guides.
Das konkrete Leck: Elo als Endstand statt zum Spielzeitpunkt gespeichert
Unsere Datenbank speichert pro Team einen einzigen Elo-Wert — die aktuelle, tagesaktuelle Bewertung. Wenn der Trainer historische Spiele verarbeitete, rief er diesen aktuellen Wert ab und verwendete ihn als Teamstärke für jedes historische Spiel — auch für Spiele, die Jahre zurücklagen. Ein Playoff-Spiel von 2019 wurde mit einer Bewertung trainiert, die bereits jede Saison von 2020 bis 2025 widerspiegelte.
Die Lösung ist konzeptionell einfach. Jedes Mal, wenn unser Collector nach einem Spiel das Elo aktualisiert, schreibt er nun das Vor-Spiel-Elo — die Bewertung, wie sie vor dem Anpfiff stand — direkt in den Spieleintrag. Der Trainer liest diesen historischen Wert. Für Live-Vorhersagen bei kommenden Spielen verwenden wir weiterhin das aktuelle Elo (was korrekt ist: die neueste Bewertung ist die beste Schätzung der aktuellen Stärke). Nur der Trainingspfad war betroffen.
Das Ergebnis: gleiche Genauigkeit, sauberes Modell
Nach der Behebung des Lecks und dem Retrain — bei dem auch die vollständige NHL-Saison 2025 eingebunden wurde, die bislang fehlte — blieb der Zielfehler im Wesentlichen gleich: MAE ≈ 1,37 Heim / 1,36 Auswärts (niedriger = besser). Ein messbarer Genauigkeitsgewinn ist nicht eingetreten.
Das sagen wir bewusst so direkt. Die Verbesserung hier ist keine neue Vorhersagekante — es ist Vertrauen. Ein auf geleakten Daten trainiertes Modell produziert Zahlen, die wir nicht vollständig erklären oder verlässlich nutzen können. Ein leckfreies Modell, dessen Zahlen stabil bleiben, ist eines, über das wir ehrlich nachdenken können — und dessen Closing Line Value wir echtem Signal zuschreiben können, nicht einem Trainingsartefakt.
- Zielfehler (MAE) — Heim ~1,37, Auswärts ~1,36 — im Wesentlichen unverändert, wie nach Behebung des Lecks zu erwarten.
- Elo-Feature-Wichtigkeit gesunken — zuvor gehörte Elo zu den wichtigsten Features; nach der Behebung ist es korrekt zurückgefallen, weil seine frühere hohe Wichtigkeit durch die geleakten Zukunftsdaten aufgebläht war.
- Saison 2025 eingebunden — die Trainingsdaten reichten nur bis 2024; v2 umfasst die vollständige NHL-Saison 2024–25.
- Live-Vorhersagen nicht betroffen — Vorhersagen für kommende Spiele wurden immer mit dem aktuellen Elo berechnet. Nur der historische Trainingspfad hat sich geändert.
Warum Integrität beim Wetten zählt
Unser gesamter Value-Betting-Ansatz basiert auf einer Idee: Die Wahrscheinlichkeitsschätzungen des Modells sollen so nah wie möglich an der tatsächlichen Ergebnisverteilung liegen. Wenn wir bei einem weichen Buchmacher eine Quote finden, die über dem liegt, was unser Modell als fair einstuft, muss diese Lücke eine echte Fehlbewertung sein — kein Ausgleich für noch unentdeckte Modellfehler.
Ein geleaktes Modell schafft ein subtiles, aber sich summierendes Problem. Die durch das Leck aufgeblähte Elo-Wichtigkeit könnte Vorhersagen für Teams verfälschen, deren aktuelles Elo stark von ihrer historischen Entwicklung abweicht. Das Entfernen des Lecks verändert den durchschnittlichen Output nicht dramatisch — aber es beseitigt eine verborgene Verzerrung. Auf der Modellseite sind die aktualisierten Kennzahlen einsehbar, live verfolgt über den Closing Line Value gegen Pinnacle.
Was kommt als Nächstes für Hockey
Mit dem abgeschlossenen Stanley Cup Playoff 2025 verfügt das Modell über eine saubere, aktuelle Historie bis zum Ende der Saison 2024–25. Wir werden im Oktober erneut trainieren, wenn die Saison 2025–26 läuft und genug Spiele gespielt wurden, um die Elo-Bewertungen in einen zuverlässigen Bereich zu bringen. Bis dahin ist v2 das aktive Modell. Alle aktuellen Picks sind auf unserer Modellseite einsehbar.
Vergangene Ergebnisse garantieren keine zukünftigen. Wetten birgt echtes finanzielles Risiko; bitte verantwortungsvoll wetten, ab 18 Jahren.