The Return of the Power Ranking: Erstausgabe 2013

Das erste Saisonviertel ist um, jede NFL-Mannschaft hat vier Spiele bestritten, was uns ausreicht, um das erste Power-Ranking der Saison 2013/14 zu veröffentlichen. Es ist kein „gefühltes“ Power-Ranking, sondern ein mathematisches. Die Grundlagen davon habe ich schon im letzten Jahr erklärt. Kurz gesagt, geht es bei diesem Power-Ranking darum, die wichtigsten Faktoren, die in der NFL von heute zu Sieg und Niederlage beitragen, zu isolieren und anhand ihrer Beständigkeit (Vorhersage-Genauigkeit; „Autokorrelation“) zu gewichten. Das Grundprinzip basiert auf den fantastischen statistischen Studien, die der ehemalige Navy-Pilot Brian Burke seit Jahren auf seiner Statistikseite Advanced NFL Stats publiziert hat. Die Einheit, auf der dieses Power-Ranking aufbaut, ist die Ressource, mit der eine Footballmannschaft arbeitet: Ihrer Effizienz in jedem Down.

Das Power-Ranking missachtet die Special-Teams und sämtliche Verletzungen. Trotzdem war es im vergangenen Jahr das zweitbeste mir bekannte Computer-Modell und putzte sämtliche nennenswerten US-Experten in ihrer Preview-Genauigkeit.

Natürlich wird auch dieses Jahr wieder der eine oder andere überraschende Name in den Top-10 der Power-Ranking aufwarten und manch einer wird es wieder als bekloppt hinstellen. Es gibt immer wieder auch Teams, an denen das Power-Ranking scheitert: 2013 stürzte zum Beispiel Philadelphia nach okayem Saisonstart ab; Washington genoss lange Zeit nicht die Wertschätzung und war wegen seiner horrenden Defense lange ziemlich weit (zu weit?) unten angesiedelt; die Renaissance der Baltimore Ravens in den Playoffs sah das Power-Ranking auch nicht kommen. Dafür wusste das Power-Ranking von Anfang an um die Genialität der Broncos (selbst als sie 2-3 waren), Panthers (selbst als diese 2-8 waren) oder Seahawks (Top-5 Team schon, als sie nur 3-3 waren), lange bevor sich Experten beim Gedanken an Russell Wilson die Höschen nass machten. Dabei ist bitte nie zu vergessen: Wer lieber nach Gefühlen tippt, bitte. Gerne. Hab ich kein Problem damit. Aber nicht vergessen, dass das mathematische Modell seit vielen Jahren die Gefühle schlägt.

Änderungen an der Version 2013

Ich hatte im kompletten Kalenderjahr noch keine Gelegenheit, mich ernsthaft mit der Weiterentwicklung wie z.B. dem Einbau der Special-Teams zu befassen. Ich machte im Winter ein paar Studienansätze, die versuchten, die Special-Teams zu isolieren, aber es misslang. Nach der Standardisierung sämtlicher Koeffizienten konnte ich zwar deklarieren, dass zirka 20% eines Spielausgangs von den Special-Teams beeinflusst wird (was ich erstmal überraschend hoch fand), aber die Autokorrelation (ergo: Vorhersagegenauigkeit) sämtlicher Special-Teams Komponenten außer dem Kickoff ist quasi bei null. Und beim Kickoff sind wir seit der Regeländerung auf die 35yds-Line bei so wenig Differenz angelangt, dass sich der Aufwand des Datensammelns und Einbauens wegen der paar Yards Differenz nicht lohnt.

Weil sich die Special-Teams in der NFL also fast wie ein Münzwurf verhalten, ist es sinnlos, sie im Power-Ranking einzubauen, denn das Power-Ranking will nur die Dinge berücksichtigen, über die Teams mehr (Passyards, Success-Rates, Penaltys) oder weniger (Turnovers) Kontrolle haben.

Ich habe weiters beschlossen, dieses Jahr auf die Wetter-Adjustierung zu verzichten, d.h. keine Anpassung der Passyards mehr für die Wärme oder Kälte in einem Footballspiel. Es war einfach zuviel Aufwand, sämtliche Daten zusammenzutragen. Ich kann die Zeit nicht mehr jede Woche aufbringen, deswegen wird diese Komponente gekickt; man muss auch berücksichtigen, dass sie sowieso nur recht kleinen Einfluss hatte (nur vier Tipps wären 2012 anders ausgefallen).

Was ich noch geändert habe: Die Koeffizienten der integrierten Komponenten (siehe übernächsten Absatz). Ich hab noch einmal eine Regression der letzten Jahre gemacht und anhand der Datenlage beschlossen, den Zeitraum 2007-2012 als Grundlage zu nehmen. Der Football, der seit 2007 in der NFL gespielt wird, ist am ähnlichstem dem, der heute gespielt wird. Sagen zumindest die Zahlen.

Ich wollte in dieser Offseason größere Fortschritte im Knacken der College-Stats machen, aber auch dort befinde ich mich noch in einem relativ primitiven Anfangsstadium. Hätte ich die Zeit, die ich dem College widmete, für das NFL-Power Ranking gewidmet, vielleicht wäre ich weiter gekommen. Hab ich leider nicht. Also wird erstmal weiter gewurstelt.

Was wird gemessen?

Die im Power-Ranking integrierten Komponenten bleiben weiterhin: Passyards in Offense und Defense, Lauf-Erfolg in Offense und Defense, Interceptions in Offense und Defense, Fumbles in Offense und Defense, Penaltys – alles adjustiert nach Down und Schedule-Stärke. Die genannten Komponenten decken zirka 85% der messbaren Komponenten eines Spiels, und ergo kann man wieder zirka zwischen 63% und 70% Vorhersagegenauigkeit dieses Modells erwarten.

Das ist weniger als erwarten würde, wenn man bedenkt, dass ein Affe 50% der Spiele richtig tippen kann und man ca. 57% Trefferquote erreicht, indem man eine Saison lang immer auf die Heimmannschaft tippt. Aber es ist auch besser als fast alle TV-Pundits in den Staaten und war zumindest in den letzten Jahren in etwa gleich gut wie die besten mathematischen Modelle (z.B. wurden diverse Formen der Sagarin-Ratings geschlagen).

Ach, und: Das Power-Ranking misst auch die „Intangibles“. Denn bringt eine Leadership eines speziellen Coaches oder Spielers oder rührende Story des 52ten Backups keinen direkten positiven Einfluss auf die messbaren Stats, sind diese Intagibles nutzlos. Der Spieler, der seine Mannschaft zum Sieg „willt“ ohne dadurch die Stats in irgendeiner Weise besser zu machen, gibt es nicht. Sorry, Tebow.

Wie kann ich das Power-Ranking schlagen?

Schlagen kann ein Team das Power-Ranking wie immer mit aggressiver Spielweise wie zum Beispiel Ausspielen möglichst vieler machbarer 4th Downs, möglichst wenigen sinnlosen Punts bei 4th-und-2 in der gegnerischen Platzhälfte, mittels Findung von optimalen Raten zwischen Lauf/Pass (was im Regelfall heißt: Mehr Passspiel, meine Herren!). Das sind die beeinflussbaren Faktoren. Nicht oder nur teilweise beeinflussen kannste andere Dinge: Turnovers im rechten Moment, viel Erfolg in Spielzügen mit hoher Hebelwirkung (3rd Downs, 4th Downs), laxer Schedule.

Also: Nach dem Sprung folgt die erste Version des Power-Rankings von Sideline Reporter von 2013/14, nebst kalkulierter Wahrscheinlichkeiten für Week 5. Wie immer habe ich volles Vertrauen in die Richtigkeit des Rankings.

(Edit: Kaum geschrieben, habe ich Böcke eingebaut. Sorry. Ich erkläre am nächsten Mittwoch kurz die Fehler. Unten habe ich auch die Wahrscheinlichkeiten aktualisiert) Weiterlesen