Oft angefragt, lange versprochen – und jetzt endlich da: Eine ausführliche Anleitung zum Lesen des Power Rankings und all der Tabellen und Aufstellungen, die mit einhergehen – erklärt anhand des neuesten Power Rankings nach Woche 15, das ich hiermit veröffentliche.
Vorausgeschickt: Ja, ich habe volles Vertrauen in die methodische Korrektheit, mit der das Power Ranking erstellt wird. Mag sein, dass ein 9-5 Team auf dem 25ten Platz keinen Sinn macht, oder dass Team A zwei Wochen nach einem Blowout-Sieg bei Team B noch immer 10 Plätze hinter Team B liegt, aber: Dieses Ranking scheißt sich nicht um Bauchgefühle. Es rechnet eiskalt nach Effizienz pro Down.
Es interessiert sich nicht für Verletzungen oder Eier, die Clutch-QB Flacco besitzt und Weichei Romo nicht hat. Es interessiert sich nicht für die Form jeder Mannschaft, da es einen Snap von Woche 1 genau gleich schwer gewichtet wie einen Snap in Woche 15. Es gewichtet dafür anders, stabile Plays wie Pass-Completions werden höher bewertet als Fluke-Plays wie Interceptions oder Fumbles. Das Ranking gewichtet die Effizienz pro Down und nach ihrer Aussagekraft in die Zukunft gerichtet.
Es gibt mir einen schnellen Überblick über Stärken und Schwächen jeder Mannschaft. Und es nimmt mir die Arbeit ab, Woche für Woche Teams nach diffusen Kriterien zu reihen um eine Latte an Kommentaren abzustauben.
Und: Es ist nicht perfekt. Aber damit kann ich leben.
Effizienz-Metriken
(zum Vergrößern bitte auf die Bilder klicken)
In dieser Tabelle sind die acht Basis-Statistiken pro Mannschaft gelistet, auf Basis dessen das Power-Ranking seine Werte errechnet.
OPASS = Pass-Offense, gemessen in NY/A
ORUN = Lauf-Offense, gemessen in SR%
OINT% = Interception-Quote Offense, gemessen in Prozent
OFUM% = Fumblequote Offense, gemessen in Prozent
DPASS= Pass-Defense, gemessen in NY/A
DRUN = Lauf-Defense, gemessen in SR%
DINT% = Interception-Quote Defense, gemessen in Prozent
PEN = Penalty-Yards pro Spielzug
NY/A bedeutet „Netto-Yards pro Attempt“, also Netto-Yards pro Passspielzug. Sacks werden dabei als Passspielzüge gewertet und die durch Sacks verlorenen Yards werden abgezogen.
SR% bedeutet „Success Rate“ -> wie viele Prozent der Läufe führen zu positiver EPA.
EPA = Expected Points Added. Das ist eine Metrik, die anhand Down und Feldposition versucht zu schätzen, wie viel ein Spielzug zu Erfolg und Misserfolg einer Mannschaft beigetragen hat. Detaillierter zu erklären reicht die Zeit nicht, ich verweise auf den großartigen, leider mittlerweile eingestellten Advanced NFL Stats Blog. Dessen Gründer Brian Burke ist mittlerweile bei ESPN angestellt.
Als Erklärung zu SR%: Ich streiche alle Kneel-Downs aus der Gleichung raus. Rausgestrichen werden auch Läufe in den letzten zwei Minuten in Spielen mit mehr als 99% Siegwahrscheinlichkeit für eine der Mannschaften. Der Mannschaft Gegner weiß in solchen Momenten, dass sie Laufspiel erwartet – entsprechend einfach und nicht repräsentativ ist die Verteidigung.
Die Werte in dieser Tabelle sind nicht adjustiert auf die Stärke des Spielplans. In der Spalte neben dem jeweiligen Wert („Rk“) wird die Platzierung des Werts angezeigt. Ist ein Wert rot eingefärbt, bedeutet das, dass er mindestens eine Standard-Abweichung schlechter ist als der Liga-Durchschnitt. Ist er grün eingefärbt, bedeutet es mindestens eine Standard-Abweichung besser als Liga-Durchschnitt.
In diesem Jahr haben wir mit Atlanta eine unglaublich effiziente Pass-Offense, aber auch gleich fünf (!) Offenses, die weniger als 5.5 NY/A im Passspiel zustande bringen, was unterirdisch ist. Umgekehrt gibt es einige schwache, aber keine historisch schwache Pass-Verteidigung, dafür mit Denvers 4.9 NY/A eine fassungslos dominante Defense. Ähnlich beim Laufspiel: Buffalos 52% sind der beste Wert seit ich das Ranking führe. Baltimores 64% in der Defense sind ähnlich famos. Und eine Überraschung bei den Penaltys: Cincinnati mit Vontaze Burfict und Pacman Jones in der Startaufstellung als das Lämmlein der Liga.
Power Ranking
Das Herzstück dieses Artikels. Ich habe die Funktionalität des Modells glaube ich oft erklärt. Die Synthese habe ich vor kurzem in einem Kommentar geschrieben:
Dieses Power Ranking misst die Effizienz jeder Mannschaft in jedem Spielzug und gewichtet diese gegen die bisher gespielten Gegner sowie den Beitrag jeder Statistik zu Gewinnen und Verlieren.
Was es nicht misst, ist die Qualität von in-Game Entscheidungen und den Anteil des Zufalls an der bisherigen Bilanz.
Was es nur indirekt misst, sind Leidenschaft, Arbeitseinsatz, Momentum und Toughness.
Ich weiß, wie diese Statistiken zustande kommen und ich weiß, wie ich sie erstellt habe. Ich weiß, wie oft ich sie hinterfragt habe. Ich weiß, wo die Schwächen liegen. Ich stehe für sie gerade.
Wie viel man solchen Statistiken Glauben schenken mag, soll jeder für sich selbst entscheiden. Wenn man mich zwischen Bauchgefühl und Zahlen entscheiden lässt, weiß ich, wem ich vertraue.
Eine Basis-Einleitung habe ich vor über vier Jahren geschrieben. In vielen weiteren Artikeln über die Jahre habe ich weitere Anpassungen diskutiert.
Das Ranking himself ist das Herzstück. Die Spalten in dieser Aufstellung sind folgende:
- RANG = Aktuelle Platzierung
- LW = Letzte Woche, Platzierung der Mannschaft letzte Woche
- TEAM = Name der Mannschaft
- WP = Win Probability, Sieg-Wahrscheinlichkeit gegen einen durchschnittlichen Gegner auf neutralem Boden (nach diesem Wert wird gereiht)
- E16 = Erwartungswert über 16 Spiele; so viele Siege würde man von dieser Mannschaft über eine volle Saison gegen den durchschnittlichen Gegner auf neutralem Boden erwarten
- SOS = Strength of Schedule: Stärke des durchschnittlichen Gegners dieser Mannschaft bisher (Mittelwert der bisher bespielten Gegner)
- Rs = Ranking des Schedules; Platzierung im Ranking Strength of Schedule, #1 am schwersten, #32 am einfachsten
- OFF = Platzierung der Offense-Stats dieser Mannschaft, adjustiert an die Stärke des Spielplans
- DEF = Platzierung der Defense-Stats dieser Mannschaft, adjustiert an die Stärke des Spielplans
- W-L = Win/Loss, aktuelle Sieg-Niederlagen Bilanz der Mannschaft
Zu beachten ist dabei, dass ein scheinbar großer Sprung oder Abfall einer Mannschaft (z.B. letzte Woche Green Bay von #18 auf #5 oder diese Woche Minnesota von #8 auf #15) nicht automatisch bedeutet, dass die Mannschaft gigantische inhaltliche Sprünge gemacht hat; oft ist das Feld der Teams gerade im Liga-Mittelfeld eng genug beisammen, dass eine dominante Partie oder ein Abstinker 1-2 Prozentpunkte an Leistung ausmachen, die sofort für 5 Plätze auf oder ab sorgen.
Alle Werte in diesem Power Ranking sind angepasst an die Stärke des Gegners. Zum Beispiel sehen wir, dass New England oder Detroit heuer Glück mit ihren Spielplänen hatten oder dass Denver einen eher toughen Spielplan hinter sich hat. Wo die Broncos manchmal leblos aussehen, sollten wir beachten, dass dieses Team im Durchschnitt einen um 3.5% schwierigeren Gegner spielen muss als ein normales Team. Das entspricht etwa 1.2 Punkten „Nachteil“ pro Partie. Summiert sich auf etwa 18 Punkte Nachteil über eine Saison. Das ist nicht zu verachten.
Ich denke, dass die Anpassung an die Stärke des bisherigen Spielplans dem Modell die Genauigkeit gibt, die es bei aller Einfachheit hat. Was das Modell berücksichtigt: Die nackten Effizienz-Zahlen pro Downs wie eingangs erwähnt. Was es nicht berücksichtigt: Wie aggressiv geht ein Coach mit Entscheidungen in 4th Downs um? Ein Coach, der die Wahrscheinlichkeiten für sich zu nutzen weiß, kann die Effizienz-Zahlen in diesem Modell schlagen. Belichick in New England schlägt sie zum Beispiel Jahr für Jahr um durchschnittlich 1 bis 1.5 Siege. Was es ebenso nicht misst: Wie viele % der Fumbles hat ein Team aufgenommen? Die Fumble-Recovery ist der Münzwurf-Spielzug der NFL.
Ergebnis-Übersicht
In dieser Tabelle sind pro Mannschaft der Record (die Sieg-Niederlagen Bilanz), die Bilanz in engen Spielen (Spiele innerhalb eines einzigen Scores, also 7 Punkten), das Punkteverhältnis (gescorte Punkte, kassierte Punkte) sowie der Pythagorean aufgelistet.
Der Pythagorean kommt aus dem Baseball und ist kurz gesagt ein Schätzwert: Anhand des Punktverhältnisses schätzt der Pythagorean, wie viele Siege eine Mannschaft über 16 Spiele einfährt. Es hat sich gezeigt, dass der Pythagorean eine bessere Prognosegenauigkeit hat als die effektive Sieg/Niederlagen Bilanz einer Mannschaft.
Im Prinzip ist der Pythagorean vergleichbar mit dem WP-Wert aus meinem Power Ranking. Er errechnet sich bloß nicht aus der Effizienz pro Down, sondern aus dem Punktverhältnis einer Mannschaft. Etwas rudimentärer, aber ein recht schnell einordenbarer und leicht verständlicher Wert.
Zum Beispiel sehen wir, dass die Oakland Raiders bislang Glückskinder sind: Sie sind 10-3 nach Record. Sie sind 8-1 in engen Spielen, ein nicht haltbarer Wert. Ihr Punktverhältnis entspricht einem Team, das über eine ganze Saison normalerweise 9.2 Siege holt. Die Raiders halten aktuell bereits bei 10 – ein Team also, das weit über seinen Verhältnissen spielt. Ähnlicher Fall Houston, das mit Punktverhältnis von -44 bereits zumindest eine 8-8 Saison garantiert hat – dank einer 7-1 Bilanz in engen Spielen.
Hingegen sind die Eagles nach dieser Betrachtungsweise ein krasses 5-9 Team: Sie haben alle 6 ihrer 1-Score Games verloren. Dabei haben sie ein positives Punktverhältnis von +17. Ein Team wie die Eagles gewinnt nach Pythagorean normalerweise 8.5 Spiele pro Saison.
Schedule
In dieser Tabelle sind die Stärken der Spielpläne aller 32 Mannschaften gelistet, jeweils mit durchschnittlichem Wert und mit der Ranking-Position („Rk“).
- Die erste Spalte wirft die Stärke des Schedules eines Teams über die komplette Saison, also alle 16 Spiele, aus.
- Die zweite („bis Week 15“) die Stärke des bisher gespielten Dieser Wert entspricht 1:1 dem Wert, den wir bereits oben im Power Ranking ausgewiesen hatten.
- Die dritte („ab Week 15“) gibt den noch bevorstehenden Bei aktuell nur noch 2 verbleibenden Spielen natürlich nicht mehr so aussagekräftig, aber wir sehen z.B., dass Miami noch ein brutales Restprogramm hat, während Pittsburgh schlafwandeln kann und trotzdem dank Cleveland im Spielplan zumindest einen Sieg quasi sicher hat.
Offense Ranking
Das Offense-Ranking bewertet nur die Effizienz der Offenses, gewichtet nach den bisher bespielten Defenses. Wenn Oakland einen Wert von bislang .638 eingefahren hat, bedeutet das nichts anderes als dass man von einer Mannschaft mit den Offense-Werten von Oakland sowie einer komplett durchschnittlichen Defense (.500) eine Siegerwartung von 63.8% auf neutralem Boden hat.
Im Prinzip durchlaufe ich für dieses Ranking die exakt selbe Prozedur wie für das Power Ranking selbst – außer, dass ich die Werte für die Defense und Penaltys neutralisiere.
Die Spalte SOS gibt die Stärke des bisherigen Spielplans (also der Defenses) aus, z.B. .539 für Oaklands gegnerische Defenses – heißt: Oakland hat seine Offense-Werte gegen die bislang schwerste Serie an gegnerischen Defenses erzielt (weil Rs = 1). Und Denver wartet noch…
Defense Ranking
Siehe Beschreibung der Offenses, nur errechnet mit effektiven Werten für Defenses mit durchschnittlichen Offenses.
Äußerst beeindruckend ist dabei Denver: Die Broncos haben nicht bloß imposante „rohe“ Werte wie eingangs in den Effizienz-Stats ersichtlich – nope: Sie haben diese Werte auch noch gegen den schwersten Offensive-Schedule der Liga erreicht. Wäre die Offense der Broncos nur exakt durchschnittlich, Denver würde im Schnitt fast 12 Saisonsiege erzielen.
Der Graph
Der Graph versucht schematisch aufzulösen, wo welche Teams in Punkto Offense und Defense angesiedelt sind. Die horizontale Achse ist die Qualität der Offense, die vertikale jene der Defense. Die Dezimalzahlen entlang der Achsen entsprechen dem Power-Ranking Wert von Offense und Defense. Je weiter das Team vom Schnittpunkt der Achsen entfernt ist, umso besser.
Der rechte obere Quadrant ist der Quadrant „gute Offense + gute Defense“. Hier sind die „kompletten“ Mannschaften mit überdurchschnittlicher Offense und überdurchschnittlicher Defense angesiedelt. Rechts unten (gute Offense, schlechte Defense) und links oben (schlechte Offense, gute Defense) sind die eindimensionalen Mannschaften angesiedelt. Links unten (schlechte Offense, schlechte Defense) sind die Gurkentruppen der NFL angesiedelt.
Wie wir im aktuellen Graph sehen, gibt es in der laufenden Saison keine wirklich kompletten Mannschaften, dafür aber viele „One Trick Ponys“.
Divisions und Conferences
Diese Tabelle wirft die durchschnittlichen Power-Ranking Werte der acht Divisionen und der beiden Conferences aus. Wir sehen, dass z.B. eine AFC West in dieser Saison massiv über eine AFC South zu stellen ist. Interessanterweise ist für das Power Ranking die NFC West die Gurkendivision, was an den beiden unterirdischen Vertretern in Los Angeles und San Francisco liegt.
Bei den Conferences schenken sich beide Ligen nichts: AFC und NFC sind durch zwei Zehntel Prozent voneinander getrennt.
Wahrscheinlichkeiten
In dieser Tabelle wird für jede Spielansetzung des kommenden Spieltags die Wahrscheinlichkeit angezeigt, mit der das jeweilige Team das Spiel gewinnt. In der letzten Spalte wird der Wert in Punkten angezeigt, z.B. bedeuten 57% Siegwahrscheinlichkeit, dass das Team im Schnitt 2.3 Punkte besser ist.
Heim-Teams bekommen 2.5 Punkte gutgeschrieben. Das entspricht bei zwei gleich guten Mannschaften rund 7%. Je größer der Qualitätsunterschied zwischen zwei Mannschaften, desto kleiner ist natürlich der Heimvorteil in Prozent. Das kannst du dir so vorstellen: Ist ein Team schon auf neutralem Feld 99%iger Favorit (was in der NFL nie passiert), macht es keinen Sinn, dass das Team mit 99% + 7% favorisiert ist. Es sind dann halt 99kommairgendwas Prozent.
New England zum Beispiel ist zuhause gegen die Jets klarer Favorit. Sie sollten laut Ranking 9 von 10 Spielen in dieser Konstellation gewinnen. Das ist ein brutaler und in der NFL selten klarer Favoritenstatus. Er entspricht einem „Spread“ von 17.5 Punkten. „Spread“ ist dabei sowas wie das „Handicap“.
Letzte Woche waren 11 der 16 Tipps korrekt. Über diese Saison liegen die auf meine Weise errechneten Tipps bei einer Genauigkeit von 66-38 korrekten Tipps, was 63.5% entspricht. Im Prinzip gilt zu sagen, dass das Modell, so es einer eine 70% Chance gibt, auch nur in 7 von 10 Fällen richtig sein sollte. Andernfalls wäre es über- oder unterkonfident.
Gegen die Spreads der Las-Vegas Wettbüros ist das Power Ranking in dieser Saison 56-45, bei 2 „Pushes“ (unentschieden). Dabei gilt: Gibt Las Vegas einer Mannschaft einen 3 Punkte-Favoritenstatus, das Power Ranking aber 4 Punkte, zähle ich es als Gewinn, wenn die Mannschaft mit mehr als 3 Punkten gewinnt (weil 4 > 3) und als Niederlage, wenn sie mit weniger als 3 Punkten gewinnt oder sogar verliert.
Die Wahrscheinlichkeiten, die das Power Ranking für die anstehende Woche 16 als verfrühtes Weihnachtsgeschenk für die Leser spendiert, sind folgende:
Ein super Beitrag, vielen Dank!
Das Powerranking hebt diesen Blog von aller mir bekannten deutschsprachigen NFL-Berichterstattung ab, weil es dem Blog etwas Analytisches gibt, das über „OBJ ist der geilste“ hinausgeht. Weiter so und nochmal ein großes Lob an deine Arbeit.
Sehr sehr gut erklärt, vielen Dank dafür! (und schöne Weihnachten 🙂 )
Respekt, hervorragend erklärt und echt ne Menge Arbeit die du da regelmäßig investierst. Eine kleine Frage bzgl. Spread hätte ich aber noch:
Wie wertest du denn beim Spread wenn ein Spiel in OT geht? Bzw wie wird das in Vegas gewertet? Zählt das dann als Remis (weil Gleichstand zum Spielende) oder als Sieg mit 6 bzw 3 Punkten (oder halt Remis wie z.b. Seattle-Arizona diese Saison)?
@Kai: 26-20 nach OT werte ich als Sieg mit 6 Punkten.
Hey,
erstmal ein Riesendanke an die Erklärungen. Das meiste hab ich eigentlich schon gewusst bzw. war auch logisch, aber gerade die Dinge mit dem Spread waren sehr hilfreich.
Ich hab (sorry!) ein paar Fragen:
– Wenn das PR einen 3 Punkte-Favoritenstatus vergibt, Vegas aber 4, zählst du es dann als Gewinn wenn die Mannschaft verliert?
– Wäre das Ranking nicht genauer, wenn du die letzten 3-4 Wochen stärker gewichten würdest als die Wochen davor (oder halt eine abfallende Gewichtung, so dass die aktuellsten Spiele immer den höchsten Einfluss haben)
– Wie genau errechnet sich der Spread aus der Gewinnwahrscheinlichkeit? Hast du das selber einfach festgelegt oder gibt es da Vorgaben/Metriken?
Danke nochmal und bitte mach weiter :D. Ich persönlich finde das PR eigentlich nur ein nettes Goodie, Die Hintergrundstories, die Vorschauen und die Analysen sind eigentlich der Hauptgrund für meine Regelmäßigen Besuche 🙂
@Deeo:
Frage 1 – ja, ist ein Gewinn gegen den Spread, da das favorisierte Team das Handicap nicht erreicht. Um das Handicap zu erreichen, müsste es in deinem Beispiel mit mindesten 5 Punkten gewinnen. Knapperer Sieg oder Niederlage = den Spread nicht gezögert, wie in deinem Beispiel vom System vorhergesagt.
Frage 2 – Hatte ich versucht, hat aber keine nennenswerten Verbesserungen in der Vorhersagegenauigkeit gebracht. 1-2 richtige Ergebnisse pro Jahr mehr. In 2 Jahren sogar ungenauer. Ich mag es einfach gehalten, also habe i
Frage 3 – Die Formel ist logarithmisch. Hab sie aber nicht auswendig im Kopf. Ich werde sie nachreichen. Sie wurde in den Untiefen des Blogs in beiden Richtungen (Punkte zu Wahrscheinlichkeit, Wahrscheinlichkeit zu Punkte) schon mehrmals veröffentlicht.
Die Funktion kommt aus der Historie der NFL-Resultate. Einfachstes Beispiel: Heimteams gewinnen roughly 57% der Spiele und erzielen dabei im Schnitt ca. 2.5 Punkte mehr als das Auswärtsteam. Also entspricht 57% in etwa 2.5 Punkten.
Ich kenne die Las-Vegas Formel nicht exakt. Meine Formel ist auf jeden Fall nicht 1:1 die Formel von Las Vegas. Ich habe sie aus den Ergebnissen der NFL-Historie abgeleitet für einen bestimmten Zeitraum (letzte 10 Jahre) und auf eine Ganzzahl als Multiplikator gerundet. Auch hier: KIS. Keep it simple. Wir müssen keine Wissenschaft aufmachen, wo es keine Wissenschaft braucht.
@korsakoff: Danke für die Erläuterungen, ich habs verstanden 😉
Frage: Mich würde interessieren, wie groß dein Aufwand jede Woche bei der Erstellung des Rankings ist? Nur so aus Interesse…
@BBQ Sauce: Aufwand ist eher gering, manueller Import, drüberschauen, kurzen Text schreiben, Bilder exportieren und hochladen macht ca. 30-45 min aus.
Haupt-Aufwand besteht meistens darin, die Spielpläne zu erstellen und die jährlichen Updates in den Berechnungen.
Kannst du das nicht automatisiert aus diesen PDF-Berichten auslesen, die auf NFL.com zur Verfügung gestellt werden? oder brauchst du da genauere Infos zu den Spielzügen?
@Denis: „Können“ ist weniger das Problem als „hinsetzen und es machen“. Aber du hast schon recht, die Playbooks der NFL sind die beste Quelle, sie sind auch locker ausreichend detailliert für das Power Ranking.
Pingback: NFL Power Ranking 2016 – Week 16 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2016 – Week 17 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 7 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 8 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 9 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 10: Wo bleiben die Freak-Teams? | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 11 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 12 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 13 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 14: Wie tief werden die Iggles fallen? | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 15 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 16 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Woche 17 | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017/18 – Wildcard Weekend | Sideline Reporter - Eier, wir brauchen Eier!
Pingback: NFL Power Ranking 2017 – Divisional Playoffs | Sideline Reporter - Eier, wir brauchen Eier!