Analytics-Twitter und die Datenrevolution in der NFL

Letzte Woche hat Ben Baldwin bei The Athletic einen viel beachteten Artikel über einige zentrale Figuren von Analytics-Twitter geschrieben:

Baldwin schildert darin die Wege von Usern wie @Moo12152, @CowboysStats, @SeanFromSeabeck, @BendixenNFL oder @903124S, die mit ihrem Analytics-Feuerwerk seit rund einem Jahr die Footballwelt in Aufruhr versetzen, und er unterstreicht auch den herausragenden Wert, den die CMU-Studenten um @Stat_Ron beigetragen haben, indem sie das NFL Play-by-Play in normalisierter Form, Import-bereit als CSV-Dateien auf Github für das Statistik-Programm R zur Verfügung stellen.

Zusammen mit den ebenso auf Twitter sehr aktiven @PFF_Eric und @PFF_George von Pro Football Focus sind sie alle wesentlich verantwortlich dafür, dass wir heute in rasender Geschwindigkeit neue Erkenntnisse aufnehmen und diskutieren können. „Pound the Football“ no more. Dan Dierdorf würde sich im Grab umdrehen.

Es ist keine Übertreibung zu behaupten, dass diese genannten Figuren den modernen NFL-Football besser verstehen als viele hochrangige NFL-Verantwortliche (u.a. einige General Manager). Dass sie das innerhalb weniger Monate geschafft haben, zeugt von der Macht der Daten.

Hie und da gewinnt der Beobachter natürlich den Eindruck, dass sich Analytics-Twitter in einer Blase bewegt, weit abgekoppelt von der „realen“ NFL-Welt, die über die Ergebnisse lacht. Doch es gibt längst Nachweise, dass auch NFL-Organisationen mit den publizierten Erkenntnissen arbeiten – und es ist hinlänglich bekannt, dass in Ligen wie der NBA oder MLB die Laptop-Generation längst die wichtigen Positionen in Front-Offices übernommen hat. Die NFL ist mittlerweile die Ausnahme, nicht die Regel.

Natürlich ist nun davon auszugehen, dass einige der von Baldwin vorgestellten Figuren von der NFL geschluckt werden – was gute und schlechte Seiten hat. Die Gute: Kreative Köpfe bringen den Sport voran – sofern sie sich intern Gehör verschaffen. Das Schlechte: Uns gehen sie dann verloren, weil sie ihre Arbeit dann nur noch hinter verschlossenen Türen verrichten.

Als Fetischist von effizientem Football würde ich dieses „Risiko“ in Kauf nehmen. Denn a) der wichtige Startschuss auf Twitter ist gesetzt, b) es werden neue Köpfe nachrücken und weitere Möglichkeiten der Datenanalyse ausloten und c) der nächste ganz große Erkenntnisschub kommt sowieso erst in dem Moment, in dem die NFL die Tracking-Daten von Next-Gen NFL-Stats freigibt.

Ob Punkt c) passieren wird, ist zum momentanen Zeitpunkt völlig offen. Es gibt unterschiedliche Strömungen, die eine Freigabe befürworten (Eagles-Owner Jeff Lurie) oder blockieren wollen (viele andere). Baseball-Analytics zum Beispiel ist in der Öffentlichkeit momentan in relativem Stillstand, weil die MLB viele proprietäre Stats hinter verschlossenen Türen wegsperrt.

Wissensstand

Wichtig scheint mir in diesem Kontext auch der Hinweis darauf, dass nur ein Teil der publizierten Studienergebnisse auf Analytics-Twitter wirklich neue Erkenntnisse bringt. Viele Ergebnisse sind nur Bestätigungen oder Weiterentwicklungen der Resultate, die z.B. ein Brian Burke zwischen 2007 und 2015 auf seiner fantastischen (noch immer zugänglichen) Advanced-Analytics-Website publiziert hatte, ehe er von ESPN als Chef-Statistiker abgeworben wurde. Ähnliche Seiten wie Football-Outsiders, PFF oder (das methodisch auf eher rudimentärem Niveau operierende) Sharp Football hatten viele der Resultate ebenso bereits kommuniziert.

Die Grundaussagen sind prinzipiell immer dieselben:

Alles durch Analytics-Twitter bestätigt. Neue Erkenntnisse der letzten 12 Monaten betreffen vor allem Bereiche, die das offizielle NFL Play-by-Play allein nicht hergibt und wofür man erweiterte Datenerfassung von Portalen wie PFF, ESPN oder SIS braucht:

Der große Vorteil von Analytics-Twitter ist die Geschwindigkeit der Publikation und der sofortige Informationsaustausch, der mehrere Herangehensweisen an die Lösung eines Problems in kürzester Zeit erlaubt.

Analytics-Twitter hat noch etwas geschafft: Es hat den Standpunkt von Analytics-Twitter innerhalb eines Jahres so weit gebracht, dass das reine NFL Play-by-Play nicht mehr ausreicht. An einigen Stellen sind bereits die Grenzen der PFF- oder SIS-Datenerfassung ausgelotet – um Themen wie Coverage vs. Pass-Rush weiter zu vertiefen, sind Tracking-Daten von entscheidender Bedeutung.

Ein Punkt, der mir persönlich wichtig scheint: Bei allen R/Stats-(Grund-)Kenntnissen, die man für viele der besprochenen Analysen braucht, wäre einer der größten Quick-Wins, der die NFL per sofort massiv voranbringen würde, für jeden Teenie mit Excel-Kenntnissen offensichtlich: Das 1st und 2nd Down Playcalling. Die Resultate schreien geradezu ins Gesicht „Mehr Passspiel!“, doch die NFL verwehrt sich noch zu sehr diesem simplen Trick, massive Effizienzsteigerungen der Offense zu generieren.

Ich muss keine Millionen in die Hand nehmen um meine Facilities zu upgraden oder hochklassige Analysten ins Haus holen um das zu lernen. Ich muss nur meine übertriebene Angst vor dem Vorwärtspass ablegen und das Heft des Handelns selbst in die Hand nehmen anstatt zu warten, bis mich die Spielsituation zum Werfen zwingt. Denn im 1st oder 2nd Down weiß die Defense noch nicht genau, was kommen wird.

Wie geht es weiter?

Mit Sean Clement hat schon einer der vorgestellten Köpfe einen Analytics-Job (bei Chip Kellys UCLA) gefunden. Weitere werden mutmaßlich folgen – und hoffentlich eher früher als später in ihren Organisationen auch Gehör finden.

Die Analytics-Welle auf dem Twitter-Netzwerk wird trotzdem kein Ende erleben. Neue Köpfe werden auftauchen und die Arbeit fortführen.

Das vorhandene Datenmaterial von #nflscrapR birgt noch zahlreiche Schätze, ehe es mit Freigabe von Tracking-Daten die nächste Stufe gezündet werden kann. Themen wie Salary-Cap Verteilung, Draft-Scouting oder Route-Tree Effizienzen werden schon bald wichtige Themen auf der Agenda sein.

Prinzipiell würde ich dem geneigten Leser / Fan zwei Empfehlungen geben:

  • Löse dich von alteingesessenen Vorstellungen. Viele werden schon in ein paar Jahren überholt sein. Lasse dich von den Ergebnissen der Analysen leiten ohne vorschnell die eine oder andere Position einzunehmen.
  • Ignoriere die Stimmen, die Analytics aus Grundsatz bashen. Es sind die Stimmen, die spüren, dass sie in Kürze obsolet sein werden. Sie sind die getroffenen Hunde, die bellen und bald vom Markt gespült sein werden. Es lohnt sich nicht mehr, mit ihnen zu diskutieren.

Einige Teams nutzen Analytics bereits in kluger Weise – es sind u.a. die Teams, die vier der letzten fünf Superbowls gewonnen haben. Doch weitere werden folgen – und sie werden auch auf Außenseiter zurückgreifen, die Twitter als Sprungbrett nutzen. Wir stehen kurz vor einer Datenrevolution in der NFL. Im Alltag gilt bereits heute: Wer die Daten hat, hat die Macht. In der NFL klingt es etwas anders: Nur wer die Daten noch richtig interpretiert, hat bald noch Chancen um den Titel mitzuspielen.

Werbung

3 Kommentare zu “Analytics-Twitter und die Datenrevolution in der NFL

  1. Schöner Beitrag, danke für die Verlinkung auf Git, zum selber ausprobieren sehr interessant.

    PS: Ich glaube Dan Dierdorf lebt noch 🙂

  2. Pingback: Es ist Herbst, Baby! | Sideline Reporter - Eier, wir brauchen Eier!

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit deinem WordPress.com-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

Diese Seite verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden..