Wissen

Die Entstehung von Toren in der Fußball-Bundesliga

Eine datengetriebene Analyse

    • Tore können durch Tracking- und Eventdaten automatisch verarbeitet und analysiert werden.
    • Ähnliche Tore werden automatisch zu Gruppen zusammengefasst.
    • Die Gruppen lassen sich interpretieren, visualisieren und eindeutig benennen. 
    • Anwendungen für die Gruppierung finden sich z. B. im Scouting oder der Gegneranalyse.
Abstract

Die Studie visualisiert erstmals, auf welche Art Tore in der Bundesliga erzielt werden. Dazu werden mehr als 2 000 Tore aus zwei Saisons der 1. und 2. Bundesliga automatisch analysiert. Jedes Tor wird zunächst durch charakteristische Merkmale beschrieben, welche aus Tracking- und Eventdaten extrahiert werden. Ähnliche Tore haben daher auch ähnliche Merkmale. Ein Algorithmus nutzt diese Ähnlichkeiten aus, um Tore in sinnvolle Gruppen einzuteilen, sodass jede Gruppe eindeutig interpretiert, visualisiert und benannt werden kann. So gibt es z. B. die Gruppen „Tore nach langen Ballbesitzphasen, in denen der Assist vom Gegner kam”, „Tore nach Einwürfen", oder „Tore nach Doppelpässen”. Die Gruppen können nach Teams, Spieler*innen oder auch Trainer*innen gefiltert werden, um z. B. im Scouting Profile miteinander zu vergleichen oder in der Spielvorbereitung die Stärken und Schwächen des nächsten Gegners zu beleuchten.

Vorgehen

Im Fußball ist es nicht nur wichtig zu wissen, wie der nächste Gegner seine Tore erzielen möchte, sondern auch, wie andere Teams gegen eben diesen Gegner Torerfolge verbuchen konnten. In der Regel geschieht dies in der Spielvorbereitung, in der Videomaterial des Gegners von Experten gesichtet und ausgewertet wird. Da dieser Prozess sehr zeitaufwendig ist, beschränkt sich die Videoanalyse häufig auf die letzten Spiele des Gegners.

Die beiden ausgehenden Fragen nach den Toren und Gegentoren einer Mannschaft können jedoch auch automatisch für eine beliebige Anzahl von Spielen oder etwa eine ganze Saison berechnet werden. Dazu müssen die Tore zunächst „digitalisiert” werden, damit sie für den Computer verarbeitbar sind. In der 1. und 2. Bundesliga werden seit mehreren Jahren alle Spiele in Form von Tracking- und Eventdaten aufgezeichnet. Erstere enthalten die Positionen der Spieler*innen und des Balls mit einer Auflösung von 25 Koordinaten pro Sekunde, letztere enthalten manuell annotierte Informationen zu allen wichtigen Ereignissen des Spiels (Tore, Pässe, Spielunterbrechungen usw.). Beide Datenquellen sind mit Zeitstempeln versehen und können „übereinandergelegt” werden, um auf diese Weise die Trackingdaten mit Ereignissen „anzureichern”.

Diese angereicherten Daten verwenden die Autoren der Studie, um die Entstehung von Toren in der Bundesliga zu untersuchen. Die angereicherten Daten werden automatisch nach Toren durchsucht. Sobald ein Tor gefunden wurde, werden weitere Informationen extrahiert, wie z. B. ob das Tor mit rechts, links oder dem Kopf erzielt wurde, den Expected Goals Wert (xG) des Tores, die Laufgeschwindigkeit beim Abschluss, der Winkel zum Tor usw. Diese Informationen bilden die Merkmale eines Tores. 

Anhand dieser Merkmale untersucht nun ein Algorithmus eine Vielzahl von Toren auf ihre Ähnlichkeit. Ziel ist es, ähnliche Tore zu Gruppen zusammenzufassen. Da ähnliche Tore auch ähnliche Merkmale haben, findet der Algorithmus die beste Gruppierung in sehr kurzer Zeit. Die gefundene Lösung hat eine baumartige Struktur und ist in ABB. 01 zu sehen.

Die Tore wurden vom Algorithmus in 50 Gruppen eingeteilt, die von den Autoren benannt (z. B. S1, S2 usw.) und mit Farben codiert wurden. Die farblich identischen Kästchen darunter enthalten die Anzahl von Toren in der Farbkategorie. Der türkisfarbene Cluster in der Mitte enthält z. B. 260 Tore. Alle 260 Tore sind nach Eckbällen erzielt worden, der Algorithmus differenziert aber weitaus feiner und unterteilt die Gruppe weiter in kleinere Gruppen, die mit C1-C5 benannt sind. Die Tore in C1 zeichnen sich durch eine Ballberührung des verteidigenden Teams vor dem Torschuss aus, C2 enthält Tore, bei denen der Ball am kurzen Pfosten weitergeleitet wird und die sich durch hohe xG-Werte auszeichnen (> 60 % Wahrscheinlichkeit für Torerfolg in C2). Die Gruppe C2 wird dabei komplettiert durch die Gruppe HA1, die Zielspieler*innen warten ebenfalls am kurzen Pfosten, leiten hier aber den Ball per Kopf weiter. Weitere Gruppen unterscheiden diverse andere Torvarianten, etwa aufgrund der Art des Assists, abgefälschten Schüssen (SA), erfolgreich gestörten Aufbauphasen des gegnerischen Teams (BE) oder taktischen Mustern, wie zum Beispiel Doppelpässe (OT) usw.

Anwendungen

Die Autoren zeigen den Mehrwert ihres Ansatzes, indem sie die allermeisten Tore aus dem Baum ausblenden. Je nach Anwendung, bleiben nur die erzielten/kassierten Tore einzelner Spieler*innen oder eines Teams über einen bestimmten Zeitraum sichtbar, während alle anderen Tore herausgefiltert werden. Die Anzahl der Tore, die in einen Ast des Baumes fallen, wird dabei durch die Stärke der Verbindung visualisiert. Die Autoren nennen die entstehenden Bilder „Fußabdrücke” und heben mehrere Anwendungsmöglichkeiten hervor, von denen hier zwei näher genannt werden sollen.

1. (Teil-)Automatisierung der Spielanalyse: In der Spielvor- und -nachbereitung werden viele Ressourcen gebunden, um Videomaterial zu sichten und auszuwerten. Eine entscheidende Frage in der Analyse ist, wie der nächste Gegner Tore erzielen konnte und wie andere Teams gegen diesen Gegner selber zum Torerfolg kommen konnten. Typischerweise ist der Spielplan eng getaktet und es bleibt nur wenig Zeit für die Analyse. Der Einfachheit halber werden daher die zuletzt erzielten Tore des Gegners häufig in vorgegebene Kategorien einsortiert. Diese Kategorien sind von Klub zu Klub verschieden, jedoch gibt es meistens nur wenige Unterscheidungen und viele Facetten eines Tores bleiben unerkannt. Die Autoren nennen Tore nach Einwürfen, effektivem Pressing oder speziellen Eckballvarianten als Beispiele, die leicht, durch die Sichtung von nur ein paar Toren, übersehen werden könnten. Sie folgern, dass viele Daten für eine umfassende Sicht auf den nächsten Gegner verarbeitet werden müssen und dass die Spielanalyse dazu teilautomatisiert werden muss. Die in der Studie vorgeschlagenen Gruppen könnten dazu eine gute Grundlage bilden.

/

2. Scouting von Spieler*innen und Trainer*innen: Das Scouting von Spieler*innen, die einem bestimmten Profil entsprechen, wird im professionellen Fußball immer wichtiger. Mithilfe der Fußabdrücke können Anforderungsprofile miteinander verglichen werden, um eine quantitative Entscheidungshilfe im häufig qualitativ geprägten Scouting heranzuziehen. ABB. 02 zeigt die Fußabdrücke von Robert Lewandowski und Timo Werner aus den Saisons 2017/18 und 2018/19. Damals drohte ein Abgang von Roberto Lewandowski und Timo Werner wurde als ein möglicher Kandidat gehandelt. Die Abbildung zeigt jedoch deutlich, dass beide Stürmer unterschiedlich sind. Auf dieselbe Art können auch die Spielweisen von Teams vor und nach einem Trainer*innenwechsel analysiert oder mit dem aktuellen Team einer potenziellen Trainerkandidat*in verglichen werden.

Literatur

  1. Anzer, G., Bauer, P., & Brefeld, U. (2021). The origins of goals in the German Bundesliga. Journal of Sports Sciences, 39(22), 2525-2544.
    Studie lesen