„Többé nem az olaj a világ legértékesebb nyersanyaga – hanem az adat” – írta 2017-ben a tekintélyes Economist nagy visszhangot kiváltó cikkének címében. Az „adat az új olaj” kifejezés azóta hivatkozási pont lett: megfellebbezhetetlen igazság. S mint ilyen, nem kerülhette el sem a sportot, sem pedig a futballt.
A futball, mint az egyik legkiszámíthatatlanabb, a véletlen hatásainak leginkább kitett sportág szélsőséges módon vonzotta nemcsak a szurkolók, hanem azok figyelmét is, akik a mind nagyobb mennyiségben rendelkezésre álló információk és adatok rendszerezésével szerették volna nagyobb hatékonysággal előrejelezhetővé tenni a meccsek végeredményét. Ezek a statisztikusok, matematikusok és adatguruk voltak azok, akik elsőként rájöttek: a hagyományos futballstatisztikák teljesen alkalmatlanok arra, hogy megjósolhatóvá tegyék a meccsek kimenetelét.
„A leíró statisztikák helyett olyan mutatót kerestem, amely alkalmas arra, hogy prognosztizálja, várhatóan mekkora eséllyel nyerhet egyik, vagy másik csapat” – magyarázta Matt Benham, a SmartOdds nevet viselő sportfogadási cég alapítója, aki ma már két futballklub (Brentford, FC Midtjylland) tulajdonosa is. Benham és társainak munkája révén néhány éven belül előbb sportfogadói, majd szakmai körökben, végül pedig a sajtóban is mind népszerűbbé vált például az úgynevezett xG-modell, amely alapján végre nemcsak a lövések számát, hanem azok minőségét is össze tudták hasonlítani az elemzők. A fejlődési folyamat sebessége aztán az elmúlt években exponenciálisan gyorsult:
A lövések minősége mellett mérhetővé – és így azonos alapon összehasonlíthatóvá – vált például a letámadás intenzitása (PPDA), az ellenfél letámadására történő reagálás minősége (OPPDA), a progresszív passzok, a kulcspasszok, a megindulások és a legkülönfélébb (támadó-, védő-, légi-) párharcok száma, illetve sikerességének aránya is. Kis túlzással: nem következhet be olyan esemény és/vagy akció a pályán, amely elkerüli a statisztikusok figyelmét, és nem épül be legalább egy olyan mutatóba, amely alkalmas a játékos és a csapat teljesítményének egzakt mérésére.
A futball valójában klasszikus területfoglalási játék
A játék lényegének szempontjából ugyanakkor a mára mainstreammé váló statisztikák (események és akciók megszámlálása, azaz: event data) zöme ugyanakkor csupán a felszínt kapargatja. Hiszen már Johan Cruyff megmondta: „Ahhoz, hogy el tudjam dönteni, ki az igazán jó játékos, azt kell megvizsgálnom, mit csinál abban a 87 percben, amikor nincs nála labda”.
De vajon hogyan mérhető a futballban az, ami nem a labda körül történik? A probléma nem újkeletű: a védők teljesítménye kapcsán hosszú évek óta vita tárgya, hogy vajon pusztán a szerelések, tisztázások, labdaszerzések és közbeavatkozások számszerűsítésével leírható-e egy olyan játékos teljesítménye, akinek különféle események bekövetkezésének elhárítása a feladata. A dilemma Maldini-paradoxon néven vált ismertté, és feloldása az: egy jó védő játékolvasási képességével, anticipációs készségeinek köszönhetően képes úgy helyezkedni, hogy az esetek többségében ne kelljen szereléssel elhárítania a veszélyt saját kapuja előtt. Ugyanígy:
– hanem az, aki jól választja meg, mikor kell párharcot vállalnia. Ilyen módon könnyen belátható, hogy a védők teljesítménye nem mérhető pusztán klasszikus, leíró, esemény alapú statisztikai mutatókkal. Mindig kell a szem is, ami kontextusba helyezi a látottakat.
Igen ám, csakhogy a szem drága. Megnézni, sőt részletesen kielemezni egy-egy meccset rendkívül időigényes. Aprólékos munkát igényel, nagy figyelme, és végül óhatatlanul szubjektív lesz: nincs az az elemző, aki képes lenne fölülkerekedni kognitív elfogultságain, miközben meccset néz. Ezt kiszűrni szinte lehetetlen feladat, rendkívül komplex kihívás, egyben a modern futballelemzés jelenlegi legfontosabb iparági kérdése.
A futball ugyanis csupán a felszínen szól a gólokról, a cselekről, a lövésekről. Valójában klasszikus területfoglalási játék: a támadók mindig üres területeket akarnak kinyitni és bejátszani, míg az a csapat, amely éppen nem birtokolja a labdát, szűkítené a rendelkezésre álló játékteret. Ez az alapvető dilemma, ennek feloldása a kulcs a győzelemhez. Ehhez képest komoly ellentmondás, hogy még az úgynevezett advanced (mélyebb) statisztikák is alapvetően pontszerűek: figyelembe veszik ugyan az esemény konkrét bekövetkezési helyét (koordinátáit), de nem tudnak mit kezdeni azok bővebb kontextusával, időzítésével. Nem úgy, mint az úgynevezett Voronoj-cellák.
Mi a fene az a Voronoj-cella?
A Voronoj-cella egy geometriai fogalom, nevét Georgij Voronoj ukrán matematikusról kapta. A ponthalmaz egy elemének Voronoj-cellája azokat a síkbeli – illetve térbeli – pontokat tartalmazza, amelyekhez a ponthalmazból az adott elem van a legközelebb. A futballban ez azért fontos, mert megfoghatóvá, vizualizálhatóvá teszi azt a fogalmat, amit fentebb a védők kapcsán játékolvasási képességként – közelebbről: helyezkedésként – definiáltam. Hiszen mit is jelent „jól helyezkedni”? Azt, hogy egy védő képes hamarabb odaérni a pálya egy bizonyos területére, mint a támadók (azaz: elfoglalni azt). Ennek legbiztosabb módja pedig az, ha már eleve, az akció (passz) bekövetkezésének pillanatában közelebb áll a potenciálisan veszélyessé váló területhez. Tiszta sor, nem igaz?
Naná! A felismerés ennek megfelelően egyáltalán nem új: David Sumpter, a Soccermatics című könyv szerzője szerzője egy 2017-es TEDx-videóban részletesen beszélt a koncepcióról, majd cikket is szentelt a témának. Sőt egy koreai fizikus már 2004-ben(!) tudományos értekezésben fejtette ki, miként elemezhető a futball, mint játék a Voronoj-cellákra alapozva – a szükséges adatokat a FIFA 2003 nevű számítógépes játékból szerezte a tanulmányához. Hogy mára a Voronoj-féle cellák a gyakorlati futballelemzés gyújtópontjának számítanak, javarészt az adatforradalomnak köszönhető: az úgynevezett tracking data segítségével valós időben követhető és vizualizálható egy-egy játékos pozíciója és mozgása a pályán, következésképp a Voronoj-cellák dinamikus képe is könnyedén felrajzolható.
Nézzünk egy gyakorlati példát az alkalmazásra! Íme, a német válogatott ötödik gólja a 2014-es világbajnokság elődöntőjében a brazilok felett aratott 7-1-es győzelem alkalmával.
(Sötét színnel látjuk a német játékosok, sárgával a brazilok által uralt területeket. Ily módon nagyon könnyű megállapítani, kinek a mozgása bontotta meg az akció elején még stabil és rendezett brazil védelmet, mikor nyílt ki terület a németek előtt, és hogyan vették át az uralmat a pálya legértékesebb része felett.)
Ez pedig egy másik híres-nevezetes találat a legutóbbi vb-ről; Pavard az argentinok lleni nyolcaddöntőben.
Külön kiemelve Matuidi „kulcspassza” (látványos, ahogyan megnyit, és bejátszik vele olyan területeket, amelyeket argentin játékosnak kellene uralnia).
A kérdés jogos. Az elemzők ugyan imádják a vizualizációt, de van, amit még jobban szeretnek, mert még könnyebb dolgozni velük: ezek a számok. A feladat tehát adott, a Voronoj-cellákból kinyert információt valamilyen módon egyetlen számadattá kellene konvertálni. De hogyan?
Az alapelv egyszerű, és ugyanazt a logikát követi, mint az xG, az xA és minden egyéb, várható értékre alapozott mutató esetén: azt kell megbecsülnünk, mekkora valószínűséggel lesz sikeres egy-egy akció/esemény, amennyiben bekövetkezik. Ahogyan egy lövés kapcsán meg lehet becsülni a történeti minta segítségével, hogy a leadás helye, az ellenfelek helyezkedése és egyéb körülmények függvényében mekkora eséllyel eredményez gólt, úgy arra vonatkozóan is lehet becslést leadni: a pálya egyes területeiről induló akció milyen valószínűséggel végződik gólhelyzettel öt akción belül? Ez az úgynevezett várható veszély (expected threat = xT) mutató.
A Voronoj-cellák segítségével a pálya minden egyes négyzetcentiméteréről tudhatjuk, hogy melyik játékpillanatban, melyik csapat dominálja. Ha ezt kombináljuk az egyes pálya-koordinátákhoz tartozó várható veszély (xT) mutatóval, megkapjuk, hogy a meccs adott időpillanatában mekkora potenciális esélye van a gólszerzésre a két csapatnak a játékosai és a labda helyzete alapján. Ezt nevezik az elemzők „potential threat” mutatónak. (A gyakorlatban összeadjuk a két csapat játékosai által uralt pályakoordináták xT-értékeit.)
Nézzünk egy gyakorlati példát erre is!
1. Az első képen látszik, hogy a védekező csapat (sötét) uralja a kapuja előtti terület nagy részét. A labdát vezető játékosnak nincs tiszta és egyértelmű passzopciója.
2. A második kép már változást mutat: a védekező csapat balhátvédje kilép a labdás játékosra, a kinyitott területbe pedig bemozog a támadók 10-es számú játékosa. Őt követi az egyik középső védő. Ezzel nagy terület nyílik ki a 6-os számú támadó előtt, miközben a 25-ös játékos védője úgynevezett vakoldalára mozog.
3. A labdás támadónak a fenti mozgások következtében lesz passzopciója. A 6-os számú támadó megkapja a labdát, emiatt a másik középső hátvédnek el kell mozdulni az ő irányába, így viszont a 25-ös játékos előtt tiszta gólszerzési esély kínálkozik, amit ő ki is használ.
Ugyanez mozgóképen itt:
és itt:
Valamint hozzá párosítva a potential threat-diagramot (jelölve a három kulcsmozzanatot):
Labda nélkül mozogni – de milyen gyorsan?
A fenti példákból tökéletesen látszik: a labda nélküli mozgás a játék egyik legfontosabb mozzanata, miközben a jelentőségét pontosan mérni szinte lehetetlen. A fenti két esetben tudtuk a mozgást részint vizualizálni, részont számokkal is megmutatni, mekkora jelentősége van egy-két labda nélküli mozgással nyitott folyosó megjátszásának. De még mindig akad olyan aspektus, amit nem vettünk figyelembe – ez a sebesség.
Jöjjön egy viszonylag híres gól példának: Cristiano Ronaldo a Camp Nou-ban.
Ha a Voronoj-cellákat pillanatképként nézzük, látszólag úgy tűnhet, CR a semmiből ért el gólt. Sem az assziszt:
sem a lövés pillanatában:
nem volt kiugróan magas a potential threat értéke. Tanulság: CR gyorsabb volt, mint a védők, így hiába uralták azok a potenciálisan veszélyes területet a Voronoj-cellák logikája alapján,
az adott szituációban.
Vagy mégsem?
Hogy a pontos igazságot megismerjük, a Voronoj-cellák mellé a játékosok dinamizmusát is mérnünk kell. Vajon CR tényleg gyorsabb volt a védőknél? Nos, az adatok alapján nem: a játékosok maximális sebessége nagyjából ugyanabban a tartományban mozgott az akció során (Ronaldo: piros – védők: fekete – kék: az assziszt pillanata):
Tanulság: Ronaldo nem annak köszönhetően foglalta el a Voronoj-cellák szerint nem általa uralt területet, hogy gyorsabb volt a védőknél, hanem mert hamarabb kezdett el sprintelni. Az anticipáció volt a kulcs, nem a sebesség. Vagy ahogyan Cruyff már évtizedekkel ezelőtt megmondta: „Ha hamarabb kezdek el futni, mint te, gyorsabbnak fogok tűnni.”
A mi szempontunkból itt az az igazán fontos, hogy az aktuálisan elfoglalt pozíció önmagában nem feltétlenül ad számunkra elegendő információt ahhoz, hogy pontos Voronoj-cellákat rajzoljunk fel. Nézzük meg, mennyit változhatnak a cellák már csak attól, ha beépítjük a modellbe a feltételezést, hogy minden egyes játékos ugyanabba az irányba és ugyanazzal a sebességgel mozog tovább, mint addig tette:
A dolog csak innentől kezd el igazán bonyolódni. Nem elég számításba venni a játékosok sebességét, mozgásuk irányát, maximális gyorsulását, de azt sem lehet kifelejteni a modellből, hogy ezek egyénenként különbözőek lehetnek. Ráadásul nem is konstans értékek, hiszen lehet dinamikát és irányt is váltani – ezek időzítése, alkalmazása adja egy-egy játékos igazi értékét a pályán.
Nem csoda, hogy a jelenség konceptualizálásához egy Harvardon végzett fizikus kellett: a most a Liverpoolnál dolgozó William Spearman korábban a Higgs-bozonnal foglalkozott, erről a területről váltott 2018-ban futballra, és lett a Vörösök vezető adatelemzője. Ha valaki szeretné részleteiben megérteni, milyen alapokra építette úgynevezett „pitch control” modelljét, akkor érdemes megnéznie ezt a 32 perces videót, amelyben Spearman elárulja, a fizika és a futball nem is különbözik egymástól olyan sokban.
A Liverpool – részben a Spearman-féle modell nagyon hatékony gyakorlati-taktikai felhasználásának köszönhetően – 2018 és 2020 között uralta az angol (meg a nemzetközi futballt), nem mellesleg az átigazolási piacon is rendre képes volt nagyot villantani. Nem véletlen, hogy legnagyobb riválisa, a Manchester City is a tettek mezejére lépet, sőt ha lehet mondani, még növelte is a tétet:
a munkába a legtehetségesebb fiatal adatguruk innovációit becsatornázva.