Az adatgyűjtéssel foglalkozó Opta az 1966-os torna óta vezet adatokat a labdarúgó-világbajnokságokról. 1966-ban a kapura lövéseknek még csupán a 41,3 százaléka esett a tizenhatoson belülről, azóta viszont ez az arány lineárisan emelkedik, és a 2022-es világbajnokságon már minden korábbinál magasabb, 63,3 százalék.
Nem éri meg a tizenhatoson kívülről lőni
A 2022-es világbajnokságon eddig 1405 alkalommal lőttek kapura a játékosok, ebből 890 esetben a tizenhatoson belülről. Ebben viszont benne vannak a büntetők, a direkt szabadrúgások és az öngólok is, ezért, hogy reálisabb képet kapjunk, mi most csak a nyílt játékhelyzetből történt lövéseket vizsgáltuk. Az így maradt 1336 lövésből 870 esett a tizenhatoson belülről (65,1 százalék), vagyis háromból kétszer erről a területről próbálkoztak a játékosok a világbajnokságon.
A jelenség az xG, vagyis a várható gól fogalmával van erős összefüggésben. Az xG-mutató minden kapura lövést minősít (nem csupán a gólokat), és így a kialakított helyzetek minőségét reprezentálva reálisabb képet ad egy-egy csapat mérkőzésen nyújtott teljesítményéről. Minél több, és minél jobb minőségű helyzetet dolgoz ki egy csapat, annál nagyobb lesz az xG-mutató értéke. Egy-egy kapura lövés minőségét az xG-modell a múltbeli adatokból tanulva határozza meg: több év összes lövésének jellemzőit vizsgálva, azokból tanulva, az xG-modell minden lövéshez hozzárendel egy valószínűséget, és megmondja, hogy egy hasonló jellemzőkkel leadott lövés az adott bajnokságban egy átlagos képességű játékost tekintve mekkora valószínűséggel eredményez gólt. Minél jobb helyzetet dolgoz ki egy csapat, ez a valószínűség annál nagyobb lesz. De, hogy pontosan értsük, miről is van szó: a 870 tizenhatoson belüli lövésnek az átlagos xG-értéke (xG/lövés) 0,15 volt ezen a világbajnokságon. A 466 tizenhatoson kívüli lövésnek 0,037. Ez azt jelenti, hogy egy-egy tizenhatoson belüli lövésnek átlagosan tizenöt százalék az esélye, hogy gól lesz belőle, míg ugyanez a valószínűség a tizenhatoson kívüli lövések esetében kevesebb, mint négy százalék.
Ez a trend nemcsak a világbajnokságon, de a klubfutballban is lemérhető. A 2022-es év elején az Opta az olasz Serie A lövéseiről és góljairól készített átfogó elemzést. Ebből kiderült, hogy a 2004/2005-ös szezon óta folyamatosan nő a tizenhatoson belüli lövések aránya, és ezzel párhuzamosan a helyzetkihasználás is javul. A játékosok tehát egyre kevesebbet lőnek távolról, mert pontosan tudják, onnan kicsi a gólszerzés esélye. Ugyanez az adatforradalom más sportágak esetében is lezajlott: az NBA-ben, például,
Egyszerűen statisztikailag jobban megéri beleállni a hárompontos dobásba, mint elvállalni a kétpontost erről a területről.
Az adatelemzés megjelenése a futballban
A fellelhető források alapján 1950. március 18. óta beszélhetünk adatelemzésről a futballban. Ekkor történt, hogy Charles Reep, a Brit Királyi Légierő tisztje a Swindon Town–Bristol Rovers meccs második félidejében elkezdett feljegyzéseket készíteni a támadásokról. Reep ezt követően szüntelenül jegyzetelni kezdett a meccseken, és nagyon hamar a profi futball első adatelemzőjévé nőtte ki magát. Reep az évek alatt saját játékelméletet fejlesztett ki: statisztikai alapon úgy vélte, hogy a túl sok passzolás csak időpocsékolás, ráadásul kockázatos is, mert a csapatok a rendezetlen labdavesztéseket követően kapják a legtöbb gólt. Reep munkásságát az angol klubok is kezdték elismerni, a Wolverhampton Wanderers pedig alkalmazta is a szakembert, akinek segítségével a csapat három angol első osztályú bajnoki címet nyert az 1950-es években. Reep játékelmélete azonban évtizedekre tévútra vitte az angol futballt. Charles Hughest 1983-ban választották meg az Angol Labdarúgó Szövetség (FA) technikai igazgatójának, ő ugyanazokat a nézeteket vallotta, mint Reep. Hughes-nak aztán nagy szerepe volt abban, hogy 1990-ben Graham Taylort nevezték ki az angol válogatott szövetségi kapitányának. Taylor korábban tíz évet dolgozott a Watford menedzsereként, és Reep játékelméletére építve öt év alatt a negyedosztályból az élvonalba vezette az együttest. Ugyanez a játék azonban csúfos kudarcba fulladt a válogatottnál, ezért amikor 1993-ban biztossá vált, hogy Anglia nem jut ki a következő évben rendezett világbajnokságra, Taylor lemondott. Hughes még egy évig maradt technikai igazgató, de 1994-ben ő is távozott. Anglia csalódást keltő szereplésével Reep évtizedeken átívelő elavult nézeteinek végérvényesen befellegzett.
Az adat elkezd beszivárogni a klubok életébe
Az 1992-es év fordulópontot jelentett a futballban. Ekkor alakult meg a Premier League, jött létre a Bajnokcsapatok Európa Kupájából a Bajnokok Ligája és törölték el a hazaadást, amit a katasztrofálisan rossz megítélést kapott 1990-es világbajnokság és az egyre gyakoribbá váló időhúzás idézett elő. A játék új, izgalmas az addigiaknál sokkal szórakoztatóbb időszaka kezdődött ekkor, ami után a futball gyorsabb és technikásabb lett. Ezt az állítást 1996-tól már adatokkal is alá lehet támasztani. Ebben az évben alakult meg az Opta Consulting – ma már STATS Perform –, amely elkezdett adatokat gyűjteni a Premier League-ről. Néhány év alatt aztán felrobbant az iparág, és adathiány helyett hirtelen adatáradat lett. Az Opta és az egyre szaporodó konkurensei több ezer adatpontot küldtek ki a kluboknak hetente. A klubok olyan adatokhoz jutottak hozzá, amelyekről korábban azt sem tudták, hogy léteznek: mennyit futnak a játékosok, hányszor csúsznak be, mennyiszer passzolnak?
Szép lassan a menedzserek is alkalmazkodtak a megváltozott körülményekhez. 2001-ben Sir Alex Ferguson az adatokat tanulmányozva döntött úgy, hogy ideje eladni a 29 éves Jaap Stamot, mert a kiöregedőben lévő védőnek egyre kevesebb becsúszó szerelése van.
Arséne Wenger szintén az adatok felhasználói közé tartozott, de az Arsenal menedzsere a teljes sporttudomány területén áttörést ért el. Megreformálta a játékosok étkezési szokásait, edzőterembe küldte őket, táplálékkiegészítőket szedetett velük. Idővel a többi edző elkezdte tanulmányozni Wenger módszereit, amelyek így beszivárogtak a Premier League-klubok mindennapi életébe. Részben ez a magyarázata annak, hogy az Arsenal semmit sem nyert a 2005 és 2013 közötti időszakban. Sam Allardyce Boltonja szintén a Premier League egyik úttörője volt. Mivel Allardyce-nak korlátozottak voltak a lehetőségei, az olcsó gólok felé fordította csapata figyelmét: szögletek, szabadrúgások, bedobások. „Megnéztük, hogy a bedobások és a szögletek után hova száll leggyakrabban a védők felszabadítása, és mi oda koncentráltuk az erőinket. Ha nem sikerült első szándékból célba érnünk, még mindig ott volt az ismétlés lehetősége” – mondta Gavin Fleig, Allardyce egyik tanítványa, aki a Fociológia című könyvnek felidézte, hogy Allardyce idejében a Bolton a góljai 45-50 százalékát rögzített játékhelyzetek után szerezte, miközben a ligaátlag 30 százalék körül volt.
2006-ban a világbajnokságon is megjelent az adatelemzés. Az elődöntőben Németország Argentínával játszott, és a tizenegyesrúgások előtt Jens Lehmann egy összegyűrt papírfecnit húzott elő a sportszárából, amelyre fel volt írva, hogy az argentin játékosok várhatóan hova lövik a labdát. A németek elemzőcsapata tizenháromezer tizenegyes adatait dolgozta fel. A papíron megadott hét rúgóból végül csak kettő állt oda, az a kettő viszont oda rúgta a labdát, ahová Lehmann várta. Roberto Ayala balra lőtt, és Lehmann ki is tudta védeni, a várakozásoknak megfelelően pedig Maxi Rodriguez jobbra, de a lövés túl pontos volt, így a kapus hiába vetődött jó irányba, a labda bement. A 2008-as Bajnokok Ligája-döntő tizenegyespárbajában az első hat Chelsea-rúgó közül öt – az előzetes útmutatásnak megfelelően – Edwin van der Sar bal oldalára rúgta a labdát. Van der Sar egyetlen tizenegyest sem fogott meg ezek közül (John Terry lövésénél is rossz irányba vetődött, de a védő elcsúszott, a lövése pedig kimaradt), Nicolas Anelka viszont oda rúgta, ahová megmondták, hogy nem szabad – ez a partizánakció pedig a Chelsea BL-győzelmébe került.
Sokkal gyorsabb és hatékonyabb munkafolyamatok
A kétezres években a futball még csak ismerkedett az adattal, a kétezer-tízes években viszont már megkerülhetetlen elemévé vált. Ma már a legnagyobb európai topkluboknál és szövetségeknél komplett adatelemző osztályok dolgoznak, amelyek saját csapat- és ellenfélelemzéssel, valamint a scouting adatalapú döntéstámogatásával segítik a szervezet működését. Labdás eseményekkel kapcsolatos adatpontokból (event data) körülbelül háromezer keletkezik egy meccsen, míg a fizikai eseményekkel kapcsolatos adatpontokból (tracking data) körülbelül hárommillió. Ezek között vannak az olyan leíró mutatók, mint a gól, kapura lövés vagy labdabirtoklás, amik ma már nem nevezhetők hasznos információnak egy klub vagy szövetség számára. Az iparág ugyanis olyan komplex mutatókat kezdett gyártani, amelyek nemcsak leírják, hanem minősítik is a játékosok és csapatok teljesítményét (ilyen például az xG).
A pályán ilyen lehet a saját csapat teljesítményének optimalizálása és az ellenfél gyengeségeinek azonosítása, scoutingban pedig az új játékosok leigazolásánál jelentkező kockázatok minimalizálása. Az adatok ráadásul nemcsak segítik a döntéshozatalt, de a munka volumenét is lecsökkentik; ma már nem szükséges ugyanis órákat utazni egy-egy csapat vagy játékos feltérképezése miatt, mert az adatszolgáltató felületén pár kattintás után elérhető minden felvétel és adat. Ha pedig kiválasztásról van szó, akkor sokkal eredményesebb a több ezer vagy tízezer elérhető játékos megszűrése posztspecifikus teljesítménymutatók alapján, mint hasra ütés szerűen rábökni valakire.
Ezekből is látszik tehát, hogy az adatok kezdik teljesen megváltoztatni a munkakultúrát, amely sokkal hatékonyabb a rendelkezésre álló erőforrások megfelelő felhasználásával.
A szerző Kovács Gábor, a Magyar Labdarúgó Szövetség adatelemzője.