Математическата революция навлезе във футбола
„Това е футболът”, е обичайното извинение на даден играч, който не може да обясни защо един мач се е развил зле. Това е и също признанието, че футболът е необясним като изкуството, пълен с хазарт, такъв от памтивека; спорт, който не може да се обясни. Но това ще важи с все по-малка сила в бъдеще. Както и в останалите спортове, науката започна да колонизира решенията на треньорите, ръководителите и техническите директори.
Хосе Луис Мендоса – директор на Институционални връзки в клуба от испанската Сегунда УКАМ Мурсия – имал „езиков” проблем със своите съгледвачи. Когато му препоръчвали даден играч, му казвали неща от сорта на „този тип е добър, защото влиза здраво в единоборствата, подава добре и вижда играта”. На Мендоса подобно обяснение му се струвало неособено убедително. Съгледвачът му настоявал: „Идва от този и този отбор и е постигнал всичко това.” Мендоса продължавал да чака различно оправдание: „Аз искам да чувам нещо такова: „Този тип е добър, защото има 80% точни къси подавания, което е над средното ниво в първенството, и второ – създава три голови положения със завършващия си пас, което е доста пунктове над средното ниво.”
Мендоса отишъл да учи в университета Бъркли през 2009 година. Там предвидил, че статистиката – вече нещо напълно нормално в бейзбола, баскетбола и американския футбол – ще стигне и до футбола. Няколко години след завръщането си в Испания търсел подобна методология и за УКАМ. И не я намирал. До този сезон.
Тя се появила благодарение на други двама емигрирали в САЩ испанци. Давид Руеда живее от седем години във Флорида, където основал Оригами Спортс. Неговата мисия е да постави статистиката на централно място във вземането на решения във футболните клубове. „Досега се вземаха мултимилионни решения въз основата на субективните възприятия на един или няколко души”, казва Руеда.
Анализаторът на Оригами е Салвадор Кармона – 27-годишен младеж, завършил икономика и тясно специализиран в статистиката в Аризонския университет. Кармона движи база данни с над 12 500 играчи от водещите лиги в света. Тези данни не включват само броя голове, изиграните минути и отправените удари, а и по-фини показатели като точни подавания, създадени положения, пасове между линиите, успешни финтове или колко пъти сам си бил финтиран. От там излизат детайли за играч от рода на „прави средно по три успешни финта на всеки 90 минути, което го поставя във водещия 1% в цяла Южна Америка” или „прави средно по над 13 точни подавания на над 35 метра разстояние на мач”. Кармона може да отправи запитване към своята база данни кой играч му е нужен въз основа на зададени определени показатели. И резултатите ще покажат играчи, които традиционните скаути никога не са виждали. Оригами има към момента клиенти в Ла Лига, Серия А и Премиър Лийг.
КАК СЕ ПРАВИ ОЦЕНКА НА НАПАДАТЕЛ
Нападател не бива да се преценява само по вкараните голове, а и по „очаквани голове”. Това е метрика, която зависи от скоростта на отиграването (нормално 2,5 м/сек), от зоната на удара и от това с коя част е отправен той. Колкото по-нисък е коефициентът на „очакван гол”, толкова по-голяма е заслугата на играча за вкарването му. Дузпата има коефициент 0,81, удар на празна врата от 1 м пред голлинията надхвърля 0,9. Ако даден нападател има висок процент на „очаквани голове” и в добавка вкарва трудни голове, придобива по-висока стойност. Подобно е положението и с асистенциите: даващият завършващия пас играч зависи от качеството на нападателя, за да запише асистенция, докато с метриката „създадени чисти положения” тази зависимост отпада или поне губи значение.
Това рафинирано използване на данни позволява по-точно преценяване на всеки футболист. Трансферите днес зависят от съгледвачите на даден клуб. „Естественият процес е да се гледат много мачове в течение на сезона в Примера, Сегунда А и Б плюс някои чужди лиги”, казва техническият секретар на Райо Валекано Рамон Планес. Колкото и играчи да вижда обаче, никой скаут не може да анализира всичко сторено от 22-амата играчи на терена във всеки мач. Докато данните могат. „Днес оглеждах играчи до 23 години във Втора лига на Португалия и Първите на Словакия и Норвегия – споделя Мендоса от УКАМ. – Играчи, които са с показатели над нивото на своите лиги, та исках да видя защо е така.”
Традиционните съгледвачи на клуба от Мурсия никога нямаше да могат да достигнат до подобна дълбочина на детайлите. Сега даден клуб може да ходи на лов за по-подходящи за себе си играчи много по-надалеч отпреди. Това носи едно очевидно предимство (плюс моментален ефект) и друго, което е може би по-интересното: възможността да купуваш евтино и да продаваш скъпо.
Математическата революция вече има своите исторически прецеденти. Лестър, Сиатъл Саундърс и Митюлан – действащите шампиони на Англия, МЛС в Северна Америка и Норвегия съответно – използваха такъв тип методология, за да съставят отборите си. Използването на статистиката в тренировките и анализирането на съперника е по-отдавнашно, ала в търсенето и намирането на играчи е по-новаторско. „Това е вече често срещано явление – казва Браян Клархот, втори треньор на шведския Нюшьопинг БИС и един от малкото северноамериканци в занаята в Европа. – Още не е често срещано обаче това базата данни да ти дава изначален списък с търсения тип играчи. Това е още ново и революционно.”
Мениджърските агенции също виждат ползите от по-добрите данни. „Ако имаш крило, което иска повече пари, трябва да гледаш отвъд неговите голове и асистенции – точност в пласирането, създадени положения и т.н. Трябва да можеш да разкажеш неговата история в цифри”, разкрива Реми Черин, агент от северноамериканската агенция Ремингтън Елис Мениджмънт.
Севиля вероятно е клубът, който най-добре работи на трансферния пазар в последните години в Испания, а може би и не само там. Спортно-техническият щаб включва 16 служители, отговарящи за съответните си лиги, където търсят и отбират определени играчи. С тази налична информация съставят списък. „Измежду 100-те централни защитници, които могат да дойдат в Севиля, сме гледали на живо 99 и треньорите казват, че 20 от тях имат качествата да са в нашия отбор. Този първи филтър е субективен. После списъкът е предаван на спортния директор Мончи и неговите помощници, които решават 10-те кандидати. Тогава започваш да се ровиш най-детайлно в статистиките, защото ако тръгнеш да го правиш, когато кандидатите са 100, можеш се побърка”, разказва Хесус Оливера, анализатор от щаба на андалуския клуб.
Севиля използва статистическите данни като финален филтър. Оливера знае, че има модели, които могат да усъвършенстват целия процес и да позволят анализирането не на 100, а на 1000 или 10 000 футболисти, ала все още това не е направено: „Да се направят статистически програми с чувствителност към играта и нейните специфични детайли все още е твърде сложно, защото трябва да се запази равновесието между информатиката и спорта. Но там е бъдещето.”
За момента Севиля няма в спортно-техническия си щаб нито един информатик или инженер. Оливера обаче не отрича подобно нещо да се случи в бъдеще.
ИНЖЕНЕРЪТ НА САУНДЪРС
Сиатъл Саундърс обаче имат информатик в своя щаб от 2013 г. насам. Рави Раминени е шефът на отдела за анализиране на данни на отбора след шест прекарани години в „Майкрософт”. Когато дошъл в клуба, бил рядка птица. Трябвало да си спечелва доверие сред колегите със своите данни. „Често чувах как някой си спомня супергол или ужасна грешка на даден играч и следователно отсича, че играчът Х е добър реализатор и затова е по-добър от Y”, разказва Раминени. Тогава той правел същото като всички статистици: гледал данните и не приемал чуждите впечатления. „Тогава ми казваха „да бе, добре” и ме питаха за моите метрики.”
Титлата на Саундърс не е случайност. Техният съперник на финала Торонто също бе направил вложение в аналитичен отдел, твърди Раминени. Той допълва: „Карам три години в клуба и в последната най-много се опирахме на данните. Не вземаме решенията си изцяло на тяхна основа, но когато имаме данни, никога не им обръщаме гръб.”
Липсата на доверие в статистиките във футбола е разбираема, защото те не са лесен залък за преглъщане. Компанията „Опта” е лидерът в това направление, а методологията ѝ представлява информатична еволюция от традиционно събираните данни. „Събираме данни за всички действия с топката: кой я отиграва, къде и кога. Можем да кажем колко пъти е докоснал топката даден футболист, с коя част на тялото, къде и в коя секунда”, казва Чечу Фернандес, един от директорите в „Опта”. Моментът на докосване на топката например е важен, защото позволява да се изчисли скоростта на даденото отиграване. Компанията има тези данни за 20 лиги в света. Има и други – двете водещи са „Инстат” и „Уайскаут”, които изрязват видеоклипове от хиляди мачове, за да съберат на едно място например всички финтове или контраатаки на определен футболист.
Тази методология изисква специални тренировки за на живо въвеждащите данни служители. За Раминени обаче тя „е много примитивна”. „Аз виждам футбола като игра, където се обработва пространството чрез движението без топка”, добавя той. За да бъдат данните полезни, Раминени иска да може да намира информация за точната позиция на всеки един от 22-амата играчи във всяка секунда от мача. Тогава, смята той, ще настъпи истинската революция на данните във футбола.
ВАЖНОСТТА НА МЕСТОПОЛОЖЕНИЕТО
Знанието за местоположението на всеки играч във всяка секунда може и да изглежда прекалено, ала не е. Матю Бенам – собственик на английския Брентфорд и датския Митюлан, който натрупа своето състояние със статистически модели в една букмейкърска компания – насочи внимание към следното на конференцията Мачбуук Трейдърс през 2015 г.: „Един играч може да е добър в отнемането на топката и влизанията, но дали не се набива в полезрението ни с активност, маскираща лошото му позициониране?”.
Статистиката навлиза късно във футбола не само защото това е консервативен спорт с голямо недоверие към статистиката, а и защото има трудни за разрешаване различия в сравнение с други спортове. Има очевидни примери: краката са по-трудни за контролиране от ръцете. „Действията на ръцете са по-лесни за проследяване, тъй като точността им е по-голяма в сравнение с тези на краката”, казва Рафа Монфорт, скаут на Удинезе и Уотфорд. Създателите на „Опта” например са двама специалисти по хандбал.
Има поне още две причини. Първата е постоянното съчетание на 11 играчи. Една от най-големите задачи на анализаторите е да определят приноса на определен футболист към отбора му, когато е с пълен състав и когато е с 10, 9 или по-малко души на терена. Втората е по-малкото общо количество данни в сравнение с други спортове. „Средният брой голове на мач е 2,5-2,7 по целия свят, 22-27 удара към вратите, пък и има много по-малко мачове отколкото в бейзбола или в НБА”, казва Раминени.
Най-голямото предимство на статистиката не е нейната надеждност или иновативност, а това, че сътрудничи на една несъвършена машина: човека. Психологията от десетилетия насам определя човешката нерационалност във вземането на решения. Има научно установени предразсъдъци. Даден съгледвач, който е бивш футболист, смята, че неговият опит е мярката, и затова търси подобни на себе си примери. Когато убедим себе си в нещо – че например един играч е точният или пък че не е, е по-вероятно да търсим причини да продължим да храним убеждението си. Когато сме купили нещо, колкото и лошо да е то, изведнъж става по-добро от всичко купено от нас досега и търсим причини да го оправдаем.
Малцина вярват, че във футбола статистическите модели могат да заменят човешката преценка при купуването на играчи. Статистиката няма да отстрани грешките, защото представянето на купения играч в нов град или страна зависи от куп фактори, които също могат да бъдат взети предвид при изчисленията. Подобрението на моделите е незавършен процес. Винаги ще има нов въпрос, който да се зададе. Макар че поне отговорът вече няма да може да бъде опростеното „Това е футболът”.Жорди Перес Коломе, „Ел Паис”