Resumo
O objetivo geral desta pesquisa foi propor uma nova abordagem para analisar o passe em partidas de futebol utilizando técnicas multivariadas e de machine learning (ML). Foram analisadas quatro partidas oficiais do Campeonato Brasileiro de Futebol 2016. Os objetivos específicos foram propostos com base em dois tipos de análise: análise da posse de bola (BP) (Estudo 1), e análise do passe (Estudos 2 e 3). No estudo 1 foram usadas 41 variáveis preditoras 'notacionais', 'ocupação do espaço' e 'sincronização de deslocamento'. As BP foram classificadas em três grupos por meio de técnicas de agrupamento: curta, média e longa. A análise discriminante identificou cinco variáveis mais relevantes para descrever cada grupo, sugerindo comportamentos coletivos que ajudam a manter a BP e realizar passes. O segundo e o terceiro estudos focaram suas análises no conceito de dificuldade de passe, que norteou a proposição de 36 variáveis relacionadas ao passe, pressão sobre o passador, pressão sobre receptor do passe, trajetória da bola, posição no campo e técnicas do passador. Em ambos os estudos, usamos uma amostra com 465 passes rotulados por experts. Os passes foram classificados como dificuldade baixa (LDP), dificuldade média (MDP) e dificuldade alta (HDP). No estudo 2, a análise discriminante apresentou 72,0 % de acurácia ao classificar o grau de dificuldade de passagem em três classes. Além disso, foram identificadas 16 entre 32 variáveis que melhor explicam o grau de dificuldade do passe no futebol. No estudo 3, melhoramos a previsão classificando os passes usando algoritmos de ML. O support vector machine (SVM), modelo não linear, alcançou uma acurácia balanceada de 88% em seu melhor desempenho. Em seguida, usamos esse modelo para predizer uma nova amostra de passes (total = 2.522) e analisar jogadores e posições. O HDP apresentou apenas 49,3% de passes certos, seguido por 84,0% para MDP e 94,9% para LDP. Essas variáveis foram usadas como inputs na análise de componentes principais (PCA). A principal componente (PC1) apresentou maior correlação com a variável acertos em HDP e MDP, sugerindo que é mais importante considerar a capacidade do jogador em executar passes de dificuldade alta e média do que passes de dificuldade baixa. Além disso, os scores da PC1 foram usados para classificar os melhores passadores. Os modelos e variáveis propostos podem ser usados por treinadores em um contexto prático para analisar seus jogadores e equipes, a fim de melhorar o desempenho na execução de passes, visto que os passes são os determinantes do sucesso em partidas de futebol.
Disponível em http://www.repositorio.unicamp.br/