Resumo
Big data provou ser de influência crescente em uma ampla gama de tomadas de decisão e processos de descoberta de conhecimento em vários domínios. Coleta, pré-processamento e a análise de dados para tomar decisões ou no processo de descoberta de conhecimento é uma tarefa nada trivial. Com o acesso crescente ao poder de computação, uma infinidade de ciência de dados técnicas surgiram como ferramentas de resolução de problemas em muitos domínios da sociedade. Na última década, uma grande quantidade de dados foi coletada no campo dos esportes. Diversos laboratórios em todo o mundo usaram esses dados em conjugação com Machine Learning/Data Técnicas de ciência (ML/DS) para agregar valor significativo à indústria do esporte e aos acadêmicos. No entanto, em comparação com o potencial dos dados disponíveis, apenas um pequeno subconjunto foi explorado. Isso se deve principalmente à falta de experiência em codificação/programação necessária para obtenha os dados em um formato ideal para a construção de modelos para responder a perguntas específicas de interesse. O problema de gargalo de pré-processamento foi parcialmente resolvido devido a dados recursos como OPTA, STATSBomb e FBRef.com, que fornecem rastreamento limpo, eventos e dados de notação. Além disso, bibliotecas em Python e R, como Floodlight, AMIE e SoccerAction oferecem pacotes que simplificam o pré-processamento e a visualização etapas, oferecendo assim grande acesso à análise de big data para experiência de domínio com limitado especialização em codificação. Tendo em conta estes desenvolvimentos, a presente tese pretende introduzir Métodos de ML/DS, como regressão, classificação binária, engenharia de recursos e k-fold validação cruzada no campo da análise esportiva. Isso pode potencialmente fornecer aos especialistas em domínios específicos as ferramentas técnicas necessárias para explorar a crescente quantidade de dados na indústria do esporte.
Referências
Alasadi, S. A., & Bhaya, W. S. (2017). Review of data preprocessing techniques in data mining. Journal of Engineering and Applied Sciences, 12 (16), 4102–4107. doi:10.36478/jeasci.2017.4102.4107
Ali, A. (2011). Measuring soccer skill performance: a review. Scandinavian Journal of Medicine & Science in Sports, 21 (2), 170–183. doi: 10.1111/j.1600-0838.2010.01256.x
Amrhein, V., Greenland, S., & McShane, B. (2019). Scientists rise up against statistical significance. Nature Publishing Group. doi: 10.1038/d41586-019-00857-9
Bai, Z., & Bai, X. (2021). Sports big data: Management, analysis, applications, and challenges. Complexity, 2021 , 11. doi: 10.1155/2021/6676297