Estatísticas inúteis do futebol. E na ciência?

galvão.jpg

Imagem: retidara da gafe do Galvão aqui e editada por Rafael_RNAm. O “p<0,05” é um limite em estatística e significa 0,05% de chance do seu resultado ser fruto do acaso.

Bem amigos do RNAm!!! Estamos aqui para mais um show de transmissão científica. Um show de imagens, de comentários abalizados, e de dados completamente inúteis!

Sim, eu não me conformo com a quantidade de dados inúteis em uma transmissão de jogo de futebol. E isso não é novidade pra ninguém, afinal há muito tempo já se tira sarro de estatísticas do tipo “só em 1843 o Piraporense do Bom Jesus ganhou de 3 a 0 do Itaquaquecetubense em um ano bissexto”. Mas assistindo a Brasil e Chile vi um nível de sofisticação fantástico na coleta de dados.

A todo momento aparecia o quanto cada jogador havia percorrido na partida, ali, em tempo real. Também o quanto desse tempo ele havia andado, trotado e corrido. No fim do jogo um gráfico mostrou a média percorrida pelos times, posse de bola, arrancadas e até um gráfico mostrando a região mais percorrida do campo por cada equipe.

Coleta de dados perfeita. Provavelmente uma câmera fixa ligada a um computador com um programa de analise de imagem fez esse serviço.

Adendo – E não é nada muito novo. Essa mesma técnica é usada para analise de comportamento de camundongos. Deixa-se uma câmera filmando a movimentação do bicho, analisando assim o comportamento depois de tratado com determinada droga, por exemplo. O software faz tudo sozinho.


Mas a pergunta é PARA QUE?!
Afinal as estatísticas no fim do jogo eram praticamente as mesmas entre os dois times (posse, distância percorrida, etc). Mas o Brasil ganhou de 4 a 2, que é uma bruta diferença. Diferença esta que existe, mas que a coleta de dados não pegou.

Ou seja, se tivéssemos só os dados estatísticos da partida, a técnica de coleta de dados durante os jogos ainda não é sensível o suficiente para prever quem ganhou de goleada.

Esse é um paralelo interessante para muitas pesquisas científicas. Muitas áreas estão ainda ajustando sua coleta de dados. E muitas já têm uma quantidade imensa de dados, mas ainda falta aprender a interpretar essa quantidade de informação. Falta fazer isso tudo fazer sentido e ajudar a prever um resultado. É o caso de áreas como a genômica, proteômica e outras ômicas: muita informação gerada e pouco tempo para análise e integração com outros dados.

Uma das críticas ao Projeto Genoma Humano era essa: muito dinheiro pra coleta de dados e pouco para análise. Bom, agora que o esforço foi concluído, realmente os resultados prometidos não vieram tão rápido, mas lentamente virão.

Na Globo, o Galvão ainda está assim: dirigindo uma Ferrari de dados mas sem saber pra onde ir. Mas sigamos coletando (principalmente quando há dinheiro sobrando)! Quem sabe um dia alguém aprende a usar isso tudo.

Para receber nosso conteúdo em primeira mão, siga-me no twitter @Rafael_RNAm e clique aqui para assinar nosso Feed/RSS!