Rubinho, ou o poder da persistência.

Uma coisa legal sobre esportes (a única coisa legal sobre esportes, em minha opinião pessoal) é que existem estatísticas detalhadas sobre praticamente cada aspecto de cada tipo de competição, e que se prestam muito bem a brincadeiras científicas de teste de hipóteses.
Por exemplo: Rubinho Barrichello tem talento?
Vamos considerar “talento” como a capacidade de obter uma performance acima do que seria de se esperar pelo mero acaso. Rubinho tem dois recordes — é o piloto que mais disputou provas na Fórmula 1 (262) e o que mais pontos marcou na carreira (530), uma média de 2 pontos por prova. Essa é uma média significativa, ou apenas a justa recompensa por uma inabalável teimosia?
Vejamos: na Fórmula 1, pontuam os oito pilotos mais bem colocados em cada prova. As corridas costumam contar com cerca de 20 pilotos; digamos, portanto, que a chance de um piloto pontuar por pura sorte — se, por exemplo, todos os que estão na frente dele quebrarem — seja de 40%. O esquema de pontuação é, em ordem decrescente de chegada, o seguinte: 10, 8, 6, 5, 4, 3, 2, 1. A pontuação média, arredondando para cima, é 5.
Assim, a pontuação média que um piloto sem talento pode esperar, contando apenas com pura sorte, é 5 x 0,4 = 2 pontos.
Ops.
Vamos ver por outro lado: apenas os três primeiros colocados em cada prova vão ao pódio. Assim, a chance de um piloto chegar ao pódio por pura sorte é de 3/20, ou 15% por corrida. Ele conseguiu 62 em 262, ou 23%. O dobro.
Esses resultados parecem sugerir que ele tem talento para o pódio, mas não para pontuar. Como isso é possível?
Mais análises em breve…

Discussão - 9 comentários

  1. Daniel disse:

    Eu não acho que sua modelagem seja muito boa. Você está assumindo que se um piloto não tem talento então as 20 colocações possíveis que ele pode ter numa determinada corrida são equiprováveis (todas têm probabilidade 1/20 ou 5%). Isso seria razoável se assumíssemos que nenhum dos pilotos nessa corrida têm talento, de modo que a configuração final é totalmente aleatória (i.e., todas as configurações finais possíveis são equiprováveis). Mas é mais razoável imaginar que alguns dos pilotos têm talento, de modo que para um piloto sem talento não é o caso que as 20 colocações são equiprováveis, mas que as primeiras colocações são mais improváveis do que as últimas.

  2. Moc disse:

    Oi, Daniel!Na verdade, não estou assumindo que todos os pilotos têm a mesma chance total de pontuar, mas que todos têm a mesma chance de contar com a sorte para pontuar. Fatores como talento pessoal ou qualidade do carro obviamente modificam o baseline de 40%, mas são exatamente esses fatores que estou tentando manter fora da análise: o que meu modelo tenta determinar é qual o desempenho que é razoável esperar de um piloto hipotético que pontua por acaso.

  3. Moc disse:

    Mas vamos tentar pôr alguns pesos na história para onde chegamos. Suponhamos que haja um piloto tão bom que pontue em 90% das corridas, e outros três bons o bastante para pontuar em 70% dos grandes prêmios. Com isso, o número de posições pontuadas disponíveis para pilotos medíocres cai a 8-(0,9+(3x0,7)) = 5. Com 16 pilotos medíocres, a chance passa a ser de 5/16, ou 30%. Se imaginarmos que a pontuação média disponível para esses pilotos seja 50% menor que que a pontuação média geral (50% sendo a parcela da média "reservada" para os bons), ficamos com 4 pontos. Fazendo 0,3x2,5, temos uma pontuação média esperada para os medíocres de 0,75.O que deixa o Rubinho com praticamebnte o TRIPLO da pontuação esperada para um sem-talento!O problema deste modelo é que a atribuição de pesos é obviamente arbitrária, e deixa de levar em conta interações do tipo "bom piloto com carro ruim", "piloto medíocre com carro bom", etc.É preciso refinar mais. E botar os pódios na jogada.

  4. Moc disse:

    Retificando: onde disse 4 pontos, são 2,5 pontos. Ô pressa...

  5. Daniel disse:

    Claro, eu entendo que o que você quer avaliar é justamente o desvio em relação ao acaso (que representa o "talento" do piloto).O problema é que não é razoável esperar que um piloto "sem nenhum talento" tenha 8/20 (ou 40%) de probabilidade de pontuar, a menos que os outros pilotos também não tenham nenhum talento (a probabilidade de pontuar para um piloto "sem nenhum talento" deve ser na verdade menor do que 8/20).É preciso também definir melhor o que significa "sem nenhum talento". Se me colocassem para correr nessas competições eu chegaria quase sempre na última posição, a menos de eventos muito raros que derrubem outros pilotos. Imagino que quando você diz "sem nenhum talento" você não tem em mente alguém como eu, que realmente não tem nenhum talento para corrida, mas sim alguém com um "talento medíocre".O tipo de abordagem que você usou no seu último comentário é mais razoável, apesar da arbitrariedade dos pesos.Para tratar esse problema seriam necessários não apenas os dados sobre o desempenho do Rubinho, mas também os dados sobre os desempenhos dos outros pilotos. Mesmo com esses dados adicionais eu não saberia assim de cara como seria a forma correta de tratar o problema.

  6. Daniel disse:

    Pensando um pouco, ocorreu-me a seguinte abordagem:suponha que tenhamos uma coleção fixa de 20 pilotos disputando várias provas (todos os pilotos participam de todas as provas). Cada um dos 20 pilotos terá no final uma pontuação média (levando em conta todas as provas) e aí podemos tirar a média aritmética dessas pontuações médias (considerando os 20 pilotos). É fácil ver que essa pontuação média será exatamente:(10+8+6+5+4+3+2+1)/20 = 1,95.Faz sentido então definir que um piloto com talento medíocre é um que tem pontuação média 1,95 ao longo de muitas provas.A pontuação média do Rubinho é pouco mais do que 2, de modo que ele está perigosamente próximo desse 1,95 (conclusão parecida com a que você obteve na sua abordagem original).Seria razoável agora testar a significância estatística da diferença entre a pontuação média do Rubinho e a pontuação média medíocre 1,95. Para isso seria necessário conhecer o desvio padrão das pontuações do Rubinho.

  7. Daniel disse:

    Estatística é uma coisa difícil. Muitas vezes vemos várias abordagens que parecem razoáveis para se tratar um problema... e infelizmente elas podem não levar todas às mesmas conclusões.

  8. Mauricio disse:

    Não foi levado em conta que o Rubinho correu um bom tempo com a pontuação antiga, que era 10-6-4-3-2-1. Se não me engano, o sistema de pontuação mudou em 2004.

  9. Moc disse:

    Maurício, esse é um dado que eu não tinha! Obrigado por chamar minha atenção para o fato.Acho que vou ter mergulhar bem mais fundo do que esperava nas estatísticas da Fórmula 1 se quiser chegar a uma conclusão defensável sobre o caso...

Envie seu comentário

Seu e-mail não será divulgado. (*) Campos obrigatórios.

Categorias

Sobre ScienceBlogs Brasil | Anuncie com ScienceBlogs Brasil | Política de Privacidade | Termos e Condições | Contato


ScienceBlogs por Seed Media Group. Group. ©2006-2011 Seed Media Group LLC. Todos direitos garantidos.


Páginas da Seed Media Group Seed Media Group | ScienceBlogs | SEEDMAGAZINE.COM