Eu sou de Belo Horizonte! E pelas bandas de lá, a “briga” entre atleticanos e cruzeirenses é acirrada. O que eu acho mais fascinante nessa disputa são as estatísticas que os torcedores usam para tirar onda com a cara um do outro. Principalmente em dia de clássico. Você escuta coisas do tipo “em toda a história dos clássicos, o Atlético venceu X partidas e o Cruzeiro só Y“, ou coisas do tipo “o Cruzeiro tem X títulos enquanto o Galo só tem Y“. No entanto, na vida real, a coisa é diferente. Na verdade, qualquer que seja a estatística, nunca vamos saber antes da partida quem vencerá um clássico. E isso ocorre por que, apesar de o resultado de uma partida ser, para nós, uma ocorrência probabilística, a nossa mente opera de maneira estocástica, ou seja, ela seleciona uma parte aleatória das memórias que temos e baseia a nossa decisão nessas memórias. Em outras palavras, utilizamos um grupo pequeno de memórias relevantes (ex.: quantos títulos o Galo tem, ou quantos gols o Bernard já marcou em clássicos) para decidir quem achamos que vai vencer o clássico. No final das contas, é impossível saber com certeza. Mas como podemos pelo menos melhorar nas nossas previsões? Como podemos acertar mais vezes quem vai vencer o clássico?
Uma pesquisa recente publicada no Proceedings of the National Academy of Sciences (PNAS) parece ter a resposta: basta basear sua decisão em um mundo ideal. Gyslain Giguère, do Departamento de Psicologia da Universidade de Montréal e Brad Love, do Departamento de Ciências Perceptuais, Cognitivas e do Cérebro da Universidade College London, fizeram um estudo onde os participantes tinham que prever o vencedor de várias partidas de Liga Nacional de Beisebol dos Estados Unidos. No entanto, antes de darem o palpite, esses participantes foram “treinados” com base em resultados (estatísticas) passados. Para metade dos participantes, os pesquisadores forneceram dados reais, ou seja, dados em que o “melhor time” ganhou algumas partidas, mas também perdeu algumas partidas. Para a outra metade dos participantes, os pesquisadores manipularam os resultados de maneira que o melhor time da liga sempre vencia as partidas. Quando os pesquisadores compararam qual grupo acertou mais quando tinham que adivinhar que time venceria uma partida, o grupo que recebeu treinamento com dados “ideais” teve uma performance significativamente melhor do que o grupo que foi treinado com dados reais.
Mas por que isso acontece? Basicamente, os dados reais (com o melhor time vencendo algumas partidas e perdendo outras) traz muitos ruídos, e esse ruídos acabam fazendo parte da nossa memória. E quando selecionamos aleatoriamente memórias para tomar uma decisão (ex.: quem vai vencer a partida), esses ruídos acabam sendo selecionados e influencia a nossa tomada de decisão. É isso que acontece quando, mesmo jogando contra um time inferior, nós sempre temos uma pontinha de medo de que o nosso time vai perder. Essa pontinha de medo é causada por esse ruído dos dados reais. E esse medo é ainda mais forte caso a memória em que o time inferior vence o nosso time é uma memória recente.
Mas alguém pode dizer: “uai, é óbvio que o grupo que viu as estatísticas manipuladas vai ser melhor, pois eles têm dados mais limpos“. Acontece que, estatísticamente falando, o grupo que viu as estatísticas reais teria, em termos probabilísticos, uma visão mais correta da realidade (eles seria capazes de dizer, por exemplo, a probabilidade de um time pequeno ganhar uma partida). No entanto, é o uso que a nossa cognição/memória faz dessa estatística que está em jogo. É a maneira como a nossa mente registra esses ruídos e como eles atrapalham o nosso processo de tomada de decisões.
Para quem trabalha com decisões e incerteza o tempo todo (radiólogos, analistas de inteligência, agentes de segurança, etc), treinar a mente com dados ideais pode ser uma boa estratégia para evitar que ruídos da memória atrapalhem o processo de tomada de decisão (basicamente, eles vão acertar mais vezes). Para o resto de nós (ou melhor: alguns de nós), reles mortais torcedores do Galãooo da Massa, nos resta imaginar um mundo em que o Galo ganha tudo. Daí tudo fica azul… ou melhor, tudo fica bom!
Não deixe de seguir o Cognando no Facebook, Twitter e Google+. Cruzeirense também é bem vindo! Corinthiano eu tenho que pensar!!! 🙂
Referência:
Giguère G, & Love BC (2013). Limits in decision making arise from limits in memory retrieval. Proceedings of the National Academy of Sciences of the United States of America PMID: 23610402
É um tanto mais complicado extrapolar resultados obtidos sobre o beisebol para o futebol. O futebol é um esporte tipicamente de baixo escore (são poucos os gols marcados por partida), estando sujeito a mais efeitos vicissitudinais do que esportes de placares de maior pontuação.
(Na NLB, há uma média de 9,18 runs por partida; no Campeonato Brasileiro, a média é de 1,23 gol por partida.)
[]s,
Roberto Takata
Faz sentido. No entanto, tanto a história passada (de vitórias e derrotas) quanto os "guesses" dos participantes foram binários (ganhou ou perdeu), de forma que a pontuação de runs e até mesmo duração da partida não entraram em jogo. Nesse sentido a extrapolação parece ser válida. E obviamente, a ideia é que ruídos acabam virando traços de memória e, como consequência da maneira como nossa mente funciona, esses traços mais atrapalham que ajudam (pelo menos nesse tipo de tomada de decisão).
A.
Mais uma publicação muito interessante.
Sempre achei muito válido seus posts, agora sabendo que você também é um dos torcedores do Galãooo da Massa, ai que virei mesmo seu fã kkkk.
Mas é que no Campeonato Brasileiro, as chances de cada resultado: vitória, empate, derrota, são muito parecidas (por causa do efeito do baixo escore): 40 pro mandante, 30 pro empate e 30 pro visitante. Se fosse 1/3 pra cada - *qualquer* estratégia teria o mesmo resultado: 1/3 de acerto. Como as chances reais não diferem muito do acaso, o efeito, se houver, será muito sutil.
[]s,
Roberto Takata
Basicamente você está dizendo que a baseline performance de brasileiros em predizer o vencedor de uma partida seria melhor do que a baseline performance de um americano tentando predizer o vencedor de uma partida de beisebol? É uma pergunta empírica interessante. No paper original, Gyslain rodou um modelo computacional (to tipo SVM-Optimal e SVM-Sampling) com os mesmos tipos de dados do experimento com humanos e os resultados foram comparáveis. Se tivermos acesso a dados do brasileirão, seria fácil rodar os modelos computacionais pra ver o que daria. Eu acho pouco provável que seja diferente, mas é uma pergunta empírica interessante.
Os dados estão disponíveis na internet. Envolveria um certo esforço braçal pra compilar. (Ou bons relacionamentos com a equipe da UFMG que tem um programa de previsão de resultados de futebol pra eles cederem os dados tabulados: http://www.mat.ufmg.br/futebol/.)
[]s,
Roberto Takata
Conversei com Gyslain hoje e vamos ver se rola de fazer isso com dados do brasileirão (apesar de ele também achar que não deve haver diferenças). More soon!