Teorema de Bayessauro

Por muitos semestres precisei explicar pra minhas de graduação e médio o que é o Teorema de Bayes. Isoladamente cada conceito atrelado a ele não é difícil de ser compreendido, porém quando juntamos tudo em um enunciado essa aparente simplicidade vira puro caldo de caos… Principalmente quando começamos a tentar usá-lo desconexo de seu sentido, ou seja, só aplicando a fórmula como se fosse mágica.

Mas nesse semestre achei um jeito que parece estar funcionando e ele envolve dinossauros!

No mundo existem dois tipos de ovos de dinossauros, os vermelhos e os azuis. E dois tipos de dinossauros, os pescoçudos e os narigudos (ambos podem vir em ovos vermelhos ou azuis). Os ovos são encontrados na natureza com uma distribuição de X% de ovos vermelhos, e (1-X%) de ovos azuis. Dos ovos vermelhos temos em Y% das vezes um dinossauro pescoçudo, e em (1 – Y%) um dinossauro narigudo. Já dos ovos azuis temos em Z% das vezes um dinossauro pescoçudo, e em (1 – Z%) um dinossauro narigudo.

Então um dia aparece o Pavel com um dinossauro pescoçudo, ele disse que ganhou esse dinossauro mas não sabe de onde ele veio (isto é, de um ovo vermelho ou azul). Para determinar a chance dele ter vindo de um ovo vermelho, fazemos os casos favoráveis Y%*X% dividido pelos casos totais (Y%*X% + (1 – Y%)*(1 – X%)). O complementar desse resultado é a chance do dinossauro pescoçudo ter vindo de um ovo azul.

De modo análogo, se o Pavel tivesse aparecido com um dinossauro narigudo, pra determinar a chance dele ter vindo de um ovo vermelho, fazemos os casos favoráveis Z%*X% dividido pelos casos totais (Z%*X% + (1 – Z%)*(1 – X%)). O complementar desse resultado é a chance do dinossauro narigudo ter vindo de um ovo azul.

O conceito é bem simples, mas bastante útil. Pense assim, existe uma doença que afeta X% da população, um sintoma que Y% das pessoas com a doença apresentam, mas que Z% das pessoas sem a doença também apresentam. Dado que você tem o sintoma, qual a chance de você ter a doença? E dado que você não tem o sintoma qual a chance de você ter a doença?

Esse problema é exatamente o mesmo dos ovos de dinossauros. Substitua a doença pelos ovos vermelhos e azuis. Agora troque ter ou não ter o sintoma pelos dinossauros pescoçudos e narigudos.

Da minha experiência em sala de aula, com provas e livros, o que eu sinto que afeta/atrapalha o entendimento do teorema de Bayes são.

  1. Uso exagerado de símbolos sem um preparo prévio: trabalha-se muito com probabilidade usando linguagem comum, e quando chega nesse conceito é comum meter logo sua notação simbólica de um evento está para a ocorrência do outro patatimbas a intersecção dos eventos… Ok, podemos trabalhar com probabilidade usando notação simbólica, mas é preciso que seja um processo gradual, e não cair de paraquedas exatamente quando entra nesse assunto, e depois nunca mais usar após mostrar sua linda forma simbólica.
  2. Omissão de informações no enunciado: é certo que se sabemos a probabilidade de um evento, sabemos também a probabilidade de seu evento complementar. Porém para fins didáticos não custa deixar claro quais são suas probabilidades complementares… mas não é isso que acontece, geralmente vemos um enunciado com o mínimo de informações, esperando que a pessoa deduza as demais a partir do que é dado. Se fosse um processo seletivo, ok, mas em um momento de aprendizagem inicial, isso é péssimo.
  3. Preocupação com aplicabilidade: de tantos assuntos curriculares que estão lá por mero formalismo, parece que esse em particular traz uma responsabilidade de “mostrar serviço” aos estudantes, de justificar porque foi necessário aprender tanta coisa até agora, para finalmente chegarmos em algo útil, e dai vem uma série de contextos. Fala-se por exemplo de testes de exames médicos com resultados falso-positivo, falso-negativo, contextualização com testes de gravidez, teste de COVID… novamente, não vejo erro algum nisso, somente que há uma quebra no ritmo com que os contextos ultra-realistas aparecem, vindo uma montanha desses contextos de uma só vez, e logo mais desaparecendo, voltando para os contextos fictícios ou sequer,descontextualizados.
  4. Dificuldade interpretativa: dinossauros vem de ovos, sabendo o dinossauro, queremos determinar a chance dele ter vindo de um tipo específico de ovo! Nesse contexto fictício (exceto para os adeptos da sociedade reptiliana), temos claro o que é o resultado, e que buscamos descobrir a chance dele ter vindo de uma determinada situação. Porém, em problemas envolvendo o Teorema de Bayes, vemos enunciados que requerem uma interpretação do que é cada parte, e interpretar errado, leva a um erro na resolução.
  5. Mistura de representações: esse é um conceito por vezes tratado de forma textual, com os valores de probabilidade dados, outras vezes por tabelas, e ainda algumas vezes por ambas as formas combinadas. Não acho errado o exercício de variar as representações, porém em fase de aprendizagem, essa variação deve ser a princípio didática, de preferência sem o conceito do Teorema de Bayes atrelado, para depois de consolidado as mudanças de representação, utilizá-las com o Teorema de Bayes.

Enfim, são algumas das minhas reflexões sobre esse assunto, que estavam querendo escapar da minha cabeça (pelo nariz, em forma de uma substância verde rsrsrs).


Como referenciar este conteúdo em formato ABNT (baseado na norma NBR 6023/2018):

SILVA, Marcos Henrique de Paula Dias. Teorema de Bayessauro. In: UNIVERSIDADE ESTADUAL DE CAMPINAS. Zero – Blog de Ciência da UnicampVolume 14. Ed. 1. 2º semestre de 2025. Campinas, 6 de dezembro de 2025. Disponível em: https://www.blogs.unicamp.br/zero/6151/. Acesso em: <data-de-hoje>.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *