Em busca da estatística perfeita #DivãDaPós
O blog está parado há pouco mais de um mês, e isso se deveu a um experimento gigantesco do meu mestrado e de uma outra colega de laboratório e que foi realizado na 5ª e na 6ª da semana passada (dias 15 e 16 de março). E quando eu falo que é um experimento gigantesco, acreditem… É tão grande que quando a gente vai realizá-lo, praticamente interditamos o laboratório – tanto porque a gente precisa de muita mão de obra, quanto de material e equipamentos. Na quinta-feira, o experimento começou às 7h30 às terminou às 20h – eu extendi até as 22h pra terminar dois ciclos de centrifugação – e na 6a conseguimos terminar às 18h.
O melhor de tudo foi o chefe ter me pedido para tabular todos os dados, montar os gráficos e fazer análise estatística de tudo para a segunda-feira seguinte! O detalhe é que não são dados de apenas 2 dias de experimento… Esses dois dias foram apenas o final, no qual a gente consegue o material para as análises futuras. Na verdade esse experimento durou 18 dias – e a minha tarefa do final de semana envolvia todos os dados desses 18 dias!
Chellenge accepted.
Passei meu sábado inteirinho (literalmente) digitando números no excell… depois fiz os cálculos necessários para obter os valores para plotar os gráficos.
Montar gráficos no programa estatístico. (check)
[é claro que, na segunda-feira, o chefe pediu pra mudar umas contas e refazer todos os gráficos]
Chegou, então, o momento cruel: fazer a análise estatística!
Nada contra estatística, na verdade eu até curtia ficar calculando média, variância e desvio padrão na calculadora nas aulas/provas de bioestatistica. Mas a questão que eu queria levantar aqui é que hoje temos pacotes estatísticos fantásticos e muito acurados, mas o problema é que tem muita gente que não tem a menor ideia de qual teste é o melhor a fazer. [alguém se identifica???]
Nas aulas de estatística, ficamos muito presos a fórmulas, e a forma de aplicação acabam ficando esquecidas. Não interpretem que estou dizendo que saber como calcular um teste t é desnecessário, mas pra a minha realidade atual como pesquisador saber se o teste t é o meu teste de escolha é mais importante, pois há uma infinidade de programas que podem fazer esses cálculos pra mim!
E o bendito valor de “p”. O que é mesmo que ele significa? Ele só mostra que o resultado é estatisticamente significativo? O que significa dizer que algo é significativo? É uma verdade absoluta?
Desde que li, há mais de um ano, o texto “Check list”, do Mauro, aqui no SbBr, eu passei a me preocupar um pouco mais com isso. Desde então, eu estou na busca por entender um pouquinho mais o que fazer com meus resultados… Com a finalidade de não simplesmente usar teste t pra tudo [acho que, inclusive, no excell a gente consegue fazer teste t para mais de três grupos de dados] ou usar, sem questionar, o teste que o programa estatístico sugere, mas poder escolher o teste que realmente se aplica para a analise daqueles dados.
Nesses 5 anos no lab, cansei de ver gente gente fazendo diferentes disciplinas de estatística na pós-graduação. Todo mundo elogia pra caramba a que é ofertada pela Escola de Veterinária, mas quando você pergunta alguma coisa, ninguém sabe explicar… o mesmo com a disciplina da PG da Medicina. Então, será que pelo jeito, entender estatística é entrar num beco sem saída? Eu acho que não… mesmo não tendo encontrado muitas plaquinhas de orientação.
Já passaram pelas minhas mãos pelo menos 4 livros, nenhum deles me foram úteis era o que eu procurava… Todos muito focados nos cálculos e tão extensos/complexos/chatos que acabei desistindo deles. Esta semana consegui um que promete exatamente o que eu procuro, estática sem conta uma abordagem mais textual/científica e menos matemática [ele mostra as fórmulas, propõe aplicações e exercícios]. Agora é esperar pra ver.
O André, autor do blog Cognando, escreveu o texto “Quem tem medo de estatística? – parte I” (publicado no CogPsi). Aqui, o André apresenta e desmistifica alguns conceitos básicos, além de levantar questões para próximos posts (que eu estou aguardando ansiosamente). [e se você não sabe, ele participou no Nerdcast #302 – Notas mentais sobre neurociência].
O “Meio de Cultura” também está no Facebook e no Twitter. Você também pode receber nossas atualizações no seu email!
Quando vc descobrir, conta pra gente! 🙂
Acho que nunca vou descobrir... mas posso tentar chegar perto 😉
A primeira parte do seu post me lembra uma paródia que cantava nos meus tempos de doutorado...
"Levava uma vida sossegada, gostava de sombra e água fresca... Aí resolvi fazer doutorado..."
Abraços
Esse problema relatado é simplesmente um retrato do situação da educação Brasileira. Esperaria que em curso superior exigisse o raciocínio, livre pensamento e crítica, porém sabemos que não é assim que acontece. Geralmente os questionadores são ditos como chatos e o ensino acaba sendo Jesuíticos (eu falo você escuta)
What this Greek scholar discovers is, the students in another country learn Greek by first learning to pronounce the letters, then the words, and then sentences and paragraphs. They can recite, word for word, what Socrates said, without realizing that those Greek words actually mean something. To the student they are all artificial sounds. Nobody has ever translated them into words the students can understand. I said, “That’s how it looks to me, when I see you teaching the kids ‘science’ here in Brazil.” (Big blast, right?)
Livro: "Surely You're Joking, Mr. Feynman!": Adventures of a Curious Character: Adventures of a Curious Character
by Richard P. Feynman
Não tem jeito. Pode parecer chato, mas você só aprende estatística conhecendo como se calcula teste t, anova e outros testes "na mão". Só assim você vai ver que as premissas e limitações de cada método devem ser respeitadas para que o resultado seja útil.
O principal problema que vejo nos alunos mais novos é o uso indiscriminado de pacotes estatísticos e das suas "sugestões". Ou fazer algum teste que "todo mundo usa", sem saber se esse é o melhor teste para os seus dados. Ou ainda pior, colocar os dados no excel e mandar ele fazer "uma reta", sem saber que isso é uma análise estatística que tem premissas e limitações.
Recomendo um artigo interessante sobre estatística, que fala um pouco sobre os perigos do uso indiscriminado e como ela pode validar qualquer dado, dependendo de como você usa:
http://oikosjournal.wordpress.com/2012/02/16/must-read-paper-how-to-make-any-statistical-test-come-out-significant/
E claro, temos que sempre voltar a um ponto central. Você nunca deve escolher um teste estatístico que se aplique aos seus dados. Você deve gerar dados que se apliquem aos testes estatísticos que você previamente pesquisou.
Oi Samir! Bem legal o teu texto, a situação é bem essa! A maioria dos estudantes sabe que TEM que usar estatística, mas não sabe como, nem onde e, muitas vezes, nem porquê! (Em geral, porquê o orientador mandou...)
Eu adoro estatística! Não domino plenamente todos os testes e ainda estou descobrindo as ferramentas do programa que utilizo, mas o livro que me ajudou a entender bem a teoria é o que recomendo abaixo:
Callegari-Jacques, Sídia Maria . Bioestatística: Princípios e aplicações. Porto Alegre: ArtMed, 2003. v. 1. 255p .
Boa sorte na tua busca! Abraço
hahaha adorei a foto da menina descabelando... vou colocar na porta do meu gabinete e escrever: "if you're for stats, get it together before knocking" hahahahaha
Concordo com o @Luiz Bento. O proliferação de "receitinhas estatísticas" é uma praga...e o que mais tem é livro ensinando receitinhas de testes estatísticos...
Sem querer fazer propaganda -- mas já fazendo -- o meu livro sai no segundo semestre de 2012. O título era pra ser algo do tipo: "Ihhh Fudeu! Estatística de novo". Mas a editora barrou... hahah.
O que eu tentei fazer no livro foi colocar em prática uma idéia que eu sempre tive sobre estatística: vc só aprende estatística FAZENDO estatística... e fazendo estatística com dados que são relevantes para você... Daí meu livro é do tipo HANDS-ON do início ao fim (sem contar que utilizo uma plataforma/linguagem GRATIS que qualquer um pode baixar e usar!!) Fica a dica!! 🙂
A parte II do texto com http://cog-psi.blogspot.com vai sair logo!!! Espero!
A.
SPSS, fio. SPSS...
> R summary(R)
$ganho1 = conhecimento dos seus dados através de análise exploratória dos dados
$ganho 2 = pode fazer QUALQUER teste estatístico sem precisar da instalação de milhões de softwares (e alguns pagos)
$ganho 3 = entender o que tá fazendo!
$perda = algum tempo no começo
$ganho 4 - visualização de dados no R é fora do comum (o R foi na verdade desenvolvido como uma extensão do S e S-Plus para visualização de dados)
$ganho 5 - FREEEEEEEEEEEEEE
lol
Pessoal, e que tal, quando possível, uma parceria com estatísticos/alunos de Estatística? A Estatística precisa das outras ciências para ser realmente útil, então por que não pensar em colaboração? Uma etapa importantísima de todo exeperimento é o planejamento e dele devia participar sempre alguém que entenda bem de Estatística, sob risco de você ficar logo depois com um monte de dados que não servem para muita coisa. Já aconteceu várias vezes comigo, na época que eu dava assessoria no meu Laboratório: estudantes, principalmente de Medicina, chegavam com seus conjuntos de dados prontos, mas após alguns questionamentos já mostrávamos que tinha havido erro em alguma etapa e o estudo perdia validade.
Em geral os cursos de Estatística possuem uma atividade em que os alunos de último período devem prestar assessoria a pesquisadores. Aproveitem. Abraço.
Prof. Benito Olivares Aguilera
Depto. de Estatística/ UFPR