Popularidade do Lula cai, Dilma come poeira…

Saiu ontem a nova rodada de pesquisas CNT/Sensus, que indica uma queda na popularidade do presidente Lula e dificuldades para os planos eleitorais da ministra Dilma Roussef.
Mas este é um blog de ciência, não de política – na maior parte das vezes, ao menos – então, por que diabo estou falando nisso? Basicamente, porque pesquisas de opinião pública são um instrumento científico, e é interessante entender melhor o que elas significam. Para isso, é preciso ter uma noção do que significam a margem de erro, o nível de confiança e a própria pesquisa.
No Brasil, a mídia raramente divulga o intervalo de confiança das pesquisas de opinião. Talvez seja para não confundir. Já nos EUA é comum ver coisas como “margem de erro de 3%, 19 de 20”. O “19 de 20” significa que o intervalo de confiança é 95%. Afinal, o que essas coisas querem dizer?
Bom, primeiro, a pesquisa: uma pesquisa de opinião pública, se bem executada (não vale, por exemplo, criar perguntas que já vêm com a resposta embutida, ou entrevistar só gente que concorda com você), é um retrato da opinião da população visada no momento em que a pesquisa é feita. Ela não prevê o resultado das eleições; apenas diz o que as pessoas estão pensando naquele momento.
A margem de erro é a variação esperada entre o resultado da pesquisa feita por amostragem (no nosso caso, ouvindo apenas alguns milhares de pessoas, em vez de milhões de eleitores) e o de uma outra pesquisa, hipotética, que tivesse realmente ouvido todo mundo.
Quando a CNT/Sensus diz que sua margem é de 3%, o que ela está dizendo é que, se tivesse entrevistado todos os eleitores brasileiros (em vez de apenas 2 mil) o resultado estaria dentro de uma margem de 3 pontos percentuais do obtido na pesquisa realmente feita.
E aí aparece a questão do intervalo de confiança. Digo, com que grau de segurança pode-se afirmar uma coisa dessas? Que uma pesquisa de 100% da população, que não foi feita, teria um resultado dentro de determinada margem?
Nas pesquisas americanas, essa questão é respondida pela expressão “19 de 20”: com isso, estão dizendo que, se a pesquisa fosse repetida 20 vezes, em 19 delas (ou, em 95% dos casos) o resultado ficaria a, no máximo, 3 pontos percentuais de distância do que seria apurado se ouvíssemos todas as pessoas. Em outras palavras, há uma chance em 20 de que o resultado da pesquisa esteja fora da margem de 3 pontos, por puro azar.
Não chega a surpreender, portanto, que é o intervalo de confiança desejado que determina o cálculo da margem de erro. E é uma conta extremamente simples: para um intervalo de confiança de 95% (ou “19 de 20”) basta dividir 98 pela raiz quadrada do total de pessoas entrevistadas. Para a pesquisa CNT/Sensus, o resultado é 2,19%. Mas eles anunciaram a margem de erro de 3%! Arredondaram quase um ponto percentual para cima?
Ou isso, ou talvez estejam trabalhando com um intervalo de confiança maior. Digamos, de 99 em 100 — isto é, espera-se que, de cada 100 repetições, 99 caiam dentro da margem. Para calcular a margem de erro nesse intervalo, basta dividir 129 pela raiz quadrada do total de entrevistados. Isso dá 2,88%, uma aproximação muito melhor de 3%.
(Checando o site da CNT, encontrei o relatório completo da pesquisa, que realmente indica um intervalo de confiança de 95%, não 99%. Isso pode ser um arredondamento cauteloso para cima, ou algum tipo de correção necessária por conta da forma como foi selecionada a amostra; as contas com 98 e 129 só valem para as chamadas amostras aleatórias simples).

Discussão - 7 comentários

  1. Tatiana disse:

    Que ótima ideia explicar como funcionam as pesquisas de opinião e um pouco da análise estatística!

  2. Tatiana disse:

    ah, e só um toque: o último link (amostras aleatórias simples) ñ tá funcionando

  3. cretinas disse:

    Faltou o h do http... Desculpe!

  4. Gatoso disse:

    Cabe destacar como no Wikipedia não há o equivalente traduzido para português. Talvez o que leve a população à ingenuidade seja a falta de informação confiável disponível.

  5. Joao disse:

    Bem. Margem de erro, intervalo de confiança, tudo bem. Mas senti dificuldade no entendimento de como a opinião vira estatística e vice-versa. Pense comigo... Se para verificar se uma sopa que minha mãe fez está boa sem precisar bebe-la toda, eu preciso um método amostral consistente que me leve a mexer bem a bendita (a sopa e não a minha mãe, convenhamos...) para evitar distorções na amostra (colherada que darei com sal devidamente distribuído na totalidade da sopa), por exemplo, imagine o que devo "mexer" quando a "amostra representativa" trata-se de uma opinião sobre algo? A sopa a gente até entende o porquê da mexidinha ser tão importante. Mas como é isso com gente humana assim, tão contraditória? A elegância corretiva da "margem de erro" e do "intervalo de confiança" traduzem bem o que de contraditório pode existir numa "opinião"? Fico tão escasquetado com essa coisas.

  6. cretinas disse:

    João,
    não superestime o poder da pesquisa. O que ela revela -- se for bem realizada, e a amostra for realmente aleatória (ou uma aproximação boa o suficiente) -- é de que forma cada fração da população responde, num dado momento, à pergunta feita pelo pesquisador. O que essa resposta realmente "significa" é um outro problema...

  7. Joao disse:

    C.
    Tudo bem. Não superestimo. Por isso mesmo ponderei. Mas convenha que o que chamamos de "opinião" é justamente o que essa resposta "significa". Eu observo as vezes com certa curiosidade a maneira como se produz enunciados de certos resultados a partir de agregações matemáticas (não necessáriamente estatísticas). Veja o caso do " O povo de São Paulo elegeu Kassab". O voto é um ato individual, secreto, etc. O povo é um conceito vago, cheio de nuances a respeito do partilhar de individuos as condições de um dado ambiente socio-politico-cultural num dado espaço geográfico... Como o voto (individual) se tranforma em "escolha coletiva"? Veja,aqui não estou falando nem mais em pesquisa, mas no resultado de uma eleição. Isso para mostrar que não estou duvidando da eficácia da pesquisa, mas desse arbitrio contido que é sim "um outro problema"... E que faz parte do problema principal ao meu ver que é trazer a linguagem estatística para o vernaculo mundano. Concordo com vc nos seus objetivos: esclarecer o que são intervalos de confiança e margem de erro para o universo estatístico (objetivo do seu texto, se não me engano) ajuda a entender o que se pode dizer do que os dados dizem. Mas não me pouparia da pergunta: o que se pode dizer desses dados quando é preciso tirá-los da liguagem que os produziu?

Envie seu comentário

Seu e-mail não será divulgado. (*) Campos obrigatórios.

Categorias

Sobre ScienceBlogs Brasil | Anuncie com ScienceBlogs Brasil | Política de Privacidade | Termos e Condições | Contato


ScienceBlogs por Seed Media Group. Group. ©2006-2011 Seed Media Group LLC. Todos direitos garantidos.


Páginas da Seed Media Group Seed Media Group | ScienceBlogs | SEEDMAGAZINE.COM