segunda-feira, outubro 04, 2010

Sondagens no Brasil: muito barulho por nada?

Os resultados (quase) finais (99,99% das secções apuradas) da 1ª volta no Brasil foram os seguintes:

Dilma Rousseff: 46,9%
José Serra: 32,61%
Marina Silva: 19,33%

A abstenção foi, como sempre, relativamente baixa (18,12%). O voto "obrigatório" (ponho com aspas porque a coisa é complicada, havendo eleitores para quem o voto não é obrigatório e mais algumas complicações, ver aqui) ajuda. Outra coisa que costuma estar associada a uma abstenção baixa é uma alta proximidade entre os resultados das últimas sondagens e aqueles que acabam por ser os resultados finais. A razão é simples: em sistemas com alta abstenção, as intenções de voto recolhidas anteriormente têm menor probabilidade de se concretizarem. E se, por alguma razão, aqueles que declaram uma intenção de voto e votam forem diferentes daqueles que declaram uma intenção de voto e não votam, é óbvio que vai haver, ceteris paribus, uma maior discrepância entre as sondagens e os resultados eleitorais. Em países com alta abstenção, a única maneira de lidar com isto é ter bons modelos de "votantes prováveis". Mas o que é um bom modelo de "votantes prováveis" é algo que pode mudar de eleição para eleição. No Brasil, essa dificuldade não se coloca de forma tão grave como noutros países (Portugal, por exemplo, e Estados Unidos, ainda mais).

No Brasil, nas eleições de  2006, 1º turno, Lula teve 48,6%, seguido de Alckmin (41,6%) e Helena (6,9%). Nessa altura, se excluirmos a sondagem da Sensus (feita no dia 24 de Setembro), as restantes (conduzidas pelo Ipespe, Vox Populi, Datafolha e IBOPE) deram resultados que não foram muito diferentes daqueles que vieram a ser os resultados das eleições. Em todos os casos, Lula e Helena tiveram pior resultado nas eleições do que nas sondagens, e o inverso sucedeu com Alckmin. Mas a média dos desvios absolutos entre o resultado eleitoral dos três principais candidatos e o resultado da última sondagem foi de 4,3 pontos para a Vox Populi, 2,4 para Datafolha e IBOPE e 2 pontos para o Ipespe.

Isto é "bom" ou é "mau"?  Para termos um ponto de comparação, podemos usar as últimas presidenciais portuguesas. Aí, a média dos desvios absolutos para os três maiores candidatos, nas sondagens conduzidas logo antes das eleições, oscilou entre 1,3 pontos (Católica) e 3,2 pontos (Eurosondagem). Logo, uma conclusão rápida é que, apesar da "pressão para o erro" causada por uma maior abstenção em Portugal, há qualquer coisa a causar maiores discrepâncias entre as sondagens brasileiras e os resultados eleitorais. E julgo que é evidente que a gigantesca diferença de escala e as dificuldades colocadas pela realização de trabalho de campo no Brasil têm de ter um papel aqui. Imaginem o que significa tentar chegar a contactar pessoas que vivem em prédios com segurança armada à porta, em favelas ou em zonas rurais inacessíveis. Para lidar com isto, os institutos brasileiros utilizam amostras muito grandes - a última sondagem da Datafolha tinha 20.960 inquiridos!  - e, quase invariavelmente, amostragem por quotas. Mas a amostragem por quotas tem problemas potenciais, a começar pela qualidade da informação censitária e indo até à própria escolha das quotas relevantes. Talvez um ponto de comparação mais relevante sejam as eleições presidenciais americanas: aí, "a média dos erros médios" anda pelos 2,8 pontos percentuais. Os resultados do Ibope e da Datafolha foram, deste ponto de vista, "normais", e o que é "anormal" são os resultados das sondagens portuguesas.

Como correram as coisas nesta 1ª volta de 2010? Vejamos as últimas sondagens que julgo terem sido publicadas antes da eleição (votos válidos):

Datafolha (1 e 2 de Outubro): Dilma, 50%; Serra, 31%; Marina, 17%.
IBOPE (27 de Setembro): Dilma, 51%; Serra, 31%; Marina, 17%.
Sensus (28 Setembro): Dilma, 54,7%; Serra, 29,5%; Marina, 13,3%.

Isto corresponde a uma média de desvios absolutos de 2,3 pontos para a Datafolha, 2,7 para o Ibope e 5,6 para a Sensus. Logo, para Ibope e Datafolha, valores muito próximos dos de 2006 (como sucede de resto para a Sensus, que já em 2006 tinha estado muito longe dos resultados finais).

Pelo que leio, há agitação no Brasil pelos "falhanços" das sondagens. Mas de um ponto de vista estritamente técnico, não vejo bem porquê. Os dois institutos mais prestigiados ambos apontaram para a impossibilidade de determinar se Dilma ganharia à 1ª volta. Ambas as sondagens sobrevalorizaram Dilma, mas em 2006 ambas tinham sobrevalorizado Lula, sendo de resto habitual que um candidato claramente favorito acabe por ter nas eleições resultados piores que nas sondagens (seja porque os seus apoiantes, tendo segurança de vitória, se desmobilizam ou votam noutros candidatos seja porque os apoiantes de outros candidatos se inibem de mostrar uma intenção "minoritária" aos inquiridores). Muito barulho por nada, aqui.

Já na sondagem à boca das urnas ("boca de urna", no Brasil), a coisa complica-se um pouco. Em princípio, uma boca de urna resolve dois problemas: primeiro, mede comportamentos de votantes, não intenções de potenciais votantes; segundo, tem menos problemas amostrais, porque não tem de encontrar as pessoas nos seus domicílios, mas apenas à saída do local de voto. Aqui, 51% para Dilma, como sucedeu na boca de urna do IBOPE, sugere problemas na selecção dos locais de voto, na capacidade para seleccionar uma boa amostra de eleitores ou em ajustar em relação a recusas. O último ponto costuma ser muito relevante. Recordem-se que, naturalmente, a recolha dos votos numa boca de urna continua a depender da colaboração voluntária de eleitores. E se houve recusas maiores da parte dos apoiantes de Serra ou Marina (e incapacidade das empresas para ajustar resultados a essas recusas), uma coisa destas pode suceder, mesmo numa boca de urna. Mas é só uma hipótese.
Enviar um comentário