segunda-feira, janeiro 23, 2006
Hibernação
Obrigado pelos e-mails e comentários e ligações nos vossos blogues. E desculpem as irritações ocasionais, mas a blogosfera é como as famílias: we only hurt the ones we love. E eu gosto mesmo disto.
Mas para já, chega de sondagens.
Rescaldo 2
Muito próximo do que se passou em 2001 e em todas as sondagens à boca das urnas desde aí: grande precisão. Ao contrário do que se tem passado até agora, SIC e Eurosondagem muito próxima (para todos os efeitos, igual) dos restantes canais e institutos. Católica com ligeira vantagem na questão da margem de vitória.
Rescaldo 1
1. As sondagens Intercampus e Pitagórica foram conduzidas antes das restantes, o que diminuiu à partida a sua capacidade para captar mudanças de preferências nos eleitores ocorridas mais perto do acto eleitoral;
2. Os resultados apresentados no quadro para a Pitagórica resultam de uma redistribuição proporcional de indecisos. O JN não apresentou esses resultados, e sim apenas resultados anteriores à redistribuição de indecisos. A redistribuição é feita apenas para o fim de tornar os resultados da sondagem comparáveis com resultados eleitorais, seguindo prática académica comum já aqui muitas vezes mencionada e fundamentada.
3. Calculam-se dois tipos de erro: Método 3 (a média dos desvios absolutos) e Método 5 (a diferença entre a margem de vitória prevista e a margem de vitória de real na base dos dados publicados de acordo com a opção dos institutos). Para mais informação sobre isto, ver estes posts e as referências lá citadas. A sua aplicação neste momento não vai ser na versão mais completa e "canónica" - que exige umas operações adicionais - mas isso, para o fundamental, não vai fazer diferença. Quando houver resultados eleitorais definitivos far-se-á a versão completa.
Compreensivelmente, as sondagens cujo trabalho de campo foi conduzido mais longe das eleições ficaram mais longe dos resultados, apesar de a Intercampus, apesar de tudo, ter ficado mais perto que a Eurosondagem. Quanto àquelas que são realmente comparáveis entre si e com os resultados eleitorais - as da última semana - a Católica ficou mais perto do ponto de vista do desvio absoluto médio e a Marktest do ponto de vista da margem de vitória. Mas as diferenças entre estas e a da Aximage carecem de qualquer espécie de significado. Para todos os efeitos, foram igualmente precisas. Curioso, assim, verificar que diferentes metodologias e dimensões amostrais podem gerar resultados igualmente fiáveis. E curioso também que, uma vez mais, a margem de vitória é sempre sobrestimada, tal como em 1996 e 2001.
Como se compara isto com o passado? Uma visita aqui revelará que as sondagens pré-eleitorais nas presidenciais de 2006 foram substancialmente mais precisas do que as realizadas em 1996 ou 2001. Isso sucede mesmo quando tomamos em conta o facto de o desvio absoluto médio ser sensível ao número de estimativas feitas (quantas mais, menor o erro médio). Assim, por exemplo, com cinco candidatos em 2001, a média dos "desvios absolutos médios" para a várias sondagens foi de 3,9%, enquanto que em 2006, para os cinco primeiros candidatos, foi de 1,6%. (para as sondagens da última semana). Em 1996, com dois candidatos, a média dos desvios absolutos médios foi de 3,2%. Em 2006, apenas para os dois primeiros candidatos, foi de 2%. Mas nas legislativas de 2005 as sondagens ainda foram mais precisas...
Em resumo, resultados muito apresentáveis quer em comparação com o passado quer em comparação internacional.
sexta-feira, janeiro 20, 2006
Afinal volto...
Primeiro, se não for grande incómodo, gostava de ser citado correctamente. O "tema que se encontra resolvido" noutros países é o da adopção de standards sobre como se apresentam resultados de sondagens, e não o da "suspeição sistemática sobre as intenções por detrás da apresentação deste ou daquele resultado". Sendo também certo que as confusões evitáveis no primeiro domínio contribuem bastante para a suspeição. E se se quer saber como se evitam, pode-se consultar isto e isto.
Segundo, a ideia de que "a opção dos media em divulgar resultados que não consideram a fatia de indecisos, nem os votos em branco, parecendo ser uma opção técnica, é principalmente uma opção ética – de má ética jornalística" é errada. Os media divulgam (ou devem divulgar, e na sua maioria fazem-no) ambos os resultados, os brutos e aqueles que são comparáveis com resultados eleitorais. Não divulgar os segundos seria, isso sim, uma enorme irresponsabilidade. Não sei como fazer isto sem me repetir, mas as percentagens de "indecisos" e "abstencionistas" são altamente sensíveis a variações nos formatos dos questionários e em metodologias de inquirição, o que significa que nem eles são directamente comparáveis entre si nem os restantes resultados brutos, por arrastamento, o são.
Isto não quer dizer que os resultados brutos sejam irrelevantes. Por isso mesmo podem e devem ser publicados (e, com raras excepções, são-no).
Ok? Podemos partir para outra?
O futuro
O que pode trazer o futuro? Antes de mais, convém dizer que, como é óbvio, não faço ideia. Ou melhor, faço pelo menos duas. O problema é que são contraditórias em termos do desfecho que podem gerar:
1. O primeiro cenário é aquele onde Cavaco Silva vem em perda de intenções válidas de voto não só porque os indecisos da área socialista se começam a decidir (e presumivelmente não por ele) mas também porque começa a perder votos de eleitores que antes tencionavam nele votar. Na primeira sondagem da tracking poll Marktest, divulgada dia 9, Cavaco recolhia o voto de 17% de eleitores socialistas. Na sondagem Marktest dos dias 11-14 de Janeiro, 15% dos socialistas tencionavam votar Cavaco. Na sondagem dos dias 15-18, essa percentagem é 9%. Um erosão comparável, se bem que muito menos significativa em termos absolutos, ocorre com os exóticos comunistas que, nas sondagens anteriores, tencionavam votar Cavaco. Agora, pelos vistos, não há nenhum. Cavaco necessitava destes votos - assim como daqueles que não são próximos de qualquer partido político - para a maioria absoluta. Agora, não é seguro que os tenha, seja porque se estão a desmobilizar à última hora seja porque decidiram "voltar ao redil" de um voto orientado pela identificação partidária e ideológica.
É certo que estas sondagens e o ambiente geral do comentário político vêm minimizando os riscos ligados a uma outra possibilidade que já discuti aqui, o de "abstenção por certeza de vitória", que afectaria de forma diferencial o eleitorado potencial de Cavaco Silva. Não me parece que isso continue a ser um factor de peso: certezas sobre o resultado já ninguém com dois dedos de testa consegue ter. Mas se Cavaco vem perdendo o eleitorado socialista e apartidário de que dispunha até agora - seja porque ele se assustou com a prometida vigilância às actividades do Governo, seja porque a identificação partidária e ideológica fala mais forte, seja ainda por desinteresse em torno de uma opção que, para eles, nunca terá sido particularmente entusiasmante e inequívoca - então a segunda volta está aí ao virar da esquina.
2. Há, contudo, pelo menos uma outra possibilidade. A de que, curiosamente, a abstenção diferencial afecte mais os candidatos de esquerda do que Cavaco, especialmente, diria, Alegre e Louçã. Sabemos que a abstenção declarada em sondagens é sempre inferior à abstenção real. E a verdade é que, em todas as sondagens cujos dados publicados permitem esta análise, o eleitorado de Cavaco foi-se sempre mostrando mais convicto da sua decisão de votar e da sua decisão de em quem votar. Na medida em que não haja uma desmobilização "táctica" por certeza de vitória - possibilidade que, como disse, me parece diminuída pelos eventos desta última semana - eles estão lá, seguros da sua decisão, prontos para ir votar.
E os outros, estão? É certo que há o famoso "povo de esquerda" que se foi escondendo das sondagens até agora, como Medeiros Ferreira sugeria desde o início. Tal como os últimos resultados mostram, tinha, num certo sentido, razão, como aliás lhe dei na altura:
Diria que é altamente presumível que, neste momento e para estas eleições concretas, muitos eleitores de "esquerda" não tenham ainda, pura e simplesmente, decidido o que vão fazer, em face da multiplicação de candidatos, dos sinais confusos e contraditórios emanados inicialmente pelo Partido Socialista, da insatisfação de algum eleitorado PS com a actuação do governo, etc. É possível, e provável, que muitos desses indecisos se venham a abster, mas certamente muitos deles irão também acabar por votar num dos candidatos de esquerda (não excluindo, claro, que alguns venham a votar em Cavaco Silva).
Esse "povo" apareceu finalmente, abandonando progressivamente a sua indecisão e declarando nas sondagens as suas intenções (se bem que talvez não no sentido que Medeiros Ferreira desejaria). Mas a pergunta que fica é esta: vão mesmo votar? Vão votar tanto como os agora declarados eleitores de Cavaco Silva? A abstenção, quem dela vem e quem para ela passa, é, como sempre, a chave dos resultados eleitorais, muito mais do que as transferências de voto deste para aquele partido ou candidato. Não é um acaso, portanto, que todos os candidatos apelem de forma dramática e quase desesperada à participação eleitoral. Da resposta diferencial a esses apelos depende o resultado de Domingo. A ver vamos.
A não ser que a sondagem Intercampus diga qualquer coisa de extraordinariamente surpreendente, só cá volto 2ª feira.
P.S.- Ontem na SIC, Rui Oliveira e Costa falava da especial dificuldade que estas eleições trazem para as sondagens à boca das urnas, devido ao facto de existir um candidato independente cujo peso presumível na amostra selecccionada não poder se apreciado à luz de resultados eleitorais passados. É por isso que as sondagens à boca das urnas são importantes e interessantes. Livres do problema das pré-eleitorais - a medição de intenções em vez de comportamentos - elas são o teste último aos procedimentos de amostragem adoptados por cada instituto, e são de facto a única altura em que a bondade desses procedimentos pode ser testada e melhorada em face de circunstâncias novas, como a candidatura de Alegre.
Tendência
Contudo, suspendam por momentos a descrença. Como apreciar a plausibilidade a ideia de que as preferências dos eleitores mudaram ao longo da campanha e pré-campanha? Três maneiras, por ordem crescente de sofisticação:
1. Comparar sondagens entre si mantendo constante o instituto que as produziu. Se nos concentrarmos nos institutos com mais observações ao longo do tempo - Aximage e Marktest - rapidamente verificamos que em ambas:
- Cavaco mantém-se estável até pelo menos até à primeira semana de 2006, descendo a partir daí;
- Alegre desce até à primeira semana de 2006, começando a subir a partir daí;
- Soares sobe até fim de Dezembro/início de 2006, descendo de seguida e estabilizando no final.
2. Smoothing:
As tendências são confirmadas quando ajustamos uma regressão local aos dados: Cavaco oscilante, com tendência final de descida; Alegre a descer até ao princípio de Janeiro, crescendo no final; Soares sobe até final de Dezembro, iniciando depois declínio e com estabilização final; Jerónimo e Louçã com tendência de lenta mas consistente subida ao longo do tempo.
3. Controlar "house effects":
O problema das abordagens anteriores é o facto de estarem ainda, porventura, excessivamente dependentes de quem faz as sondagens. Notem: se partirmos do princípio de que existem "house effects" - um enviesamento sistemático resultante do facto de um determinado instituto fazer um conjunto estável de opções metodológicas - então não devemos ficar surpreendidos com o facto da abordagem 2. repetir as conclusões da abordagem 1.: afinal, a Aximage e a Marktest foram que mais com sondagens para o bolo total.
Uma maneira de tentar chegar a um resultado "livre" de house effects é a avançada por Erikson e Wlezien, num artigo intitulado "Presidential Polls as a Time Series", no volume 63 da Public Opinion Quarterly (1999). Os que não gostam de estatística saltam para o parágrafo seguinte. Se regredirmos os resultados das sondagens em relação a variáveis dicotómicas (com valores 0 e 1) representando os institutos de sondagens que as fizeram (todos menos um) e as datas das sondagens, os coeficientes associados às variáveis temporais vão, se a constante for excluída da equação, representar as estimativas para cada candidato "livres" de house effects (ou seja, mantendo esses efeitos constantes).
Devido ao escasso número de sondagens, tive de definir as variáveis temporais como representando períodos e não datas singulares. Os resultados da análise são os seguintes:
Não tem os valores concretos porque, para o que conta (e por razões técnicas que não vale a pena explicar aqui), esses valores não são muito importantes e variam de acordo com algumas opções que se tomem na análise. O que importa, e é indiferente a essas opções, é a tendência. E essa é clara: independentemente dos efeitos que cada instituto de sondagens impõe - pelas opções técnicas que metodológicas que toma - nos resultados, Cavaco desce na última semana, Alegre sobe na última semana, Soares desde a partir de Dezembro e Jerónimo e Louça sobem com ultra-lentidão.
Era o que toda a gente já sabia? Pois. Mas assim a incerteza diminui.
Convergência
1. O facto de os resultados das sondagens até então parecerem ser afectados por algumas (poucas) mas aparentemente cruciais variações metodológicas.
2. E a hipótese de que as sondagens conduzidas mais perto das eleições acabassem por obter, por um lado, resultados substancialmente diferentes das precedentes, e por outro, mais convergentes entre si do que as anteriores.
Não é preciso grandes cálculos matemáticos para observar que a hipótese se confirmou, com excepção (no que respeita à dispersão) dos resultados de Manuel Alegre. O quadro seguinte, rudimentar mas suficiente, mostra a média e o desvio padrão associado aos resultados estimados para os diferentes candidatos em três períodos de realização do trabalho de campo:
Por que acontece este fenómeno? Várias hipóteses:
1. Mero acaso;
2. À medida que intenções de voto vão cristalizando e diminuindo o nº de indecisos sobre se irão votar e/ou em quem, as diferentes opções tomadas para os medir e redistribuir perdem impacto nos resultados;
3. À medida que nos aproximamos do dia das eleições, investimento em recursos por parte dos órgãos de comunicação social e dos institutos de sondagem aumenta;
Há ainda uma hipótese adicional, levantada aqui e aqui há uns meses a propósito das eleições no Reino Unido, que não pode ser completamente excluída.
Seja como for, há uma preocupação que é mitigada com estas últimas sondagens: temos de tudo. Telefónicas e presenciais. Escolha aleatória de inquiridos (Católica e Eurosondagem) e amostragem por quotas (Aximage e Marktest). Redistribuição proporcional de indecisos (Marktest, Eurosondagem), redistribuição por "inclinação de voto" (Católica) e redistribuição "mistério" (Aximage). Questionário sem (Marktest) e com (Católica) filtros para determinar prováveis abstencionistas. Os resultados convergem.
O facto de convergirem não quer dizer que estão a medir correctamente as intenções de voto no momento em que foram feitas (podem estar a ser afectadas por um enviesamento comum e indiferente às variações metodológicas) e muito menos que servem para prever seja o que for. Mas diminui a incerteza, o que já não é mau.
Os resultados
1. As sondagens estão colocadas por ordem crescente do último dia de trabalho de campo;
2. As últimas sondagens de cada instituto estão assinaladas no final, a azul.
3. A última sondagem Marktest tem um dia de trabalho de campo comum com a anterior que estava no quadro. Logo, retirei a anterior e deixei apenas a última.
4. A sondagem Aximage anterior foi também retirada do quadro e colocada apenas a divulgada hoje, já que as sondagens divulgadas nos últimos dias no CM resultam da acumulação de novos inquiridos à amostra inicial. Os pontos de interrogação dizem respeito aos elementos que a Aximage ou o Correio da Manhã decidiram não querer partilhar com os leitores, nomeadamente, os resultados brutos, para além do próprio método de redistribuição dos indecisos.
5. Deverá faltar aqui, pelo menos, a sondagem Intercampus para a TVI. Se existir - só deverá ser divulgada hoje à noite.
quinta-feira, janeiro 19, 2006
Últimas arrumações
Alexandre Picoito esclarece também que o tratamento de abstenção a que se aludia no JN "resulta de várias questões incluídas no questionário e cujas respostas ponderadas entre si, identificam uma 'projecção provável' de abstencionistas que são retirados das análises de voto". É, de facto, uma prática comum a outras sondagens, especialmente em países de abstenção elevada (a que nós, em bom rigor, começamos a pertencer).
O curioso destas coisas gostaria de saber exactamente como se constrói esse modelo. Mas aqui, admito, a curiosidade tem limites. Por um lado, não é fácil a qualquer órgão de comunicação explicar exactamente todos os pormenores destas coisas. E por outro, mais importante, os responsáveis dos institutos de sondagens não são obrigados a fazê-lo, e podem, se assim o entenderem, encarar estes modelos como uma propriedade intelectual que não desejam partilhar.
Muito diferente é a questão da redistribuição dos indecisos: ao contrário do que alguns ainda parecem julgar, é a própria legislação que obriga a que, "sempre que seja efectuada a redistribuição dos indecisos" se faça na ficha técnica "a descrição das hipóteses em que a mesma se baseia". Aqui não pode haver "segredo industrial". Mas isso nada tem a ver com a sondagem da Pitagórica: o jornal nem publicou os resultados após redistribuição dos indecisos e que as hipóteses que a empresa faz na sua análise, cujos resultados coloco agora no quadro, são claras, simples e evidentes: redistribuição proporcional.
quarta-feira, janeiro 18, 2006
Aditamento
Carta da Aximage, correcção e resposta minhas
Boa tarde,
Como responsável da Aximage gostaria de clarificar que:
1. Fazemos os questionários de acordo com a nossa percepção da actualidade.Ou seja, estudamos com humildade exaustiva os fenómenos que nos rodeiam, sem andarmos a ler (ou ouvir “recados”) “aqui” ou “ali”; 2. Nem tudo o que é perguntado é publicado. Por razões para mim óbvias do ponto de vista da investigação e da actualidade editorial.O leitor também sabe que essa era uma última pergunta, efectuada fora docontexto lógico das que permitiram publicar os resultados;
3 - As leituras feitas às nossas sondagens só vinculam quem faz as leituras,não as sondagens. Por motivos deontológicos também não comentamos a validade da forma como,noutras, estão formuladas as questões que conduzem à "passagem" da 1ª para a 2ª volta.
Melhores cumprimentos.
Suponho que se refere a este post.
Mas há uma mensagem data de hoje, que exige mais atenção (sublinhados meus):
E.mo Senhor,
Verifico que não deve ter recebido o meu mail de 14 de Setembro, sobre matéria em que a Aximage era citada. Encontrá-lo-á abaixo. Quanto aos comentários de hoje e ao tratamento dos nossos resultados tenho a dizer-lhe que considero cientificamente criticável, para dizer o mínimo, a distribuição que faz dos indecisos em trabalhos que não conduz/supervisiona. Contudo, atendendo ao carácter do media em que publica as suas conclusões, vamos "vivendo" com isso. Já me custa a aceitar, porque revela falta de seriedade intelectual, que o faça quando os responsáveis do trabalho, utilizando métodos que não o da simples máquina de calcular, publicaram esse dado. Que não dá, como é óbvio, 8%!
Cumprimentos,
João Queiroz
Aximage
Ora bem. Em parte, culpa minha. Numa sondagem anterior, já tinha sucedido que a Aximage tinha feito uma redistribuição de indecisos que não correspondia à distribuição proporcional pelas opções válidas. Parece-me perfeitamente legítimo que se tomem, para esse efeito - caso se queira fazer essa operação de redistribuição - as opções que se quiser. E foi por isso mesmo que, no quadro que aqui publico, segui os dados fornecidos pela Aximage. Basta ver o que se passou neste post. Logo, desta vez, o erro foi meu: não vi que, no corpo do texto da notícia do Correio da Manhã, são dados os resultados que decorrem das opções da Aximage de redistribuição de indecisos. São agora apresentados, com as minhas desculpas pelo lapso.
A questão com que fico, e creio com que alguns dos leitores do Correio da Manhã ficam, é esta: como, então, redistribui a Aximage os indecisos? Se não é com a "simples máquina da calcular", então como é? Teremos nós, os leitores do Correio da Manhã de hoje, o direito de saber? E terei eu algum impedimento deontológico que me impeça de fazer a pergunta?
E há um último aspecto para resolver: por que razão neste blogue se apresentam quer os resultados brutos quer os resultados após redistribuição de indecisos (da forma como os próprios institutos os redistribuem ou, na ausência dessa redistribuição, de forma proporcional pelos candidatos)? As razões são as seguintes:
1. Porque os diferentes resultados brutos dados pelas diferentes empresas não são comparáveis entre si, por razões já explicadas várias vezes neste blogue, por exemplo aqui.
2. Porque é a boa prática internacional, sancionada e confirmada dezenas de vezes em muitos estudos académicos, tais como este ou este, e sancionada em estudos da American Association for Public Opinion Research, como este.
3. Porque se assim não se fizer, se gera ainda maior confusão entre a opinião pública do que necessário, como sucedeu neste caso.
4. Porque essa confusão pode ser manipulada por responsáveis de institutos de sondagens com o objectivo de validarem injustificadamente o seu próprio trabalho, comparando, por exemplo, os resultados brutos (ou seja, ainda com indecisos ou abstencionistas) das suas sondagens com resultados eleitorais finais. Se querem um exemplo deste tipo de actuação, podem ir à Hemeroteca ler um artigo publicado na Visão, em 21 de Dezembro de 2001, intitulado "Não Matem o Mensageiro". As ironias do destino a que se sujeitam os que não têm memória...
Aximage, Presidenciais, 18 de Janeiro
terça-feira, janeiro 17, 2006
Questões sobre a tracking poll da Marktest
Uma das questões levantadas, de resposta simples, tem a ver com aparentes mudanças na composição etária da amostra. Ora parece-me aqui que pode haver confusão. Lendo as fichas técnicas de dia para dia, disponíveis aqui, verifica-se que a composição das amostras pelos três escalões etários usados se tem mantido estável. Só começa a mudar recentemente devido ao aumento progressivo da dimensão da amostra, mas apenas em termos absolutos, já que as diferenças em termos relativos (distribuição da amostra por estratos etários) são muito reduzidas. Nem podia ser de outra forma, dado ser uma amostragem por quotas e a idade entrar para a construção dessas quotas. Talvez tenha sucedido uma confusão na análise entre a composição das amostras e as das sub-amostras, tal como se assinala nos comentários ao post acima mencionado...
O segundo problema assinalado pelo David Santos é o facto de o PSD aparecer com intenção de voto maioritária nas legislativas em todas as sondagens. Aqui, creio que o autor do post se refere aos totais que aparecem em linha no ficheiro de resultados. Mas aqui deve haver outra confusão: estou a olhar, este momento, para os resultados da sondagem divulgada dia 16, onde o Martinho da Arcada vê 153 votos para o PSD e 150 para o PS. Mas eu vejo, com estes que a terra há-de comer, 179 para o PS e e 165 para o PSD. O que o David Santos está a ver são as intenções de voto nas legislativas daqueles que têm uma intenção de voto nas presidenciais. Pois, mas isso já todos sabíamos: o eleitorado do PS está mais desmobilizado e mais indeciso que os dos restantes partidos, logo está subrepresentado no interior da sub-amostra daqueles que têm uma intenção de voto nas presidenciais.
Estou a ver a coisa bem? Creio que sim. E assinalo, uma vez mais, que esta saudável conversa só existe porque a Marktest põe tudo cá para fora.
De gustibus non est disputandum
Tudo bem. Mas eu julgava que a citação do Patterson não tinha a ver quer com os efeitos das sondagens no comportamento eleitoral quer com as eventuais "falhanços" das sondagens como instrumentos de descrição da opinião pública ou previsão do comportamento de voto. Pensava sim que falava do efeito negativo que a colocação das sondagens no centro da cobertura jornalística da vida política pode ter para a qualidade do funcionamento da democracia.
Mas se calhar tenho de ler outra vez: vou aproveitar para ler uma versão amavelmente traduzida (obrigado!).
Marktest, Presidenciais, 17 Janeiro
segunda-feira, janeiro 16, 2006
Talvez o post mais importante deste blogue nos últimos meses
The use of polls can extend beyond reason. U.S. elections have reached that point. As reported by the American press, a campaign is a spectacular struggle: rapid followers, do-or-die encounters, strategy, tactics, winners, and losers. A campaign, to be sure, is all of these things, but it is more than these things. It is an opportunity to choose the nation's leadership. (...) America's poll-driven election coverage squeezes out content that would inform voter's judgment.
Poll-driven stories also distort the public's perceptions of the candidates. (...) Candidates are strategists, of course. But the fact that they dramatize their appeals and tailor their messages is nothing new. Such maneuvers are as old as politics itself. What is new is the penetrating intensity with which candidates' activities are exposed, dissected, and criticized. And it should occasion no surprise that as candidates have increasingly been portrayed as master of strategy and manipulation, Americans would think less highly of them.
Nor should it occasion surprise that American have soured on campaigns. Elections have become negative affairs filled with horse-race commentary and analysis. (...) Polling cannot be blamed for all or even most of the ills of American campaigns. But this powerful technique has taken its place alongside big money, negative advertising, attack journalism, and other developments that in combination have diminished American elections.
In Thomas E. Patterson, "Of Polls, Mountains: U.S. Journalists and their Use of Election Surveys", Public Opinion Quarterly, Vol. 69, nº 5, pp. 716-724.
Mais comentários e dúvidas
Há um apontamento seu, recente, que merece um pequeno comentário meu – de leigo. É em relação à comparação entre as últimas sondagens de 1996 e o resultado de Sampaio. Também já tinha analisado o assunto, mas encontrei uma explicação diferente. O diferencial terá resultado do facto de as sondagens retratarem apenas o comportamento dos eleitores no Continente. Por regra, a esquerda (neste caso, Sampaio) “perde” 1 ponto ou 1 ponto e ½ quando se consideram os eleitores das regiões autónomas e da emigração. Se for assim, o episódio não se repetirá com Cavaco... Enfim, no dia 22, saberemos.
Parece-me correcto. Não creio que isso chegue para explicar diferenças de tão grande magnitude, mas na medida em que o universo das sondagens seja - e é-o, invariavelmente - o dos eleitores do Continente, o comportamento diferencial dos eleitores das regiões autónomas e da emigração fará sempre alguma diferença. O que significa uma coisa: ceteris paribus, Cavaco estará, provavelmente, a ser ligeiramente subestimado nas sondagens em relação aos resultados totais finais.
2. De outro e-mail:
A chamada tracking poll, ao somar os resultados dos últimos 4 dias acaba por "mascarar" subidas ou descidas abruptas num dado dia porquanto se tem sempre em conta os três dias anteriores. Certo? E como se mede esse efeito?
Subidas ou descidas abruptas num dia são de facto "amortecidas" ao se juntarem os resultados dessa sub-amostra diária aos das sub-amostras anteriores. Isso, contudo, é uma coisa boa: nada nos garante que "subidas" ou "descidas" medidas através de uma amostra de 150 inquiridos sejam "subidas" ou "descidas" reais. Quando as sucessivas sub-amostras começam a mostrar sistematicamente as mesmas tendências, então sim, é provável que estejamos a ver mudanças reais. E isso será visível quer na comparação com os dias anteriores quer comparando as duas sondagens mais próximas com bases amostrais completamente diferentes, como faço nos quadros que aqui apresento.
3. De outro e-mail:
Porque é que as percentagens de Cavaco são inversamente proporcionais ao número de inquiridos, sendo estes directamente proporcionais com as de Soares?
Até certa altura, também me pareceu que, quanto maior a dimensão da amostra, melhores os resultados para Soares (e piores os de Cavaco). Contudo, assim que introduzimos a dicotomia quotas vs. aleatória como variável de controlo, o efeito da dimensão da amostra desaparece. Por outras palavras: o facto de amostras maiores estarem a dar melhores resultados para Soares parece resultar apenas do facto de sondagens com a amostragem aleatória terem sido, até certa altura, e tendencialmente, as sondagens com maiores amostras. Mas essa relação é espúria.
4. E o último:
Os resultados alternados de Jerónimo e Louçã - quer entre sondagens, quer nas mesmas sondagens - não demonstrarão, mais do que a dúvida entre Soares e Alegre, uma confusão generalizada entre o eleitorado de esquerda? É que se assim for, o que me parece, pode estar a existir um equívoco generalizado na distribuição de indecisos, uma vez que os mesmos podem conviver nesse "drama" da escolha, optando, por ora, por se mostrarem indecisos.
Como já aqui escrevi várias vezes, eu partilho do palpite (que é mais do que um palpite, quando analisamos a composição partidária da sub-amostra "indecisos"). Mas a minha conclusão continua a ser esta.
Obrigado
Pitagórica, Presidenciais, 16 de Janeiro
- A ausência dos resultados brutos completos não é falta nem do JN nem da Pitagórica, mas sim minha, que não tenho o jornal comigo nem encontro os resultados completos na Net. Mas eles estavam lá. Actualizo amanhã;
- Como de costume, para tornar os resultados comparáveis entre si, redistribuo os indecisos proporcionalmente pelas opções válidas;
- A ordem de apresentação é crescente pela data de realização do trabalho de campo;
- Nada de novo, a não ser a confirmação de que amostragens aleatórias estão a dar piores resultados para Cavaco e para Alegre. Porquê? No tengo ni idea.
(Actualização: afinal, relendo o jornal, não está lá nada sobre percentagem de inquiridos que afirmaram não votar, votar em branco ou nulo. Há uns "resultados brutos" e depois um misterioso "tratamento de abstenção sem distribuição de indecisos". Fica assim como está).
sexta-feira, janeiro 13, 2006
O crente e o céptico (2)
No seguimento disso, o céptico mostra o seguinte quadro ao crente, lembrando-lhe que, nalguns casos, as diferenças entre os resultados médios por institutos de sondagens são tão grandes que não se poderão certamente dever a erro aleatório, resultando apenas do facto de determinados institutos tenderem a "beneficiar" ou "prejudicar" (sem que isso corresponda propriamente a uma intencionalidade) este ou aquele candidato:
O crente responde com as mudanças nas preferências dos eleitores. Mas o céptico diz-lhe que, numa regressão linear que tenha a dimensão da amostra, o nº de dias desde a primeira sondagem e uma dummy para o ano de 2006 como variáveis de controlo, os institutos de sondagens como restantes variáveis independentes e os resultados de Cavaco Silva como variável dependente, quase todas (e apenas) as dummies para os institutos de sondagens são estatisticamente significativas.
Ou seja: que os resultados que as sondagens têm apontado para Cavaco Silva parece ser mais afectados pelo facto de ter sido este ou aquele instituto a fazê-la do que pela passagem do tempo, pela nova fase criada com a entrada do ano de 2006 ou pela dimensão da amostra. E que instituto está a captar melhor a realidade? Que teoria de comportamento político temos para o que está a acontecer? Não sabemos, não podemos ter, diz o céptico.
Sois crentes ou cépticos?
O crente e o céptico (1)
A primeira é a do crente (se bem que não necessariamente crédulo). O crente está convencido que, apesar do erro aleatório, as diferenças entre os resultados obtidos pelos candidatos ao longo do tempo reflectem mudanças reais nas preferências dos eleitores. O crente não vai ao ponto de achar que a relação entre o tempo e os resultados dos candidatos seja puramente linear, preferindo formas mais subtis de captar as mudanças causadas pelos eventos de campanha.
Mas quando olha para os gráficos seguintes, o crente formula uma teoria: para fim de determinação do vencedor, estas eleições acabaram. Cavaco flutua, em 19 das 19 sondagens, acima dos 50%, sem tendência aparente. Os eleitores, mesmo os do PS, estão maioritariamente persuadidos quer da sua vitória quer do facto de essa vitória não ter consequências de maior para a governação. Logo, estas eleições já não são sobre quem vai ganhar. E assim, Soares, o único visto como podendo derrotar Cavaco, perde o gás definitivamente na abertura do ano de 2006, no rescaldo dos debates e dos ataques à comunicação social. Os incentivos para o voto útil à esquerda desapareceram: Louçã, Jerónimo e até Alegre (cujas debilidades foram expostas ao longo da campanha e o tinham levado à descida), ficam com os despojos desta batalha perdida, e parecem crescer na recta final.
Marktest e Intercampus, 12 e 13 de Janeiro
Análises e comentários de seguida.
quinta-feira, janeiro 12, 2006
Críticas
Ali não encontro qualquer esclarecimento capaz de satisfazer o eleitor comum. Nos sites dos candidatos, não vejo nenhuma versão contraditória dos factos das sondagens. Nos jornais, encontro sensacionalismo e preversão dos números. No DN esta semana, uma sondagem actualizada todos os dias pretende demonstrar a evolução dia-a-dia das tendências do voto, como se fosse um campeonato, ou uma volta a Portugal em bicicleta. Este empolamento não passa de uma falácia para criar suspense e vender jornais.
Mais porrada aqui.
quarta-feira, janeiro 11, 2006
It ain't necessarily so...(2)
Para os mais ortodoxos e defensivos, a resposta é pouco ou nada. As sondagens são descrições e não previsões, etc e tal. Eu acho certamente que dizem alguma coisa. Existem alguns padrões regulares de relações entre os resultados de sondagens e os resultados de eleições. Mas há pelo menos duas coisas para as quais queria chamar a atenção e que impelem a alguma prudência:
1. É uma banalidade dizer-se que sondagens conduzidas mais perto das eleições produzem resultados mais próximos dos resultados eleitorais, o que sugere que as sondagens da próxima semana estarão mais perto desses resultados que as de hoje. Claro. Contudo, a questão não é apenas a de estarem mais perto. A questão é que, por vezes, as últimas sondagens antes das eleições são substancialmente diferentes das sondagens que as precedem. Parte do fenómeno tem a ver com o facto de, simultaneamente, se cristalizarem opções de voto de anteriores indecisos e de esses indecisos serem substancialmente diferentes do resto do universo. Já vimos, por exemplo, como os actuais indecisos são desproporcionalmente compostos por simpatizantes do PS, e isso pode ter consequências.
Mas a outra parte menos conhecida e, talvez, mais importante do fenómeno é que o investimento dos meios de comunicação social e dos institutos de sondagens tende a ser muito maior nas últimas sondagens, precisamente porque se entende que é à luz destas últimas que o seu desempenho vai ser julgado pelo público e pelos clientes. Logo, não surpreende que, na última semana, os resultados dos vários institutos tendam a convergir mais entre si (e com os que vêm a ser os resultados eleitorais) do que sucede nas semanas anteriores. Foi, aliás, o que aconteceu aqui, aqui e aqui, se bem se recordam. Por outras palavras: pela natureza das coisas (a maior proximidade do acto eleitoral) e pela natureza das sondagens (a sua melhor qualidade na recta final), as sondagens da próxima semana vão ser melhores elementos de previsão do que as feitas até agora. E podem (ou não) ser muito melhores. Veremos.
2. Um segundo aspecto a considerar na comparação entre as sondagens e os resultados eleitorais é a abstenção. Em si mesma, a abstenção não é fonte de erro, desde que os que disseram nas sondagens que votariam e depois se abstêm não sejam especialmente diferentes daqueles que acabaram por votar. Contudo, pode haver um candidato ou conjunto de candidatos que sejam particularmente afectados pela abstenção, tratando-se nesse caso daquilo a que normalmente se chama a abstenção diferencial.
Nas sondagens, e em diferentes graus, faz-se um esforço considerável para evitar as distorções resultantes da dificuldade em determinar quem vai votar. Nas sondagens da Católica, por exemplo, os inquiridos são questionados sobre a "probabilidade de irem votar", e para fim das estimativas, só são considerados aqueles que dizem "ter a certeza que vão votar" (é o método MORI, em versão ligeiramente mitigada). E estou convencido que outros farão um esforço semelhante.
Até agora, que eu saiba, a filtragem dos votantes menos prováveis tem produzido um único efeito: aumentar as intenções de voto em Cavaco Silva e Manuel Alegre, e diminuir as intenções de voto em Mário Soares. Isto é congruente com o que digo aqui há muito tempo, ou seja, o facto de eleições como estas gerarem maior desmobilização entre os potenciais apoiantes de candidatos dos partidos de governo.
Contudo, há uma outra desmobilização potencial: a dos apoiantes do candidato cuja vitória é vista como certa. 2001 foi um caso extremo. Nas últimas sondagens antes das eleições, Jorge Sampaio recolhia, em média, 65,3% dos votos. Teve, no dia das eleições, 55,8%. Bem sei que nada sugere que possamos ter, desta vez, uma abstenção próxima dos 50%. O que está em jogo, do ponto de vista político, é bem maior do que em 2001. O eleitorado de direita não parece, à partida, muito susceptível de se desmobilizar. Mas se querem algo mais comparável (e, mesmo assim, em eleições bem mais divididas e, logo, menos susceptíveis de gerar desmobilização), pensem em 1996. Aí, Jorge Sampaio tinha, nas últimas sondagens antes das eleições, 56,1%. Terminou com 53,8%.
E se, na próxima semana, as estimativas médias para Cavaco, resultantes de sondagens conduzidas, o mais tardar, até à próxima 3ª feira, forem, digamos, 54-55%? Poriam, nesse caso, todo o vosso dinheiro em que não há segunda volta? Sim? Eu não.
Interlúdio 4
Interlúdio 3
Isto anda cada vez mais bem frequentado.
Interlúdio 2
A mulher do candidato decidiu partilhar com a plateia um caso que disse ter ocorrido há três dias quando uma amiga, professora de Filosofia em Coimbra, lhe telefonou a contar uma "história que parece anedota, mas que é verdadeira". Segundo Maria Barroso, "telefonaram para casa dela a perguntar se havia alguém na faixa etária entre os 30 e os 45 anos". "Ela mandou a funcionária ao telefone e perguntaram-lhe assim: então em quem é que vai votar? Eu vou votar no dr. Mário Soares, que é em quem eu votei sempre. E eles disseram de lá: desculpe, foi engano", contou.
"Isto não se faz, isto é uma desonestidade, é uma forma ínvia de fazer as sondagens. Se dizem que é a favor de um determinado candidato que não é o que eles querem, então dizem que já não tem efeito e que não lhes interessa", acrescentou.
Cada um tira as conclusões que quiser. Mas a mim interessa-me por outras razões: repararam como, inicialmente, o(a) inquiridor(a) aceitou a entrada na amostra de uma "funcionária" que "havia lá", sem indagar se era residente, só pelo facto de preencher a quota? É para verem o que acontece com as quotas...
Interlúdio
terça-feira, janeiro 10, 2006
It ain't necessarily so...(1)
Como instrumentos de descrição, as sondagens que conhecemos têm um problema fundamental: não são suficientemente variadas do ponto de vista técnico e metodológico para nos garantirem que as medições que têm estado a obter são independentes dessas opções técnicas e metodológicas. Note-se, por exemplo, que todas as sondagens usaram inquirição telefónica, com uma única excepção que, mesmo assim, não é para mim inteiramente clara (na ficha técnica da sondagem Intercampus de 22 de Dezembro fala-se em "entrevista pessoal", o que eu interpreto como sendo uma sondagem "face-a-face", mas não estou seguro).
Não quero com isto dizer que haja um problema genérico em fazer sondagens telefónicas (já perorei muitas vezes sobre o assunto aqui, defendendo que, até agora, e ceteris paribus, não é isso que parece fazer a diferença) ou que elas tenham tido até agora um enviesamento intrínseco numa direcção ou noutra. Quero apenas dizer que cada eleição é uma eleição, nunca sabemos se tem características podem fazer com que uma dada opção produza enviesamento, e que ficava muito mais descansado com estes resultados se visse maior variedade de técnicas de inquirição.
Acresce a isto que, quando essas variações metodológicas existem no nosso conjunto de sondagens, o seu impacto parece ser grande. Falo, por exemplo, do contraste entre sondagens que usam informação socio-demográfica para a construção da amostra (quotas) ou ponderação dos resultados (ponderadores) e aquelas que se limitam a confiar na aleatoriedade pura. Nas primeiras, que são a maioria, a média das estimativas para Cavaco, Alegre e Soares é, respectivamente, 59%, 16% e 14%. Nas segundas, é de 53%, 14% e 20%. E se excluirmos as sondagens da Católica - de classificação mais ambígua deste ponto de vista (porque seleccionam inquiridos aleatoriamente mas ponderam os resultados com dados do Censos) - do primeiro grupo, a média fica, respectivamente, 60%, 15% e 14%. São diferenças muito importantes.
É certo que parte destas discrepâncias se poderão atribuir ao facto de as diferentes sondagens serem feitas em momentos diferentes, sendo por isso afectadas pela passagem do tempo. Foi essa a perspectiva que, por exemplo, adoptei aqui, aqui e aqui. E é também verdade que tenho convicções próprias acerca de que sondagens e de que métodos obtêm medições mais fiáveis.
Mas a perspectiva do céptico, que foi a que adoptei aqui, limita-se a constatar diferenças e a interpretá-las como sintomas de incerteza. Neste momento, a amplitude dos resultados de Soares desde finais de Outubro (a diferença entre a estimativa mais baixa e a mais alta) é de 10,7 pontos percentuais, mais de duas vezes superior àquilo que seria de esperar exclusivamente apenas na base do erro amostral. A amplitude dos resultados de Cavaco é de 10,9 pontos percentuais, 1,7 vezes acima do que se poderia esperar na base do erro amostral. É bastante. O céptico só pode sentir-se algo incerto.
Actualização, 10 de Janeiro
Não vou introduzir os resultados das sondagens diárias da Marktest/DN/TSF. É uma tracking poll, o que significa que foge à lógica das anteriores: dia a dia, a base amostral é apenas parcialmente renovada. Vou introduzir sim esses resultados assim que a base amostral tiver sido completamente renovada, ou seja, pelas minhas contas, na sondagem a divulgar esta 6ª feira. Entretanto, os resultados da tracking poll podem ser consultados aqui.
Mais questões
Apenas um reparo aos últimos posts, espero que não pareça um preciosismo.Quando se fala da retirada dos indecisos tratando-os como abstencionistas isso na prática é o mesmo que fazer uma distribuição proporcional e não equitativa. Ou seja quando se trata os indecisos como abstencionistas é o mesmo (matematicamente) que dizer que 60% deles votam Cavaco, 16 Alegre, 13 Soares, etc, etc....E por isso mesmo penso que seria pertinente que o Pedro Magalhães se pronunciasse sobre esta distribuição proporcional de indecisos num cenário de candidato consensual (e estabilizado - há cerca de um ano ou mais) à direita em contraponto a uma esquerda espartilhada. Pode ou não este método de estimativa introduzir um erro sistemático? Porque não fazer como a Intercampus, que noticia sempre primeiro os resultados brutos e só depois a estimativa, menorizando assim a estimativa em detrimento dos resultados brutos?
Certíssimo. Enganei-me no post anterior: quando se "eliminam" indecisos, tratando-os como abstencionistas, está-se a redistribuí-los proporcionalmente pelas opções "válidas". Já tinha explicado isto em muitos posts anteriores, mas ontem enganei-me.
Quanto à questão substantiva, diria o seguinte:
Como já disse aqui e aqui, "parece-me plausível a ideia de que a indecisão é maior entre o eleitorado potencial dos candidatos de esquerda, especialmente o eleitorado do PS". A sondagem de Novembro da Católica não confirmava essa ideia, mas a mais recente confirma-a, como sabemos. Como proceder na posse desta informação? Uma hipótese, comum em vários institutos de sondagens noutros países e em eleições legislativas, é usar a simpatia partidária como elemento informativo para a redistribuição. Por exemplo: se eu souber que, em geral, os simpatizantes do PS tendem a votar mais em Alegre e Soares, uso esta informação para redistribuir os simpatizantes do PS que não me dizem em que candidato irão votar, presumindo que se irão redistribuir da mesma forma que aqueles que partilham a mesma identificação psicológica com um partido. Isto, contudo, levanta dois problemas. Por um lado, presume-se assim que a "simpatia partidária" é, em Portugal, um fenómeno fortemente estruturante das atitudes e comportamentos políticos. Por outro lado, presume-se assim que a simpatia partidária é um fenómeno fortemente estruturante do comportamento eleitoral em eleições presidenciais. Tenho, por razões demasiado longas para explicar aqui, fortes dúvidas sobre a validade de cada uma dessas pressuposições.
Logo, a alternativa que achámos - sugerida por um dos colaboradores do CESOP - foi, como expliquei no post anterior, usar uma questão sobre "em que candidato(s) nunca votaria" para não redistribuir votos de indecisos por candidatos em que nos dizem que "nunca votariam". Contudo, como também já expliquei, o resultado dessa operação foi que encontrámos resultados em tudo semelhantes aos anteriores.
Isto não impede que eu ache que esta indecisão actual, fortemente concentrada nos simpatizantes do PS, acabe por se resolver parcialmente, mais tarde ou mais cedo, num voto por um dos candidatos próximos da área socialista. Mas em que números? Com que intensidade? Por qual candidato? Quando estas questões se multiplicam e quando a sua resolução implica aplicarmos pressuposições sobre o comportamento dos eleitores de cuja validade não estamos minimamente certos, devemos recordar-nos do fundamental: a sondagem dá um retrato do momento, e a estimativa deve ter, como função básica, a de mostrar esse retrato de forma que seja comparável a um resultado eleitoral, e não de forma a que procure tudo prever acerca de qual virá a ser esse resultado eleitoral duas semanas depois. É a minha opinião.
E no que respeita à comparação com a Intercampus, penso que há um lapso do leitor: a Intercampus e a Católica fornecem aos seus clientes os resultados brutos e as estimativas. Os clientes divulgam os resultados como entendem, desde que cumpram a lei (ou seja, divulgando ambos), que é, creio, o que fazem, com diferentes destaques. E quanto a dar mais valor aos "resultados brutos", já falei dos problemas que isso levanta muitas vezes neste blogue. Por exemplo, aqui, há cerca de um ano.
segunda-feira, janeiro 09, 2006
Dúvidas (com correcção a um anterior lapso meu, a vermelho)
1. O nível de confiança é, por norma, complementar da margem de erro; isto é, para o clássico nível de confiança de 95% existe uma margem de erro de 5% e, portanto, uma flutuabilidade dos dados apresentados; a sondagem apresenta para um nível de confiança uma margem de erro de 3,4%.
Importa não confundir o erro amostral com o nível de confiança na base do qual se pode dizer que o erro amostral é x ou y.
"Using a sample of 1000 as an example, the statement could read: the chances are 95% of coming within +/- 3% of a hypothetical survey conducted among all members of the population. This means that 95% of all samples which could possibly be drawn will yield an outcome within 3% of the true percentage among the population."
2. Os inquéritos optam, por norma, por um universo [suponho que aqui se queria dizer "amostra"]de cerca de 1.000 entrevistas validadas para a representação do eleitorado nacional; esta sondagem tem 815 inquéritos válidos.
Desconheço a existência desta "norma". Dependendo dos objectivos- o que se quer medir e a margem de erro amostral que se está disposto a tolerar - uma amostra pode ser muito mais pequena ou muito maior que 1000. Explicação muito técnica aqui, explicações mais simples e com exemplos aqui (powerpoint). A money quote: "for very large populations, 500-700 is usually adequate".
3. Há uma distribuição de indecisos de modo equitativo pelas seis candidaturas e, portanto, beneficia-se artificialmente Cavaco ao dar-lhe, por exemplo, mais indecisos dos que possui e ao minorizar a percentagem de indecisos na área socialista (isto é, Alegre e Soares poderão conseguir muitos mais votos que os assinalados).
Lamento, mas não houve, na sondagem da Católica, uma distribuição de indecisos de modo equitativo. Os indecisos foram colocados perante uma segunda pergunta, onde se lhes pedia que indicassem uma "inclinação de voto" por um dos candidatos. E essas inclinações, se dadas por inquiridos que disseram "ter a certeza" que vão votar, foram contadas como votos efectivos. Os restantes foram distribuídos de modo proporcional (ou seja, tratados como abstencionistas). Tudo isto está, desta vez, bem explicado na notícia do Público, mais do que uma vez. Para além disso, ensaiámos no inquérito uma experiência: perguntar aos indecisos que se recusaram a indicar inclinações "em que candidatos nunca votariam", e usar essa informação para não redistribuir os seus votos por candidatos assim indicados. Os resultados obtidos foram iguais aos anteriores, pelo que se optou por não usar essa informação (para não complicar a apresentação nem mudar de metodologia a meio caminho). Isso não nos impediu de assinalar o facto de haver um número desproporcional de simpatizantes do PS entre os indecisos. Cada um usa essa informação como entender, mas não me peçam para pressupor que todos os indecisos do PS vão votar Soares, Alegre ou de outra maneira qualquer...
4. A distribuição aleatória foi afectada pela significativa taxa de recusas (a edição de hoje já não as trazia) o que introduzir mortalidade na amostra, ou seja, uma nova distribuição não aleatória que afecta a chamada validade interna (e, portanto, inferencial) do estudo (veja-se que os resultados se reportam aos que respondem, não aos que votam ou aos que foram inquiridos), porém, este é um critério recorrente em todas as sondagens.
A obtenção de uma amostra genuinamente aleatória é obviamente afectada pelo facto de inquiridos seleccionados aleatoriamente se recusarem a fazer parte da amostra, assim como pelo facto de não se conseguir inquirir (por ausência) inquiridos seleccionados aleatoriamente. Logo, a amostra não é verdadeiramente aleatória. Isto gera problemas para a qualidade dos dados? Há alternativas? O que se pode fazer? Recomendo a leitura disto (.pdf) e disto (.pdf). As respostas são menos óbvias do que parecem à primeira vista...
5. Numa sondagem em que se proceda à ponderação dos resultados [seja de acordo com a distribuição da população em relação a variáveis sócio-demográficas como idade, sexo, habilitação, etc., ou de acordo com o sentido de voto nas ultimas eleições] será legítimo continuar a pressupor que a margem de erro é a mesma caso essa ponderação não tivesse sido feita?
Não. Os valores de erro amostral pressupõem uma amostra puramente aleatória. Pelas razões explanadas no ponto 4., nenhuma sondagem é verdadeiramente aleatória, mesmo que o tente. Logo, nesses casos, a margem de erro amostral é um mero valor de referência, baseado na dimensão da amostra. Por maioria de razão, nas alternativas - utilização de quotas ou ponderação pós-amostral - aplica-se o mesmo princípio: a margem de erro é apenas um valor de referência, baseado na dimensão da amostra, e não algo que possa ser interpretado como transmitindo a real probabilidade de que os resultados se situem dentro de um dado intervalo. É por isso mesmo que a ficha técnica da Católica não diz que a margem de erro é desta amostra, e sim de uma amostra aleatória.
Assim sendo, porque se usa?
- Porque a lei obriga;
- Porque é uma maneira fácil de transmitir ao leitor as possíveis consequências de diferentes dimensões da amostra;
- Porque a pesquisa mostra que as amostragens por quota tendem a errar na estimação de valores reais dentro das mesmas margens que amostras aleatórias;
- Porque a pesquisa mostra que, quanto maior uma amostra, menor o erro na estimação de valores reais, pelo que o conceito de margem de erro, se bem que possa não ter rigor em termos absolutos, deverá tê-lo em termos relativos (ceteris paribus, quanto maiores as amostras, maior a precisão).
5. Nesta sondagem afirma-se que 52% dos inquiridos eram do sexo feminino. Depois, diz-se que os resultados foram ponderados tendo em conta, entre outras variáveis, o sexo. Ora sendo a percentagem da população do sexo feminino de aproximadamente 52%, não percebo o sentido dessa eventual ponderação.
O facto de, numa amostra, haver tantas mulheres como no universo não significa que elas estejam distribuídas por idades e graus de instrução da mesma forma como no universo. Daí a necessidade de ponderação.
Mandem sempre.
Marktest
Um aspecto importante da sondagem divulgada hoje no DN: é uma "tracking poll". Ou seja: combina os resultados de vários dias consecutivos - digamos, três - e depois, ao juntar os resultados do quatro dia, deita fora os resultados do primeiro.
Para além da leitura atenta da documentação da Marktest, vale a pena ver este site CNN/Gallup onde explicam o que fazem e como se devem ler os resultados.
Marktest, Presidenciais, 8 de Janeiro
Marktest, 4-7 Janeiro, Telefónica
Votos válidos:
Cavaco Silva:61%
Mário Soares:14,3%
Manuel Alegre:11,5%
Jerónimo de Sousa:6,9%
Francisco Louçã:6,1%
Em relação às duas sondagens anteriores, tinha assinalado algumas aparentes tendências que careceriam de confirmação. Pois ela aqui está:
- subida de Cavaco Silva de 2005 para início de 2006: intenções válidas de voto subiram em relação a anteriores sondagens da Católica (finais de Novembro) e da Marktest (meados de Dezembro), mantendo-se estáveis em relação a última sondagem Aximage (antes do Natal). Se nas próximas sondagens Eurosondagem e Intercampus Cavaco tiver qualquer coisa acima dos 53%, então a tendência de subida vê-se confirmada para além de qualquer dúvida razoável.
-descida ou, no máximo, estabilização de Mário Soares: intenções válidas de voto em Soares desceram em relação a anteriores sondagens da Católica e da Aximage, para além de ligeira descida em relação a Marktest . Se não desce, pelo menos, parou de subir. Se nas próximas sondagens Eurosondagem ou Intercampus Soares não passar, respectivamente, dos 20% ou dos 18%, a tendência de estabilização (ou descida) confirma-se para além de qualquer dúvida razoável.
sábado, janeiro 07, 2006
Divulgações antecipadas
Lei 10/2000, Art. 12.º Comunicação da sondagem aos interessados. Sempre que a sondagem de opinião seja realizada para pessoas colectivas públicas ou sociedades de capitais exclusiva ou maioritariamente públicos, as informações constantes da ficha técnica prevista no artigo 6.º devem ser comunicadas aos órgãos, entidades ou candidaturas directamente envolvidos nos resultados apresentados.
Um pouco mais estranho é que, dois minutos depois da Antena 1 ter anunciado os resultados, o Diário Digital já tivesse alinhado uma notícia completa sobre o tema, com dados não ainda mencionados pela Antena 1, e cujo texto reproduz em vários pontos, ipsis verbis, o relatório de análise dos dados enviado pela Católica à RDP, RTP e Público. Isto significa que alguém do Diário Digital teve acesso a esse relatório. Como? Não faço ideia. Mas nada disto tem grande importância. Se os órgãos de comunicação que encomendam sondagens não conseguem mantê-las sob embargo, o problema é deles e nosso para resolver.
O problema é outro. Quem nos garante que os dados divulgados antecipadamente por outros órgãos de comunicação ou por blogues são os correctos? Quem nos garante que não são postos a circular dados falsos, como meros fins de desinformação? A mim, por exemplo, meia-hora antes do fecho das urnas nas autárquicas, juraram-me a pés juntos que a Eurosondagem ia dar o Carrilho à frente do Carmona na sondagem à boca das urnas da SIC. A coisa cheirava a esturro à distância, mas pode haver casos menos claros. Nos Estados Unidos, por exemplo, vários blogues colocaram durante a tarde do dia das eleições resultados brutos parciais das sondagens à boca das urnas que davam a vitória a Kerry, mesmo antes das necessárias análises e ponderações finais que sempre se têm de fazer. Estão a imaginar o que sucederia, no próximo dia 22, se blogues como o Mau Tempo no Canil começassem a dar resultados parciais de sondagens à boca das urnas porque alguém lhos transmitiu ao telefone, e blogues como o Acidental começassem a amplificar essa notícias porque "a informação já circulava" ou porque "não é só o Jorge Coelho que tem direito" ? Não me parece grande ideia.
Mas o Francisco Trigo de Abreu está mais do que perdoado. Primeiro, porque a quem ele tem de pedir desculpas é a quem lhe lê o blogue, e não a mim (se bem que eu também seja leitor). E segundo, porque quem tem um filho chamado Joaquim, como o meu, dispõe de indulgência automática aqui do Margens de Erro.
Tendências, 2ª parte
Cavaco Silva:
Em 2006, subida, aferida pelas sondagens Católica e Aximage, compensando assim anterior descida mostrada pela Eurosondagem e pela Intercampus. O facto de estas diferentes tendências serem mostradas por sondagens de diferentes institutos sugere a possibilidade de que subidas e descidas sejam,na realidade, inexistentes , reflectindo apenas diferentes opções técnicas. Contudo, o facto da Católica colocar Cavaco nos 60% é intrigante, porque se é verdade que a Aximage tem dado valores acima da média a Cavaco, o mesmo não sucedeu, até agora, com a Católica.
Mário Soares:
Se fosse só a Aximage, poder-se-ia atribuir isto ao acaso. Se fosse só a Católica, idem. Mas ambas as sondagens mostram Soares a ver interrompida a sua constante ascensão até ao Natal. É preciso mais sondagens para validar esta nova tendência que, como se verifica, é invisível quando se pressupõe uma relação linear entre o tempo e os resultados. Mas será essa relação linear? É sempre arriscado avançar teorias após as observações, mas pensemos um pouco. Será que a imagem de Soares que ficou dos debates, assim que a poeira assentou, lhe foi favorável? Será que as altas expectativas depositadas pelos seus apoiantes nos debates foram satisfeitas? Terá sido o ataque aos meios de comunicação social logo no início do ano uma estratégia sensata?
Manuel Alegre:
O facto de Alegre surgir à frente de Soares na sondagem Católica pode trazer alguma satisfação aos seus apoiantes, mesmo sabendo que a diferença entre um e outro nessa sondagem é inferior à margem de erro amostral. O que já não pode trazer satisfação é que nem esse resultado serve para inverter a tendência desde Outubro, que continua a ser de descida. A não se que a sondagem Aximage tenha estado muito ao lado, a sondagem da Católica não chega para validar uma forte convicção de que essa tendência foi estancada.
Jerónimo de Sousa:
Com uns resultados melhores e outros piores, Jerónimo de Sousa é, no entanto, o candidato cujas intenções válidas de voto têm permanecido mais estáveis.
Francisco Louçã:
Quase indistinguível de Jerónimo de Sousa, se bem que com maior instabilidade. Nada de novo.
Temos assim duas novas hipóteses levantadas pelas duas sondagens mais recentes: a de que Cavaco subiu na passagem de 2005 para 2006, e a de que Soares perdeu o gás na mesma altura. Aguardemos por mais sondagens para vermos se estas hipóteses se confirmam.
Católica, Presidenciais, 7 de Janeiro
Outros aspectos possivelmente interessantes da sondagem:
- a sobrerepresentação dos simpatizantes do PS no conjunto dos que se dizem "indecisos" sobre em quem votar;
- a convicção maioritária - mesmo entre os simpatizantes do PS (dois em cada três) - de que Cavaco Silva será o próximo PR;
- a convicção minoritária -mesmo entre os simpatizantes do PS (um em cada cinco) - de que Cavaco Silva na Presidência irá "dificultar a acção do governo" ou fazer com que o governo fique com "menos hipóteses" de sobreviver até ao fim da legislatura.
sexta-feira, janeiro 06, 2006
Divulgação antecipada
Novidades?
Note-se, por um lado, a subida tremenda de Francisco Louçã, se bem que, como já vimos, as suas estimativas vêm exibindo grande instabilidade ao longo do tempo, sem tendência discernível.
Já sabemos que instabilidade também há nas estimativas do voto em Mário Soares, mas sabíamos também que havia uma tendência (de subida). Mantém-se? A julgar por esta sondagem, pelo menos em termos das estimativas de resultados eleitorais, a resposta é não. Pode ser um mero acaso ditado pelo erro amostral. Mas é a primeira vez que Soares desce numa sondagem da Aximage (começou com 11% em Outubro e terminou com 17% no final de Dezembro), e a descida contraria a tendência geral que já tínhamos visto que vinha, em geral, sucedendo desde Outubro ao Natal, no conjunto das sondagens.
Um ano
Achei que seria bom que existisse em Portugal uma fonte de informação sistemática sobre as sondagens que vão sendo publicadas. É também provável que, por obrigação profissional, tenha de recolher alguma dessa informação, especialmente durante os próximos treze meses onde haverá eleições legislativas, autárquicas e presidenciais. É possível que tenha algumas coisas para dizer sobre essas sondagens. E essas coisas raramente são ditas (ou podem ser ditas) noutras fontes de informação que não um blogue. Logo, serão ditas e escritas aqui.
Nem tudo correu como eu gostaria. Suspeito que não terei resolvido sempre da melhor maneira o dilema entre, por um lado, a vontade de debater estes temas e, por outro, a necessidade de fugir ao papel de "polícia" de quem faz ou divulga as sondagens, papel para o qual não sou talhado, especialmente tendo em conta que, para além de "consumidor" de sondagens, sou também "produtor" e parte interessada.
Sei também que perdi demasiado tempo com questões eleitorais, ficando-me pouco tempo para pensar, escrever e debater outros temas que, de resto, me interessam bastante mais. O que é e como se mede isto da "opinião pública"? Qual é (e qual deveria ser) o seu papel no funcionamento da nossa democracia? Sondagens em geral, e sondagens eleitorais em especial, contribuem uma pequeníssima parte para a resposta às perguntas anteriores.
E lamento que, de todos os e-mails e comentários que li, sejam raríssimos aqueles que contestaram as minhas opções e interpretações técnicas. Eu conheço várias objecções a essas opções e interpretações, suspeito que outras existam, e sei que há pessoas que sabem muito mais de vários assuntos aqui debatidos do que eu. Portanto, de futuro, não se acanhem.
Apesar disto, o ano não foi mau de todo. Nunca imaginei que, num ano, este blogue pudesse ser visitado mais de 120.000 vezes, ou que lhe fizessem mais de 400 ligações noutros blogues. Não supunha que, entre sugestões e comentários de leitores e investigação que tive de fazer para comentar temas que foram surgindo, acabaria por aprender tantas coisas e descobrir tantas novas fontes de informação sobre estas questões. E creio - mas talvez isto não passe de wishful thinking e grave imodéstia - que o panorama geral da divulgação das (e dos comentários sobre) as sondagens terá mudado, de forma quase imperceptível mas real, desde que isto existe.
Agradeço a todos os aqui vieram, mas especialmente aos que divulgaram e comentaram o que aqui se escrevia nos seus próprios blogues, nos jornais, ou de outra maneira qualquer.
segunda-feira, janeiro 02, 2006
Homossexualidade em Portugal: sondagens
Seja como for, vale a pena lembrar que os estudos do famoso Kinsey também apontavam para cerca de 10% dos homens com comportamentos exclusivamente homossexuais (notem a ênfase no "comportamento" em vez da "identidade") durante pelo menos três anos consecutivos entre as idades de 16 e 55 anos (enquanto que, nas mulheres, as percentagens são mais baixas).
Contudo, este "número mágico" de 10% tem sido muito criticado, devido ao facto da amostra de Kinsey não ser aleatória, e sim uma "amostra de conveniência". Nas minhas aulas, aliás, uso sempre o exemplo do relatório Kinsey para falar do enviesamento amostral: afinal, quem está interessado em falar do seu comportamento sexual a não ser aqueles que têm uma moral sexual mais liberal?
Uma série de estudos posteriores, com amostras propriamente representativas, têm obtido valores mais baixos. Mas depois aqui joga outro factor óbvio: relutância em assumir comportamentos socialmente censurados, que pode levar a subestimação do valor real. Pelo que esta "percentagem" é notoriamente difícil de obter. Um excerto de um artigo muito recente:
"Much attention has been given to estimating the rate of "homosexuality" among men and women. The commonly cited figure of 10 percent can be traced to Alfred Kinsey and his colleagues, who concluded that in the United States, "10 percent of the [white] males are more or less exclusively homosexual for at least three years between the ages of 16 and 53" (Kinsey et al. 1948:651). Kinsey et al. (1953) estimated that the rate for women was a third to half as large as that for men. A study based on national probability samples of American adults from 1988 to 1993 found that women were about half as likely as men to report having had a same-sex sex partner in the previous year (1.4 percent of women vs. 2.7 percent of men) (Laumann et al. 1994)" in Amy C. Butler, "Gender Differences in the Prevalence of Same-Sex Sexual Partnering, 1988-2002", in Social Forces, vol. 84, Setembro de 2005.
Este artigo em particular revela um aumento muito acentuado desde 1988 nos Estados Unidos da percentagem de homens e (especialmente) mulheres que declaram ter tido um parceiro sexual do mesmo sexo no ano anterior. Mas assume a dificuldade em explicar o fenómeno: aumento de comportamentos homossexuais ou aumento das pessoas que assumem esses comportamentos perante um inquiridor, em face de mudanças sociais, políticas, culturais e legais favoráveis?
Given the sensitive nature of the topic being studied, it will always be difficult to distinguish between changes in reporting bias and changes in actual behavior. The same arguments that normative, economic, and legal factors affect sexual behavior can be used to argue that they affect honesty of reporting that on a questionnaire.
O tema é muito interessante mas muito complexo, e merecia mais do que o espírito habitual no Expresso: o frissonzinho da primeira página, desta vez com tons de rosa...