Este blogue vai entrar agora em hibernação. A procura, de resto, é sazonal, pelo que a oferta também o será. Se ocorrerem eventos tão interessantes como as eleições no Reino Unido ou na Alemanha ou o referendo francês, que foram aqui cobertos, voltarei com certeza com regularidade. E há um referendo à vista em Portugal. O regresso poderá ser lento, mas é seguro.
Obrigado pelos e-mails e comentários e ligações nos vossos blogues. E desculpem as irritações ocasionais, mas a blogosfera é como as famílias: we only hurt the ones we love. E eu gosto mesmo disto.
Mas para já, chega de sondagens.
segunda-feira, janeiro 23, 2006
Rescaldo 2
No quadro seguinte estão as projecções apresentadas às 20.00h e a comparação dos pontos médios dos intervalos com os resultados eleitorais. A vermelho sobre cada ponto médio, o desvio absoluto. O resto já sabem.

Muito próximo do que se passou em 2001 e em todas as sondagens à boca das urnas desde aí: grande precisão. Ao contrário do que se tem passado até agora, SIC e Eurosondagem muito próxima (para todos os efeitos, igual) dos restantes canais e institutos. Católica com ligeira vantagem na questão da margem de vitória.

Muito próximo do que se passou em 2001 e em todas as sondagens à boca das urnas desde aí: grande precisão. Ao contrário do que se tem passado até agora, SIC e Eurosondagem muito próxima (para todos os efeitos, igual) dos restantes canais e institutos. Católica com ligeira vantagem na questão da margem de vitória.
Rescaldo 1
O quadro seguinte compara os resultados eleitorais com as últimas sondagens pré-eleitorais conduzidas por cada instituto. Algumas notas:
1. As sondagens Intercampus e Pitagórica foram conduzidas antes das restantes, o que diminuiu à partida a sua capacidade para captar mudanças de preferências nos eleitores ocorridas mais perto do acto eleitoral;
2. Os resultados apresentados no quadro para a Pitagórica resultam de uma redistribuição proporcional de indecisos. O JN não apresentou esses resultados, e sim apenas resultados anteriores à redistribuição de indecisos. A redistribuição é feita apenas para o fim de tornar os resultados da sondagem comparáveis com resultados eleitorais, seguindo prática académica comum já aqui muitas vezes mencionada e fundamentada.
3. Calculam-se dois tipos de erro: Método 3 (a média dos desvios absolutos) e Método 5 (a diferença entre a margem de vitória prevista e a margem de vitória de real na base dos dados publicados de acordo com a opção dos institutos). Para mais informação sobre isto, ver estes posts e as referências lá citadas. A sua aplicação neste momento não vai ser na versão mais completa e "canónica" - que exige umas operações adicionais - mas isso, para o fundamental, não vai fazer diferença. Quando houver resultados eleitorais definitivos far-se-á a versão completa.

Compreensivelmente, as sondagens cujo trabalho de campo foi conduzido mais longe das eleições ficaram mais longe dos resultados, apesar de a Intercampus, apesar de tudo, ter ficado mais perto que a Eurosondagem. Quanto àquelas que são realmente comparáveis entre si e com os resultados eleitorais - as da última semana - a Católica ficou mais perto do ponto de vista do desvio absoluto médio e a Marktest do ponto de vista da margem de vitória. Mas as diferenças entre estas e a da Aximage carecem de qualquer espécie de significado. Para todos os efeitos, foram igualmente precisas. Curioso, assim, verificar que diferentes metodologias e dimensões amostrais podem gerar resultados igualmente fiáveis. E curioso também que, uma vez mais, a margem de vitória é sempre sobrestimada, tal como em 1996 e 2001.
Como se compara isto com o passado? Uma visita aqui revelará que as sondagens pré-eleitorais nas presidenciais de 2006 foram substancialmente mais precisas do que as realizadas em 1996 ou 2001. Isso sucede mesmo quando tomamos em conta o facto de o desvio absoluto médio ser sensível ao número de estimativas feitas (quantas mais, menor o erro médio). Assim, por exemplo, com cinco candidatos em 2001, a média dos "desvios absolutos médios" para a várias sondagens foi de 3,9%, enquanto que em 2006, para os cinco primeiros candidatos, foi de 1,6%. (para as sondagens da última semana). Em 1996, com dois candidatos, a média dos desvios absolutos médios foi de 3,2%. Em 2006, apenas para os dois primeiros candidatos, foi de 2%. Mas nas legislativas de 2005 as sondagens ainda foram mais precisas...
Em resumo, resultados muito apresentáveis quer em comparação com o passado quer em comparação internacional.
1. As sondagens Intercampus e Pitagórica foram conduzidas antes das restantes, o que diminuiu à partida a sua capacidade para captar mudanças de preferências nos eleitores ocorridas mais perto do acto eleitoral;
2. Os resultados apresentados no quadro para a Pitagórica resultam de uma redistribuição proporcional de indecisos. O JN não apresentou esses resultados, e sim apenas resultados anteriores à redistribuição de indecisos. A redistribuição é feita apenas para o fim de tornar os resultados da sondagem comparáveis com resultados eleitorais, seguindo prática académica comum já aqui muitas vezes mencionada e fundamentada.
3. Calculam-se dois tipos de erro: Método 3 (a média dos desvios absolutos) e Método 5 (a diferença entre a margem de vitória prevista e a margem de vitória de real na base dos dados publicados de acordo com a opção dos institutos). Para mais informação sobre isto, ver estes posts e as referências lá citadas. A sua aplicação neste momento não vai ser na versão mais completa e "canónica" - que exige umas operações adicionais - mas isso, para o fundamental, não vai fazer diferença. Quando houver resultados eleitorais definitivos far-se-á a versão completa.

Compreensivelmente, as sondagens cujo trabalho de campo foi conduzido mais longe das eleições ficaram mais longe dos resultados, apesar de a Intercampus, apesar de tudo, ter ficado mais perto que a Eurosondagem. Quanto àquelas que são realmente comparáveis entre si e com os resultados eleitorais - as da última semana - a Católica ficou mais perto do ponto de vista do desvio absoluto médio e a Marktest do ponto de vista da margem de vitória. Mas as diferenças entre estas e a da Aximage carecem de qualquer espécie de significado. Para todos os efeitos, foram igualmente precisas. Curioso, assim, verificar que diferentes metodologias e dimensões amostrais podem gerar resultados igualmente fiáveis. E curioso também que, uma vez mais, a margem de vitória é sempre sobrestimada, tal como em 1996 e 2001.
Como se compara isto com o passado? Uma visita aqui revelará que as sondagens pré-eleitorais nas presidenciais de 2006 foram substancialmente mais precisas do que as realizadas em 1996 ou 2001. Isso sucede mesmo quando tomamos em conta o facto de o desvio absoluto médio ser sensível ao número de estimativas feitas (quantas mais, menor o erro médio). Assim, por exemplo, com cinco candidatos em 2001, a média dos "desvios absolutos médios" para a várias sondagens foi de 3,9%, enquanto que em 2006, para os cinco primeiros candidatos, foi de 1,6%. (para as sondagens da última semana). Em 1996, com dois candidatos, a média dos desvios absolutos médios foi de 3,2%. Em 2006, apenas para os dois primeiros candidatos, foi de 2%. Mas nas legislativas de 2005 as sondagens ainda foram mais precisas...
Em resumo, resultados muito apresentáveis quer em comparação com o passado quer em comparação internacional.
sexta-feira, janeiro 20, 2006
Afinal volto...
Porque entretanto dei com um mais um post do Doc Log sobre estes assuntos.
Primeiro, se não for grande incómodo, gostava de ser citado correctamente. O "tema que se encontra resolvido" noutros países é o da adopção de standards sobre como se apresentam resultados de sondagens, e não o da "suspeição sistemática sobre as intenções por detrás da apresentação deste ou daquele resultado". Sendo também certo que as confusões evitáveis no primeiro domínio contribuem bastante para a suspeição. E se se quer saber como se evitam, pode-se consultar isto e isto.
Segundo, a ideia de que "a opção dos media em divulgar resultados que não consideram a fatia de indecisos, nem os votos em branco, parecendo ser uma opção técnica, é principalmente uma opção ética – de má ética jornalística" é errada. Os media divulgam (ou devem divulgar, e na sua maioria fazem-no) ambos os resultados, os brutos e aqueles que são comparáveis com resultados eleitorais. Não divulgar os segundos seria, isso sim, uma enorme irresponsabilidade. Não sei como fazer isto sem me repetir, mas as percentagens de "indecisos" e "abstencionistas" são altamente sensíveis a variações nos formatos dos questionários e em metodologias de inquirição, o que significa que nem eles são directamente comparáveis entre si nem os restantes resultados brutos, por arrastamento, o são.
Isto não quer dizer que os resultados brutos sejam irrelevantes. Por isso mesmo podem e devem ser publicados (e, com raras excepções, são-no).
Ok? Podemos partir para outra?
Primeiro, se não for grande incómodo, gostava de ser citado correctamente. O "tema que se encontra resolvido" noutros países é o da adopção de standards sobre como se apresentam resultados de sondagens, e não o da "suspeição sistemática sobre as intenções por detrás da apresentação deste ou daquele resultado". Sendo também certo que as confusões evitáveis no primeiro domínio contribuem bastante para a suspeição. E se se quer saber como se evitam, pode-se consultar isto e isto.
Segundo, a ideia de que "a opção dos media em divulgar resultados que não consideram a fatia de indecisos, nem os votos em branco, parecendo ser uma opção técnica, é principalmente uma opção ética – de má ética jornalística" é errada. Os media divulgam (ou devem divulgar, e na sua maioria fazem-no) ambos os resultados, os brutos e aqueles que são comparáveis com resultados eleitorais. Não divulgar os segundos seria, isso sim, uma enorme irresponsabilidade. Não sei como fazer isto sem me repetir, mas as percentagens de "indecisos" e "abstencionistas" são altamente sensíveis a variações nos formatos dos questionários e em metodologias de inquirição, o que significa que nem eles são directamente comparáveis entre si nem os restantes resultados brutos, por arrastamento, o são.
Isto não quer dizer que os resultados brutos sejam irrelevantes. Por isso mesmo podem e devem ser publicados (e, com raras excepções, são-no).
Ok? Podemos partir para outra?
O futuro
Uma coisa é dizer que a nossa incerteza sobre a forma como as preferências dos eleitores evoluiram até agora diminuiu. Outra ainda é dizer que estamos igualmente menos incertos sobre quais seriam elas à volta dos dias 15-18 de Janeiro. Contudo, outra muito diferente é a nossa incerteza sobre o futuro. Estas sondagens são o passado. O futuro é Domingo.
O que pode trazer o futuro? Antes de mais, convém dizer que, como é óbvio, não faço ideia. Ou melhor, faço pelo menos duas. O problema é que são contraditórias em termos do desfecho que podem gerar:
1. O primeiro cenário é aquele onde Cavaco Silva vem em perda de intenções válidas de voto não só porque os indecisos da área socialista se começam a decidir (e presumivelmente não por ele) mas também porque começa a perder votos de eleitores que antes tencionavam nele votar. Na primeira sondagem da tracking poll Marktest, divulgada dia 9, Cavaco recolhia o voto de 17% de eleitores socialistas. Na sondagem Marktest dos dias 11-14 de Janeiro, 15% dos socialistas tencionavam votar Cavaco. Na sondagem dos dias 15-18, essa percentagem é 9%. Um erosão comparável, se bem que muito menos significativa em termos absolutos, ocorre com os exóticos comunistas que, nas sondagens anteriores, tencionavam votar Cavaco. Agora, pelos vistos, não há nenhum. Cavaco necessitava destes votos - assim como daqueles que não são próximos de qualquer partido político - para a maioria absoluta. Agora, não é seguro que os tenha, seja porque se estão a desmobilizar à última hora seja porque decidiram "voltar ao redil" de um voto orientado pela identificação partidária e ideológica.
É certo que estas sondagens e o ambiente geral do comentário político vêm minimizando os riscos ligados a uma outra possibilidade que já discuti aqui, o de "abstenção por certeza de vitória", que afectaria de forma diferencial o eleitorado potencial de Cavaco Silva. Não me parece que isso continue a ser um factor de peso: certezas sobre o resultado já ninguém com dois dedos de testa consegue ter. Mas se Cavaco vem perdendo o eleitorado socialista e apartidário de que dispunha até agora - seja porque ele se assustou com a prometida vigilância às actividades do Governo, seja porque a identificação partidária e ideológica fala mais forte, seja ainda por desinteresse em torno de uma opção que, para eles, nunca terá sido particularmente entusiasmante e inequívoca - então a segunda volta está aí ao virar da esquina.
2. Há, contudo, pelo menos uma outra possibilidade. A de que, curiosamente, a abstenção diferencial afecte mais os candidatos de esquerda do que Cavaco, especialmente, diria, Alegre e Louçã. Sabemos que a abstenção declarada em sondagens é sempre inferior à abstenção real. E a verdade é que, em todas as sondagens cujos dados publicados permitem esta análise, o eleitorado de Cavaco foi-se sempre mostrando mais convicto da sua decisão de votar e da sua decisão de em quem votar. Na medida em que não haja uma desmobilização "táctica" por certeza de vitória - possibilidade que, como disse, me parece diminuída pelos eventos desta última semana - eles estão lá, seguros da sua decisão, prontos para ir votar.
E os outros, estão? É certo que há o famoso "povo de esquerda" que se foi escondendo das sondagens até agora, como Medeiros Ferreira sugeria desde o início. Tal como os últimos resultados mostram, tinha, num certo sentido, razão, como aliás lhe dei na altura:
Diria que é altamente presumível que, neste momento e para estas eleições concretas, muitos eleitores de "esquerda" não tenham ainda, pura e simplesmente, decidido o que vão fazer, em face da multiplicação de candidatos, dos sinais confusos e contraditórios emanados inicialmente pelo Partido Socialista, da insatisfação de algum eleitorado PS com a actuação do governo, etc. É possível, e provável, que muitos desses indecisos se venham a abster, mas certamente muitos deles irão também acabar por votar num dos candidatos de esquerda (não excluindo, claro, que alguns venham a votar em Cavaco Silva).
Esse "povo" apareceu finalmente, abandonando progressivamente a sua indecisão e declarando nas sondagens as suas intenções (se bem que talvez não no sentido que Medeiros Ferreira desejaria). Mas a pergunta que fica é esta: vão mesmo votar? Vão votar tanto como os agora declarados eleitores de Cavaco Silva? A abstenção, quem dela vem e quem para ela passa, é, como sempre, a chave dos resultados eleitorais, muito mais do que as transferências de voto deste para aquele partido ou candidato. Não é um acaso, portanto, que todos os candidatos apelem de forma dramática e quase desesperada à participação eleitoral. Da resposta diferencial a esses apelos depende o resultado de Domingo. A ver vamos.
A não ser que a sondagem Intercampus diga qualquer coisa de extraordinariamente surpreendente, só cá volto 2ª feira.
P.S.- Ontem na SIC, Rui Oliveira e Costa falava da especial dificuldade que estas eleições trazem para as sondagens à boca das urnas, devido ao facto de existir um candidato independente cujo peso presumível na amostra selecccionada não poder se apreciado à luz de resultados eleitorais passados. É por isso que as sondagens à boca das urnas são importantes e interessantes. Livres do problema das pré-eleitorais - a medição de intenções em vez de comportamentos - elas são o teste último aos procedimentos de amostragem adoptados por cada instituto, e são de facto a única altura em que a bondade desses procedimentos pode ser testada e melhorada em face de circunstâncias novas, como a candidatura de Alegre.
O que pode trazer o futuro? Antes de mais, convém dizer que, como é óbvio, não faço ideia. Ou melhor, faço pelo menos duas. O problema é que são contraditórias em termos do desfecho que podem gerar:
1. O primeiro cenário é aquele onde Cavaco Silva vem em perda de intenções válidas de voto não só porque os indecisos da área socialista se começam a decidir (e presumivelmente não por ele) mas também porque começa a perder votos de eleitores que antes tencionavam nele votar. Na primeira sondagem da tracking poll Marktest, divulgada dia 9, Cavaco recolhia o voto de 17% de eleitores socialistas. Na sondagem Marktest dos dias 11-14 de Janeiro, 15% dos socialistas tencionavam votar Cavaco. Na sondagem dos dias 15-18, essa percentagem é 9%. Um erosão comparável, se bem que muito menos significativa em termos absolutos, ocorre com os exóticos comunistas que, nas sondagens anteriores, tencionavam votar Cavaco. Agora, pelos vistos, não há nenhum. Cavaco necessitava destes votos - assim como daqueles que não são próximos de qualquer partido político - para a maioria absoluta. Agora, não é seguro que os tenha, seja porque se estão a desmobilizar à última hora seja porque decidiram "voltar ao redil" de um voto orientado pela identificação partidária e ideológica.
É certo que estas sondagens e o ambiente geral do comentário político vêm minimizando os riscos ligados a uma outra possibilidade que já discuti aqui, o de "abstenção por certeza de vitória", que afectaria de forma diferencial o eleitorado potencial de Cavaco Silva. Não me parece que isso continue a ser um factor de peso: certezas sobre o resultado já ninguém com dois dedos de testa consegue ter. Mas se Cavaco vem perdendo o eleitorado socialista e apartidário de que dispunha até agora - seja porque ele se assustou com a prometida vigilância às actividades do Governo, seja porque a identificação partidária e ideológica fala mais forte, seja ainda por desinteresse em torno de uma opção que, para eles, nunca terá sido particularmente entusiasmante e inequívoca - então a segunda volta está aí ao virar da esquina.
2. Há, contudo, pelo menos uma outra possibilidade. A de que, curiosamente, a abstenção diferencial afecte mais os candidatos de esquerda do que Cavaco, especialmente, diria, Alegre e Louçã. Sabemos que a abstenção declarada em sondagens é sempre inferior à abstenção real. E a verdade é que, em todas as sondagens cujos dados publicados permitem esta análise, o eleitorado de Cavaco foi-se sempre mostrando mais convicto da sua decisão de votar e da sua decisão de em quem votar. Na medida em que não haja uma desmobilização "táctica" por certeza de vitória - possibilidade que, como disse, me parece diminuída pelos eventos desta última semana - eles estão lá, seguros da sua decisão, prontos para ir votar.
E os outros, estão? É certo que há o famoso "povo de esquerda" que se foi escondendo das sondagens até agora, como Medeiros Ferreira sugeria desde o início. Tal como os últimos resultados mostram, tinha, num certo sentido, razão, como aliás lhe dei na altura:
Diria que é altamente presumível que, neste momento e para estas eleições concretas, muitos eleitores de "esquerda" não tenham ainda, pura e simplesmente, decidido o que vão fazer, em face da multiplicação de candidatos, dos sinais confusos e contraditórios emanados inicialmente pelo Partido Socialista, da insatisfação de algum eleitorado PS com a actuação do governo, etc. É possível, e provável, que muitos desses indecisos se venham a abster, mas certamente muitos deles irão também acabar por votar num dos candidatos de esquerda (não excluindo, claro, que alguns venham a votar em Cavaco Silva).
Esse "povo" apareceu finalmente, abandonando progressivamente a sua indecisão e declarando nas sondagens as suas intenções (se bem que talvez não no sentido que Medeiros Ferreira desejaria). Mas a pergunta que fica é esta: vão mesmo votar? Vão votar tanto como os agora declarados eleitores de Cavaco Silva? A abstenção, quem dela vem e quem para ela passa, é, como sempre, a chave dos resultados eleitorais, muito mais do que as transferências de voto deste para aquele partido ou candidato. Não é um acaso, portanto, que todos os candidatos apelem de forma dramática e quase desesperada à participação eleitoral. Da resposta diferencial a esses apelos depende o resultado de Domingo. A ver vamos.
A não ser que a sondagem Intercampus diga qualquer coisa de extraordinariamente surpreendente, só cá volto 2ª feira.
P.S.- Ontem na SIC, Rui Oliveira e Costa falava da especial dificuldade que estas eleições trazem para as sondagens à boca das urnas, devido ao facto de existir um candidato independente cujo peso presumível na amostra selecccionada não poder se apreciado à luz de resultados eleitorais passados. É por isso que as sondagens à boca das urnas são importantes e interessantes. Livres do problema das pré-eleitorais - a medição de intenções em vez de comportamentos - elas são o teste último aos procedimentos de amostragem adoptados por cada instituto, e são de facto a única altura em que a bondade desses procedimentos pode ser testada e melhorada em face de circunstâncias novas, como a candidatura de Alegre.
Tendência
Qual o caminho percorrido para chegarmos aos resultados conhecidos hoje? É duvidoso que as diferenças entre as sondagens feitas ao longo do tempo resultem exclusivamente de mudanças nas preferências nos eleitores. Várias das hipóteses avançadas nos posts anteriores para a "convergência" nos últimos dias são, aliás, contrárias a essa ideia, e o céptico que aqui escreveu juntou razões adicionais.
Contudo, suspendam por momentos a descrença. Como apreciar a plausibilidade a ideia de que as preferências dos eleitores mudaram ao longo da campanha e pré-campanha? Três maneiras, por ordem crescente de sofisticação:
1. Comparar sondagens entre si mantendo constante o instituto que as produziu. Se nos concentrarmos nos institutos com mais observações ao longo do tempo - Aximage e Marktest - rapidamente verificamos que em ambas:
- Cavaco mantém-se estável até pelo menos até à primeira semana de 2006, descendo a partir daí;
- Alegre desce até à primeira semana de 2006, começando a subir a partir daí;
- Soares sobe até fim de Dezembro/início de 2006, descendo de seguida e estabilizando no final.
2. Smoothing:





As tendências são confirmadas quando ajustamos uma regressão local aos dados: Cavaco oscilante, com tendência final de descida; Alegre a descer até ao princípio de Janeiro, crescendo no final; Soares sobe até final de Dezembro, iniciando depois declínio e com estabilização final; Jerónimo e Louçã com tendência de lenta mas consistente subida ao longo do tempo.
3. Controlar "house effects":
O problema das abordagens anteriores é o facto de estarem ainda, porventura, excessivamente dependentes de quem faz as sondagens. Notem: se partirmos do princípio de que existem "house effects" - um enviesamento sistemático resultante do facto de um determinado instituto fazer um conjunto estável de opções metodológicas - então não devemos ficar surpreendidos com o facto da abordagem 2. repetir as conclusões da abordagem 1.: afinal, a Aximage e a Marktest foram que mais com sondagens para o bolo total.
Uma maneira de tentar chegar a um resultado "livre" de house effects é a avançada por Erikson e Wlezien, num artigo intitulado "Presidential Polls as a Time Series", no volume 63 da Public Opinion Quarterly (1999). Os que não gostam de estatística saltam para o parágrafo seguinte. Se regredirmos os resultados das sondagens em relação a variáveis dicotómicas (com valores 0 e 1) representando os institutos de sondagens que as fizeram (todos menos um) e as datas das sondagens, os coeficientes associados às variáveis temporais vão, se a constante for excluída da equação, representar as estimativas para cada candidato "livres" de house effects (ou seja, mantendo esses efeitos constantes).
Devido ao escasso número de sondagens, tive de definir as variáveis temporais como representando períodos e não datas singulares. Os resultados da análise são os seguintes:

Não tem os valores concretos porque, para o que conta (e por razões técnicas que não vale a pena explicar aqui), esses valores não são muito importantes e variam de acordo com algumas opções que se tomem na análise. O que importa, e é indiferente a essas opções, é a tendência. E essa é clara: independentemente dos efeitos que cada instituto de sondagens impõe - pelas opções técnicas que metodológicas que toma - nos resultados, Cavaco desce na última semana, Alegre sobe na última semana, Soares desde a partir de Dezembro e Jerónimo e Louça sobem com ultra-lentidão.
Era o que toda a gente já sabia? Pois. Mas assim a incerteza diminui.
Contudo, suspendam por momentos a descrença. Como apreciar a plausibilidade a ideia de que as preferências dos eleitores mudaram ao longo da campanha e pré-campanha? Três maneiras, por ordem crescente de sofisticação:
1. Comparar sondagens entre si mantendo constante o instituto que as produziu. Se nos concentrarmos nos institutos com mais observações ao longo do tempo - Aximage e Marktest - rapidamente verificamos que em ambas:
- Cavaco mantém-se estável até pelo menos até à primeira semana de 2006, descendo a partir daí;
- Alegre desce até à primeira semana de 2006, começando a subir a partir daí;
- Soares sobe até fim de Dezembro/início de 2006, descendo de seguida e estabilizando no final.
2. Smoothing:





As tendências são confirmadas quando ajustamos uma regressão local aos dados: Cavaco oscilante, com tendência final de descida; Alegre a descer até ao princípio de Janeiro, crescendo no final; Soares sobe até final de Dezembro, iniciando depois declínio e com estabilização final; Jerónimo e Louçã com tendência de lenta mas consistente subida ao longo do tempo.
3. Controlar "house effects":
O problema das abordagens anteriores é o facto de estarem ainda, porventura, excessivamente dependentes de quem faz as sondagens. Notem: se partirmos do princípio de que existem "house effects" - um enviesamento sistemático resultante do facto de um determinado instituto fazer um conjunto estável de opções metodológicas - então não devemos ficar surpreendidos com o facto da abordagem 2. repetir as conclusões da abordagem 1.: afinal, a Aximage e a Marktest foram que mais com sondagens para o bolo total.
Uma maneira de tentar chegar a um resultado "livre" de house effects é a avançada por Erikson e Wlezien, num artigo intitulado "Presidential Polls as a Time Series", no volume 63 da Public Opinion Quarterly (1999). Os que não gostam de estatística saltam para o parágrafo seguinte. Se regredirmos os resultados das sondagens em relação a variáveis dicotómicas (com valores 0 e 1) representando os institutos de sondagens que as fizeram (todos menos um) e as datas das sondagens, os coeficientes associados às variáveis temporais vão, se a constante for excluída da equação, representar as estimativas para cada candidato "livres" de house effects (ou seja, mantendo esses efeitos constantes).
Devido ao escasso número de sondagens, tive de definir as variáveis temporais como representando períodos e não datas singulares. Os resultados da análise são os seguintes:

Não tem os valores concretos porque, para o que conta (e por razões técnicas que não vale a pena explicar aqui), esses valores não são muito importantes e variam de acordo com algumas opções que se tomem na análise. O que importa, e é indiferente a essas opções, é a tendência. E essa é clara: independentemente dos efeitos que cada instituto de sondagens impõe - pelas opções técnicas que metodológicas que toma - nos resultados, Cavaco desce na última semana, Alegre sobe na última semana, Soares desde a partir de Dezembro e Jerónimo e Louça sobem com ultra-lentidão.
Era o que toda a gente já sabia? Pois. Mas assim a incerteza diminui.
Convergência
Aqui há uns tempos, chamei a atenção neste blogue para duas coisas:
1. O facto de os resultados das sondagens até então parecerem ser afectados por algumas (poucas) mas aparentemente cruciais variações metodológicas.
2. E a hipótese de que as sondagens conduzidas mais perto das eleições acabassem por obter, por um lado, resultados substancialmente diferentes das precedentes, e por outro, mais convergentes entre si do que as anteriores.
Não é preciso grandes cálculos matemáticos para observar que a hipótese se confirmou, com excepção (no que respeita à dispersão) dos resultados de Manuel Alegre. O quadro seguinte, rudimentar mas suficiente, mostra a média e o desvio padrão associado aos resultados estimados para os diferentes candidatos em três períodos de realização do trabalho de campo:

Por que acontece este fenómeno? Várias hipóteses:
1. Mero acaso;
2. À medida que intenções de voto vão cristalizando e diminuindo o nº de indecisos sobre se irão votar e/ou em quem, as diferentes opções tomadas para os medir e redistribuir perdem impacto nos resultados;
3. À medida que nos aproximamos do dia das eleições, investimento em recursos por parte dos órgãos de comunicação social e dos institutos de sondagem aumenta;
Há ainda uma hipótese adicional, levantada aqui e aqui há uns meses a propósito das eleições no Reino Unido, que não pode ser completamente excluída.
Seja como for, há uma preocupação que é mitigada com estas últimas sondagens: temos de tudo. Telefónicas e presenciais. Escolha aleatória de inquiridos (Católica e Eurosondagem) e amostragem por quotas (Aximage e Marktest). Redistribuição proporcional de indecisos (Marktest, Eurosondagem), redistribuição por "inclinação de voto" (Católica) e redistribuição "mistério" (Aximage). Questionário sem (Marktest) e com (Católica) filtros para determinar prováveis abstencionistas. Os resultados convergem.
O facto de convergirem não quer dizer que estão a medir correctamente as intenções de voto no momento em que foram feitas (podem estar a ser afectadas por um enviesamento comum e indiferente às variações metodológicas) e muito menos que servem para prever seja o que for. Mas diminui a incerteza, o que já não é mau.
1. O facto de os resultados das sondagens até então parecerem ser afectados por algumas (poucas) mas aparentemente cruciais variações metodológicas.
2. E a hipótese de que as sondagens conduzidas mais perto das eleições acabassem por obter, por um lado, resultados substancialmente diferentes das precedentes, e por outro, mais convergentes entre si do que as anteriores.
Não é preciso grandes cálculos matemáticos para observar que a hipótese se confirmou, com excepção (no que respeita à dispersão) dos resultados de Manuel Alegre. O quadro seguinte, rudimentar mas suficiente, mostra a média e o desvio padrão associado aos resultados estimados para os diferentes candidatos em três períodos de realização do trabalho de campo:

Por que acontece este fenómeno? Várias hipóteses:
1. Mero acaso;
2. À medida que intenções de voto vão cristalizando e diminuindo o nº de indecisos sobre se irão votar e/ou em quem, as diferentes opções tomadas para os medir e redistribuir perdem impacto nos resultados;
3. À medida que nos aproximamos do dia das eleições, investimento em recursos por parte dos órgãos de comunicação social e dos institutos de sondagem aumenta;
Há ainda uma hipótese adicional, levantada aqui e aqui há uns meses a propósito das eleições no Reino Unido, que não pode ser completamente excluída.
Seja como for, há uma preocupação que é mitigada com estas últimas sondagens: temos de tudo. Telefónicas e presenciais. Escolha aleatória de inquiridos (Católica e Eurosondagem) e amostragem por quotas (Aximage e Marktest). Redistribuição proporcional de indecisos (Marktest, Eurosondagem), redistribuição por "inclinação de voto" (Católica) e redistribuição "mistério" (Aximage). Questionário sem (Marktest) e com (Católica) filtros para determinar prováveis abstencionistas. Os resultados convergem.
O facto de convergirem não quer dizer que estão a medir correctamente as intenções de voto no momento em que foram feitas (podem estar a ser afectadas por um enviesamento comum e indiferente às variações metodológicas) e muito menos que servem para prever seja o que for. Mas diminui a incerteza, o que já não é mau.
Os resultados
Algumas notas:
1. As sondagens estão colocadas por ordem crescente do último dia de trabalho de campo;
2. As últimas sondagens de cada instituto estão assinaladas no final, a azul.
3. A última sondagem Marktest tem um dia de trabalho de campo comum com a anterior que estava no quadro. Logo, retirei a anterior e deixei apenas a última.
4. A sondagem Aximage anterior foi também retirada do quadro e colocada apenas a divulgada hoje, já que as sondagens divulgadas nos últimos dias no CM resultam da acumulação de novos inquiridos à amostra inicial. Os pontos de interrogação dizem respeito aos elementos que a Aximage ou o Correio da Manhã decidiram não querer partilhar com os leitores, nomeadamente, os resultados brutos, para além do próprio método de redistribuição dos indecisos.
5. Deverá faltar aqui, pelo menos, a sondagem Intercampus para a TVI. Se existir - só deverá ser divulgada hoje à noite.
1. As sondagens estão colocadas por ordem crescente do último dia de trabalho de campo;
2. As últimas sondagens de cada instituto estão assinaladas no final, a azul.
3. A última sondagem Marktest tem um dia de trabalho de campo comum com a anterior que estava no quadro. Logo, retirei a anterior e deixei apenas a última.
4. A sondagem Aximage anterior foi também retirada do quadro e colocada apenas a divulgada hoje, já que as sondagens divulgadas nos últimos dias no CM resultam da acumulação de novos inquiridos à amostra inicial. Os pontos de interrogação dizem respeito aos elementos que a Aximage ou o Correio da Manhã decidiram não querer partilhar com os leitores, nomeadamente, os resultados brutos, para além do próprio método de redistribuição dos indecisos.
5. Deverá faltar aqui, pelo menos, a sondagem Intercampus para a TVI. Se existir - só deverá ser divulgada hoje à noite.
quinta-feira, janeiro 19, 2006
Últimas arrumações
Um amável e-mail de Alexandre Picoito, responsável da Pitagórica, ajuda-me a acabar de preencher o quadro das sondagens. Para não sobrecarregar o blogue, limito-me a substituir a imagem que estava aqui.
Alexandre Picoito esclarece também que o tratamento de abstenção a que se aludia no JN "resulta de várias questões incluídas no questionário e cujas respostas ponderadas entre si, identificam uma 'projecção provável' de abstencionistas que são retirados das análises de voto". É, de facto, uma prática comum a outras sondagens, especialmente em países de abstenção elevada (a que nós, em bom rigor, começamos a pertencer).
O curioso destas coisas gostaria de saber exactamente como se constrói esse modelo. Mas aqui, admito, a curiosidade tem limites. Por um lado, não é fácil a qualquer órgão de comunicação explicar exactamente todos os pormenores destas coisas. E por outro, mais importante, os responsáveis dos institutos de sondagens não são obrigados a fazê-lo, e podem, se assim o entenderem, encarar estes modelos como uma propriedade intelectual que não desejam partilhar.
Muito diferente é a questão da redistribuição dos indecisos: ao contrário do que alguns ainda parecem julgar, é a própria legislação que obriga a que, "sempre que seja efectuada a redistribuição dos indecisos" se faça na ficha técnica "a descrição das hipóteses em que a mesma se baseia". Aqui não pode haver "segredo industrial". Mas isso nada tem a ver com a sondagem da Pitagórica: o jornal nem publicou os resultados após redistribuição dos indecisos e que as hipóteses que a empresa faz na sua análise, cujos resultados coloco agora no quadro, são claras, simples e evidentes: redistribuição proporcional.
Alexandre Picoito esclarece também que o tratamento de abstenção a que se aludia no JN "resulta de várias questões incluídas no questionário e cujas respostas ponderadas entre si, identificam uma 'projecção provável' de abstencionistas que são retirados das análises de voto". É, de facto, uma prática comum a outras sondagens, especialmente em países de abstenção elevada (a que nós, em bom rigor, começamos a pertencer).
O curioso destas coisas gostaria de saber exactamente como se constrói esse modelo. Mas aqui, admito, a curiosidade tem limites. Por um lado, não é fácil a qualquer órgão de comunicação explicar exactamente todos os pormenores destas coisas. E por outro, mais importante, os responsáveis dos institutos de sondagens não são obrigados a fazê-lo, e podem, se assim o entenderem, encarar estes modelos como uma propriedade intelectual que não desejam partilhar.
Muito diferente é a questão da redistribuição dos indecisos: ao contrário do que alguns ainda parecem julgar, é a própria legislação que obriga a que, "sempre que seja efectuada a redistribuição dos indecisos" se faça na ficha técnica "a descrição das hipóteses em que a mesma se baseia". Aqui não pode haver "segredo industrial". Mas isso nada tem a ver com a sondagem da Pitagórica: o jornal nem publicou os resultados após redistribuição dos indecisos e que as hipóteses que a empresa faz na sua análise, cujos resultados coloco agora no quadro, são claras, simples e evidentes: redistribuição proporcional.
quarta-feira, janeiro 18, 2006
Aditamento
Com a ajuda dos responsáveis da Aximage, lá cheguei (compreensão lenta) aos resultados após redistribuição por indecisos. Já estão corrigidos abaixo. Mantenho tudo o resto que lá está escrito.
Carta da Aximage, correcção e resposta minhas
Este blogue recebeu hoje um e-mail de João Queiroz, responsável da Aximage. Nele reproduz-se um e-mail que, segundo o autor, me foi enviado dia 14 de Setembro, e que não recebi. Diz-se nele o seguinte:
Boa tarde,
Como responsável da Aximage gostaria de clarificar que:
1. Fazemos os questionários de acordo com a nossa percepção da actualidade.Ou seja, estudamos com humildade exaustiva os fenómenos que nos rodeiam, sem andarmos a ler (ou ouvir “recados”) “aqui” ou “ali”; 2. Nem tudo o que é perguntado é publicado. Por razões para mim óbvias do ponto de vista da investigação e da actualidade editorial.O leitor também sabe que essa era uma última pergunta, efectuada fora docontexto lógico das que permitiram publicar os resultados;
3 - As leituras feitas às nossas sondagens só vinculam quem faz as leituras,não as sondagens. Por motivos deontológicos também não comentamos a validade da forma como,noutras, estão formuladas as questões que conduzem à "passagem" da 1ª para a 2ª volta.
Melhores cumprimentos.
Suponho que se refere a este post.
Mas há uma mensagem data de hoje, que exige mais atenção (sublinhados meus):
E.mo Senhor,
Verifico que não deve ter recebido o meu mail de 14 de Setembro, sobre matéria em que a Aximage era citada. Encontrá-lo-á abaixo. Quanto aos comentários de hoje e ao tratamento dos nossos resultados tenho a dizer-lhe que considero cientificamente criticável, para dizer o mínimo, a distribuição que faz dos indecisos em trabalhos que não conduz/supervisiona. Contudo, atendendo ao carácter do media em que publica as suas conclusões, vamos "vivendo" com isso. Já me custa a aceitar, porque revela falta de seriedade intelectual, que o faça quando os responsáveis do trabalho, utilizando métodos que não o da simples máquina de calcular, publicaram esse dado. Que não dá, como é óbvio, 8%!
Cumprimentos,
João Queiroz
Aximage
Ora bem. Em parte, culpa minha. Numa sondagem anterior, já tinha sucedido que a Aximage tinha feito uma redistribuição de indecisos que não correspondia à distribuição proporcional pelas opções válidas. Parece-me perfeitamente legítimo que se tomem, para esse efeito - caso se queira fazer essa operação de redistribuição - as opções que se quiser. E foi por isso mesmo que, no quadro que aqui publico, segui os dados fornecidos pela Aximage. Basta ver o que se passou neste post. Logo, desta vez, o erro foi meu: não vi que, no corpo do texto da notícia do Correio da Manhã, são dados os resultados que decorrem das opções da Aximage de redistribuição de indecisos. São agora apresentados, com as minhas desculpas pelo lapso.

A questão com que fico, e creio com que alguns dos leitores do Correio da Manhã ficam, é esta: como, então, redistribui a Aximage os indecisos? Se não é com a "simples máquina da calcular", então como é? Teremos nós, os leitores do Correio da Manhã de hoje, o direito de saber? E terei eu algum impedimento deontológico que me impeça de fazer a pergunta?
E há um último aspecto para resolver: por que razão neste blogue se apresentam quer os resultados brutos quer os resultados após redistribuição de indecisos (da forma como os próprios institutos os redistribuem ou, na ausência dessa redistribuição, de forma proporcional pelos candidatos)? As razões são as seguintes:
1. Porque os diferentes resultados brutos dados pelas diferentes empresas não são comparáveis entre si, por razões já explicadas várias vezes neste blogue, por exemplo aqui.
2. Porque é a boa prática internacional, sancionada e confirmada dezenas de vezes em muitos estudos académicos, tais como este ou este, e sancionada em estudos da American Association for Public Opinion Research, como este.
3. Porque se assim não se fizer, se gera ainda maior confusão entre a opinião pública do que necessário, como sucedeu neste caso.
4. Porque essa confusão pode ser manipulada por responsáveis de institutos de sondagens com o objectivo de validarem injustificadamente o seu próprio trabalho, comparando, por exemplo, os resultados brutos (ou seja, ainda com indecisos ou abstencionistas) das suas sondagens com resultados eleitorais finais. Se querem um exemplo deste tipo de actuação, podem ir à Hemeroteca ler um artigo publicado na Visão, em 21 de Dezembro de 2001, intitulado "Não Matem o Mensageiro". As ironias do destino a que se sujeitam os que não têm memória...
Boa tarde,
Como responsável da Aximage gostaria de clarificar que:
1. Fazemos os questionários de acordo com a nossa percepção da actualidade.Ou seja, estudamos com humildade exaustiva os fenómenos que nos rodeiam, sem andarmos a ler (ou ouvir “recados”) “aqui” ou “ali”; 2. Nem tudo o que é perguntado é publicado. Por razões para mim óbvias do ponto de vista da investigação e da actualidade editorial.O leitor também sabe que essa era uma última pergunta, efectuada fora docontexto lógico das que permitiram publicar os resultados;
3 - As leituras feitas às nossas sondagens só vinculam quem faz as leituras,não as sondagens. Por motivos deontológicos também não comentamos a validade da forma como,noutras, estão formuladas as questões que conduzem à "passagem" da 1ª para a 2ª volta.
Melhores cumprimentos.
Suponho que se refere a este post.
Mas há uma mensagem data de hoje, que exige mais atenção (sublinhados meus):
E.mo Senhor,
Verifico que não deve ter recebido o meu mail de 14 de Setembro, sobre matéria em que a Aximage era citada. Encontrá-lo-á abaixo. Quanto aos comentários de hoje e ao tratamento dos nossos resultados tenho a dizer-lhe que considero cientificamente criticável, para dizer o mínimo, a distribuição que faz dos indecisos em trabalhos que não conduz/supervisiona. Contudo, atendendo ao carácter do media em que publica as suas conclusões, vamos "vivendo" com isso. Já me custa a aceitar, porque revela falta de seriedade intelectual, que o faça quando os responsáveis do trabalho, utilizando métodos que não o da simples máquina de calcular, publicaram esse dado. Que não dá, como é óbvio, 8%!
Cumprimentos,
João Queiroz
Aximage
Ora bem. Em parte, culpa minha. Numa sondagem anterior, já tinha sucedido que a Aximage tinha feito uma redistribuição de indecisos que não correspondia à distribuição proporcional pelas opções válidas. Parece-me perfeitamente legítimo que se tomem, para esse efeito - caso se queira fazer essa operação de redistribuição - as opções que se quiser. E foi por isso mesmo que, no quadro que aqui publico, segui os dados fornecidos pela Aximage. Basta ver o que se passou neste post. Logo, desta vez, o erro foi meu: não vi que, no corpo do texto da notícia do Correio da Manhã, são dados os resultados que decorrem das opções da Aximage de redistribuição de indecisos. São agora apresentados, com as minhas desculpas pelo lapso.

A questão com que fico, e creio com que alguns dos leitores do Correio da Manhã ficam, é esta: como, então, redistribui a Aximage os indecisos? Se não é com a "simples máquina da calcular", então como é? Teremos nós, os leitores do Correio da Manhã de hoje, o direito de saber? E terei eu algum impedimento deontológico que me impeça de fazer a pergunta?
E há um último aspecto para resolver: por que razão neste blogue se apresentam quer os resultados brutos quer os resultados após redistribuição de indecisos (da forma como os próprios institutos os redistribuem ou, na ausência dessa redistribuição, de forma proporcional pelos candidatos)? As razões são as seguintes:
1. Porque os diferentes resultados brutos dados pelas diferentes empresas não são comparáveis entre si, por razões já explicadas várias vezes neste blogue, por exemplo aqui.
2. Porque é a boa prática internacional, sancionada e confirmada dezenas de vezes em muitos estudos académicos, tais como este ou este, e sancionada em estudos da American Association for Public Opinion Research, como este.
3. Porque se assim não se fizer, se gera ainda maior confusão entre a opinião pública do que necessário, como sucedeu neste caso.
4. Porque essa confusão pode ser manipulada por responsáveis de institutos de sondagens com o objectivo de validarem injustificadamente o seu próprio trabalho, comparando, por exemplo, os resultados brutos (ou seja, ainda com indecisos ou abstencionistas) das suas sondagens com resultados eleitorais finais. Se querem um exemplo deste tipo de actuação, podem ir à Hemeroteca ler um artigo publicado na Visão, em 21 de Dezembro de 2001, intitulado "Não Matem o Mensageiro". As ironias do destino a que se sujeitam os que não têm memória...
Aximage, Presidenciais, 18 de Janeiro
Quadro com a sondagem divulgada hoje pelo Correio da Manhã. Com a redistribuição dos indecisos, a "tangente" de que se fala da 1ª página é uma tangente de...8%. Actualizo também informação sobre a Intercampus: a escolha dos inquiridos é feita na base de quotas de sexo e idade, após selecção aleatória de localidades e domicílios. Fiquei a saber isto devido à amabilidade do António Salvador, director da Intercampus. mas não fiquei nem ficámos a saber disto pela TVI...
terça-feira, janeiro 17, 2006
Questões sobre a tracking poll da Marktest
No Martinho da Arcada levantam-se duas questões sobre a composição das amostras na tracking poll Marktest, e tenho recebido vários e-mails pedindo-me uma opinião. Fiquei curioso, e fui ver os resultados.
Uma das questões levantadas, de resposta simples, tem a ver com aparentes mudanças na composição etária da amostra. Ora parece-me aqui que pode haver confusão. Lendo as fichas técnicas de dia para dia, disponíveis aqui, verifica-se que a composição das amostras pelos três escalões etários usados se tem mantido estável. Só começa a mudar recentemente devido ao aumento progressivo da dimensão da amostra, mas apenas em termos absolutos, já que as diferenças em termos relativos (distribuição da amostra por estratos etários) são muito reduzidas. Nem podia ser de outra forma, dado ser uma amostragem por quotas e a idade entrar para a construção dessas quotas. Talvez tenha sucedido uma confusão na análise entre a composição das amostras e as das sub-amostras, tal como se assinala nos comentários ao post acima mencionado...
O segundo problema assinalado pelo David Santos é o facto de o PSD aparecer com intenção de voto maioritária nas legislativas em todas as sondagens. Aqui, creio que o autor do post se refere aos totais que aparecem em linha no ficheiro de resultados. Mas aqui deve haver outra confusão: estou a olhar, este momento, para os resultados da sondagem divulgada dia 16, onde o Martinho da Arcada vê 153 votos para o PSD e 150 para o PS. Mas eu vejo, com estes que a terra há-de comer, 179 para o PS e e 165 para o PSD. O que o David Santos está a ver são as intenções de voto nas legislativas daqueles que têm uma intenção de voto nas presidenciais. Pois, mas isso já todos sabíamos: o eleitorado do PS está mais desmobilizado e mais indeciso que os dos restantes partidos, logo está subrepresentado no interior da sub-amostra daqueles que têm uma intenção de voto nas presidenciais.
Estou a ver a coisa bem? Creio que sim. E assinalo, uma vez mais, que esta saudável conversa só existe porque a Marktest põe tudo cá para fora.
Uma das questões levantadas, de resposta simples, tem a ver com aparentes mudanças na composição etária da amostra. Ora parece-me aqui que pode haver confusão. Lendo as fichas técnicas de dia para dia, disponíveis aqui, verifica-se que a composição das amostras pelos três escalões etários usados se tem mantido estável. Só começa a mudar recentemente devido ao aumento progressivo da dimensão da amostra, mas apenas em termos absolutos, já que as diferenças em termos relativos (distribuição da amostra por estratos etários) são muito reduzidas. Nem podia ser de outra forma, dado ser uma amostragem por quotas e a idade entrar para a construção dessas quotas. Talvez tenha sucedido uma confusão na análise entre a composição das amostras e as das sub-amostras, tal como se assinala nos comentários ao post acima mencionado...
O segundo problema assinalado pelo David Santos é o facto de o PSD aparecer com intenção de voto maioritária nas legislativas em todas as sondagens. Aqui, creio que o autor do post se refere aos totais que aparecem em linha no ficheiro de resultados. Mas aqui deve haver outra confusão: estou a olhar, este momento, para os resultados da sondagem divulgada dia 16, onde o Martinho da Arcada vê 153 votos para o PSD e 150 para o PS. Mas eu vejo, com estes que a terra há-de comer, 179 para o PS e e 165 para o PSD. O que o David Santos está a ver são as intenções de voto nas legislativas daqueles que têm uma intenção de voto nas presidenciais. Pois, mas isso já todos sabíamos: o eleitorado do PS está mais desmobilizado e mais indeciso que os dos restantes partidos, logo está subrepresentado no interior da sub-amostra daqueles que têm uma intenção de voto nas presidenciais.
Estou a ver a coisa bem? Creio que sim. E assinalo, uma vez mais, que esta saudável conversa só existe porque a Marktest põe tudo cá para fora.
De gustibus non est disputandum
Este post teve várias interpretações na blogosfera. Aqui foi citado a propósito de possíveis efeitos das sondagens sobre os resultados eleitorais. Aqui já mereceu uma discordância explícita, sugerindo-se que "há aspectos bem mais determinantes e sólidos do que a interacção do sentido das escolhas das pessoas com os resultados das várias sondagens" e criticando-se, por interposta citação, o meu fantasismo sobre a minha própria importância. Já aqui sugere-se que estou a "pôr as barbas de molho" (a precaver-me contra possíveis discrepâncias entre as sondagens e os que vierem a ser os resultados, suponho).
Tudo bem. Mas eu julgava que a citação do Patterson não tinha a ver quer com os efeitos das sondagens no comportamento eleitoral quer com as eventuais "falhanços" das sondagens como instrumentos de descrição da opinião pública ou previsão do comportamento de voto. Pensava sim que falava do efeito negativo que a colocação das sondagens no centro da cobertura jornalística da vida política pode ter para a qualidade do funcionamento da democracia.
Mas se calhar tenho de ler outra vez: vou aproveitar para ler uma versão amavelmente traduzida (obrigado!).
Tudo bem. Mas eu julgava que a citação do Patterson não tinha a ver quer com os efeitos das sondagens no comportamento eleitoral quer com as eventuais "falhanços" das sondagens como instrumentos de descrição da opinião pública ou previsão do comportamento de voto. Pensava sim que falava do efeito negativo que a colocação das sondagens no centro da cobertura jornalística da vida política pode ter para a qualidade do funcionamento da democracia.
Mas se calhar tenho de ler outra vez: vou aproveitar para ler uma versão amavelmente traduzida (obrigado!).
Marktest, Presidenciais, 17 Janeiro
A amostra da tracking poll da Marktest foi novamente renovada em completo. Começa também, tal como previsto, a aumentar de dimensão. Os resultados estão na última linha do quadro seguinte. Vou reservar a minha análise de resultados e tendências para após a divulgação de todas as sondagens.
segunda-feira, janeiro 16, 2006
Talvez o post mais importante deste blogue nos últimos meses
À vossa e minha atenção, um excerto de um artigo no último e magnífico número especial da Public Opinion Quarterly dedicado às sondagens eleitorais:
The use of polls can extend beyond reason. U.S. elections have reached that point. As reported by the American press, a campaign is a spectacular struggle: rapid followers, do-or-die encounters, strategy, tactics, winners, and losers. A campaign, to be sure, is all of these things, but it is more than these things. It is an opportunity to choose the nation's leadership. (...) America's poll-driven election coverage squeezes out content that would inform voter's judgment.
Poll-driven stories also distort the public's perceptions of the candidates. (...) Candidates are strategists, of course. But the fact that they dramatize their appeals and tailor their messages is nothing new. Such maneuvers are as old as politics itself. What is new is the penetrating intensity with which candidates' activities are exposed, dissected, and criticized. And it should occasion no surprise that as candidates have increasingly been portrayed as master of strategy and manipulation, Americans would think less highly of them.
Nor should it occasion surprise that American have soured on campaigns. Elections have become negative affairs filled with horse-race commentary and analysis. (...) Polling cannot be blamed for all or even most of the ills of American campaigns. But this powerful technique has taken its place alongside big money, negative advertising, attack journalism, and other developments that in combination have diminished American elections.
In Thomas E. Patterson, "Of Polls, Mountains: U.S. Journalists and their Use of Election Surveys", Public Opinion Quarterly, Vol. 69, nº 5, pp. 716-724.
The use of polls can extend beyond reason. U.S. elections have reached that point. As reported by the American press, a campaign is a spectacular struggle: rapid followers, do-or-die encounters, strategy, tactics, winners, and losers. A campaign, to be sure, is all of these things, but it is more than these things. It is an opportunity to choose the nation's leadership. (...) America's poll-driven election coverage squeezes out content that would inform voter's judgment.
Poll-driven stories also distort the public's perceptions of the candidates. (...) Candidates are strategists, of course. But the fact that they dramatize their appeals and tailor their messages is nothing new. Such maneuvers are as old as politics itself. What is new is the penetrating intensity with which candidates' activities are exposed, dissected, and criticized. And it should occasion no surprise that as candidates have increasingly been portrayed as master of strategy and manipulation, Americans would think less highly of them.
Nor should it occasion surprise that American have soured on campaigns. Elections have become negative affairs filled with horse-race commentary and analysis. (...) Polling cannot be blamed for all or even most of the ills of American campaigns. But this powerful technique has taken its place alongside big money, negative advertising, attack journalism, and other developments that in combination have diminished American elections.
In Thomas E. Patterson, "Of Polls, Mountains: U.S. Journalists and their Use of Election Surveys", Public Opinion Quarterly, Vol. 69, nº 5, pp. 716-724.
Mais comentários e dúvidas
1. De um e-mail:
Há um apontamento seu, recente, que merece um pequeno comentário meu – de leigo. É em relação à comparação entre as últimas sondagens de 1996 e o resultado de Sampaio. Também já tinha analisado o assunto, mas encontrei uma explicação diferente. O diferencial terá resultado do facto de as sondagens retratarem apenas o comportamento dos eleitores no Continente. Por regra, a esquerda (neste caso, Sampaio) “perde” 1 ponto ou 1 ponto e ½ quando se consideram os eleitores das regiões autónomas e da emigração. Se for assim, o episódio não se repetirá com Cavaco... Enfim, no dia 22, saberemos.
Parece-me correcto. Não creio que isso chegue para explicar diferenças de tão grande magnitude, mas na medida em que o universo das sondagens seja - e é-o, invariavelmente - o dos eleitores do Continente, o comportamento diferencial dos eleitores das regiões autónomas e da emigração fará sempre alguma diferença. O que significa uma coisa: ceteris paribus, Cavaco estará, provavelmente, a ser ligeiramente subestimado nas sondagens em relação aos resultados totais finais.
2. De outro e-mail:
A chamada tracking poll, ao somar os resultados dos últimos 4 dias acaba por "mascarar" subidas ou descidas abruptas num dado dia porquanto se tem sempre em conta os três dias anteriores. Certo? E como se mede esse efeito?
Subidas ou descidas abruptas num dia são de facto "amortecidas" ao se juntarem os resultados dessa sub-amostra diária aos das sub-amostras anteriores. Isso, contudo, é uma coisa boa: nada nos garante que "subidas" ou "descidas" medidas através de uma amostra de 150 inquiridos sejam "subidas" ou "descidas" reais. Quando as sucessivas sub-amostras começam a mostrar sistematicamente as mesmas tendências, então sim, é provável que estejamos a ver mudanças reais. E isso será visível quer na comparação com os dias anteriores quer comparando as duas sondagens mais próximas com bases amostrais completamente diferentes, como faço nos quadros que aqui apresento.
3. De outro e-mail:
Porque é que as percentagens de Cavaco são inversamente proporcionais ao número de inquiridos, sendo estes directamente proporcionais com as de Soares?
Até certa altura, também me pareceu que, quanto maior a dimensão da amostra, melhores os resultados para Soares (e piores os de Cavaco). Contudo, assim que introduzimos a dicotomia quotas vs. aleatória como variável de controlo, o efeito da dimensão da amostra desaparece. Por outras palavras: o facto de amostras maiores estarem a dar melhores resultados para Soares parece resultar apenas do facto de sondagens com a amostragem aleatória terem sido, até certa altura, e tendencialmente, as sondagens com maiores amostras. Mas essa relação é espúria.
4. E o último:
Os resultados alternados de Jerónimo e Louçã - quer entre sondagens, quer nas mesmas sondagens - não demonstrarão, mais do que a dúvida entre Soares e Alegre, uma confusão generalizada entre o eleitorado de esquerda? É que se assim for, o que me parece, pode estar a existir um equívoco generalizado na distribuição de indecisos, uma vez que os mesmos podem conviver nesse "drama" da escolha, optando, por ora, por se mostrarem indecisos.
Como já aqui escrevi várias vezes, eu partilho do palpite (que é mais do que um palpite, quando analisamos a composição partidária da sub-amostra "indecisos"). Mas a minha conclusão continua a ser esta.
Há um apontamento seu, recente, que merece um pequeno comentário meu – de leigo. É em relação à comparação entre as últimas sondagens de 1996 e o resultado de Sampaio. Também já tinha analisado o assunto, mas encontrei uma explicação diferente. O diferencial terá resultado do facto de as sondagens retratarem apenas o comportamento dos eleitores no Continente. Por regra, a esquerda (neste caso, Sampaio) “perde” 1 ponto ou 1 ponto e ½ quando se consideram os eleitores das regiões autónomas e da emigração. Se for assim, o episódio não se repetirá com Cavaco... Enfim, no dia 22, saberemos.
Parece-me correcto. Não creio que isso chegue para explicar diferenças de tão grande magnitude, mas na medida em que o universo das sondagens seja - e é-o, invariavelmente - o dos eleitores do Continente, o comportamento diferencial dos eleitores das regiões autónomas e da emigração fará sempre alguma diferença. O que significa uma coisa: ceteris paribus, Cavaco estará, provavelmente, a ser ligeiramente subestimado nas sondagens em relação aos resultados totais finais.
2. De outro e-mail:
A chamada tracking poll, ao somar os resultados dos últimos 4 dias acaba por "mascarar" subidas ou descidas abruptas num dado dia porquanto se tem sempre em conta os três dias anteriores. Certo? E como se mede esse efeito?
Subidas ou descidas abruptas num dia são de facto "amortecidas" ao se juntarem os resultados dessa sub-amostra diária aos das sub-amostras anteriores. Isso, contudo, é uma coisa boa: nada nos garante que "subidas" ou "descidas" medidas através de uma amostra de 150 inquiridos sejam "subidas" ou "descidas" reais. Quando as sucessivas sub-amostras começam a mostrar sistematicamente as mesmas tendências, então sim, é provável que estejamos a ver mudanças reais. E isso será visível quer na comparação com os dias anteriores quer comparando as duas sondagens mais próximas com bases amostrais completamente diferentes, como faço nos quadros que aqui apresento.
3. De outro e-mail:
Porque é que as percentagens de Cavaco são inversamente proporcionais ao número de inquiridos, sendo estes directamente proporcionais com as de Soares?
Até certa altura, também me pareceu que, quanto maior a dimensão da amostra, melhores os resultados para Soares (e piores os de Cavaco). Contudo, assim que introduzimos a dicotomia quotas vs. aleatória como variável de controlo, o efeito da dimensão da amostra desaparece. Por outras palavras: o facto de amostras maiores estarem a dar melhores resultados para Soares parece resultar apenas do facto de sondagens com a amostragem aleatória terem sido, até certa altura, e tendencialmente, as sondagens com maiores amostras. Mas essa relação é espúria.
4. E o último:
Os resultados alternados de Jerónimo e Louçã - quer entre sondagens, quer nas mesmas sondagens - não demonstrarão, mais do que a dúvida entre Soares e Alegre, uma confusão generalizada entre o eleitorado de esquerda? É que se assim for, o que me parece, pode estar a existir um equívoco generalizado na distribuição de indecisos, uma vez que os mesmos podem conviver nesse "drama" da escolha, optando, por ora, por se mostrarem indecisos.
Como já aqui escrevi várias vezes, eu partilho do palpite (que é mais do que um palpite, quando analisamos a composição partidária da sub-amostra "indecisos"). Mas a minha conclusão continua a ser esta.
Obrigado
Ao Linha do Horizonte e ao Bi-Marketing pela lembrança (e ao A Origem das Espécies, à Loja de Ideias, e ao iuris).
Pitagórica, Presidenciais, 16 de Janeiro
Quadro actualizado com uma sondagem feita para o JN pela Pitagórica. Algumas notas:
- A ausência dos resultados brutos completos não é falta nem do JN nem da Pitagórica, mas sim minha, que não tenho o jornal comigo nem encontro os resultados completos na Net. Mas eles estavam lá. Actualizo amanhã;
- Como de costume, para tornar os resultados comparáveis entre si, redistribuo os indecisos proporcionalmente pelas opções válidas;
- A ordem de apresentação é crescente pela data de realização do trabalho de campo;
- Nada de novo, a não ser a confirmação de que amostragens aleatórias estão a dar piores resultados para Cavaco e para Alegre. Porquê? No tengo ni idea.
(Actualização: afinal, relendo o jornal, não está lá nada sobre percentagem de inquiridos que afirmaram não votar, votar em branco ou nulo. Há uns "resultados brutos" e depois um misterioso "tratamento de abstenção sem distribuição de indecisos". Fica assim como está).
- A ausência dos resultados brutos completos não é falta nem do JN nem da Pitagórica, mas sim minha, que não tenho o jornal comigo nem encontro os resultados completos na Net. Mas eles estavam lá. Actualizo amanhã;
- Como de costume, para tornar os resultados comparáveis entre si, redistribuo os indecisos proporcionalmente pelas opções válidas;
- A ordem de apresentação é crescente pela data de realização do trabalho de campo;
- Nada de novo, a não ser a confirmação de que amostragens aleatórias estão a dar piores resultados para Cavaco e para Alegre. Porquê? No tengo ni idea.
(Actualização: afinal, relendo o jornal, não está lá nada sobre percentagem de inquiridos que afirmaram não votar, votar em branco ou nulo. Há uns "resultados brutos" e depois um misterioso "tratamento de abstenção sem distribuição de indecisos". Fica assim como está).
sexta-feira, janeiro 13, 2006
O crente e o céptico (2)
Contudo, o céptico gostaria de recordar algo ao crente: as diferenças entre sondagens ao longo do tempo reflectem não apenas mudanças reais de preferências ou o erro amostral (aleatório), mas também o erro não-amostral, fruto da interacção entre as opções e decisões técnicas dos institutos de sondagens e a realidade que encontram. E uma das maneiras como muitas vezes se encapsula esse erro não amostral é na ideia de um "house effect", ou seja, o facto de o conjunto de opções feitas por um determinado instituto o levar a enviesamentos próprios.
No seguimento disso, o céptico mostra o seguinte quadro ao crente, lembrando-lhe que, nalguns casos, as diferenças entre os resultados médios por institutos de sondagens são tão grandes que não se poderão certamente dever a erro aleatório, resultando apenas do facto de determinados institutos tenderem a "beneficiar" ou "prejudicar" (sem que isso corresponda propriamente a uma intencionalidade) este ou aquele candidato:

O crente responde com as mudanças nas preferências dos eleitores. Mas o céptico diz-lhe que, numa regressão linear que tenha a dimensão da amostra, o nº de dias desde a primeira sondagem e uma dummy para o ano de 2006 como variáveis de controlo, os institutos de sondagens como restantes variáveis independentes e os resultados de Cavaco Silva como variável dependente, quase todas (e apenas) as dummies para os institutos de sondagens são estatisticamente significativas.
Ou seja: que os resultados que as sondagens têm apontado para Cavaco Silva parece ser mais afectados pelo facto de ter sido este ou aquele instituto a fazê-la do que pela passagem do tempo, pela nova fase criada com a entrada do ano de 2006 ou pela dimensão da amostra. E que instituto está a captar melhor a realidade? Que teoria de comportamento político temos para o que está a acontecer? Não sabemos, não podemos ter, diz o céptico.
Sois crentes ou cépticos?
No seguimento disso, o céptico mostra o seguinte quadro ao crente, lembrando-lhe que, nalguns casos, as diferenças entre os resultados médios por institutos de sondagens são tão grandes que não se poderão certamente dever a erro aleatório, resultando apenas do facto de determinados institutos tenderem a "beneficiar" ou "prejudicar" (sem que isso corresponda propriamente a uma intencionalidade) este ou aquele candidato:

O crente responde com as mudanças nas preferências dos eleitores. Mas o céptico diz-lhe que, numa regressão linear que tenha a dimensão da amostra, o nº de dias desde a primeira sondagem e uma dummy para o ano de 2006 como variáveis de controlo, os institutos de sondagens como restantes variáveis independentes e os resultados de Cavaco Silva como variável dependente, quase todas (e apenas) as dummies para os institutos de sondagens são estatisticamente significativas.
Ou seja: que os resultados que as sondagens têm apontado para Cavaco Silva parece ser mais afectados pelo facto de ter sido este ou aquele instituto a fazê-la do que pela passagem do tempo, pela nova fase criada com a entrada do ano de 2006 ou pela dimensão da amostra. E que instituto está a captar melhor a realidade? Que teoria de comportamento político temos para o que está a acontecer? Não sabemos, não podemos ter, diz o céptico.
Sois crentes ou cépticos?
Subscrever:
Mensagens (Atom)