sexta-feira, junho 05, 2009
Últimas palavras
1. A primeira é a que se tem seguido até ao momento: pôr os números a falar o mais possível. Haveria eventualmente mais coisas que se poderia fazer, mas a verdade é que com quatro sondagens, ou mesmo com as 13 ao longo de toda a campanha e pré-campanha, há limites para o que se pode fazer. As ideias gerais não vou repetir: estão aqui, aqui, aqui e aqui. Já agora, algumas das coisas que fizemos decorreram directa ou indirectamente de comentários aqui no blogue. Só por isso, já valeu a pena abrir a caixa. Obrigado a todos.
2. Tudo o que diz respeito ao ponto anterior partiu sempre da pressuposição que a única fonte de erro na capacidade das sondagens medirem as intenções de voto no momento em que foram feitas era o erro aleatório associado à selecção de uma amostra que dava a mesma probabilidade a cada membro do universo de ser seleccionado. Sabemos que as coisas não se passam assim. Nenhuma amostra é verdadeiramente aleatória, mesmo que se tente (as pessoas não são bolas nas esfera do Euromilhões, e recusam-se a ser "medidas" ou não estão "lá" para ser medidas quando "deviam" estar). Algumas sondagens até são por quotas. E há uma miríade de potenciais problemas de medição daquilo que se quer medir. Já discuti isto neste blogue muitas vezes, mas no confronto entre as eleições e as sondagens, quase todas as eleições mostram que há um partido ou mais partidos que são sobrestimados pelas sondagens e outros que são subestimados. Claro que isso se pode dever a algo que ocorra entre o trabalho de campo e a eleição. E claro que, ao contrário do que defendem algumas pessoas particularmente imunes ao confronto com os factos, nem sempre são os mesmos partidos que são sobrestimados ou subestimados. Mas isto sugere também a possibilidade de que haja enviesamentos sistemáticos comuns a todas as sondagens num dado contexto eleitoral. Logo, tudo o que resulta das análises descritas no ponto 1 tem de ser visto também deste ângulo mais céptico.
3. Finalmente, a eleição do dia 7 está no futuro, enquanto as sondagens estão no passado. Entre o passado e futuro nem sempre ocorrem coisas que provoquem mudanças nas intenções dos eleitores ou, pelo menos, se ocorrem, dão às vezes ar de se cancelarem umas às outras. Mas há sinais de que, noutros casos, ocorrem. A abstenção é talvez o problema fundamental. Por um lado, está ligado ao ponto anterior (de medição): como apurar se, num determinado momento, alguém tenciona realmente abster-se ou não? As pessoas resistem - porventura cada vez menos - a admitir isso e, logo, dão intenções de voto que não se realizam. Se essas forem sistematicamente diferentes das do que realmente votam, temos o caldo entornado. Mas é também um problema de diferença entre intenções presentes e comportamentos futuros: eu posso achar hoje que vou votar e, no Domingo, arranjar algo melhor para fazer. Se quem chega a esta conclusão for sistematicamente diferente daqueles que não chegam, o caldo entorna-se ainda mais. Em geral, todos os estudos mostram, inclusivamente em Portugal (shameless plug), que eleições de alta abstenção tendem a exibir maiores diferenças entre as sondagens e os resultados. E esta do dia 7 é, claro, desse terrível género.
Tudo isto para dizer aquilo que estas sondagens dizem sobre o que ocorrerá no Domingo tem limites, uns estimáveis (ponto 1), outros infelizmente não (pontos 2 e 3). Logo, se se importam com os resultados, o melhor que têm a fazer é ir votar. E é com esta nota profundamente cívica - abstendo-me de estimar a probabilidade de um voto individual ser decisivo para não desmoralizar ninguém - que me despeço até 2ª feira.
Previsível empate técnico
Não consigo imaginar o que quererá o Público dizer quando diz que um dos resultados mais previsíveis na noite eleitoral será um empate técnico. Penso que quer Vital quer Rangel disseram que a vitória era ter mais um voto do que o oponente. Pelo que, provavelmente, o Público quererá mesmo dizer que os dois terminarão com o mesmo número de votos. Nem sei bem como calcular a probabilidade de que ambos acabem com o mesmo número de votos, mas vou fazer um esforço por quantificar tais quantidades.
Para começar, Portugal tem cerca de 8 milhões de eleitores. Destes, cerca de 65% não votarão, pelo ficamos com 2 milhões e 800 mil votantes. Como apenas queremos analisar a possibilidade de empate entre o PS e o PSD, retiremos os restantes eleitores. Admitamos, para simplificar que o PS e o PSD terão cerca de 2 milhões de votos ao todo. Para haver empate é necessário que vote um número par de pessoas (se o número for ímpar o empate é impossível). Simplifiquemos ao máximo e admitamos que votam exactamente 2 milhões de pessoas (um número par, portanto).
Lamento, mas ainda não chega. Temos de simplificar um pouco mais. Admitamos que a nossa percepção é de uma divisão completa. Ou seja, quando olhamos para um tipo pela rua, atribuímos-lhe a probabilidade de 50% de votar no PS e de 50% de votar no PSD. Com todas estas simplificações, a probabilidade de um empate é 0,00056. Um cenário probabilíssimo, como se vê. Mas, admitamos uma hipótese um pouco mais realista. Dado que o mesmo Público nos diz que o PS aparece à frente em quase todas as sondagens, é razoável admitir que um tipo que encontremos na esquina da rua vá votar PS com uma probabilidade de, digamos, 50,5%. Votará no Paulo Rangel com probabilidade de 49,5%. Com estes novos números, qual seria então a probabilidade de cada um ter um milhão de votos? A resposta a esta pergunta é de 0,000000000000000000000000000000000000000000000021 (salvo qualquer erro a digitar os quarenta e seis zeros). É este cenário que o Público, o melhor jornal Português, considera como um dos mais previsíveis.
A "previsão" do LA-C
Logo, apesar do verdadeiro confronto desta previsão com os resultados poder vir a ser feita logo após as eleições (tomando como base, obviamente, o resultados dos cinco maiores), fica aqui a "tradução" da previsão do LA-C em resultados eleitorais "convencionais", presumindo que os OBN serão 9,2%, ou seja, a média ponderada para as 4 sondagens. O que diz a Bola de Cristal do Qui-Quadrado?
PS: 34,5%
PSD: 31,8%
CDU: 9,9%
BE: 9,5%
CDS: 5%
OBN (presumido): 9,2%
Confirmas, Luís? Os intervalos encolherão um pouco, claro. E esta minha operação, evidentemente, "força" a semelhança com a média ponderada. Mas era só para ter a certeza que a coisa era devidamente compreendida.
As minhas “previsões” para a noite eleitoral (2)
E, seguindo a metodologia explicada no post anterior, aqui ficam as minhas previsões:

Quando o Público fizer 30 anos e uma nova antologia dos disparates, este terá lugar de destaque.
As minhas “previsões” para a noite eleitoral (1)
Os representantes dos pequenos partidos que me desculpem, mas, dado que nenhuma sondagem lhes dá uma votação suficientemente relevante para elegerem um deputado que seja, neste post vou esquecê-los.
Juntando a informação sobre as últimas sondagens realizadas que o Pedro Magalhães recolheu (com a incerteza sobre alguma destas informações que o Pedro também detalhou). Ficamos com o seguinte quadro:

Os totais não dão 100% precisamente por causa das pessoas que declaram ir votar em Outros/Brancos/Nulos. Se nos centrarmos apenas nas votações dos 5 grandes partidos, ficamos com a seguinte repartição:

Olhando para a ordenação dos partidos a sondagens parecem razoavelmente consensuais. Apenas 2 elementos de discórdia: de acordo com a Marktest é o PSD que lidera a corrida e a CESOP põe a CDU à frente do BE.
Olhando para este quadro não se vê nenhuma sondagem se seja brutalmente diferente das outras. Se tivermos em consideração intervalos de confiança de 95%, é fácil de ver que há resultados finais que são compatíveis com todas as sondagens.
Mas em que sentido é que eu digo que os resultados são compatíveis com as sondagens? Haveria algumas formas de responder a esta pergunta. Por exemplo, o Pedro Magalhães já calculou as médias ponderadas, o que é uma boa forma de lidar com a questão, dado que estas médias correspondem ao estimador de máxima verosimilhança (admitindo distribuições multinomiais como base e mais alguns pressupostos)
Eu vou recorrer a um teste muito simples, que é dado nos cursos de Introdução à Estatística que é o teste do Qui quadrado. Basicamente, Suponhamos que queremos testar a hipótese de que o PS tem 25% dos votos, o CDS 15% e todos os outros 20%. E, para tal, usamos a sondagem da CESOP. De acordo com a nossa hipótese, em 1426 entrevistados, 357 devia ter declarado votar no PS, 285 no PSD, na CDU e no BE e, finalmente, 214 no CDS. Mas, de acordo com o quadro acima, houve 539 que declararam votar no PS, 507 no PSD, 143 no BE, 174 na CDU e 63 no CDS. Para ver se estas diferenças são estatisticamente relevantes, calcula-se:
![]()
Quanto mais próximos esta conta for de zero, mais razoável é a nossa hipótese de partida. Para ver testar se este valor é suficientemente próximo de zero usa-se a distribuição do Qui-quadrado. Neste caso, rejeitava-se a hipótese de a nossa hipótese ser correcta com uma certeza de 99,99999%.
O exercício que vou fazer no meu próximo post é simples. Usando este teste do Qui-quadrado, perguntar qual seria a votação para cada partido que é mais compatível com as últimas sondagens feitas. Para tal calculo o Qui-quadrado associado a cada uma das sondagens e minimizo a sua soma.
Não entrei aqui em grandes detalhes estatísticos, mas em bom rigor, tal procedimento apenas seria válido se as amostras fossem aleatórias (o que não é o caso), se as sondagens fossem independentes (o que não é garantido), etc, etc. Vejam isto como eu vejo: um mero exercício que apenas seria absolutamente correcto sob condições óptimas.
Como?
O PS lidera todas as sondagens desde que se iniciou a campanha eleitoral, no Público.
O conjunto das sondagens (2)


A amostra agora é de 4109 inquiridos. Sobre o CDS-PP ser o quinto partido não há novidades, claro. Mas agora a vantagem do PS sobre o PSD torna-se significativa. Claro que esta abordagem tem vantagens e desvantagens. Estamos a valorizar mais as sondagens com amostras maiores, como deve ser. Mas estamos a desvalorizar sondagens que podem ter eventualmente, apesar de uma amostra menor, uma qualquer outra característica que lhe tenha permitido contornar melhor todas as outras restantes fontes de erro. Estou a pensar na Marktest, claro. Mas entre uma quase certeza (maior amostra, maior precisão) e uma incerteza, creio que ficamos a saber mais quando olhamos para os dados assim.
O conjunto das sondagens (1)

Duas telefónicas, duas presenciais com simulação de voto em urna. Uma com amostragem por quotas (Marktest), três com amostragem estratificada aleatória, sendo que duas delas (CESOP e Marktest) fazem ponderação pós-amostral com base em dados das estatísticas nacionais. Três tratam indecisos como abstencionistas, outra usa um modelo próprio (Aximage). Apesar de tudo, uma razoável diversidade de abordagens.
Questões concretas:
1. Quem estava à frente no momento em que foi feito o trabalho de campo? A única sondagem que "diz" saber a resposta a essa pergunta com elevado grau de confiança é a Eurosondagem. A sua resposta é "o PS". Como vemos no quadro abaixo, tendo em conta a dimensão da amostra, a diferença de 4,1 pontos nessa sondagem é estatísticamente significativa. As restantes três sondagens não sabem a resposta a essa pergunta. Nem mesmo a Aximage, apesar de dar 5,3 pontos de vantagem ao PS. É o preço a pagar por uma amostra reduzida (mas pode ser um preço compensador se isso resultar de uma boa exclusão de não-votantes; com mais de 60% de não-votantes na Aximage, isso pode ser o caso).

2. Quem estava à frente no momento em que foi feito o trabalho de campo: BE ou CDU? A única sondagem que "diz" saber a resposta a essa pergunta é a do CESOP. "CDU", é a resposta. Para todas as outras, as diferenças num sentido ou noutro não têm significância estatística.
3. Qual era o quinto partido no momento em que foi feito o trabalho de campo? Pelo menos, aqui há consenso: o CDS-PP.
Tudo o que está acima presume que as amostras são genuinamente probabilisticas e que não há fontes de erro para além do erro amostral. Não é verdade. Mas é o que temos.
Europeias. Eurosondagem, 1-2 Junho, N= 2033, simulação em urna.
PSD: 31,9%
BE: 10,1%
CDU: 9,0%
CDS-PP: 6,1%
OBN: 6,9%
A amostra é de 2033. Desses, 16,4% estavam indecisos, pelo que as percentagens acima são calculadas em relação a um total de, no máximo, 1700 inquiridos. Não se fala na notícia do Expresso em abstencionistas, pelo que teremos de os presumir ausentes da amostra.
quinta-feira, junho 04, 2009
Europeias. Aximage, 1-4 Junho, N=1274, Tel.
PSD: 30,9%
BE: 10,2%
CDU: 10,1%
CDS-PP: 5,0%
Não sei se é resultado antes ou depois de redistribuição de indecisos. Sei apenas que a soma disto dá 92,4%. É provavelmente mais sensato esperar pelo Correio da Manhã de amanhã antes de tirar mais conclusões sobre esta sondagem.
Actualização (5 de Junho):
1. OBN é mesmo 7,6%. Estas percentagens já excluem indecisos e não respostas. Segundo o CM, a distribuição dos indecisos "foi realizada a partir de um modelo que combina perguntas sobre o tipo de indecisão (abstenção/voto em quem), voto anterior, dinâmica de vitória e simpatia pelos principais candidatos". Interessante.
2. A amostra é de 1274 inquiridos. 65,3% disseram que não iriam votar. Sobram 442. Alguns deles terão dito que estão indecisos, pelo que as percentagens acima terão como base um valor inferior a 442. Mas a julgar pelas anteriores sondagens da Aximage, esse valor não há de ser muito inferior. Vamos considerar 442.
Europeias. CESOP, 30 Maio-2 Junho, N=3375, simulação voto urna.
PSD: 32%
CDU: 11%
BE: 9%
CDS-PP: 4%
MEP: 2%
PCTP-MRPP: 1%
Outros: 3%
Brancos e nulos: 4%
Esta estimativa tem como base as intenções de voto dos inquiridos que afirmaram "ter a certeza" que irão votar e que forneceram intenções de voto válidas, em branco ou nulo: foram 1584. Podem descarregar mais detalhes aqui.
O que aí vem.
Um primeiro quadro dá alguma informação geral, mostra as estimativas de resultados eleitorais e o intervalo de confiança a 95% (aproximação à normal) associado a cada estimativa, na base da dimensão da sub-amostra de inquiridos que exprimiram uma intenção de voto, mesmo que seja em branco ou nulo. Um segundo quadro mostra diferenças entre partidos na sondagem, assim como a margem de erro da diferença. Quando a diferença na amostra é inferior à margem de erro, isso significa que essa diferença carece de significância estatística a 95%, e assinalo isso a vermelho. Quando a diferença na amostra é superior, isso significa que a diferença é estatisticamente significativa a 95%, e assinalo isso a verde. Respeitarei a opção de cada instituto de apresentar resultados com ou sem casas decimais. Tudo isto pressupõe, claro, amostragem probabilística, que sabemos ser uma pressuposição inválida. Mas enfim.
Comecemos então pela Marktest. Desde logo, a dimensão da sub-amostra de intenções válidas não se pode calcular na base das notícias saídas até ao momento. Por isso, para já, irei presumir que a percentagem de abstencionistas declarados, indecisos e não respostas é igual à do estudo anterior, o que resulta numa sub-amostra de 383.

O que nos dizem estes quadros:
1. Estritamente na base da sondagem Marktest, não é possível dizer, com um elevado grau de confiança, se a vantagem do PSD sobre o PS na amostra correspondia, à data da sondagem, a uma vantagem real na população.
2. A mesma afirmação serve para a relação entre o BE e a CDU.
3. O mesmo já não sucede com o CDS-PP: a vantagem encontrada da CDU e do BE sobre o CDS-PP é estatisticamente significativa.
Sondagens "sem validade"?
1. "O primeiro erro, começa pela sondagem não ter em conta a Região Autónoma dos Açores e a Região Autónoma da Madeira";
2. O facto da distribuição espacial dos inquéritos por regiões "Norte", "Centro" e "Sul" não respeitar a distribuição espacial da população portuguesa.
Vejamos. Primeiro, a ficha técnica da sondagem explica claramente que o universo sobre o qual está a fazer inferências é o da população de Portugal Continental com 18 ou mais anos. O que o post poderia tentar argumentar é que a ausência dos Açores e da Madeira fazem com que não se possa fazer inferências dos resultados do Continente para os resultados totais. Mas nem a sondagem faz essa inferência nem o autor faz esse argumento. Remete para uma questão de "erro de amostragem". Mas isto não é erro nenhum: é uma opção. E ainda por cima, se o autor do blogue tivesse alguma vez olhado para resultados eleitorais, ficaria a saber que, tendencialmente, a inclusão dos Açores e da Madeira tenderia normalmente a aumentar a vantagem do PSD, não a diminuí-la.
A segunda crítica é ainda menos fundamentada:
1. O autor fala da distribuição da população, quando o que mais se aproxima do universo de interesse é a população com 18 ou mais anos.
2. Apresenta dados para Norte, Centro e Sul, divisão que não coincide com as unidades territoriais do INE;
3. Compara esses dados com a distribuição territorial do inquérito da Marktest, sem ter apurado se as categorias que usa coincidem com as da Marktest.
Europeias. Marktest, 27-30 Maio, N=807, Tel.
PS: 29,4%
BE: 8,9%
CDU: 8,9%
CDS-PP: 3,3%
É o que sei para já, na base desta notícia. Excitante, não? Claro que voltamos ao "empate técnico", ideia que, volto a dizer, é preciso confirmar quando soubermos a dimensão real da sub-amostra na base da qual estas percentagens são estimadas (ainda não sei qual é, mas não é 807, certamente). Mas é a primeira sondagem que coloca o PSD à frente, e isso pode não ser irrelevante, porque pode sugerir uma tendência. Mas com mais dados poderemos olhar melhor para isso. Agora ainda é cedo.
Sei que sou fastidioso, mas recordo, a propósito de uma notícia no Público: se de facto o PSD subiu nos últimos dias, isto não "confirma uma tendência" prévia (indetectável na base dos dados anteriores). E a habitual frase "Se as eleições europeias fossem hoje o [partido x] venceria o escrutínio" está mesmo a pedir inclusão no capítulo no Livro de Estilo do Público intitulado "Frases que constituem justa causa para despedimento".
A soma dá 83%, pelo que presumo que haja 17% de votos noutros partidos, brancos e nulos. Mas rectificarei caso se verifique não ser assim. Obrigado ao leitor que me avisou em comentário no post abaixo.
quarta-feira, junho 03, 2009
Meios de campanha
"Para mim, que estou muito longe destas realidades, esta peça do Público sobre os meios de campanha é impressionante: http://tcp3.com/j1kz"
Previsão modelo Hix/Marsh para Portugal
Previsões actualizadas modelo Hix/Marsh para Portugal:
PS: 35% (9);
PSD: 30% (7);
BE: 11% (2);
CDU: 10% (2);
CDS-PP: 8.5% (2)
segunda-feira, junho 01, 2009
Voto obrigatório
P.S. - Caro João. Quem apanhe esta discussão a meio fica a pensar que eu defendi o voto obrigatório no artigo do Público. Não defendi, pelo contrário, como certamente reparou. Mas escrevi um parágrafo no texto sobre a discussão do tema num plano meramente normativo, simplesmente para dizer que a discussão é muito difícil de resolver nesse plano, e que de todo se pode resolver numa penada, como esta sua penada que critiquei neste post. Só para dar um exemplo, consentir que apenas algumas pessoas votem (e outras não) pode ser visto como algo que colide com a igualdade política, se acreditarmos que há obstáculos económicos e sociais ao voto que um regime democrático deve tomar em conta e resolver (ver aqui, aqui ou aqui). E note que eu nem sequer disse que concordo com esta segunda visão. O que procurei fazer foi dizer que, num plano meramente normativo, a questão é muito mais difícil do que é sugerido pelo seu post inicial, e que podemos tomar um atalho: questionar, do ponto de vista empírico, as pressuposições sobre os efeitos do voto obrigatório daqueles que o defendem no plano dos princípios.
domingo, maio 31, 2009
Tendências?

Nem me arrisco a fazer qualquer tipo de afirmação sobre isto, a não ser para vos dar um elemento adicional. Há um teste estatístico sobre a diferença de proporções entre duas amostras independentes (ver aqui, por exemplo). Se o fizermos, para as duas sondagens de cada instituto e para cada partido, e tomando em conta as dimensões das sub-amostras, só quatro dessas diferenças emergem como estatisticamente significativas a 95%:
- 3 na Intercampus: BE (-), CDS-PP (-) e OBN (+);
- 1 na Aximage: OBN (+).
Europeias, Ponto de Situação
Taxas de resposta
Note-se que a taxa de resposta em entrevistas telefónicas corresponde à proporção de entrevistas completas sobre a soma das seguintes parcelas:
1. Entrevistas completas
2. Entrevistas iniciadas mas não completadas;
3. Recusas;
4. Casos em que não se estabeleceu contacto com a pessoa que deveria responder;
5. Outros casos em que a pessoa que deveria ter sido inquirida não o pôde ser (falecido, incapaz de responder por razões físicas ou psíquicas, problemas linguísticos, etc.);
6. Casos em que não se conseguiu apurar se o nº de telefone seleccionado corresponde a um domicílio;
7. Casos em que o nº de telefone esteve ocupado nas várias tentativas.
8. Casos em que não se conseguiu determinar se no domicílio existe um membro do universo.
É evidente, para quem saiba um mínimo sobre como este tipo de sondagens correm realmente, que a divisão do valor 1 sobre a soma dos valores 1 a 8 nunca dá 0,85, ou seja, não há taxas de resposta de 85% em inquéritos deste género. Logo, uma das coisas com que a ERC se deveria preocupar, a meu ver, seria garantir que todos os institutos usam, nas suas fichas técnicas, a mesma definição do que é uma taxa de resposta, porque pelos vistos não o estão a fazer. Estarão, provavelmente, a relatar uma taxa de cooperação, que é simplesmente o rácio do valor em 1 sobre a soma dos valores 1 a 3 (na sua versão mais "benévola"). O que significa também que, enquanto não houver convergência de critérios, ninguém vai dar a taxa de resposta (ninguém está disposto a fornecer valores reais de 10-30% para que eles sejam - ilegitimamente - comparados com valores de 85%).
Isto é especialmente importante para as sondagens que usam amostragem aleatória porque, como se diz no post que mencionei inicialmente, é assim que se mostra em que medida a amostra obtida se desvia da presunção de que todos os seus elementos resultaram de uma selecção dos membros do universo com igual probabilidade.
sábado, maio 30, 2009
Coisas que me chegam pelo Google Alerts
"Não houve uma única eleição em que eu tivesse participado em que as sondagens não tivessem apresentado para o CDS piores resultados do que os votos em urna. O CDS vai ter um grande resultado."
"Manuela Moura Guedes criticou esta noite a «falta de ética» e o «comportamento jornalístico» do Diário de Notícias. Em causa, o facto de a edição electrónica do diário ter referido durante a tarde uma sondagem exclusiva da TVI."
E a grande vencedora de hoje:
"Ainda é muito cedo para vaticinar uma vitória do PS (...) são factores que vão determinar uma vitória do PS"
Europeias. Marktest, 20-22 Maio, N=804, Tel.
PSD: 30,1%
BE: 7,1%
CDU: 7.1%
CDS-PP: 4,7%
OBN: 19.1%
Estas percentagens são em relação a um total de 382 inquiridos, já que, dos 804, 387 não responderam ou disseram não saber em quem votar ao passo que 35 declararam que não votariam.
Gostava de chamar a atenção para uma coisa. Aqui há uns tempos, a propósito do Barómetro da Marktest para as legislativas, lembrei que a Marktest faz ponderação pós-amostral usando a recordação de voto em 2005 como variável de ponderação. Mais recentemente, quando olhei para os resultados da sondagem anterior da Marktest sobre as europeias, desconfiei. Mas agora confirmei: a Marktest, no caso das europeias, não faz ponderação pós-amostral. E fica por isso com valores para os OBN semelhantes àqueles que tipicamente apresenta nas sondagens sobre as legislativas antes de ponderação. Na sondagem sobre as legislativas divulgada também hoje, por exemplo, os OBN antes de ponderação são 17,2%.
Por que faz a Marktest isto? Não sei. Eu imaginaria que um procedimento que tem como objectivo corrigir distorções da amostra serve tão bem (ou tão mal) para perguntas sobre uma eleição como para perguntas sobre outra (ou, de resto, para perguntas que nem sejam sobre eleições). Mas deve haver uma razão. Já os simpatizantes de um dos "Outros" partidos talvez não devam gastar os foguetes todos a propósito destes "19,1%" (se bem que, se eu fosse um político de um desses partidos, se calhar já tinha começado a explicar que a Marktest anuncia uma transformação radical do sistema partidário português...).
sexta-feira, maio 29, 2009
Europeias. Intercampus, 15-26 Maio, N=992, Presencial (voto simulado em urna)
PSD: 32%
BE: 9,9%
CDU: 7,7%
CDS-PP: 3,5%
OBN: 9,8% (outros partidos representam 4,9%).
19,2% da amostra era composta por Não sabe/Não responde, pelo que as percentagens acima foram calculadas em relação a uma base de 802 inquiridos. Não detecto em sítio nenhum números sobre abstencionistas declarados, pelo que mais uma vez presumo que ou a amostra é composta por pessoas que afirmam tencionam votar ou os abstencionistas declarados estão entre os 19,2%.
Obrigado aos leitores que foram enviando esta informação.
Europeias, Ponto de Situação

Já agora, mesmo ciente das objecções possíveis, aqui vão os resultados caso estas sondagens fossem uma única (ou seja, uma média ponderada de todas as sondagens), com uma amostra de 5326 inquiridos com intenções de voto válidas, branco e nulo:

Reporto apenas intervalos de confiança com aproximação à normal, dado que, com uma amostra destas, os resultados são exactamente (à décima) iguais aos dos intervalos exactos. Notem como as diferenças entre PS e PSD, BE e CDU, e CDU e CDS estão todas acima da margem de erro (explicação aqui, com links para fontes).
Sobre intervalos de confiança para distribuições multinomiais, há uma discussão interessante entre o LA-C e um comentador aqui. Segundo percebo, o paper mais citado sobre o assunto é este. Mas o tema está muito para além das minhas capacidades.
Europeias. Eurosondagem, 25-27 Maio, N= 2525, Tel.
PSD: 32,5%
CDU: 9,2%
BE: 8,8%
CDS-PP: 6,5%
A soma disto dá 92,5%, pelo que presumo que OBN:7,5%.
A notícia menciona igualmente que, entre os 2525, 19,2% (485) não sabe ou não responde. Pelo que a sub-amostra de eleitores com intenções de voto será de 2040 inquiridos. Não há menção de abstencionistas declarados nas várias notícias que consultei, pelo que presumo que, entre os 2525, todos afirmaram que iriam votar. Mas estou a presumir.
quinta-feira, maio 28, 2009
Intervalos de confiança exactos (e outros)
E um mini-paper que desenvolve o que o Luís explicou.
Ainda o empate entre o PS e o PSD
Há quem não goste da estratégia de tratar de várias sondagens como se de uma só (grande) sondagem se tratasse. Os argumentos são legítimos: Não podemos saber se não terá havido uma pessoa a responder a mais do que uma sondagem, as metodologias das sondagens são diferentes, o tratamento dos indecisos é diferente, etc, etc. Todos estes argumentos são válidos apesar de, na minha opinião, serem pouco relevantes. De qualquer forma, podemos pegar no problema por outra perspectiva.
Vamos admitir que o PS e o PSD estão, de facto, empatados. Se esta hipótese estiver correcta, então a probabilidade de o PS aparecer à frente numa dada sondagem é de 0,5 (50%). A probabilidade de aparecer à frente em duas sondagens é de 0,5x0,5=0.25 (25%). A probabilidade de aparecer à frente nas seis sondagens já realizadas seria de 0,5^6=0,015625 (1,56%). Ou seja, se os partidos estivessem empatados, a probabilidade de nas 6 sondagens já feitas o PS aparecer sempre à frente seria de 1,56%. Podemos então pôr de parte essa hipótese de ambos estarem empatados com um grau de certeza de 98,4%. É impossívelque estejam empatados? Não, apenas altamente improvável. O mesmo raciocínio se aplica à disputa pelo terceiro lugar, entre o BE e o CDS, e à disputa para o 4º lugar no pódio, disputa entre o CDS-PP e a CDU.
quarta-feira, maio 27, 2009
Intervalos de confiança (só para nerds)
Num dos seus últimos posts, o Pedro explicou com algum detalhe como se calculam intervalos de confiança a partir das sondagens. Penso que explicou muito bem, mas houve algo que não explicitou.
A ideia de um intervalo de confiança é tentar perceber que votações num dado partido são compatíveis com uma dada sondagem. Por exemplo. Suponhamos que uma sondagem dá 40% ao PS. É apenas uma sondagem, não podemos ter a certeza de que a percentagem de votantes no PS seja, de facto, 40%. Pergunta-se então que valores que são compatíveis com os 40% da sondagem? Se a sondagem aponta para 40%, então não é razoável acreditar que o verdadeiro valor das intenções de voto seja 80%, por exemplo. Já 38 ou 42% parecem valores razoáveis. E 48%?, é razoável? É na definição dos extremos que entram os intervalos de confiança.
Por qualquer motivo, que desconheço, convencionou-se que um bom intervalo de confiança era o de 95%. A ideia é subtil. Escolhe-se um intervalo de tal forma que se se fizessem muitas sondagens, 95% delas incluiriam o verdadeiro valor da votação do PS nos seus intervalos de confiança. Isso quer dizer que se, se fizer muitas sondagens, uma em cada 20 errará por muito.
Como calcular esse intervalo de confiança? Quem sabe uns rudimentos de estatística, sabe que a distribuição dos votos segue uma lei de probabilidade binomial. Mas esta é daquelas distribuições que é chatinha de usar, pelo que a maioria das pessoas usa a lei normal, que é muito simples de usar e é uma aproximação bastante razoável na maioria dos casos.
Infelizmente, quando se fala de partidos com pequenas votações a aproximação deteriora-se bastante, podendo até levar a situações de puro nonsense. Imagine o leitor que numa amostra de 400 pessoas, 0,7% declararam votar no POUS. Um intervalo de confiança de 95% incluiria todos os valores desde o 0,1% negativos até ao 1,5% positivo. Ou seja, estar-se-ia a considerar como hipótese razoável que o POUS tivesse um número negativo de votos. Já se se usasse a lei binomial concluir-se-ia, correctamente, que o intervalo de confiança ia de 0,15% até 1,79%. Refaço o quadro que o Pedro fez com os intervalos de confiança para a última sondagem da Aximage, com percentagens calculadas para um universo de 401 pessoas):
Veja-se que a aproximação que o Pedro fez é quase perfeita para o PS e PSD, subestima um pouco a votação dos pequenos partidos (BE, PCP e CDS) e prejudica bastante os micro partidos (o meu intervalo inferior é 30% mais elevado que o do Pedro). Repare-se que este fenómeno pode ajudar a explicar a sensação que muitas vezes se tem de que as votações dos pequenos partidos, sistematicamente, se situam na parte superior do intervalo de confiança. Muitas vezes ouvi dirigentes do PCP e do CDS a queixarem-se disto mesmo.
Olhando para os intervalos de confiança estimados a partir desta sondagem, não se poria de parte a hipótese de o PSD ser o mais votado, nem de o CDS-PP ser a terceira força. Infelizmente para uns, e felizmente para outros, o facto de haver várias sondagens permite reduzir os intervalos de confiança. Como mero exemplo académico, imagine o leitor que em vez de uma sondagem da Aximage, havia 4 sondagens diferentes, feitas seguindo a mesma metodologia e que em média, os resultados são iguais ao quadro de cima. Excluindo a hipótese de haver alguém que tenha respondido a mais do que uma sondagem, temos o equivalente a uma grande sondagem feita com base em 1604 pessoas:

Os intervalos de confiança ficam bem estreitos. Dado que já várias sondagens foram feitas e que todas apontam para uma vitória do PS é difícil de aceitar a hipótese de o PSD e o PS estarem empatados. Para já, o PS leva vantagem.
A última sondagem da Aximage, reloaded
Abstenção: 64,7% (776 dos 1200 inquiridos, na base do gráfico apresentado)
Intenções de voto antes de redistribuição de indecisos:
PS: 38,0%
PSD: 31,1%
BE: 8,5%
CDU (PCP): 7,9%
CDS-PP: 6,3%
OBN: 2,8%
Indecisos: 5,4%
Intenções de voto após redistribuição de indecisos (tratados como abstencionistas; meu cálculo):
PS: 40,2%
PSD: 32,9%
BE: 9,0%
CDU (PCP): 8,4%
CDS-PP: 6,7%
OBN: 3,0%
(Soma dá 100,2% devido a arredondamentos)
Agora notem uma coisa interessante. Se na amostra há 776 declarados abstencionistas, e se nos 424 que indicaram que iriam votar há 5,4% de indecisos (23 pessoas), então a sub-amostra na base da qual os últimos resultados são calculados é composta por 401 observações. E se é assim:

Então esta sondagem dá (espero não ter errado nenhuma fórmula)... outro empate técnico entre o PS e o PSD, seja do ponto de vista mais vulgar da "sobreposição de intervalos" seja do ponto de vista mais correcto da significância estatística da diferença entre as duas proporções. Não parecia, pois não? Isto, claro, na presunção de que os 64,7% de abstencionistas correspondam a 64,7% da amostra. Mas no CM em papel não ficam dúvidas disso.
Por outro lado, como expliquei aqui no outro dia, não é de todo indiferente que esta seja a sexta de seis sondagens onde, havendo "empates técnicos", há sempre mais intenções de voto no PS que no PSD...
terça-feira, maio 26, 2009
Europeias. Aximage, 18-22 Maio, N=1200, Tel.
Mais sobre "empates técnicos" (só para nerds)
Mas importa notar que, se quisermos mesmo saber se as diferenças entre dois partidos numa sondagem são estatisticamente significativas com um determinado nível de confiança, a abordagem, sempre que haja mais do que duas opções de resposta, tem realmente de ser diferente (a abordagem que vou adoptar aqui não é a mesma, julgo, daquela que usou o comentador, mas a mensagem genérica é a mesma).
A margem de erro associada às diferenças entre as proporções dos partidos não é a mesma coisa que a margem de erro associada a cada proporção. Para isso, temos de calcular - desculpem o jargão - a variância da diferença entre duas proporções multinomiais. Eis a fórmula:

O caso concreto que dei foi o de converter as cinco sondagens numa única, em que 2477 respondentes teriam dado as suas intenções de voto numa única pergunta. Nesse caso, o PS teria 35,5% dessas intenções, e o PSD 33,3%. A margem de erro (com 95% de confiança) para a diferença entre o PS e o PSD equivale a:

Esse valor, com estes resultados e com um N de 2477, é de 3,27%. Por outras palavras: a diferença obtida na sondagem (2,2 pontos percentuais) é inferior à margem de erro para a diferença entre as estimativas (3,27). A diferença não está fora da margem de erro. Logo, aqui sim, "empate técnico" propriamente dito.
Já agora: se a dimensão da amostra, em vez de 2477, fosse de 5500 inquiridos, a margem de erro das diferenças seria 2,19%. Por outras palavras, a mesma diferença entre o PS e o PSD (2,2 pontos) já seria estatisticamente significativa.
Tudo isto está superiormente (como sempre) explicado aqui, que por sua vez o tirou do "clássico dos clássicos".
Uma impressão de campanha
Imagino que isto seja deliberado, pensado, eventualmente até testado com focus groups e sondagens. E daí talvez não. Talvez esta campanha do PS esteja a ser conduzida e organizada por pessoas sem competência para a função. Já sucedeu no passado com vários partidos, em várias eleições. E costuma ser um indicador interessante sobre a "saúde" de um partido, a sua coesão e motivação e o grau de isolamento da sua liderança. Dentro de poucas semanas, saberemos melhor.
segunda-feira, maio 25, 2009
Em 2004, foi assim

Contudo, ao contrário do que veio a suceder um ano depois nas legislativas, permaneceram grandes variações quer na estimação das intenções de voto na coligação quer na votação da CDU. E todos indicaram mais intenções de voto no BE do que aquele que veio a ser o seu resultado (mesmo que as diferenças sejam insignificantes em dois casos). Por outras palavras, repetindo um padrão já conhecido, eleições com muito elevada abstenção tendem a produzir maiores discrepâncias entre as sondagens e os resultados eleitorais, assim como maiores discrepâncias das sondagens entre si. Intenções de voto recolhidas acabam por não se converter em comportamentos, e diferentes pressuposições sobre como tratar o fenómeno da abstenção e estimar o que poderá ser o "votante provável" acabam por fazer sentir os seus efeitos neste confronto entre sondagens realizadas a uma semana das eleições e os resultados. Logo, eu seria céptico sobre a possibilidade das próximas sondagens "resolverem" todas as dúvidas sobre o que poderá suceder dia 7, especialmente porque, desta vez, tudo o que vimos até ao momento sugere que a margem de vitória de seja quem for o vencedor será certamente menor.
"Empate técnico"
Minha nossa. Ora vamos lá outra vez:
1. A margem de erro anunciada na ficha técnica não é a margem de erro associada às estimativas para o PS ou para o PSD. Por duas razões. Primeiro, a dimensão da amostra na base da qual essas margens de erro têm de ser estimadas é inferior à dimensão da amostra geral na base da qual se apresenta calcula a margem de erro anunciada na ficha técnica. É inferior porque as percentagens são calculadas em relação a uma base que exclui indecisos e abstencionistas. Segundo, a margem de erro apresentada na ficha técnica é uma margem de erro máxima, presumindo amostragem aleatória e com uma confiança de 95%. Essa margem de erro máxima é a associada a uma estimativa de 50%. Quando as estimativas são superiores ou inferiores a 50%, a margem de erro é diferente (inferior).
2. Logo, se quisermos saber qual é o intervalo que cada sondagem está a estimar para cada estimativa - mais uma vez, presumindo amostragem aleatória e com 95% de confiança - não se trata de somar e subtrair 2,2% (ou seja lá o que a ficha técnica identifique como margem de erro máxima) a cada resultado, como muita gente costuma fazer. A margem de erro tem de ser calculada para cada caso, tendo em conta a sub-amostra em relação à qual as percentagens são calculadas e o valor concreto que está a ser estimado.
3. As notícias na imprensa nem sempre são claras quanto à dimensão dessa dita sub-amostra. Só lá se pode chegar por inferência, usando a informação sobre a dimensão da amostra geral, a percentagem daqueles que dizem que não votariam e a percentagem dos indecisos (normalmente tratados como abstencionistas quando se trata de redistribuir).
4. Se o fizermos, chegamos rapidamente à conclusão que todas as sondagens divulgadas até agora sobre as Europeias configuram um empate técnico entre o PS e o PSD, se por "empate técnico" entendermos intervalos que se sobrepõem para as estimativas dos dois partidos (presumindo amostragem aleatória e com 95% de confiança). A saber:
Marktest:
PS: 27,3-38,9
PSD: 27,1-38,7
Intercampus:
PS: 29,3-38,7
PSD: 28,8-38,2
CESOP:
PS: 34,5-43,5
PSD: 31,6-40,4
Aximage:
PS: 33,5-47,5
PSD: 27,3-40,7
Eurosondagem:
PS: 31,6-37,0
PSD: 29,4-34,8
Os intervalos são enormes? São: porque são tantos os que se declaram abstencionistas ou indecisos que a sub-amostra que sobra para estimar resultados é diminuta. E é assim que as coisas são, não há volta a dar-lhe. Só no planeta em que vive o deputado Marco António é que as "boas" sondagens têm toda a gente a dizer que vai votar e a saber perfeitamente em quem.
5. Se a isto somarmos que:
- as sondagens foram conduzidas em momentos diferentes;
- usam metodologias completamente diferentes e há muitas fontes de erro para além do erro aleatório amostral;
- estimam intenções de voto num momento, e não comportamentos no futuro;
- nenhuma amostra é verdadeiramente aleatória (tendo em conta recusas e impossibilidade de encontrar o inquirido que devia responder) e algumas não são aleatórias de todo (usando quotas);
- as margens de erro são estimadas com 95% de confiança (1 em cada 20 inquéritos vai produzir resultados fora da margem);
- as discrepâncias enormes entre os resultados das cinco sondagens...
ficamos com uma boa ideia da incerteza associada aos resultados do próximo dia 7.
6. Dito isto, atenção. Apesar de termos cinco "empates técnicos", as sondagens têm uma coisa em comum. O PS está à frente em todas. Podem estar todas erradas, claro. Mas que o PS tenha estado sempre à frente não é indiferente. Imaginem que, em vez de as tratamos com cinco sondagens diferentes, as tratamos com uma única sondagem, em que a sub-amostra dessa "super-sondagem" é a soma das sub-amostras das restantes (2477 inquiridos). Se o fizermos, o PS aparece com 35,5% e o PSD com 33,3%. Mas a margem de erro associada a ambos os casos é substancialmente menor, 1,88% para o PS e 1,86% para o PSD. Continua a ser "empate técnico", mas note-se, por exemplo, como o resultado máximo do PSD (35,1%) é inferior à estimativa pontual para o PS (35,5%). Mas as sondagens foram conduzidas em momentos diferentes, usam metodologias diferentes, etc, etc, etc. "Incerteza", sim, parece-me bem, para já.
sexta-feira, maio 22, 2009
terça-feira, maio 19, 2009
Progressão geométrica
"as diferenças de 800 por cento entre as sondagens e os resultados nas urnas acabaram por criar em mim uma imunidade a sondagens."
domingo, maio 17, 2009
Europeias. Aximage, 5-7 Maio, N=600, Tel.
PS: 38,5%
PSD: 32,3%
BE: 9,2%
PCP: 8,7%
CDS-PP: 5,6%
OBN: 0,7%
Indecisos: 5,0%
Após redistribuição (proporcional) de indecisos:
PS: 40,5%
PSD: 34,0%
BE: 9,7%
PCP: 9,2%
CDS-PP: 5,9%
OBN: 0,7%
São assim quatro as sondagens divulgadas até ao momento sobre as Europeias:
Correcção no método
E a queixa na ERC: já terá dado entrada?
sábado, maio 16, 2009
sexta-feira, maio 15, 2009
"Portugal: uma democracia em construção"
Legislativas. Aximage, 5-7 Maio, N=600, Tel.
PS:37,3% (38,1%)
PSD:26,7% (25,1%)
BE:12,6% (12,6%)
CDU:8,5% (10,3%)
CDS:5,2% (5,7%)
OBN+Indecisos: 9,7% (8,1%)
Na base desta notícia, não é possível apresentar os resultados como se fossem resultados eleitorais, dado que os valores para "indecisos" e "outros, brancos e nulos" não são apresentados. Mas talvez a edição em papel amanhã tenha esta informação.
Ignorando essa questão, e se nos concentramos apenas nas tendências, temos que, nas últimas quatro sondagens divulgadas sobre legislativas:
- PS desce em 3, mantém numa.
- PSD sobe em 3, desce numa.
- BE sobe em 3, mantém numa.
- CDU desce em 3, sobe numa.
- CDS-PP desce nas quatro.
Atenção, contudo, que os pontos de comparação temporais não são sempre os mesmos: mensal para Marktest, Aximage e Eurosondagem, trimestral para CESOP/UCP.
quinta-feira, maio 14, 2009
Assim é que está bem
Sondagens
segunda-feira, maio 11, 2009
Broken Windows
Broken windows: New evidence from New York City and a five-city social experiment- "evidence (..) provides no support for a simple first-order disorder-crime relationship as hypothesized by Wilson and Keller."
Carrots, Sticks, and Broken Windows - "it is important to emphasize that arrests for felonies have the largest effect on felony crimes and that the effects of broken-windows policing, although significant for some crimes, are not universally significant, nor are they of great magnitude."
The irony of broken windows policing: A micro-place study of the relationship between disorder, focused police crackdowns and fear of crime: "This study provided evidence for the broken windows policing hypothesis that disorder leads to fear of crime. Examining fear of crime among citizens at a micro-place unit of analysis revealed that higher levels of both perceived social disorder and observed physical disorder led to significantly higher levels of fear of crime. For those advocating broken windows policing approaches, however, the data also suggest reason for caution. Those living in an area that received the extra police presence (controlling for other factors in the model) also reported higher levels of fear."
E dois estudos que interpretam os mesmos dados chegando a conclusões diferentes. O primeiro é o mais citado de sempre sobre o tema:
Systematic social observation of public spaces: A new look at disorder in urban neighborhoods:
"observed disorder did not match the theoretical expectations set up by the main thesis of “broken windows” (Wilson and Kelling 1982; Kelling and Coles 1996). Disorder is a moderate correlate of predatory crime, and it varies consistently with antecedent neighborhood characteristics. Once these characteristics were taken into account, however, the connection between disorder and crime vanished in 4 out of 5 tests—including homicide, arguably our best measure of violence."
Spuriousness or mediation? Broken windows according to Sampson and Raudenbush (1999): "In sum, Wilson and Kelling's broken windows theory argues that disorder causes social withdrawal and low informal social control, which in turn causes crime. Sampson and Raudenbush, 1999 interpreted their own results as not supporting the broken windows theory because disorder did not have a direct effect on crime after controlling for collective efficacy. The problem with this interpretation is that the broken windows theory never argued that disorder had a direct unmediated effect on crime. According to the broken windows theory, disorder undermines informal social control, which in turn leads to an increase in crime. This is the core premise of the broken windows theory, a premise that Sampson and Raudenbush's results did not contradict."
E uma última frase neste último artigo que diz tudo:
"While debate in the popular press continues, academics are pushing forward in their attempts to understand the link between disorder and crime. Several articles have been published in recent years showing empirical evidence both in support of and against the broken windows theory (...) Thus far, no final consensus has been reached."
Era fácil se fosse só as broken windows, não era?
P.S. - Só para dizer que, não sendo especialista do assunto, até simpatizo com a tese. Mas os resultados das experiências dos psicólogos sociais, como acontece tantas vezes, não são fáceis de replicar e comprovar quando se sai de ambientes mais artificiais e se tenta generalizar...
P.P.S - Enviada por um leitor, uma referência adicional de Steven Levitt, tornada famosa devido ao argumento sobre os efeitos de Roe vs. Wade na criminalidade: Understanding Why Crime Fell in the 1990s.
"Manipulação infernal"
"A Universidade Católica Portuguesa – através do Centro de Estudos e Sondagens de Opiniões (CESOP), tem demonstrado uma incompetência e uma desonestidade que escandaliza qualquer pessoa minimamente bem formada. Esta atitude, já com longos anos de prática demonstra como a igreja católica portuguesa e a sua componente científica troca conscientemente os mandamentos de Deus, por interesses materiais e de grupos apoiados na manipulação da verdade. Como católico, fico profundamente chocado quando o vício do pecado se torna banal ao ponto de ser exibido com naturalidade em público. "
"Manipular a verdade é próprio das pessoas de mau carácter, pactuar com situações destas é um exemplo de que a comunicação social é pobre do ponto de vista jornalístico, no mínimo passiva, mas a igreja ao mais alto nível apoiar valores contrários aos sagrados princípios demonstra a fraqueza humana."
sábado, maio 09, 2009
Europeias. Marktest, 14-19 Abril, N=803, Tel.
PSD: 32,9%
BE: 8,4%
CDU: 7,6%
CDS-PP: 4,5%
Brancos/Nulos: 13,5%
O total disto é 100%, pelo que presumo que ninguém na amostra indicou intenção de voto noutros partidos. A notícia no Semanário Económico indica igualmente que, em relação à totalidade da amostra, 50,7% afirmaram não saber em quem votariam ou não respondem.
Uma nota final para assinalar que, do ponto de vista do trabalho de campo, esta foi de facto a primeira sondagem, das três já divulgadas, a ser conduzida.
sexta-feira, maio 08, 2009
Sondagens e democracia
Por estes dias, passa-se algo que me faz lembrar estas palavras de Greenberg. Ao abrigo do novo Estatuto dos Açores, a Assembleia Legislativa Regional prepara-se para legalizar a "Sorte de Varas" em toda a região, ou seja, se bem percebo - não sou nada entendido - as corridas de touros com picadores. O tema tem sido controverso nos Açores mas - digo isto à distância, talvez esteja errado - não parece ser suficientemente importante para poder ditar o resultado de futuras eleições. Em circunstâncias destas, os agentes políticos têm incentivos para acederem à vontade de interesses particularistas, que até podem ser partilhados por muito pouca gente mas estão bem organizados e dão grande importância a um determinado tema. Neste caso, os membros da Tertúlia Tauromáquica Terceirense.
Mas o que pensa a generalidade dos açorianos de tudo isto? A verdade é que não se sabe. É até possível que a maioria esteja a favor ou seja indiferente. É certo que, na Assembleia Legislativa dos Açores entraram, se não erro, 406 petições sobre o assunto, 17 a favor da Sorte de Varas e 389 contra. Mas não é absolutamente garantido que isto reflicta a distribuição das preferências dos açorianos. Houve uma sondagem online, com resultados muito desfavoráveis, mas amostras voluntárias em sites de internet não dão garantias se sequer se aproximarem de uma boa imagem das opiniões do universo dos açorianos.
Logo, o ideal seria, claro, um referendo regional. Num artigo já com uns anos, o economista político Bruno Frey explica uma das vantagens dos referendos. Os políticos podem formar coligações contra os eleitores, impedindo a entrada de certos temas na agenda política e impondo outros. Especialmente se houver possibilidade dos cidadãos proporem iniciativas de referendo, os referendos retiram o monopólio no controlo da agenda política aos políticos e revelam as preferências dos eleitores em temas nos quais os políticos prefeririam que elas não fossem conhecidas (presumindo, claro, que não se utilizariam o tipo de regras de quórum de aprovação ou participação que distorcem os resultados). Infelizmente, nos Açores, se não estou em erro, só a Assembleia Legislativa pode apresentar propostas de referendo regional. Logo, o instrumento que poderia quebrar uma coligação da classe política contra os eleitores está nas mãos da...classe política.
O que sobra? Sondagens. É pena que só sobre isto. Mas elas poderiam ajudar a confirmar se, de facto, a maioria dos açorianos apoia ou é indiferente a esta proposta ou se, pelo contrário, é contra. O facto de não se planear um referendo nem haver vislumbre de sondagens sobre o assunto consente supor, infelizmente, que deverá ser a segunda hipótese a verdadeira.
Corredor do Poder
Legislativas. Eurosondagem, 30 Abril-5 Maio, N=1021, Tel.
PSD: 30,5% (29,6%)
BE: 9,8% (9,6%)
CDU: 9,2% (9,4%)
CDS-PP: 6,9% (7,0%)
OBN: 4,8% (4,8%)
Aqui.
quinta-feira, maio 07, 2009
Mais Espanha
quarta-feira, maio 06, 2009
Espanha
Factos
Num post abaixo, escrevi que o deputado António Carlos Monteiro tinha afirmado na RTP-N que, nas últimas regionais dos Açores, o CDS-PP tinha tido o dobro dos votos que aquilo que uma sondagem da Católica previa. Contestei essa afirmação, mostrando que o CESOP não tinha conduzido nenhuma sondagem pré-eleitoral nessa eleição e mostrando os resultados da única sondagem que a Católica tinha feito para essa eleição, uma sondagem à boca das urnas divulgada pela RTP no fecho das urnas.
Num comentário a esse post, entre outras considerações, António Sousa Monteiro desmente ter dito aquilo que eu afirmei que ele disse. Escreve, nomeadamente, o seguinte:
"Aconselho-o também a ser mais cuidadoso nas afirmações que faz e quando imputa aos outros mentiras ou invenções. Tive o cuidado de ouvir novamente tudo o que disse no programa em causa: desvalorizei todas as sondagens porque subavaliavam em regra o CDS-PP, chamei à atenção para que os resultados nos Açores tinham penalizado o centrão e o CDS tinha tido o dobro do previsto, sem nunca ter mencionado o nome da Católica (aliás a Universidade onde tirei o curso e que lamento ver o nome associado a estas sondagens).Vá verificar tudo o que eu disse e veja se sou eu ou o Pedro Magalhães quem inventou ou mentiu? Terá sido por enfiar a carapuça?"
Segui o conselho do senhor deputado. Passo assim à transcrição das afirmações de António Sousa Monteiro no programa Pontos de Vista, emitido pela RTP-N no dia 2 de Maio:
"Eu só diria o seguinte. Se até já o PCP se queixa das sondagens, então o que é que o CDS pode fazer. Aliás, nos Açores - e as sondagens que foram feitas para o acto eleitoral dos Açores demonstraram que o CDS valia muito mais do que aquilo que aparecia nas sondagens. Aliás, nos Açores, teve o dobro daquilo que a vossa sondagem na RTP previa."
A não ser que o deputado Sousa Monteiro - mesmo após ter ido comentar uma sondagem da Católica para a RTP e depois de ter tido "o cuidado de ouvir novamente tudo o que disse" - ainda não tenha descortinado que é a Universidade Católica que faz as sondagens para a RTP, teremos então de concluir que os factos contrariam não apenas a sua primeira afirmação - a da existência da tal sondagem - mas também a segunda - a de que não afirmou aquilo que eu disse que ele afirmou. O vídeo está disponível aqui, no site da RTP. A transcrição refere-se a um trecho que ocorre quando o relógio no canto superior direito marca 1:44.
Late deciders
segunda-feira, maio 04, 2009
Colecção
O CDS-PP e as sondagens
O problema, contudo, é quando se fazem afirmações que colidem, de forma comprovável, com a realidade. Essas, lamento, não posso deixar passar. Já mencionei um deputado do CDS-PP que imaginou uma sondagem inexistente do CESOP. E agora, quer em comentários abaixo quer em num post de Paulo Pinto Mascarenhas, aparece a ideia de que "a Católica costuma falhar redondamente nas previsões sobre o CDS."
Sugiro que dêem uma vista de olhos no quadro abaixo. Contém, para as eleições mais recentes em que o PP concorreu sozinho e para as quais o CESOP fez sondagens, assim como para todas as legislativas e europeias com as mesmas características:
- as estimativas para o CDS-PP da última sondagem publicada pelo CESOP antes das eleições;
- a média dos resultados das restantes sondagens;
- o resultado do CDS-PP nas eleições;
- o confronto entre as estimativas do CESOP e a média das restantes sondagens com os resultados reais;
- o erro amostral associado às estimativas feitas pelo CESOP para o CDS-PP, tendo em conta a dimensão da amostra e pressupondo aleatoriedade;
- se a estimativa ficou, no confronto com o resultado, dentro do erro amostral.
1. Em nove eleições consideradas, a estimativa do CESOP esteve cinco vezes abaixo do resultado que o CDS-PP acabou por ter, e quatro vezes acima desse resultado.
2. Em quatro desses cinco vezes que subestimou o resultado do CDS-PP, o CESOP subestimou-o menos que a média das restantes sondagens realizadas para as mesmas eleições.
3. Em duas dessas cinco vezes, a estimativa do CESOP ficou dentro dos limites do erro amostral.
Quer isto dizer que está tudo óptimo para mim? Não. Há quatro dos nove casos que me aborrecem: as legislativas de 2002 e as Europeias de 1999, em que apesar de termos subestimado o CDS-PP menos do que a média das restantes sondagens, as estimativas ficaram fora do erro amostral; Lisboa 2005, em que sobrestimámos a votação no CDS-PP (pouco) mais do que admissível pelo erro amostral ; e as legislativas de 2005, em que subestimámos o CDS-PP mais do que a média das restantes sondagens e fora do erro amostral.
Dito isto, espero que tenha ficado claro que a afirmação "a Católica costuma falhar redondamente nas previsões sobre o CDS" é falsa. Não tem outra classificação possível. Primeiro, porque a Católica não costuma "falhar redondamente" nas "previsões" sobre o CDS. Segundo, porque quando a Católica subestimou o CDS-PP, subestimou-o quase sempre menos que a média das restantes sondagens. Isto não impede que reflictamos sobre a possibilidade de que haja um problema geral na estimação dos votos no CDS-PP, como tive a oportunidade a de discutir aqui há uns anos neste mesmo blogue. Mas isso não autoriza a afirmação citada.
O post aqui fica, como registo, e para aqui farei ligação quando voltar a ouvir o "lapso" (vamos designá-lo com benevolência) do costume. Da maior parte das pessoas que agitam esta ideia, que espero ter mostrado ser comprovadamente falsa, não espero que venham agora a público corrigir as suas afirmações. A não ser de um: Paulo Pinto de Mascarenhas. É o único caso em que vou ficar desapontado se aguardar em vão.






