quinta-feira, junho 04, 2009
Deputados
Europeias. Marktest, 27-30 Maio, N=807, Tel.
PS: 29,4%
BE: 8,9%
CDU: 8,9%
CDS-PP: 3,3%
É o que sei para já, na base desta notícia. Excitante, não? Claro que voltamos ao "empate técnico", ideia que, volto a dizer, é preciso confirmar quando soubermos a dimensão real da sub-amostra na base da qual estas percentagens são estimadas (ainda não sei qual é, mas não é 807, certamente). Mas é a primeira sondagem que coloca o PSD à frente, e isso pode não ser irrelevante, porque pode sugerir uma tendência. Mas com mais dados poderemos olhar melhor para isso. Agora ainda é cedo.
Sei que sou fastidioso, mas recordo, a propósito de uma notícia no Público: se de facto o PSD subiu nos últimos dias, isto não "confirma uma tendência" prévia (indetectável na base dos dados anteriores). E a habitual frase "Se as eleições europeias fossem hoje o [partido x] venceria o escrutínio" está mesmo a pedir inclusão no capítulo no Livro de Estilo do Público intitulado "Frases que constituem justa causa para despedimento".
A soma dá 83%, pelo que presumo que haja 17% de votos noutros partidos, brancos e nulos. Mas rectificarei caso se verifique não ser assim. Obrigado ao leitor que me avisou em comentário no post abaixo.
quarta-feira, junho 03, 2009
Meios de campanha
"Para mim, que estou muito longe destas realidades, esta peça do Público sobre os meios de campanha é impressionante: http://tcp3.com/j1kz"
Previsão modelo Hix/Marsh para Portugal
Previsões actualizadas modelo Hix/Marsh para Portugal:
PS: 35% (9);
PSD: 30% (7);
BE: 11% (2);
CDU: 10% (2);
CDS-PP: 8.5% (2)
segunda-feira, junho 01, 2009
Voto obrigatório
P.S. - Caro João. Quem apanhe esta discussão a meio fica a pensar que eu defendi o voto obrigatório no artigo do Público. Não defendi, pelo contrário, como certamente reparou. Mas escrevi um parágrafo no texto sobre a discussão do tema num plano meramente normativo, simplesmente para dizer que a discussão é muito difícil de resolver nesse plano, e que de todo se pode resolver numa penada, como esta sua penada que critiquei neste post. Só para dar um exemplo, consentir que apenas algumas pessoas votem (e outras não) pode ser visto como algo que colide com a igualdade política, se acreditarmos que há obstáculos económicos e sociais ao voto que um regime democrático deve tomar em conta e resolver (ver aqui, aqui ou aqui). E note que eu nem sequer disse que concordo com esta segunda visão. O que procurei fazer foi dizer que, num plano meramente normativo, a questão é muito mais difícil do que é sugerido pelo seu post inicial, e que podemos tomar um atalho: questionar, do ponto de vista empírico, as pressuposições sobre os efeitos do voto obrigatório daqueles que o defendem no plano dos princípios.
domingo, maio 31, 2009
Tendências?

Nem me arrisco a fazer qualquer tipo de afirmação sobre isto, a não ser para vos dar um elemento adicional. Há um teste estatístico sobre a diferença de proporções entre duas amostras independentes (ver aqui, por exemplo). Se o fizermos, para as duas sondagens de cada instituto e para cada partido, e tomando em conta as dimensões das sub-amostras, só quatro dessas diferenças emergem como estatisticamente significativas a 95%:
- 3 na Intercampus: BE (-), CDS-PP (-) e OBN (+);
- 1 na Aximage: OBN (+).
Europeias, Ponto de Situação
Taxas de resposta
Note-se que a taxa de resposta em entrevistas telefónicas corresponde à proporção de entrevistas completas sobre a soma das seguintes parcelas:
1. Entrevistas completas
2. Entrevistas iniciadas mas não completadas;
3. Recusas;
4. Casos em que não se estabeleceu contacto com a pessoa que deveria responder;
5. Outros casos em que a pessoa que deveria ter sido inquirida não o pôde ser (falecido, incapaz de responder por razões físicas ou psíquicas, problemas linguísticos, etc.);
6. Casos em que não se conseguiu apurar se o nº de telefone seleccionado corresponde a um domicílio;
7. Casos em que o nº de telefone esteve ocupado nas várias tentativas.
8. Casos em que não se conseguiu determinar se no domicílio existe um membro do universo.
É evidente, para quem saiba um mínimo sobre como este tipo de sondagens correm realmente, que a divisão do valor 1 sobre a soma dos valores 1 a 8 nunca dá 0,85, ou seja, não há taxas de resposta de 85% em inquéritos deste género. Logo, uma das coisas com que a ERC se deveria preocupar, a meu ver, seria garantir que todos os institutos usam, nas suas fichas técnicas, a mesma definição do que é uma taxa de resposta, porque pelos vistos não o estão a fazer. Estarão, provavelmente, a relatar uma taxa de cooperação, que é simplesmente o rácio do valor em 1 sobre a soma dos valores 1 a 3 (na sua versão mais "benévola"). O que significa também que, enquanto não houver convergência de critérios, ninguém vai dar a taxa de resposta (ninguém está disposto a fornecer valores reais de 10-30% para que eles sejam - ilegitimamente - comparados com valores de 85%).
Isto é especialmente importante para as sondagens que usam amostragem aleatória porque, como se diz no post que mencionei inicialmente, é assim que se mostra em que medida a amostra obtida se desvia da presunção de que todos os seus elementos resultaram de uma selecção dos membros do universo com igual probabilidade.
sábado, maio 30, 2009
Coisas que me chegam pelo Google Alerts
"Não houve uma única eleição em que eu tivesse participado em que as sondagens não tivessem apresentado para o CDS piores resultados do que os votos em urna. O CDS vai ter um grande resultado."
"Manuela Moura Guedes criticou esta noite a «falta de ética» e o «comportamento jornalístico» do Diário de Notícias. Em causa, o facto de a edição electrónica do diário ter referido durante a tarde uma sondagem exclusiva da TVI."
E a grande vencedora de hoje:
"Ainda é muito cedo para vaticinar uma vitória do PS (...) são factores que vão determinar uma vitória do PS"
Europeias. Marktest, 20-22 Maio, N=804, Tel.
PSD: 30,1%
BE: 7,1%
CDU: 7.1%
CDS-PP: 4,7%
OBN: 19.1%
Estas percentagens são em relação a um total de 382 inquiridos, já que, dos 804, 387 não responderam ou disseram não saber em quem votar ao passo que 35 declararam que não votariam.
Gostava de chamar a atenção para uma coisa. Aqui há uns tempos, a propósito do Barómetro da Marktest para as legislativas, lembrei que a Marktest faz ponderação pós-amostral usando a recordação de voto em 2005 como variável de ponderação. Mais recentemente, quando olhei para os resultados da sondagem anterior da Marktest sobre as europeias, desconfiei. Mas agora confirmei: a Marktest, no caso das europeias, não faz ponderação pós-amostral. E fica por isso com valores para os OBN semelhantes àqueles que tipicamente apresenta nas sondagens sobre as legislativas antes de ponderação. Na sondagem sobre as legislativas divulgada também hoje, por exemplo, os OBN antes de ponderação são 17,2%.
Por que faz a Marktest isto? Não sei. Eu imaginaria que um procedimento que tem como objectivo corrigir distorções da amostra serve tão bem (ou tão mal) para perguntas sobre uma eleição como para perguntas sobre outra (ou, de resto, para perguntas que nem sejam sobre eleições). Mas deve haver uma razão. Já os simpatizantes de um dos "Outros" partidos talvez não devam gastar os foguetes todos a propósito destes "19,1%" (se bem que, se eu fosse um político de um desses partidos, se calhar já tinha começado a explicar que a Marktest anuncia uma transformação radical do sistema partidário português...).
sexta-feira, maio 29, 2009
Europeias. Intercampus, 15-26 Maio, N=992, Presencial (voto simulado em urna)
PSD: 32%
BE: 9,9%
CDU: 7,7%
CDS-PP: 3,5%
OBN: 9,8% (outros partidos representam 4,9%).
19,2% da amostra era composta por Não sabe/Não responde, pelo que as percentagens acima foram calculadas em relação a uma base de 802 inquiridos. Não detecto em sítio nenhum números sobre abstencionistas declarados, pelo que mais uma vez presumo que ou a amostra é composta por pessoas que afirmam tencionam votar ou os abstencionistas declarados estão entre os 19,2%.
Obrigado aos leitores que foram enviando esta informação.
Europeias, Ponto de Situação

Já agora, mesmo ciente das objecções possíveis, aqui vão os resultados caso estas sondagens fossem uma única (ou seja, uma média ponderada de todas as sondagens), com uma amostra de 5326 inquiridos com intenções de voto válidas, branco e nulo:

Reporto apenas intervalos de confiança com aproximação à normal, dado que, com uma amostra destas, os resultados são exactamente (à décima) iguais aos dos intervalos exactos. Notem como as diferenças entre PS e PSD, BE e CDU, e CDU e CDS estão todas acima da margem de erro (explicação aqui, com links para fontes).
Sobre intervalos de confiança para distribuições multinomiais, há uma discussão interessante entre o LA-C e um comentador aqui. Segundo percebo, o paper mais citado sobre o assunto é este. Mas o tema está muito para além das minhas capacidades.
Europeias. Eurosondagem, 25-27 Maio, N= 2525, Tel.
PSD: 32,5%
CDU: 9,2%
BE: 8,8%
CDS-PP: 6,5%
A soma disto dá 92,5%, pelo que presumo que OBN:7,5%.
A notícia menciona igualmente que, entre os 2525, 19,2% (485) não sabe ou não responde. Pelo que a sub-amostra de eleitores com intenções de voto será de 2040 inquiridos. Não há menção de abstencionistas declarados nas várias notícias que consultei, pelo que presumo que, entre os 2525, todos afirmaram que iriam votar. Mas estou a presumir.
quinta-feira, maio 28, 2009
Intervalos de confiança exactos (e outros)
E um mini-paper que desenvolve o que o Luís explicou.
Ainda o empate entre o PS e o PSD
Há quem não goste da estratégia de tratar de várias sondagens como se de uma só (grande) sondagem se tratasse. Os argumentos são legítimos: Não podemos saber se não terá havido uma pessoa a responder a mais do que uma sondagem, as metodologias das sondagens são diferentes, o tratamento dos indecisos é diferente, etc, etc. Todos estes argumentos são válidos apesar de, na minha opinião, serem pouco relevantes. De qualquer forma, podemos pegar no problema por outra perspectiva.
Vamos admitir que o PS e o PSD estão, de facto, empatados. Se esta hipótese estiver correcta, então a probabilidade de o PS aparecer à frente numa dada sondagem é de 0,5 (50%). A probabilidade de aparecer à frente em duas sondagens é de 0,5x0,5=0.25 (25%). A probabilidade de aparecer à frente nas seis sondagens já realizadas seria de 0,5^6=0,015625 (1,56%). Ou seja, se os partidos estivessem empatados, a probabilidade de nas 6 sondagens já feitas o PS aparecer sempre à frente seria de 1,56%. Podemos então pôr de parte essa hipótese de ambos estarem empatados com um grau de certeza de 98,4%. É impossívelque estejam empatados? Não, apenas altamente improvável. O mesmo raciocínio se aplica à disputa pelo terceiro lugar, entre o BE e o CDS, e à disputa para o 4º lugar no pódio, disputa entre o CDS-PP e a CDU.
quarta-feira, maio 27, 2009
Intervalos de confiança (só para nerds)
Num dos seus últimos posts, o Pedro explicou com algum detalhe como se calculam intervalos de confiança a partir das sondagens. Penso que explicou muito bem, mas houve algo que não explicitou.
A ideia de um intervalo de confiança é tentar perceber que votações num dado partido são compatíveis com uma dada sondagem. Por exemplo. Suponhamos que uma sondagem dá 40% ao PS. É apenas uma sondagem, não podemos ter a certeza de que a percentagem de votantes no PS seja, de facto, 40%. Pergunta-se então que valores que são compatíveis com os 40% da sondagem? Se a sondagem aponta para 40%, então não é razoável acreditar que o verdadeiro valor das intenções de voto seja 80%, por exemplo. Já 38 ou 42% parecem valores razoáveis. E 48%?, é razoável? É na definição dos extremos que entram os intervalos de confiança.
Por qualquer motivo, que desconheço, convencionou-se que um bom intervalo de confiança era o de 95%. A ideia é subtil. Escolhe-se um intervalo de tal forma que se se fizessem muitas sondagens, 95% delas incluiriam o verdadeiro valor da votação do PS nos seus intervalos de confiança. Isso quer dizer que se, se fizer muitas sondagens, uma em cada 20 errará por muito.
Como calcular esse intervalo de confiança? Quem sabe uns rudimentos de estatística, sabe que a distribuição dos votos segue uma lei de probabilidade binomial. Mas esta é daquelas distribuições que é chatinha de usar, pelo que a maioria das pessoas usa a lei normal, que é muito simples de usar e é uma aproximação bastante razoável na maioria dos casos.
Infelizmente, quando se fala de partidos com pequenas votações a aproximação deteriora-se bastante, podendo até levar a situações de puro nonsense. Imagine o leitor que numa amostra de 400 pessoas, 0,7% declararam votar no POUS. Um intervalo de confiança de 95% incluiria todos os valores desde o 0,1% negativos até ao 1,5% positivo. Ou seja, estar-se-ia a considerar como hipótese razoável que o POUS tivesse um número negativo de votos. Já se se usasse a lei binomial concluir-se-ia, correctamente, que o intervalo de confiança ia de 0,15% até 1,79%. Refaço o quadro que o Pedro fez com os intervalos de confiança para a última sondagem da Aximage, com percentagens calculadas para um universo de 401 pessoas):
Veja-se que a aproximação que o Pedro fez é quase perfeita para o PS e PSD, subestima um pouco a votação dos pequenos partidos (BE, PCP e CDS) e prejudica bastante os micro partidos (o meu intervalo inferior é 30% mais elevado que o do Pedro). Repare-se que este fenómeno pode ajudar a explicar a sensação que muitas vezes se tem de que as votações dos pequenos partidos, sistematicamente, se situam na parte superior do intervalo de confiança. Muitas vezes ouvi dirigentes do PCP e do CDS a queixarem-se disto mesmo.
Olhando para os intervalos de confiança estimados a partir desta sondagem, não se poria de parte a hipótese de o PSD ser o mais votado, nem de o CDS-PP ser a terceira força. Infelizmente para uns, e felizmente para outros, o facto de haver várias sondagens permite reduzir os intervalos de confiança. Como mero exemplo académico, imagine o leitor que em vez de uma sondagem da Aximage, havia 4 sondagens diferentes, feitas seguindo a mesma metodologia e que em média, os resultados são iguais ao quadro de cima. Excluindo a hipótese de haver alguém que tenha respondido a mais do que uma sondagem, temos o equivalente a uma grande sondagem feita com base em 1604 pessoas:

Os intervalos de confiança ficam bem estreitos. Dado que já várias sondagens foram feitas e que todas apontam para uma vitória do PS é difícil de aceitar a hipótese de o PSD e o PS estarem empatados. Para já, o PS leva vantagem.
A última sondagem da Aximage, reloaded
Abstenção: 64,7% (776 dos 1200 inquiridos, na base do gráfico apresentado)
Intenções de voto antes de redistribuição de indecisos:
PS: 38,0%
PSD: 31,1%
BE: 8,5%
CDU (PCP): 7,9%
CDS-PP: 6,3%
OBN: 2,8%
Indecisos: 5,4%
Intenções de voto após redistribuição de indecisos (tratados como abstencionistas; meu cálculo):
PS: 40,2%
PSD: 32,9%
BE: 9,0%
CDU (PCP): 8,4%
CDS-PP: 6,7%
OBN: 3,0%
(Soma dá 100,2% devido a arredondamentos)
Agora notem uma coisa interessante. Se na amostra há 776 declarados abstencionistas, e se nos 424 que indicaram que iriam votar há 5,4% de indecisos (23 pessoas), então a sub-amostra na base da qual os últimos resultados são calculados é composta por 401 observações. E se é assim:

Então esta sondagem dá (espero não ter errado nenhuma fórmula)... outro empate técnico entre o PS e o PSD, seja do ponto de vista mais vulgar da "sobreposição de intervalos" seja do ponto de vista mais correcto da significância estatística da diferença entre as duas proporções. Não parecia, pois não? Isto, claro, na presunção de que os 64,7% de abstencionistas correspondam a 64,7% da amostra. Mas no CM em papel não ficam dúvidas disso.
Por outro lado, como expliquei aqui no outro dia, não é de todo indiferente que esta seja a sexta de seis sondagens onde, havendo "empates técnicos", há sempre mais intenções de voto no PS que no PSD...



