terça-feira, maio 31, 2011

Eurosondagem, 26-30 Maio, N=2059, Tel.

PSD: 35,5%
PS: 32,2%
CDS: 12,6%
CDU: 7,6%
BE: 6,3%

Aqui. Em relação aos resultados de ontem, PSD sobe 0,7 pontos, é a única mudança assinalável. No trabalho de campo conduzido exclusivamente no dia 30, os resultados foram os seguintes:


PSD: 36,4%
PS: 32,4%
CDS: 12,3%
CDU: 7,6%
BE: 6,1%

Mas estamos neste caso a falar de cerca de 500 inquiridos. 

Gráfico dinâmico

Há por aí muitos gráficos com sondagens. Este, feito por mim, este, na Marktest, ou este e este, no Público e na SIC Notícias, respectivamente. E de certeza que há mais.

Mas o que não há, que eu saiba, é um gráfico dinâmico onde se possa, que sei eu, ver todos os resultados desde 2005, escolher diferentes empresas ou partidos, modificar o eixo y para ver melhor o que se passa com os pequenos partidos ou escolher diferentes intervalos de tempo.

Não há? Não havia. Mas o Bernardo Caldas, 19 anos, estudante de Engenharia Electrotécnica e de Computadores no Instituto Superior Técnico, achou que devia haver. E achou bem. Parece-me que fez isto em dois fins de tarde. E vocês, na infografia dos jornais online, já voltaram de tomar o cafézinho?

segunda-feira, maio 30, 2011

Eurosondagem, 25-29 Maio, N=2052, Tel.

PSD: 34,7%
PS: 32,1%
CDS-PP: 12,9%
CDU: 7,7%
BE: 6,3%

Aqui. Estes resultados são produzidos inquirindo 2052 pessoas mas ponderando os quatro dias de trabalho de campo de forma diferente (não houve trabalho de campo dia 28). Eu tenho tratado os resultados de uma maneira alternativa, olhando para os resultados de blocos de cerca de 1000 inquiridos de cada vez. Se o fizermos (e compararmos com os 1000 anteriores), ficamos, salvo erro, assim:

27-29 Maio, N=1025
PSD: 34,8% (+1,0)
PS: 32,1% (-0,6)
CDS-PP: 12,6% (-0,7)
CDU: 7,6% (-0,1)
BE: 6,5% (=)

Intercampus, 25-29 Maio, N=1010, Tel.

PSD: 37% (-2,6)
PS: 32,3% (-0,9)
CDS-PP: 12,7% (+0,6)
CDU: 7,7% (+1,1)
BE: 5,2% (-0,4)

Aqui. Espero que isto não lance confusão, mas tal como tenho sempre feito estou a comparar com a última amostra independente da Intercampus, ou seja, o estudo cujo trabalho de campo terminou a 22 de Maio. Como é óbvio pela notícia, se compararmos com a amostra da sondagem imediatamente anterior (com a qual esta partilha dois dias de trabalho de campo), o PSD sobe.

Intenções de voto e resultados eleitorais

Sondagens não são previsões, já sabemos. Mas se houvesse um padrão regular nas diferenças entre as intenções de voto medidas pelas sondagens e os resultados eleitorais, isso seria desde logo um passo possível numa tentativa de usar as intenções de voto para prever resultados. O que tenho para dizer sobre o assunto está aqui (.pdf) em colaboração com o Luís Aguiar-Conraria e o Miguel Maria Pereira. Mas numa abordagem um pouco mais descritiva, o que encontramos quando comparamos as sondagens feitas nas últimas duas semanas antes das eleições (medindo intenções de voto) e aqueles que acabam por ser os resultados? O quadro abaixo mostra o que se encontra nas três últimas eleições legislativas:


Não quero tirar daqui conclusão alguma. O que concluo sobre este tipo de análise está no artigo linkado acima. Os leitores tirarão as suas.

Nota: tendo em conta os comentários aqui e noutros sítios, duas coisas. Primeiro, o intervalo mostra os valores mínimos e máximos. A média é a média dessas E das restantes sondagens. Segundo, olho apenas para 2002 e seguintes porque antes não se podia divulgar sondagens na última semana.

Probabilidade de o PS ganhar as eleições, segundo MRS

"Eu próprio dizia, há quatro ou cinco dias, que achava que o PS tinha 10% de hipóteses de vitória, olhando para a evolução das sondagens, há uma semana atrás ou no começo da semana. Aumentou essas probabilidades, eu hoje já diria que tem para aí 30% ou 35% das hipóteses", afirmou ontem Marcelo Rebelo de Sousa, no jornal das 8 da TVI.

Um mês de twitosfera (29 de Abril a 29 de Maio)




"Outros, Brancos e Nulos"

Um amigo chamou-me a atenção para a possibilidade da parcela "Outros, Brancos e Nulos" estar a aumentar nas sondagens. Fiquei curioso, mas desde logo um pouco preocupado. Primeiro, fico sempre um pouco inquieto quando se trata de analisar o conceito de "Outros, Brancos e Nulos", uma categoria residual, no sentido em que reúne coisas muito diferentes entre si. Segundo, receio sempre que os resultados das sondagens nesta categoria tenham um tratamento demasiado diferente de sondagem para sondagem. Na Marktest, por exemplo, notem como os resultados, mesmo depois de distribuídos os indecisos, atribuem 12,6% à categoria "Voto Branco/Outros" e como depois a Marktest "pondera" os resultados finais da seguinte forma: "ajustado o valor dos votos brancos e outros com base no valor obtido nas últimas Eleições para a Assembleia da República - Fev.2005" (deve ser gralha o Fev. 2005). Por outras palavras: a Marktest acha que a sondagem está a sobrestimar os OB's e recalcula tudo atribuindo-lhes um valor mais baixo. O único outro caso que conheço bem é o do CESOP, onde as pessoas que declaram voto em branco são questionadas sobre a sua inclinação de voto. Só aqueles que dizem que votariam em branco E não demonstram uma inclinação de voto são tratados como votos em branco no final. E não sei o que se faz ou como se faz nas outras empresas. Tudo isto para dizer que:

1. Há pelo menos duas empresas que sentem que captam votos em branco acima das reais intenções dos inquiridos;
2. As empresas tratam desta assunto de formas muito diferentes.

Dito isto, podemos olhar, com muita cautela, para a evolução dos OBN's. A primeira coisa que vi foi isto:



















Se presumirmos a possibilidade de os OBNs estarem a mudar linearmente com a passagem do tempo e formos à procura desse padrão, ele está lá, e é de crescimento. Mas o que acontece se tornarmos esta evolução mais sensível a mudanças na tendência?



















Crescimento até início do ano e depois diminuição. Mas tudo isto merece outro tipo de tratamento. Se o tratamento dos OBN's é muito sensível ao que é feito por cada empresa, temos um caso onde controlar por house effects se torna particularmente importante. E se fizermos isso, o que vemos?

1. Entre Março de 2005 e Janeiro de 2011, a percentagem de OBN's aumenta quase 4 pontos.
2. Entre Janeiro de 2011 e a segunda metade de Maio, desce 2,5 pontos.

Logo, a afirmação de que os OBN's estão a subir é correcta a médio/longo prazo, mas incorrecta a curto-prazo. É o melhor que consigo concluir neste momento.

"Perceba a treta das sondagens"

Por Luís Filipe Malheiro, no Jornal da Madeira. Um excerto:

"Sempre que as pessoas ouvirem falar de sondagens, percebam logo que estão a ser enganadas, porque estamos a falar de um embuste e de uma aldrabice que deveria, apadrinhada pela comunicação social, justificar a intervenção do Ministério Público, levando a tribunal as empresas vendedoras desta falcatrua para além da reacção de outras entidades com tutela neste domínio, casos da Comissão Nacional de Eleições e da ERC."

sábado, maio 28, 2011

Ponto da situação (rectificado)

Sobre a Eurosondagem, o que começou a ser feito a partir de ontem é a apresentação de uma média ponderada dos últimos 4 dias de trabalho de campo: 40% o dia anterior, 30% antes desse, 20% antes desse e 10% antes desse. Eu acho isto interessante e já houve comentários também nesse sentido aqui no blogue. Mas vou apresentar uma coisa mais convencional. O quadro abaixo é uma lista de resultados de amostras independentes desde meados de Abril. Com isto quero dizer que conto apenas com as sondagens de Intercampus "uma sim uma não" e, no caso da Eurosondagem, agrego os resultados de dois dias consecutivos. Calculo também a dimensão da amostra na base da qual as estimativas são apresentadas e duas médias ponderadas por essa dimensão: a das últimas cinco sondagens e a das últimas sondagens de cada empresa.


Várias coisas:

1. Parecem poucas, não parecem? Se filtrarmos as tracking pegando apenas em amostras independentes, ficam menos sondagens do que nos vai parecendo no dia-a-dia.
2. Últimas cinco sondagens (as mais recentes): entre 34 e 36 para o PSD; entre 32 e 36 para o PS; entre 10 e 13 para o CDS; entre 8 e 9 para CDU; entre 6 e 7 para BE. Acham muito? Não é, tendo em conta as dimensões das amostras efectivas.

3.  Recordo médias da nossa pool de previsões:
PSD: 34,2%
PS: 32,2%
CDS-PP: 11,9%
CDU: 8,4%
BE: 7,2%
Giro, não é?

P.S.- O quadro anterior tinha um erro numa sondagem da Intercampus e outro numa sondagem Aximage. Agradeço a Fernando Pereira Bastos. Acrescento também que as sondagens da Aximage têm sido apresentadas sem distribuir indecisos. Para tornar os seus resultados comparáveis com os das restantes, tratei os indecisos como abstencionistas.

O que acontece quando se proíbe a publicação de sondagens durante a campanha?

Em Itália, as sondagens são proibidas a partir de duas semanas antes do dia das eleições. Mas neste fim de semana há eleições locais, incluindo em Milão. Como fazer? Assim:


Ed ecco a voi le ultimissime corse clandestine. Come al solito  i nostri osservatori vogliono rimanere segreti (il perché è facilmente capibile da chi è pratico dell meccanismo delle corse clandestine). Vi assicuro, però, che sono stati tra gli osservatori più precisi nello scorso turno (se non i migliori).

Ma ecco i risultati!


 milano (davanti a 64 mila spettatori)

ferrari 54 km (-1 km)
 red bull 46 km (+1 km)


napoli ( davanti a 58 mila spettatori)

toro rosso 51 km (-1 km)
red bull 49 km (+1 km)


 cagliari (davanti a 59 mila spettatori)
ferrari 52 km (-1 km)
 red bull 48 km (+1 km)

Obrigado ao Goffredo Adinolfi pela dica.

Isto merece ser lido com atenção

"The idea substantiated in the MoU that an entire country can be reengineered - notwithstanding its faults, the World’s 38th biggest economy - based on a 3-week 34-page outline is remarkable."

sexta-feira, maio 27, 2011

Eurosondagem, 23-26 Maio, N=(temos de falar sobre o assunto), Tel.

PSD: 33,9%
PS: 32,3%
CDS-PP: 13,4%
CDU: 7,9%
BE: 6,3%

Aqui. Eu vou ter de dedicar um post específico a este assunto mas agora não tenho tempo. A única coisa que interessa dizer para já é que quatro das cinco empresas de sondagens já estão em consenso: principais partidos muito próximos, vantagem, a existir, para o PSD.

P.S- Digo "já estão" na expectativa de que o que está a suceder seja o padrão habitual de convergência entre as sondagens nas últimas duas semanas. Mas o que se segue pode desmentir isto...

Intercampus, 21-26 Maio, N=1015, Tel.

PSD: 35,8% (+0,1)
PS: 34,1% (=)
CDS-PP: 11,4% (-0,6)
CDU: 7,7% (+0,2)
BE: 6,5% (+0,3)

Aqui. Comparação com a sondagem cujo trabalho de campo terminou dia 19.

Comentários

Só para dizer que tento responder a todos os comentários que contenham perguntas, mas às vezes faço-o tarde. E pode-me passar algum. Se assim for, insistam. E queria também dizer que para os pessimistas na qualidade do debate público sobre sondagens ou na qualidade dos comentários nos blogues - e eu sou às vezes um deles - ler aquilo que vocês têm escrito aqui é um verdadeiro bálsamo.

Eurosondagem, N=1550, 23-25 Maio, Tel.

O resultado apresentado pela Eurosondagem de hoje parece-me ser a média ponderada dos resultados de 3 dias de trabalho de campo, um com 525 inquiridos, outro com 510 inquiridos, e outro com 515 inquiridos.

PSD: 33,6%
PS: 32,5%
CDS-PP: 12,8%
CDU: 8,1%
BE: 6,5%

Aqui.

quarta-feira, maio 25, 2011

Eurosondagem, 24 de Maio, N=1035, Tel.

PSD: 33,7% (+0,6)
PS: 32,0% (-0,6)
CDS-PP: 13,2% (-0,5)
CDU: 8,1% (+0,5)
BE: 6,7% (+0,1)

Aqui. Estes resultados representam a média entre o trabalho de campo de dia 23 (sondagem divulgada ontem) e o trabalho de campo de ontem. A comparação é com os resultados divulgados ontem. Daqui em diante tentarei apenas comparar amostras independentes. Espero estar a compreender correctamente o que foi feito do ponto de vista da dimensão da amostra.

Sondagens nas eleições britânicas de 2010

Um ano depois das eleições no Reino Unido, um número especial do Journal of Elections, Public Opinion and Parties sobre o assunto. E de acesso livre, ainda por cima. Com alguns dos melhores especialistas mundiais no estudo do comportamento eleitoral. Artigos sobre as lideranças, a decisão do voto e as consequências dos resultados. E dois sobre sondagens:

Why Did the Polls Overestimate Liberal Democrat Support? Sources of Polling Error in the 2010 British General Election.

Confounding the Commentators: How the 2010 Exit Poll Got it (More or Less) Right.

Um deles começa assim:

"Pollsters once again found themselves in the firing line in the aftermath of the 2010 British general election." Ah, como vos compreendo.

E conclui:

"During the 2010 British general election campaign the polling industry as a whole exhibited a bias: it overestimated Liberal Democrat support. Our analysis demonstrates that it is very unlikely this could have been the consequence of a late swing in public opinion. It was also not clearly the result of any of the polling methodological features we tested." Ora bolas. E ah, como vos compreendo.

Alguns resultados interessantes da sondagem do CESOP

Tal como apresentados no DN de hoje:
1. 85% dos inquiridos afirma não ter lido sequer uma parte dos programas eleitorais de qualquer partido.
2. Os únicos líderes políticos cuja avaliação desce em relação à sondagem anterior são Cavaco Silva e José Sócrates.
3. PSD é visto por mais pessoas como tendo as melhores soluções para o relançamento económico do país do que o PS; na Saúde e na Educação a situação inverte-se.
4. 30% dos inquiridos acham que há um partido que faria melhor do que o actual se fosse governo. Parecendo eventualmente um valor baixo, é comparativamente elevado em relação a sondagens anteriores.

Encontros na Universidade do Minho

Sondagens: a realidade e os mitos, com Marcelo Rebelo de Sousa, Henrique Monteiro, José Leite Pereira, Dinis Pestana e Estelita Vaz, moderado por Felisbela Lopes. Dia 26, 5ª feira, às 21.00h, na Reitoria.

Twitosfera: desde 28 de Abril























Dados REACTION até às 19h de ontem.

Indecisos

1. Quantos são? 28%? 25,1%? 25,4%? Ou 8,3%? Ou 33,3%? Qualquer discussão sobre este assunto tem de começar por reconhecer que o conceito de "indecisos" captado por estas sondagens terá quase certamente de ser diferente. Indecisos sobre se vão votar mas decididos sobre o partido? Decididos que vão votar mas indecisos sobre como? As duas coisas? Isto mais não os que não querem responder à questão sobre se vão votar? Ou os que não querem responder à questão sobre em que partido votariam? Ambas? O quê?

2. Presumindo que as empresas medem isto de forma internamente consistente, há mais qualquer coisa que podemos dizer. A 10 de Setembro de 2009, a duas semanas das eleições, a Católica captava que 19% do eleitores manifestavam tencionar votar mas diziam não saber em quem. A uma semana das eleições, esse valor tinha baixado para 17%. Agora, a duas semanas das eleições, estamos com 28%. Mas notem como as coisas se complicam quando olhamos para a Marktest: em 2009, na última sondagem antes de eleições, a Marktest captava 37% de indecisos. Na mais recente, 33,3%. Mas na última sondagem de Setembro de 2009 apenas 2,6% de pessoas diziam que não iriam votar!  Vou ser franco: acho que na Marktest há muita abstenção misturada com indecisão e vou-me arriscar a dizer que nestas eleições parece haver uma percentagem superior de pessoas que se sente indecisa em comparação com 2009.

3. Porque estas coisas mudam mesmo de eleição para eleição. Segundo os dados dos inquéritos pós-eleitorais do projecto Comportamento Eleitoral dos Portugueses, eis as percentagens de eleitores em relação ao total (incluindo abstencionistas) que afirmam ter decidido em quem votar na última semana antes da eleição:

2002: 9%
2005: 17%
2009: 10%

4. Como tratar os indecisos numa sondagem de intenção de voto?
- Primeiro seria importante garantir que estamos a falar da mesma coisa. Tal como os dados iniciais sugerem, não estamos.
- Segundo, seria importante garantir que os dados brutos estão sempre disponíveis: distribuir os indecisos desta ou daquele forma é importante para que os resultados das sondagens sejam comparáveis entre si e comparáveis com os resultados de eleições, mas os leitores devem ter acesso aos dados antes de qualquer distribuição. Hoje em dia, pelo menos através dos depósitos na ERC, essa informação existe.
- Terceiro: não há consenso sobre a melhor maneira de lidar com a questão. Nos Estados Unidos, a grande discussão é a de saber se os indecisos devem ser distribuidos igualmente ou proporcionalmente pelos dois principais partidos, ou ainda se se deve usar uma pergunta de "inclinação de voto". Há estratégias mais complicadas, mas tendem a ser usadas mais por analistas dos resultados do que pelas empresas, precisamente por serem complicadas e difíceis de transmitir. E quando são usadas pelas empresas - "o challenger rule" da Gallup, por exemplo, que supõe que os indecisos se inclinam mais para o partido menos votado - isso baseia-se em conhecimento de um contexto completamente diferente do nosso. Em Portugal, naturalmente, ninguém redistribui indecisos igualmente pelos partidos: isso não faz sentido num sistema multipartidário. O que se faz é ou tratá-los como abstencionistas (o que significa distribui-los proporcionalmente pelas opções válidas) ou usar uma pergunta de inclinação de voto (Católica).

5. O que não se faz: nenhuma empresa redistribui na base de resultados eleitorais passados; nenhuma empresa pondera os seus resultados na base de recordações de voto em eleições anteriores. Digo isto porque vi a confusão surgir quer em comentários a este blogue quer num debate ontem na SIC Notícias.

terça-feira, maio 24, 2011

Do not panic

2005. No fim de Janeiro, dia 28, uma sondagem atribuía 45% de intenções de voto ao partido A, com 13 pontos de vantagem sobre o partido B. Mas logo no dia 1 de Fevereiro, outra dava 49% de intenções de voto ao A, 18 pontos sobre o B. Dia 11, era publicada outra sondagem que dava 48% para o A, mas no dia seguinte era divulgada uma que lhe dava 44,4%. Na última semana, as estimativas para o partido A oscilaram entre 43% e 46,8%, quase 4 pontos de diferença. E a margem do A sobre o B? Entre 12 e 19,2 pontos.


2009.  A 9 de Setembro, terminou o trabalho de campo de uma sondagem que obtinha 34% de intenções de voto para o partido A, com uma muito escassa vantagem de 0,9 pontos sobre o partido B. Mas quatro dias depois, terminava o trabalho de campo de outra sondagem que dava 38% ao partido A, 6 pontos de vantagem sobre o partido B. No dia seguinte, o partido A aparecia com 32,9%. Mas menos de uma semana depois todas as sondagens davam uma vantagem muito mais confortável ao partido A.


As histórias anteriores estão documentadas aqui e aqui. Elas servem para percebermos que o que então ia acontecendo nas semanas que antecederam essas eleições não é necessariamente diferente do que está a ocorrer agora. Como os dois principais partidos estão aparentemente mais próximos entre si do que em 2005 ou 2009, notamos mais a dispersão dos resultados de uma sondagem para outra. Mas é só isso. Do  not panic. As sondagens são isto mesmo, e os eleitores também. Só é preciso ter cuidado com as precipitações.

Eurosondagem, N=525, 23 Maio, Tel.

PSD: 33,1% (-2,7)
PS: 32,6% (+0,1)
CDS-PP: 13,7% (+2,6)
CDU: 7,6% (-0,1)
BE: 6,6% (=)

Aqui. Comparação com última sondagem da mesma empresa, de 3 de Maio.

CESOP/Católica, 21-22 Maio, N=1136, Presencial

PSD: 36% (+2)
PS: 36% (=)
CDS-PP: 10% (=)
CDU: 9% (=)
BE: 6% (+1)

Aqui. Comparação é com a última sondagem do CESOP, de 1 de Maio.

O efeito dos debates

Com a sondagem de ontem, e dependendo do que se siga hoje e nos próximos dias, a ideia de que o debate Sócrates/Passos Coelho pode ter afectado as intenções de voto vai fazer o seu caminho. Mas algumas notas sobre o assunto:

1. O CESOP fez-me chegar o relatório síntese da sondagem feita após o debate. É exactamente a mesma informação, e nada mais, do que está depositado na ERC e será disponibilizado no seu site, pelo que não tenho acesso a informação privilegiada. E os resultados são muito interessantes: a "vitória" de Passos dá-se por duas razões. Primeiro, enquanto que 74% dos simpatizantes do PS acharam que Sócrates ganhou, 88% dos simpatizantes do PSD acharam que Passos ganhou. Entre os restantes, houve empate para 21%, 34% achou que Sócrates ganhou e 34% achou que Passos ganhou. Segundo, ao contrário do que sucede na população em geral, a amostra daqueles que assistiram ao debate tem mais simpatizantes do PSD que do PS. Por outras palavras:

- houve exposição selectiva: o debate atraiu desproporcionalmente os eleitores que se identificam com o PSD;
- entre os que assistiram, as prediposições dos eleitores fiéis ao PSD foram mais reforçadas pelo debate do que as dos eleitores fiéis ao PS;
- logo, o resultado final é que, das pessoas que assistiram, há mais gente que acha que PPC ganhou do que JS ganhou.

Entre os que simpatizam com outros partidos e os que não simpatizam com partido algum, 71% disseram que o debate não contribuiu para definir a sua intenção de voto.

2. A investigação sobre a matéria nos Estados Unidos é, como de costume, imensa. Um resumo possível das conclusões é que o efeito dos debates nas intenções de voto é real, mas a sua dimensão é muito heterogénea de estudo para estudo e de eleição para eleição. Mais interessante é a possibilidade de que os debates afectem indirectamente o voto, ao mudarem os temas de relevância para as pessoas e a sua percepção da personalidade dos candidatos (mas não a percepção da sua competência). Em geral, contudo, o cânone sobre isto - e a ideia que muitos tentam refutar, mas raramente com sucesso - é que os debates reforçam preferências pré-existentes e têm um efeito líquido de conversão de eleitores bastante pequeno.

3. Tom Holbrook, o autor do excelente Do Campaigns Matter?, mostrava há uns anos que "the norm is for very little swing in candidate support following debates. Across all thirteen presidential debates the average absolute change in candidate support was 1 percentage point."

4. Em Portugal, o que se sabe? Cito Eduardo Cintra Torres num estudo empírico neste livro:"os debates servem funções de reforço e de certeza de voto, não sendo possível confirmar estatisticamente com as fontes disponíveis uma ligação a um efeito de conversão do eleitorado" (p. 102). Mas ECT avisa também que "não só cada eleição é um caso, como cada candidato deve se tratado como um caso". Daqui a dias talvez tenhamos uma visão mais clara do que se pode estar a passar em 2011.

P.S.- A culpa é toda minha, porque usei neste post o termo "ganhar o debate". Peço desculpa. Na verdade, o que a sondagem pergunta é "quem é que lhe parece que esteve melhor no debate de hoje?", tal como tinha mostrado aqui. Importa também dizer que a sondagem colocou perguntas sobre quem tem melhores propostas para diferentes áreas. Não sei se isto muda muito estas reflexões, mas era só para clarificar.

Sondagens e os "outros": uma sugestão













O que está aqui em cima é uma parte de um quadro de relatório-síntese de uma das sondagens que fiz para a Católica há uns anos. Queria chamar a atenção para o asterisco referente a "outros": dá-se a informação do número de inquiridos na amostra que declara tencionar votar em partidos que não os cinco principais. Comecei a fazer isto inspirado pelas sondagens em França, onde esta informação é também facultada. Eu acho que isto devia ser sistematicamente mostrado. É perfeitamente compreensível e correcto que as sondagens não apresentem resultados percentuais para partidos que valem menos de 1% das intenções de voto. Mas os "pequenos partidos" já têm obstáculos suficientes para fazer passar as suas ideias para ainda por cima as sondagens fazerem de conta que eles não existem. Não custa nada dar esta informação, desta ou de outra maneira qualquer que se entenda mais apropriada. Mas dá-la.

segunda-feira, maio 23, 2011

Intercampus, 18-22 Maio, N=1021, Tel.

PSD: 39,6% (+ 3,5)
PS: 33,2% (- 2,2)
CDS-PP: 12,1% (- 0,5)
CDU: 6,6% (- 0,9)
BE: 5,6% (-0,6)

Aqui. A comparação é com a sondagem cujo trabalho de campo terminou a 15 de Maio.

House effects

Esqueçam a questão da percentagem de intenções de voto em cada partido. Coloquem uma outra questão: qual foi a evolução ao longo do tempo para cada um? Subiu, desceu, quando? O que tenho abaixo é um gráfico que mostra a tendência para cada partido, a partir de estimativas para cada mês (e para a 1ª e 2ª metades de Maio) "limpas" de house effects. A distribuição, a ordem dos partidos no gráfico (é a dos resultados eleitorais de 2009), etc, mais uma vez repito, nada disso é importante aqui: dependendo da empresa que colocamos como categoria de referência, essas distribuições mudam. Mas a evolução de um momento para o outro é sempre igual independentemente disso.
O gráfico mostra que a grande descida do PSD ocorre de Março para Abril, e que é concomitante com uma subida do PS no mesmo período. O PSD continua a descer de Abril para a 1ª metade de Maio, e desta vez essa descida é concomitante não com uma nova subida do PS mas com uma subida do CDS-PP. Subida essa que continua quando comparamos as sondagens da 1ª metade com Maio com as mais recentes, ao passo que o PS dá sinais (ligeiros) de descida. Dito isto, a "2ª metade de Maio" é um conceito ainda vago e indeterminado, dado que temos apenas duas e o mês ainda não chegou ao fim. Mas estas estimativas usam o facto de essas duas sondagens terem sido feitas pala Intercampus e pela Aximage e tomam em conta o que isso implicou no passado.

É a primeira vez que apresento as coisas assim e isto pode não estar claro. Tentarei explicar melhor se for preciso.

sábado, maio 21, 2011

CESOP/Católica, 21 Maio, N=659, Tel.

Quem esteve melhor no debate?
Passos Coelho: 46,4%
José Sócrates: 33,9%
Empate: 12,7%
Ns/Nr: 7%

O debate contribuiu para definir o seu sentido de voto?
Não: 59,3%
Pouco: 8,6%
Contribuiu ou contribuiu muito: 32%

Quem apresentou as melhores propostas...
Para relançar a economia?
PPC: 50,5%
JS: 25,3%
Ns/Nr: 24,1%

Na saúde?
PPC: 44,6%
JS: 32,2%
Ns/Nr: 23,2%


Para melhorar a vida dos portugueses?
PPC: 47,8%
JS: 23,1%
Ns/Nr: 29,1%


Algumas notas:
- Casas decimais? Ora bolas.
- O universo é o dos eleitores no Continente que viram o debate.
- Tudo isto é interessante, mas mais interessante ainda seria ter cruzamentos disto com identificação partidária, posição ideológica, intenção de votar e intenção de voto. Pode ser que lá estejam quando formos ver o depósito na ERC.
- Esta sondagem devia ter mais destaque noticioso. É raro - e muito difícil - fazer trabalhos destes.

Twitosfera: das 19h do dia 20 até às 7h do dia 21

A situação

Das oito sondagens (com amostras independentes) conduzidas em Maio, temos como média:

PSD: 35,5%
PS: 33,8%
CDS-PP: 11,5%
CDU: 7,9%
BE: 6,2%

Dito isto, importa não esquecer que o conjunto de todas estas sondagens de Maio representa já uma "amostra" de quase 8000 pessoas e que, desse ponto de vista, poder-se-ia dizer, sob certos pressupostos, que a vantagem do PSD é pequena mas estatisticamente significativa.

Mais gráficos

Chamaram-me muito a atenção comentários que, baseados no gráfico anterior, se referiram a "tendências" e projecções na base dessas tendências. Peço muito cuidado com esse tipo de raciocínio. O gráfico que tenho vindo a apresentar resulta de uma escolha inicial que, não sendo completamente arbitrária (quis que fosse bastante sensível a eventos recentes), não tem nenhum fundamento "absoluto". E a partir dessa escolha inicial tenho apenas sido consistente. Mas reparem no que sucede se eu passar a largura de banda para o smoother de 10% para 20% (ou seja, aumentando as observações recentes que são tomadas em conta):
Já parece algo diferente, correcto? Eu sei que há uma bibliografia sobre selecção de largura de banda para smoothers, mas sinceramente não tenho competência suficiente para isso. Se alguém estiver a ler isto e tenha ideias sobre o assunto por favor diga.

sexta-feira, maio 20, 2011

Gráfico actualizado

Aximage, 14-18 Maio, N=750, Tel.

PSD: 31,1%
PS: 29,5%
CDS-PP: 12,9%
CDU: 7,3%
BE: 5,2%
Indecisos: 8,3%

Aqui. O que acontece se tratarmos os indecisos como abstencionistas, assim tornando os resultados desta sondagem comparáveis com resultados eleitorais e das restantes sondagens?

PSD: 33,9% (=)
PS: 32,2% (+1,7)
CDS-PP: 14,1% (+2,0)
CDU: 8,0% (-2,0)
BE: 5,7% (-2,6)

Intercampus, 14-19 Maio, N=1018, Tel.

PSD: 35,7% (+1,8)
PS: 34,1% (-2,7)
CDS-PP: 12,8% (-0,6)
CDU: 7,5% (+0,1)
BE: 6,8% (+0,8)

Aqui. A comparação é feita com a sondagem cujo trabalho de campo terminou dia 12 de Maio.

Um comentário

"O programa Opinião Pública desta tarde na SIC Notícias, está a perguntar aos tele-espectadores se acreditam na possibilidade de "empate técnico" nas eleições 'tal como apontam as sondagens'."


Acrescento apenas que, apesar deste fascinante tema não receber suficiente atenção no debate público em Portugal, há pelo menos um importante precedente.

As "tracking polls"

Com as sondagens feitas pela Intercampus para a TVI e o Público e com o que está previsto a partir da próxima semana por parte da Eurosondagem para a SIC e o Expresso, a questão do que é uma "tracking poll" volta a levantar-se. Uma boa maneira de começar a perceber bem do que se trata é ler esta nota da CNN sobre o assunto. Mas deixem-me que cite a melhor fonte sobre o tema para este efeito, o muito útil e acessível The Voter's Guide to Election Polls de Michael Traugott e Paul Lavrakas (p. 17, 2ª edição, 2000, tradução minha):

"As tracking polls usam diferentes técnicas metodológicas para produzir estimativas diárias durante as últimas duas a quatro semanas da campanha. Por exemplo, pequenas amostras de inquiridos podem ser contactadas via telefone todos os dias e sujeitos a breves séries de questões. Em si mesmas, estas amostras diárias de 100 a 200 entrevistas são demasiado pequenas para fornecer estimativas precisas do apoio a este ou aquele candidato ou da vantagem de um candidato sobre outro. Logo, as empresas de sondagens facultam médias 'rolantes' de três dias consecutivos de entrevistas para fornecer as estimativas. Assim, entrevistas conduzidas numa 2ª feira em Outubro contribuem para a produção de estimativas de períodos de três dias cobrindo Sábado-Domingo-2ª feira, Domingo-2ª feira- 3ª feira, e 2ª feira-3ªfeira-4ª feira, por exemplo.

Cada uma destas estimativas acaba assim por ser baseada em 500 a 600 entrevistas, agregadas ao longo destes períodos de três dias. Se o candidato A era apoiado por 49% da amostra no Sábado (baseado em 200 entrevistas), 45% da amostra no Domingo (baseado noutras 200 entrevistas) e 47% da amostra na 2ª feira (baseado em 200 entrevistas), o apoio médio para este período, divulgado na 3ª feira, seria 47% (baseado num total de 600 entrevistas)."

Traugott e Lavrakas explicam depois alguns dos problemas que algumas tracking polls podem ter (pp. 17-18):

- como são sondagens feitas numa única noite, podem não empregar os mesmos procedimentos para tentar recontactar os inquiridos quando não foi possível inquiri-los nessa noite;
- algumas empresas, para apressarem o trabalho, não escolhem os inquiridos aleatoriamente;

Eu acrescento:

- estes problemas apontados por Traugott e Lavrakas são problemas potenciais e habituais nos Estados Unidos, não significando isso que sejam problemas intrínsecos às tracking polls;
- o exemplo que dão não reflecte exactamente o que fazem aqui a Intercampus e fará a Eurosondagem, tendo números e períodos temporais diferentes. Mas o princípio é o mesmo;
- as tracking polls devem ser lidas com especial cuidado: se bem que tenham a vantagem de produzir informação diária que pode ser lida como indicando tendências, essas flutuações de dia para dia podem acabar por ser "sobre-interpretadas" como resultantes deste ou daquele facto, quando na realidade podem carecer de qualquer significância estatística.

Em estéreo com o Escrita Política da TSF.

quarta-feira, maio 18, 2011

Keeping it (more or less) simple

Média das últimas 5 sondagens conduzidas por empresas diferentes:
PSD: 35,9%
PS: 33,6%
CDS-PP: 11,0%
CDU: 8,1%
BE: 6,2%

Média ponderada (dimensão da amostra) das últimas 5 sondagens conduzidas por empresas diferentes:

PSD: 35,8%
PS: 33,7%
CDS-PP: 10,9%
CDU: 8,0%
BE: 6,1%

PSD: 34,2%
PS: 32,2%
CDS-PP: 11,9%
CDU: 8,4%
BE: 7,2%



terça-feira, maio 17, 2011

Amanhã (e prometo que não vos aborreço mais com isto)

Menções na twitosfera: evolução do share






















Poucas observações? Sem dúvida. Amanhã estas linhas podem ficar bastante diferentes. Mera curiosidade? Talvez. É o que é, para já acho que é a única coisa que se pode dizer.

Bem, talvez mais qualquer coisinha. Paula Carvalho e outros colegas envolvidos no REACTION têm um paper onde analisam comentários a 10 notícias online do Público sobre os debates televisivos para as eleições de 2009. São 2.795 comentários, 3.537 frases anotadas, que foram analisadas manualmente (ao contrário do que temos aqui agora). Foram classificadas em termos dos seus alvos (os líderes) e a sua polaridade ( de "muito negativa" a "muito positiva"). O que descobriram? Entre outras coisas:

1. 60% das frases eram comentários negativos.
2. Sócrates era quem tinha mais comentários negativos, mas...
3. Foi o share de comentários positivos, não o total de comentários ou o saldo entre positivos e negativos, que mais se correlacionou com o voto.

Vamos então ver a evolução do share das menções positivas na twitosfera:






















Há uma frase que me irrita brutalmente quando aplicada às sondagens mas que aqui acho que se aplica: isto vale o que vale. Mas com o tempo e a experiência poderemos talvez deixar de a usar e saber melhor o que realmente vale.

sexta-feira, maio 13, 2011

House effects

Variação da estimativa de Abril para Maio (até agora):
PSD: - 1,5
PS: + 0,2
CDS-PP: + 2,1
CDU: - 0,2
BE: - 0,6

Gráfico actualizado

Já com Marktest e Intercampus mais recentes:

Intercampus, 7-12 Maio, N=1029, Tel.

PS: 36,8% (+2,0)
PSD: 33,9% (-3,1)
CDS-PP: 13,4% (+2,9)
CDU: 7,4% (-0,5)
BE: 6,0% (-1,0)

Estou a comparar não com a última sondagem da Intercampus, mas sim com a imediatamente anterior a essa, dado que esta partilha 40% da amostra com a que terminou dia 8. Decidi também eliminar a sondagem anterior da base de dados a partir da qual faço os gráficos, de forma a ter apenas amostras independentes. Sei que em parte estou a perder informação, mas acho preferível assim.

P.S.- Este post já foi mudado três vezes de tão mal escrito que estava. Teve uma versão anterior, e outra anterior a essa, sendo que a segunda foi anterior à primeira, etc.

Menções na twitosfera desde dia 28 até 19h do dia 12

Sócrates vs. Louçã na twitosfera (19h de 11 de Maio até 19h de 12 de Maio)

quinta-feira, maio 12, 2011

Capítulo 1

Para abrir o apetite (ou para o matar definitivamente), com a autorização da FFMS, partilho aqui o primeiro capítulo do livro (.pdf).

Evolução do share de menções na twitosfera

Dados do REACTION. As cores explicam-se a si próprias, creio. Muita volatilidade, poucos dias, é o que há. Mas já é sugestivo.

House effects

Sei que quem apanhe estas discussões a meio pode não fazer ideia do que significa o título deste post, por isso deixem-me repetir o texto de um post anterior (quem já leu salte para o fim):

1. O gráfico que contém todas as estimativas - vamos chamar-lhe "Mr. Smoother" - faz o seu trabalhinho da seguinte forma: pega em cada observação e transforma-a numa observação "amaciada", usando para esse efeito um sub-conjunto de observações na sua vizinhança (no caso, 2510% do total das observações) e dando mais peso àquelas que estão mais próximas. Juntando os pontos "amaciados" ficamos com uma linha cuja variabilidade é inferior à real variabilidade dos dados e que, desejavalmente, nos permite visualizar melhor tendências sem estarmos a ser confundidos por ruído aleatório.

O problema de Mr. Smoother é que é um bocadinho ingénuo: se eu lhe atirar com 50 sondagens de um instituto e uma de outro para cima, ele ignora esse facto e continua com o seu trabalhinho como se nada fosse. Mas compensa essa ingenuidade com um sólido conservadorismo: como "tempera" cada observação com informação das observações vizinhas, Mr. Smoother não se deixa enganar facilmente por flutuações irrelevantes e, para dizer que algo está a mudar, exige ser convencido e persuadido repetidamente. Só se lhe mostrar várias observações consecutivas que apontam na mesma direcção é que ele se decide a dizer que algo está a mudar. Não lhe fica mal.

2. O Dr. House Effects (PhD) é toda uma outra personalidade: chega ao fim de um mês e grita "Subiu!", "Desceu!", "Não mudou!" em comparação com o mês anterior. E diz estas coisas mesmo se eu só lhe mostrar uma sondagem para esse mês. Como é que a criatura se arrisca a dizer uma coisa destas? Bem, a diferença entre o Dr. House Effects e o Mr. Smoother é que o primeiro, quando diz qualquer coisa, olha para todas as observações desde 2005. E sabe uma coisa sobre cada uma delas que o Mr. Smoother resolve ignorar: que instituto fez cada sondagem.

Tomando essa informação em conta, o Dr. House Effects apura que, ao longo de todo o período, há institutos que tendem a dar melhores ou piores resultados para um determinado partido. E quando lhe dizem que um determinado resultado veio de um determinado instituto, o Dr. House Effects toma essa informação em conta para estimar um resultado para cada mês. Ele não diz que esse resultado é o resultado "certo". Esse assunto não o interessa. O que lhe interessa é dar resultados mensais comparáveis uns com os outros, independentemente do "mix" particular de institutos que fizeram sondagens em cada mês. Gosta de arriscar e pode-se mais facilmente espatifar, ao contrário do Sr. Smoother. Mas é menos ingénuo que o seu colega.

O Sr. Smoother vai falar amanhã, quando tiver nas mãos a sondagem da Intercampus. mas o que o Dr. House Effects gostaria de dizer neste momento é que:

- A sondagem da Marktest não muda uma conclusão que já se tirava das anteriores: a comparação de Abril com esta primeira metade de Maio sugere que o PS terá deixado de subir nas sondagens.
- A descida do PSD de Abril para a primeira metade de Maio vê-se algo mitigada, mas continua a aparecer nos dados.
- Confirma-se subida do CDS.

Marktest, 9-10 Maio, N=805, Tel.

A notícia é um bocado críptica sobre percentagens mas com jeito vai-se lá:

PSD: 39,7% (+4,4)
PS: 33,4% (-2,7)
CDS-PP: 9,0% (+1,5)
CDU: 6,5% (-1,6)
BE: 4,8% (-1,2)

quarta-feira, maio 11, 2011

Passos Coelho vs. Jerónimo (10-11 Maio)




















Não mudei a escala à esquerda do dia anterior só para percebermos como Passos Coelho e Jerónimo de Sousa geraram muito menos menções na twittosfera que Portas e Sócrates. Saldo entre menções positivas e negativas muito parecido para os dois.

Intercampus

A Intercampus está mesmo a usar uma tracking poll no trabalho para a TVI e o Público. Em cada resultado ventilado, 60% da amostra é nova e 40% faz parte da amostra anterior. Tudo normal. Nem é a primeira vez que se faz - e já se faz há bastante tempo nas sondagens partidárias - com a diferença de que, neste caso, a renovação feita de cada vez que se ventilam resultados é maior (também porque as divulgações não são diárias). A única coisa a tomar em conta, então, é que os diferentes resultados não são de amostras completamente independentes.

Notoriedade na twittosfera

Desde o dia 29 de Abril até às 19h de ontem, quais os líderes partidários mais mencionados na twittosfera? Na base dos dados do REACTION, a resposta não oferece qualquer espécie de dúvida:






















E de cada vez que foram mencionados, como se distribuíram essas menções por "negativas", "neutras" e "positivas"?























José Sócrates foi quem, proporcionalmente (e também em termos absolutos, naturalmente), recebeu mais menções negativas. Mas foi também, depois de Portas, o que recebeu proporcionalmente mais menções positivas.

terça-feira, maio 10, 2011

Sócrates vs. Portas

Na twittosfera, Portas ganhou no último dia:

















Sócrates teve mais menções entre as 19h de ontem e as 19h de hoje, mas especialmente à custa de menções negativas. Portas também tem muitas menções negativas: de resto, estes líderes partidários, como veremos mais à frente, são os que suscitam mais tráfego e maior polarização dos utilizadores do Twitter. Mas Portas teve, quer em termos relativos quer absolutos, menos menções negativas e mais positivas que Sócrates.

Dados: REACTION. Vejam este post para uma explicação do que está aqui feito.

Gráfico actualizado

Presumindo que amostra da última Intercampus é inteiramente nova:

REACTION

REACTION significa "Retrieval, Extraction and Aggregation Computing Technology for Integrating and Organizing News", e é um projecto coordenado por Mário Silva que envolve equipas da Faculdade de Ciências da Universidade de Lisboa, da Faculdade de Engenharia do Porto, da Universidade do Texas Austin e da Universidade Nova de Lisboa (o Centro de Investigação Media e Jornalismo onde está o António Granado), assim como equipas do SAPO e do Público. Um dos objectivos do REACTION consiste em detectar e analisar conteúdos online com referências a instituições, pessoas e eventos, fazendo-o de forma automatizada.

Imaginem que queríamos saber quantas vezes é que, na twittosfera, eram mencionados os diferentes líderes partidários. E que queríamos, na base dos textos, inferir automaticamente se o teor dos comentários sobre esses líderes era positivo ou negativo? Se pudéssemos fazer isto, ficávamos com uma espécie de barómetro da opinião tal como veiculada na twittosfera. E quem diz isto diz outros conteúdos online, tal como blogues, notícias ou opinião online,  comentários a uns e outros, etc. Ora bem, o REACTION deu um primeiro passo neste sentido. Desenvolveram um crawler que recolhe os tweets de 25.000 utilizadores portugueses do Twitter e analisa:

1. Menções aos líderes dos cinco principais partidos. Para isso, foi preciso desenvolver recursos que permitam detectar que "José Sócrates" é a mesma coisa que "Eng. Pinto de Sousa" e que o "Jerónimo", neste caso, não é um índio apache. Testes confrontando análise manual com os resultados dos algoritmos mostram que a capacidade de identificação correcta já está bem acima dos 90%.

2. Análise da "polaridade" das mensagens, distinguindo aquelas que emitem juízos positivos, negativos e meramente "descritivos" (ou neutros). Isto é mais díficil, e exige a automatização de uma análise linguística, nomeadamente um léxico de adjectivos e sua associação a um determinado alvo.

Os primeiros resultados começaram a estar disponíveis a partir do passado dia 29 de Abril, medindo o número de menções na twittosfera a cada um dos líderes partidários e a sua polaridade (positivo, neutro ou negativo) por dia (entre as 19h do dia 18 e as 19h do dia 29). Deste então, o sistema tem gerado resultados diários.

O que é então o gráfico no post abaixo?

















As colunas da esquerda mostram o número absoluto de tweets mencionando Jerónimo de Sousa e Paulo Portas e sua polaridade entre as 19h do dia 6 de Maio (o dia do debate Jerónimo-Portas) e as 19h dos dia 7, apanhando portanto o debate e o seu rescaldo. Várias precauções:

1. Os tweets não eram necessariamente apenas sobre o debate.
2. A análise de polaridade é muito conservadora, ou seja, haverá certamente tweets na categoria neutra que emitem uma avaliação, mas que o sistema está a classificar como neutros para não cometer falsas identificações.
3. Quando começarmos a olhar para isto dia-a-dia, vamos detectar uma volatilidade brutal, marcada por eventos, memes  que circulam na net, etc.


Resultados: primeiro, Portas foi muito mais mencionado na twittosfera do que Jerónimo. Logo, naturalmente, recebe, em termos absolutos, muitos mais comentários quer negativos quer positivos. O saldo para ambos os políticos é negativo, ou seja, é mais frequente serem criticados que elogiados, padrão habitual nos estudos congéneres. Mas na distribuição de comentários - colunas à direita - Portas recebe, proporcionalmente, mais comentários positivos que Jerónimo e o saldo é-lhe mais favorável.

O que significa tudo isto? Bem, não sei. Vamos ver. Como é óbvio, a ideia de que os utilizadores na twittosfera são representativos da população eleitoral é absurda. Mas há vários estudos que sugerem que o conteúdo da twittosfera pode ser um bom preditor de fenómenos políticos relevantes. Só dois exemplos. Este mostra que a distribuição de menções aos partidos na Alemanha (partidos, atenção, não líderes) se aproximou bastante da distribuição final dos votos, para além de revelar que as associações conjuntas de partidos reflectem proximidades políticas e ideológicas reais e que os sentimentos expressos em relação aos líderes reflectem padrões intuitivamente previsíveis. E este mostra correlações interessantes entre indicadores do mesmo género e as sondagens políticas e os índices de confiança do consumidor. Temos um problema de escala, claro, e a twittosfera portuguesa é muito menos "politizada" do que poderíamos pensar (apenas cerca de 1% do total dos tweets menciona líderes políticos). Mas vamos ver onde isto nos leva. Logo vamos olhar para um gráfico semelhante ao anterior, mas desta vez, claro, sobre Portas e Sócrates.

P.S.- Daqui a dias, estará disponível um site no SAPO com resultados destas análises.

O que será isto?

Logo explico.

segunda-feira, maio 09, 2011

Intercampus, 4-8 Maio, N=1020, Tel.

Bem, agora fico com uma dúvida. O trabalho de campo da anterior sondagem da Intercampus ocorreu entre os dias 2 e 5 de Maio. Esta, a divulgada hoje, entre os dias 4 e 8 e Maio. Quererá isto dizer que parte da amostra da anterior está a ser usada na de hoje? Não há nada de errado com isso: seria uma tracking poll. Mas se é assim, importa perceber que, em cada sondagem, só parte dos resultados são novos. Enfim, talvez seja lapso. Mas a proximidade muito grande com os resultados da anterior sugerem a possibilidade de que seja mesmo uma tracking. Assim que souber digo.

PSD: 36,2% (-0,8)
PS: 35,1% (+0,3)
CDS-PP: 10,9% (+0,4)
CDU: 7,7% (-0,2)
BE: 6,5% (-0,5)

House effects

O modelo que estima os resultados por mês onde o trabalho de campo foi terminado controlando os efeitos do facto de as sondagens terem sido feitas por empresas diferentes sugere que o PSD voltou a descer de Abril para Maio (2 pontos) mas que o PS deixou de subir. Por outras palavras, o apertar da diferença das sondagens realizadas de Abril para Maio dá-se à custa de uma descida do PSD, não de uma subida do PS (ao contrário do que sucedeu de Março para Abril, em que PS subiu e PSD desceu). Os valores estimados não são importantes, porque variam de acordo com a empresa que seja tomada como categoria de referência. Só as tendências são relevantes nesta análise.

Já agora, quem é que subiu das sondagens de Abril para as sondagens de Maio? O CDS-PP, claro, 1,8 pontos.

sexta-feira, maio 06, 2011

Não há três sem quatro

Intercampus, 2-5 Maio, N=1009, Telefónica
PSD: 37,0% (-1,7)
PS: 34,8% (+1,7)
CDS-PP: 10,5% (+1,1)
CDU: 7,9% (-0,2)
BE: 7,0% (-0,6)

Aqui. Mais do mesmo.

Deputados

Estou curioso para saber o que estimam algumas das pessoas que aqui fazem comentários e que têm os seus  próprios modelos, mas o meu proportional swing põe o PSD+CDS com maioria absoluta em duas das sondagens anteriores, e quase quase noutra. De resto, o cenário de PS com mais votos e PSD com mais deputados, já aqui levantado várias vezes por comentadores, começa a sair do reino da completa implausibilidade. Isto, mais uma confusão nas mesas de voto do género da que tivemos nas presidenciais, era mesmo a única coisa que nos faltava para irmos parar durante uns tempos às primeiras páginas da imprensa mundial.

Aqui vamos nós

Aí vem o chato, ou seja, eu. Não sei, na base disto, quantas pessoas dizem na sondagem da Eurosondagem que não tencionam votar. Mas vamos presumir - é uma possibilidade - que havia uma pergunta-filtro que deixava fora da amostra os que não tencionavam votar e que todas as percentagens relevantes se calculam em relação ao total de 2048. Então temos que 21% (430 pessoas) dizem que não sabem ou não respondem à questão de intenção de voto. Sobram 1618. É esta a amostra na base da qual as percentagens de intenções de voto válidas são calculadas. Na Católica, a amostra relevante é de 1033 pessoas.

E agora a pergunta: tendo em conta a dimensão das amostras, as diferenças entre os diferentes resultados obtidos pelas duas sondagens é estatisticamente significativa? A resposta é NÃO.

Margens de erro das diferenças entre proporções para as duas amostras independentes CESOP e Eurosondagem:
PSD: 3,7
PS: 3,7
CDS-PP: 2,4
CDU: 2,2
BE: 1,8

Em todos os casos, estas margens de erro são superior à diferenças entre as duas sondagens para os cinco partidos.

Já agora: o que passa em relação à vantagem PS sobre PSD ou PSD sobre PS? É simples: as margens de erros das diferenças, nos dois casos, são também superiores às diferenças detectadas na amostra (2 pontos a favor do PS na Católica, 3,3 pontos a favor do PSD na Eurosondagem).

Tudo o que está antes aplica-se também à Aximage, especialmente tendo em conta que estamos a falar de uma amostra bem menor. Em resumo: as três sondagens de hoje são compatíveis com a ideia de que estão a captar uma mesma realidade. Eu sei que o que interessa é o "quem vai à frente na sondagem" e etc. Mas as coisas são o que são.


Já agora, vantagens significativas:

1. PSD sobre CDS-PP, naturalmente, em todas.
2. CDS-PP sobre CDU, na Eurosondagem.
3. CDU sobre BE, na Católica.


Tudo isto explicado aqui.

Gráfico actualizado

Óbvio, mas importante

As três sondagens divulgadas hoje têm por base trabalho de campo que terminou antes da divulgação do pacote CE/BCE/FMI. Não esquecer.

Três sondagens três

1. Aximage, 29 Abril - 2 Maio, N=600, Tel.

Antes de distribuir indecisos:
PSD: 31,5%
PS: 28,3%
CDS-PP: 11,2%
CDU: 9,3%
BE: 7,7%
OBN: 4,9%
Indecisos: 7,1%

Resultados comparáveis com resultados eleitorais (e comparação com resultado anterior da Aximage):
PSD: 33,9% (-2,9)
PS: 30,5% (+0,4)
CDS-PP: 12,1% (+0,7)
CDU: 10,0% (+1,0)
BE: 8,3% (+1,4)
OBN: 5,3% (-0,5)

2. CESOP/Católica, 30 Abril - 1 Maio, N=1370, Presencial
PS: 36% (+3)
PSD: 34% (-5)
CDS-PP: 10% (+3)
CDU: 9% (+1)
BE: 5% (-1)
OBN: 6% (-1)

3. Eurosondagem, 28 Abril - 3 Maio, N=2048, Presencial
PSD: 35,8% (-0,6)
PS: 32,5% (-0,2)
CDS-PP: 11,1% (-0,2)
CDU: 7,7% (-0,1)
BE: 6,6% (-0,3)
OBN: 6,3% (+1,3)

quinta-feira, maio 05, 2011

Pool

Está aqui um ficheiro com todas as apostas registadas (são 101, incluindo a minha). Verifiquem, para o caso de haver lapsos. Não considerei apostas que somassem mais de 100% ou que apostassem em menos de 5 partidos. Arrendondei tudo a números inteiros.

Média e desvio-padrão:
PSD: 34,1 (2,6)
PS: 32,2 (2,8)
CDS-PP: 11,9 (2,1)
CDU: 8,4 (1,0)
BE: 7,1 (1,3)

Estava curioso para saber se haveria diferenças significativas entre estimativas antes e depois do anúncio do pacote EU/FMI na 3ª feira.  A resposta é não, a não ser num caso: o PSD. Pré-pacote: 34,5. Pós-pacote: 33,4. A diferença é estatisticamente significativa com p<0,07. Restantes médias pré- e pós-pacote:

PS: 32,1 / 32,4
CDS-PP: 11,7 /12,2
CDU: 8,3 / 8,6
BE: 7,0 / 7,3

Um livro























Não é o livro que ando a querer escrever há uns anos sobre sondagens, eleições e opinião pública. Esse seria um livro mais técnico, destinado a uma audiência especializada. Mas ainda não tive tempo para esse. Tenho-o antes "escrito" a pouco e pouco, em fragmentos, com a ajuda de outras pessoas, em artigos com este, este ou este. Um dia aparecerá.

Este, pelo contrário, é um livro breve (100 páginas), pouco técnico (na medida do possível) e destinado a uma audiência interessada mas não especializada. Discute coisas como o conceito de erro amostral, as outras fontes de erro em sondagens, as implicações de se colocarem perguntas desta ou daquela forma, e os usos das sondagens e dos seus resultados. E fá-lo recorrendo a exemplos simples e concretos, retirados de sondagens feitas em Portugal e, noutros casos, nos Estados Unidos. Assim, em certo sentido, o livro é uma extensão deste blogue, nos temas e até no estilo. Esteve, de resto, para se chamar Margens de Erro, e só não se chama assim porque, obviamente, a maior parte das pessoas não teria a mínima ideia do que isso quereria dizer.

Há dois tipos de atitude que encontramos frequentemente em relação às sondagens em Portugal. A primeira é a aceitação crítica dos números como se eles reflectissem uma qualquer "verdade" absoluta e inalterável. Mas basta perceber o que é uma sondagem, olhar para os detalhes sobre como são feitas e as limitações que eles implicam e ter alguma noção do que significa "opinião pública" para perceber como essa aceitação acrítica é deslocada. A segunda é a rejeição total das sondagens, frequentemente acompanhada de acusações muito graves mas nunca fundamentadas de adulteração e manipulação dos resultados. Mas basta olhar para a forma como essas acusações são feitas e olhar para os resultados das sondagens com mínima sofisticação para perceber que o objectivo dessas acusações é, aí sim, manipular e condicionar os eleitores na sua leitura dos dados disponíveis, por muito frágeis e precários que esses dados possam ser. Uma e outra atitudes, um e outro tipos de discurso, são muito nocivos para a qualidade do debate público sobre as sondagens, mas só acabam por ser eficazes se contarem com o desconhecimento dos cidadãos. Logo, a motivação básica para escrever o livro foi simples, e é a mesma que me leva a manter este blogue: contribuir, modestamente, para diminuir esse desconhecimento e, logo, contrariar esse tipo de atitudes e discursos.

O livro vai ser lançado no próximo dia 18, 4ª feira, às 17h,  no Instituto de Ciências Sociais (a final da Liga Europa é só às 19.30h :-)). Estão todos convidados. Dia 19 estará nas livrarias e no dia 26 de Maio será vendido com a revista Visão, à qual desde já agradeço. E aproveito também para repetir um outro agradecimento que já faço no livro: a todos aqueles que têm comentado, directamente ou por e-mail, as coisas que foram sendo escritas neste blogue. Aprendi muito com esses comentários, críticos ou não.

P.S. - Sei que é difícil, mas procurem resistir à tentação de fazer comentários sobre a cor da capa.

Sobre as eleições de 5 de Junho, em inglês

A minha interpretação dos acontecimentos - so far - no The Monkey Cage.

quarta-feira, maio 04, 2011

Ainda mais pool

É interessante como à medida que aumentam as apostas os valores médios praticamente não mexem. Neste momento estamos com 71 apostas e com os seguintes resultados (média e desvio-padrão):

PSD: 34,3 (2,5)
PS: 32,2 (2,7)
CDS-PP: 11,8 (2,2)
CDU: 8,3 (1,0)
BE:7,0 (1,3)

Depois de dia 5 vamos tentar olhar para isto de uma maneira ligeiramente mais sofisticada. E estou para ver se as que forem enviadas depois do pacote são significativamente diferentes...

terça-feira, maio 03, 2011

O referendo no Reino Unido

Na próxima 5ª feira, os britânicos vão votar num referendo sobre a adopção do chamado "voto alternativo", em substituição do sistema maioritário uninominal agora existente. A pergunta:

"At present, the UK uses the 'first past the post' system to elect MPs to the House of Commons. Should the 'alternative vote' system be used instead?"

O "voto alternativo" é um sistema através do qual os eleitores, em vez de escolherem apenas um candidato no seu voto, podem exprimir uma ordenação de preferências. Isto está longe da representação proporcional que os Liberais Democratas tinham prometido, mas foi o compromisso possível. O contexto do referendo está muito bem explicado nesta entrada na Wikipedia, incluindo as posições dos diferentes partidos. Ver também este artigo.

O que dizem as sondagens? Basicamente, que o Não deverá ganhar, especialmente as sondagens conduzidas desde meados de Abril. Mas é interessante a inconsistência entre as diferentes estimativas, porventura resultado do facto de o referendo ir ser caracterizado por uma enorme abstenção.

domingo, maio 01, 2011

Mais pool

Enquanto não há mais sondagens, resta-me este entretenimento. Alguns problemas:

1. Casas decimais: será feito arredondamento.
2. Apostas incompletas: não serão consideradas.
3. Apostas que somam mais de 100%: não serão consideradas.
4. Apostas que somam 100% sem OBN: não estão a perceber a coisa.

Aqueles que estão nas condições anteriores podem rever aposta. Digam se assim quiserem. Seja como for, dia 5 torno acessível uma folha de Excel com todas as apostas para que possam confirmar se as registei correctamente.

Resultados até ao momento com 47 apostas, média (e desvio-padrão):

PSD: 34,4 (2,3)
PS: 32,2 (2,8)
CDS-PP: 11,5 (2,0)
CDU: 8,4 (0,9)
BE: 7,1 (1,3)

Em relação ao post anterior, o número de submissões quase duplicou, mas quase nada mudou em relação às médias.