quarta-feira, maio 27, 2009

A última sondagem da Aximage, reloaded

Ora bem: tudo esclarecido na versão em papel do Correio da Manhã (parabéns ao CM, já agora):

Abstenção: 64,7% (776 dos 1200 inquiridos, na base do gráfico apresentado)

Intenções de voto antes de redistribuição de indecisos:
PS: 38,0%
PSD: 31,1%
BE: 8,5%
CDU (PCP): 7,9%
CDS-PP: 6,3%
OBN: 2,8%
Indecisos: 5,4%

Intenções de voto após redistribuição de indecisos (tratados como abstencionistas; meu cálculo):
PS: 40,2%
PSD: 32,9%
BE: 9,0%
CDU (PCP): 8,4%
CDS-PP: 6,7%
OBN: 3,0%
(Soma dá 100,2% devido a arredondamentos)

Agora notem uma coisa interessante. Se na amostra há 776 declarados abstencionistas, e se nos 424 que indicaram que iriam votar há 5,4% de indecisos (23 pessoas), então a sub-amostra na base da qual os últimos resultados são calculados é composta por 401 observações. E se é assim:


Então esta sondagem dá (espero não ter errado nenhuma fórmula)... outro empate técnico entre o PS e o PSD, seja do ponto de vista mais vulgar da "sobreposição de intervalos" seja do ponto de vista mais correcto da significância estatística da diferença entre as duas proporções. Não parecia, pois não? Isto, claro, na presunção de que os 64,7% de abstencionistas correspondam a 64,7% da amostra. Mas no CM em papel não ficam dúvidas disso.

Por outro lado, como expliquei aqui no outro dia, não é de todo indiferente que esta seja a sexta de seis sondagens onde, havendo "empates técnicos", há sempre mais intenções de voto no PS que no PSD...

terça-feira, maio 26, 2009

Europeias. Aximage, 18-22 Maio, N=1200, Tel.

PS: 38,0%
PSD: 31,1%
BE: 8,5%
CDU: 7,9%
CDS-PP: 6,3%

Aqui e aqui. As notícias são omissas sobre indecisos, pelo que talvez possamos presumir que o que falta aqui para 100% (8,2%) serão votos para outros partidos, brancos e nulos.

Mais sobre "empates técnicos" (só para nerds)

Um comentário de um leitor chamou-me imediatamente a atenção para que posso ter estado a induzir leitores em erro sobre a questão de quando é que a diferença entre dois partidos se pode dizer ser "estatisticamente significativa" numa sondagem. O que fiz aqui num post anterior foi usar a definição comum de "empate técnico" (sobreposição de intervalos ditados por margens de erro associadas a duas estimativas diferentes) e, aproveitando para ilustrar algumas aplicações erróneas do conceito de margem de erro (que ignoram a ideia de "margem de erro máxima" ou não tomam em conta a dimensão das sub-amostras de eleitores com reais intenções de voto), mostrar que, na base dessa definição, todas as sondagens para as europeias foram "empates técnicos" entre o PS e o PSD.

Mas importa notar que, se quisermos mesmo saber se as diferenças entre dois partidos numa sondagem são estatisticamente significativas com um determinado nível de confiança, a abordagem, sempre que haja mais do que duas opções de resposta, tem realmente de ser diferente (a abordagem que vou adoptar aqui não é a mesma, julgo, daquela que usou o comentador, mas a mensagem genérica é a mesma).

A margem de erro associada às diferenças entre as proporções dos partidos não é a mesma coisa que a margem de erro associada a cada proporção. Para isso, temos de calcular - desculpem o jargão - a variância da diferença entre duas proporções multinomiais. Eis a fórmula:


O caso concreto que dei foi o de converter as cinco sondagens numa única, em que 2477 respondentes teriam dado as suas intenções de voto numa única pergunta. Nesse caso, o PS teria 35,5% dessas intenções, e o PSD 33,3%. A margem de erro (com 95% de confiança) para a diferença entre o PS e o PSD equivale a:



Esse valor, com estes resultados e com um N de 2477, é de 3,27%. Por outras palavras: a diferença obtida na sondagem (2,2 pontos percentuais) é inferior à margem de erro para a diferença entre as estimativas (3,27). A diferença não está fora da margem de erro. Logo, aqui sim, "empate técnico" propriamente dito.

Já agora: se a dimensão da amostra, em vez de 2477, fosse de 5500 inquiridos, a margem de erro das diferenças seria 2,19%. Por outras palavras, a mesma diferença entre o PS e o PSD (2,2 pontos) já seria estatisticamente significativa.

Tudo isto está superiormente (como sempre) explicado aqui, que por sua vez o tirou do "clássico dos clássicos".

Uma impressão de campanha

Escreve aqui alguém que, ao contrário do que alguns possam imaginar, não percebe rigorosamente nada de campanhas políticas. Mas queria notar apenas, de forma meramente intuitiva, o contraste enorme entre a campanha do PS para estas europeias e a dos restantes partidos. Há na campanha do PS uma quase total "despersonalização". Os cartazes mostram figurantes contratados, falam de eventos históricos e só ao longe, estabatidas, estão as personalidades políticas, algumas delas sem relevância directa para os dias de hoje. Vital Moreira está ausente dos cartazes e parece, nas suas aparições públicas, uma pessoa algo diferente daquela que se conhecia de outras aparições noutros contextos. A ideia de meter Ana Gomes e Elisa Ferreira nas listas, se era para lhes dar visibilidade acrescida para as suas campanhas posteriores, não está a funcionar muito bem. Pelo contrário, BE, CDS-PP, PSD e até a CDU apresentam os seus candidatos, mesmo que alguns sejam completos desconhecidos. E nota-se um esforço do PS em remeter o seu discurso para questões "europeias", ao passo que os restantes partidos não passam sem uma ligação da Europa aos problemas nacionais, ou seja, àqueles que interessam aos eleitores.

Imagino que isto seja deliberado, pensado, eventualmente até testado com focus groups e sondagens. E daí talvez não. Talvez esta campanha do PS esteja a ser conduzida e organizada por pessoas sem competência para a função. Já sucedeu no passado com vários partidos, em várias eleições. E costuma ser um indicador interessante sobre a "saúde" de um partido, a sua coesão e motivação e o grau de isolamento da sua liderança. Dentro de poucas semanas, saberemos melhor.

segunda-feira, maio 25, 2009

Em 2004, foi assim

Um fenómeno muito conhecido e quase sempre repetido é que, à medida que nos vamos aproximando da data das eleições, os resultados das sondagens começam a convergir. Seja porque só no final as intenções dos eleitores começam a "cristalizar" seja porque as sondagens look over their shoulders, é isso que quase sempre sucede. Veremos o que sucederá na próxima semana. Mas em 2004, foi isso mesmo que sucedeu. O quadro mostra os resultados das sondagens divulgadas na última semana. Onde foram apresentados resultados com indecisos, tratei-os como abstencionistas, para tornar os resultados comparáveis entre si e com resultados de eleições. Como vemos, por essa altura, todas indicavam mais intenções de voto para o PS do que para a coligação PSD/CDS-PP, como veio a suceder. E as diferenças entre as sondagens são bem menores que aqueles que verificamos hoje nas sondagens realizadas até agora para as europeias de 2009.





Contudo, ao contrário do que veio a suceder um ano depois nas legislativas, permaneceram grandes variações quer na estimação das intenções de voto na coligação quer na votação da CDU. E todos indicaram mais intenções de voto no BE do que aquele que veio a ser o seu resultado (mesmo que as diferenças sejam insignificantes em dois casos). Por outras palavras, repetindo um padrão já conhecido, eleições com muito elevada abstenção tendem a produzir maiores discrepâncias entre as sondagens e os resultados eleitorais, assim como maiores discrepâncias das sondagens entre si. Intenções de voto recolhidas acabam por não se converter em comportamentos, e diferentes pressuposições sobre como tratar o fenómeno da abstenção e estimar o que poderá ser o "votante provável" acabam por fazer sentir os seus efeitos neste confronto entre sondagens realizadas a uma semana das eleições e os resultados. Logo, eu seria céptico sobre a possibilidade das próximas sondagens "resolverem" todas as dúvidas sobre o que poderá suceder dia 7, especialmente porque, desta vez, tudo o que vimos até ao momento sugere que a margem de vitória de seja quem for o vencedor será certamente menor.

"Empate técnico"

Noto alguma agitação na blogosfera (e não só) devido ao "empate técnico" entre o PS e o PSD declarado pelo Expresso a propósito da última sondagem da Eurosondagem sobre as europeias. Se bem entendo, o "empate" é declarado porque a diferença entre o PS e o PSD (2,2%) é igual à margem de erro declarada na ficha técnica (2,2%). "Vantagem do PS é de apenas 2,2%, o que equivale praticamente à margem de erro deste estudo de opinião", escreve-se no Expresso.

Minha nossa. Ora vamos lá outra vez:

1. A margem de erro anunciada na ficha técnica não é a margem de erro associada às estimativas para o PS ou para o PSD. Por duas razões. Primeiro, a dimensão da amostra na base da qual essas margens de erro têm de ser estimadas é inferior à dimensão da amostra geral na base da qual se apresenta calcula a margem de erro anunciada na ficha técnica. É inferior porque as percentagens são calculadas em relação a uma base que exclui indecisos e abstencionistas. Segundo, a margem de erro apresentada na ficha técnica é uma margem de erro máxima, presumindo amostragem aleatória e com uma confiança de 95%. Essa margem de erro máxima é a associada a uma estimativa de 50%. Quando as estimativas são superiores ou inferiores a 50%, a margem de erro é diferente (inferior).

2. Logo, se quisermos saber qual é o intervalo que cada sondagem está a estimar para cada estimativa - mais uma vez, presumindo amostragem aleatória e com 95% de confiança - não se trata de somar e subtrair 2,2% (ou seja lá o que a ficha técnica identifique como margem de erro máxima) a cada resultado, como muita gente costuma fazer. A margem de erro tem de ser calculada para cada caso, tendo em conta a sub-amostra em relação à qual as percentagens são calculadas e o valor concreto que está a ser estimado.

3. As notícias na imprensa nem sempre são claras quanto à dimensão dessa dita sub-amostra. Só lá se pode chegar por inferência, usando a informação sobre a dimensão da amostra geral, a percentagem daqueles que dizem que não votariam e a percentagem dos indecisos (normalmente tratados como abstencionistas quando se trata de redistribuir).

4. Se o fizermos, chegamos rapidamente à conclusão que todas as sondagens divulgadas até agora sobre as Europeias configuram um empate técnico entre o PS e o PSD, se por "empate técnico" entendermos intervalos que se sobrepõem para as estimativas dos dois partidos (presumindo amostragem aleatória e com 95% de confiança). A saber:

Marktest:
PS: 27,3-38,9
PSD: 27,1-38,7

Intercampus:
PS: 29,3-38,7
PSD: 28,8-38,2

CESOP:
PS: 34,5-43,5
PSD: 31,6-40,4

Aximage:
PS: 33,5-47,5
PSD: 27,3-40,7

Eurosondagem:
PS: 31,6-37,0
PSD: 29,4-34,8

Os intervalos são enormes? São: porque são tantos os que se declaram abstencionistas ou indecisos que a sub-amostra que sobra para estimar resultados é diminuta. E é assim que as coisas são, não há volta a dar-lhe. Só no planeta em que vive o deputado Marco António é que as "boas" sondagens têm toda a gente a dizer que vai votar e a saber perfeitamente em quem.

5. Se a isto somarmos que:
- as sondagens foram conduzidas em momentos diferentes;
- usam metodologias completamente diferentes e há muitas fontes de erro para além do erro aleatório amostral;
- estimam intenções de voto num momento, e não comportamentos no futuro;
- nenhuma amostra é verdadeiramente aleatória (tendo em conta recusas e impossibilidade de encontrar o inquirido que devia responder) e algumas não são aleatórias de todo (usando quotas);
- as margens de erro são estimadas com 95% de confiança (1 em cada 20 inquéritos vai produzir resultados fora da margem);
- as discrepâncias enormes entre os resultados das cinco sondagens...

ficamos com uma boa ideia da incerteza associada aos resultados do próximo dia 7.

6. Dito isto, atenção. Apesar de termos cinco "empates técnicos", as sondagens têm uma coisa em comum. O PS está à frente em todas. Podem estar todas erradas, claro. Mas que o PS tenha estado sempre à frente não é indiferente. Imaginem que, em vez de as tratamos com cinco sondagens diferentes, as tratamos com uma única sondagem, em que a sub-amostra dessa "super-sondagem" é a soma das sub-amostras das restantes (2477 inquiridos). Se o fizermos, o PS aparece com 35,5% e o PSD com 33,3%. Mas a margem de erro associada a ambos os casos é substancialmente menor, 1,88% para o PS e 1,86% para o PSD. Continua a ser "empate técnico", mas note-se, por exemplo, como o resultado máximo do PSD (35,1%) é inferior à estimativa pontual para o PS (35,5%). Mas as sondagens foram conduzidas em momentos diferentes, usam metodologias diferentes, etc, etc, etc. "Incerteza", sim, parece-me bem, para já.

terça-feira, maio 19, 2009

Progressão geométrica

Há dias, citei uma entrevista de Nuno Melo, do CDS-PP, concedida ao Correio da Manhã, onde falava de "variações de 100, 200 e de mais de 300 por cento" entre sondagens realizadas a um mês ou mais das eleições e os vieram a ser os resultados eleitorais do CDS-PP. Na entrevista de hoje ao Público, Nuno Melo clarifica o que queria dizer com "mais de 300 por cento":

"as diferenças de 800 por cento entre as sondagens e os resultados nas urnas acabaram por criar em mim uma imunidade a sondagens."

domingo, maio 17, 2009

Europeias. Aximage, 5-7 Maio, N=600, Tel.

Antes de redistribuição de indecisos:
PS: 38,5%
PSD: 32,3%
BE: 9,2%
PCP: 8,7%
CDS-PP: 5,6%
OBN: 0,7%
Indecisos: 5,0%

Após redistribuição (proporcional) de indecisos:
PS: 40,5%
PSD: 34,0%
BE: 9,7%
PCP: 9,2%
CDS-PP: 5,9%
OBN: 0,7%

São assim quatro as sondagens divulgadas até ao momento sobre as Europeias:

Correcção no método

Quase duas semanas depois de o CDS-PP ter anunciado, em conferência de imprensa, que iria "apresentar uma queixa junto da Entidade Reguladora da Comunicação Social sobre a última sondagem da Universidade Católica, considerando que 'ou há erro ou má-fé'", Nuno Melo, cabeça de lista do CDS-PP às Europeias, afirma hoje em entrevista ao Correio da Manhã que "nem quer que lhe passe pela cabeça" que haja "alguma intenção" por detrás dos resultados da sondagem. Não acredita "que haja reserva mental vindo de onde vem". O que verifica é que a Católica "nunca acerta"e que há "variações de 100, 200 e de mais de 300 por cento" (sic). "Exigia-se correcção no método.", afirma. "As previsões [sic] completamente irrealistas em relação ao CDS mantém-se numa lógica perversa num Estado de direito e numa democracia porque não andamos a brincar às sondagens e isto pode ter um efeito desmobilizador. E ataca um partido que é fundador da democracia portuguesa."

E a queixa na ERC: já terá dado entrada?

sexta-feira, maio 15, 2009

"Portugal: uma democracia em construção"

A Imprensa de Ciências Sociais acaba de editar um livro de homenagem a David Goldey, com o mesmo título deste post. Um dos capítulos é particularmente tentador, e por isso é o único que li até ao momento (para além daquele de que sou co-autor, naturalmente): "To boldly go where no man has ever gone before. As decisões do Presidente Sampaio de Julho e Dezembro de 2004", por Fernando Marques da Costa, antigo assessor do Presidente da República. Vale mesmo a pena, independentemente do que ficarmos a achar no final da leitura.

Legislativas. Aximage, 5-7 Maio, N=600, Tel.

Resultados brutos:

PS:37,3% (38,1%)
PSD:26,7% (25,1%)
BE:12,6% (12,6%)
CDU:8,5% (10,3%)
CDS:5,2% (5,7%)
OBN+Indecisos: 9,7% (8,1%)

Na base desta notícia, não é possível apresentar os resultados como se fossem resultados eleitorais, dado que os valores para "indecisos" e "outros, brancos e nulos" não são apresentados. Mas talvez a edição em papel amanhã tenha esta informação.

Ignorando essa questão, e se nos concentramos apenas nas tendências, temos que, nas últimas quatro sondagens divulgadas sobre legislativas:

- PS desce em 3, mantém numa.
- PSD sobe em 3, desce numa.
- BE sobe em 3, mantém numa.
- CDU desce em 3, sobe numa.
- CDS-PP desce nas quatro.

Atenção, contudo, que os pontos de comparação temporais não são sempre os mesmos: mensal para Marktest, Aximage e Eurosondagem, trimestral para CESOP/UCP.

segunda-feira, maio 11, 2009

Broken Windows

A propósito do editorial do director do "i" e desta resposta de João Gonçalves, impora notar que, como em tudo o que sucede nos Estados Unidos, há quilómetros de estantes sobre o assunto. Alguns dos trabalhos em revistas peer-reviewed mais recentes e/ou mais citados:

Broken windows: New evidence from New York City and a five-city social experiment- "evidence (..) provides no support for a simple first-order disorder-crime relationship as hypothesized by Wilson and Keller."

Carrots, Sticks, and Broken Windows - "it is important to emphasize that arrests for felonies have the largest effect on felony crimes and that the effects of broken-windows policing, although significant for some crimes, are not universally significant, nor are they of great magnitude."

The irony of broken windows policing: A micro-place study of the relationship between disorder, focused police crackdowns and fear of crime: "This study provided evidence for the broken windows policing hypothesis that disorder leads to fear of crime. Examining fear of crime among citizens at a micro-place unit of analysis revealed that higher levels of both perceived social disorder and observed physical disorder led to significantly higher levels of fear of crime. For those advocating broken windows policing approaches, however, the data also suggest reason for caution. Those living in an area that received the extra police presence (controlling for other factors in the model) also reported higher levels of fear."

E dois estudos que interpretam os mesmos dados chegando a conclusões diferentes. O primeiro é o mais citado de sempre sobre o tema:

Systematic social observation of public spaces: A new look at disorder in urban neighborhoods:
"observed disorder did not match the theoretical expectations set up by the main thesis of “broken windows” (Wilson and Kelling 1982; Kelling and Coles 1996). Disorder is a moderate correlate of predatory crime, and it varies consistently with antecedent neighborhood characteristics. Once these characteristics were taken into account, however, the connection between disorder and crime vanished in 4 out of 5 tests—including homicide, arguably our best measure of violence."


Spuriousness or mediation? Broken windows according to Sampson and Raudenbush (1999): "In sum, Wilson and Kelling's broken windows theory argues that disorder causes social withdrawal and low informal social control, which in turn causes crime. Sampson and Raudenbush, 1999 interpreted their own results as not supporting the broken windows theory because disorder did not have a direct effect on crime after controlling for collective efficacy. The problem with this interpretation is that the broken windows theory never argued that disorder had a direct unmediated effect on crime. According to the broken windows theory, disorder undermines informal social control, which in turn leads to an increase in crime. This is the core premise of the broken windows theory, a premise that Sampson and Raudenbush's results did not contradict."

E uma última frase neste último artigo que diz tudo:

"While debate in the popular press continues, academics are pushing forward in their attempts to understand the link between disorder and crime. Several articles have been published in recent years showing empirical evidence both in support of and against the broken windows theory (...) Thus far, no final consensus has been reached."

Era fácil se fosse só as broken windows, não era?

P.S. - Só para dizer que, não sendo especialista do assunto, até simpatizo com a tese. Mas os resultados das experiências dos psicólogos sociais, como acontece tantas vezes, não são fáceis de replicar e comprovar quando se sai de ambientes mais artificiais e se tenta generalizar...

P.P.S - Enviada por um leitor, uma referência adicional de Steven Levitt, tornada famosa devido ao argumento sobre os efeitos de Roe vs. Wade na criminalidade: Understanding Why Crime Fell in the 1990s.

"Manipulação infernal"

É o título de um artigo de Miguel Roquette, Vice-Presidente da Comissão Política da distrital de Setúbal do CDS-PP, publicado no Setúbal na Rede. Pode ser lido na íntegra aqui. Dois excertos:

"A Universidade Católica Portuguesa – através do Centro de Estudos e Sondagens de Opiniões (CESOP), tem demonstrado uma incompetência e uma desonestidade que escandaliza qualquer pessoa minimamente bem formada. Esta atitude, já com longos anos de prática demonstra como a igreja católica portuguesa e a sua componente científica troca conscientemente os mandamentos de Deus, por interesses materiais e de grupos apoiados na manipulação da verdade. Como católico, fico profundamente chocado quando o vício do pecado se torna banal ao ponto de ser exibido com naturalidade em público. "

"Manipular a verdade é próprio das pessoas de mau carácter, pactuar com situações destas é um exemplo de que a comunicação social é pobre do ponto de vista jornalístico, no mínimo passiva, mas a igreja ao mais alto nível apoiar valores contrários aos sagrados princípios demonstra a fraqueza humana."