segunda-feira, novembro 03, 2008

Milagres

A convergência miraculosa nos resultados das últimas sondagens antes das eleições, já antes assinalada neste blogue aqui ou aqui a propósito das eleições inglesas ou portuguesas, volta a acontecer, desta vez nos Estados Unidos. Nate Silver não está com meias medidas:

"Has the race settled down some? Perhaps in some proverbial sense it has. But I also think that pollsters peek at one another's results, and that there's something of a herd mentality not to be the one who falls out of line. Remember, folks, it's these final sets of national numbers that will go down on the record for all time's sake."

Evidentemente.

Amanhã.

Não me passa pela cabeça tentar dizer-vos aquilo que outros podem dizer e explicar muito melhor do que eu. De resto, uma das coisas mais espantosas desta eleição - que já se antevia em eleições passadas - é a qualidade e sofisticação das análises disponíveis sobre as eleições americanas. Desde o Pollster - cuja encarnação anterior, o Mistery Pollster, é uma das razões que me fez criar este blogue - até ao FiveThirtyEight, passando pelo The Ballot ou o The Monkey Cage, tudo o que há para dizer de interesse está lá dito.

O que sobra é apenas reforçar algumas ideias para a noite de 4 para 5 de Novembro. Aqui vão (e espero não me ter enganado nas contas no meio desta complicação):

1. Quais os estados onde a vitória de Obama é uma quase certeza absoluta, na base das sondagens e dos resultados de eleições anteriores? Os seguintes: Vermont, Connecticut, Delaware, Illinois, Maine, Maryland, Massachussets, DC, New Jersey, Michigan, Minnesota, New York, Rhode Island, Wisconsin, California, Hawaii, Oregon e Washington. Aqui não há "efeito Bradley" que valha. Perder é quase impensável. Feitas as contas, são 227 votos eleitorais. Faltam 43 para Obama ganhar.

2. Depois há alguns estados onde Obama tem vantagens muito expressivas nas sondagens mas que, na história recente, nem sempre foram ganhos por candidatos democratas. Falamos de New Hampshire (onde W. Bush ganhou a Gore), New Mexico (onde W. Bush ganhou a Kerry) e Iowa (idem). Neste momento, a estimativa da vantagem de Obama sobre McCain nestes três estados oscila entre os 9 e os 13 pontos. De resto, Clinton em 1992 e Kerry em 2004 ganharam NH, ao passo que Clinton em 1992 e Gore em 2000 ganharam Iowa and New Mexico. As dúvidas são muito poucas. Somem lá mais 16 votos. Faz 243. Ficam a faltar 27 para Obama ganhar.

3. Onde poderá Obama ir buscar esses 27? Há um estado onde a vantagem, não sendo tão expressiva como nos casos anteriores, é ainda assim muito relevante: Pennsylvania. Nas sondagens realizadas desde finais de Abril passado, há apenas uma em que McCain estava à frente de Obama, e isso foi em 12 de Setembro e era uma sondagem da Zogby (enough said). Nas sondagens realizadas na última semana (desde dia 27 de Outubro), a vantagem de Obama anda entre os 4 e os 14 pontos. Clinton ganhou Pennsylvania em 1992 (9 pontos) e 1996 (idem). Gore ganhou em 2000 (4 pontos). Kerry ganhou em 2004 (3 pontos). Vamos, com algumas cautelas, colocar já estes 21 votos do lado de Obama. Faz 264. Ficam a faltar 6.

4. Onde pode Obama ir buscar os 6 votos que faltam? Todos os restantes estados têm ou vantagens curtas para um ou outro candidato ou resultados passados menos tranquilizadores para os Democratas.

Mas notem: só faltam 6 votos. Segue-se uma lista de estados onde Obama pode ganhar e onde, se ganhar apenas um deles (e na base das pressuposições anteriores), ultrapassa os 270 votos. Por ordem de encerramento das urnas:
- Virginia: 13 votos, vantagem de 6 pontos nas sondagens;
- Carolina do Norte: 15 votos, vantagem de 1 ponto nas sondagens;
- Ohio: 20 votos, vantagem de 5 pontos nas sondagens.
- Florida: 27 votos, vantagem de 3 pontos nas sondagens;
- Missouri, 11 votos, vantagem de 2 pontos nas sondagens;
- Colorado, 9 votos, vantagem de 7 pontos nas sondagens.

Por outras palavras: se tudo o que está nos pontos 1, 2 e 3 der certo, basta que um destes estados caia para Obama para os 270 estarem garantidos. E a isto acrescem alguns estados que estão com ligeira vantagem para McCain nas sondagens mas ainda competitivos: Georgia (15 votos) e Indiana (11 votos). E há ainda estados que, sózinhos, não chegam aos 6 votos, mas estão, neste momento, ambos inclinados para Obama: North Dakota (3 votos) e Nevada (5 votos).

5. Logo, como se sugere aqui, atenção então a Virginia, Indiana e Georgia, que encerram à meia-noite de Lisboa. Se um deles cair para Obama, ficamos com sinais muito fortes de que tudo poderá estar terminado. Mas se nenhum deles cair para Obama, ainda haverá várias outras hipóteses.

6. Dito isto, muito cuidado com as sondagens à boca das urnas. Quatro razões:

- É sempre possível que haja fuga de dados durante o dia, apesar da equipa responsável estar de quarentena, fechada numa sala, até às cinco da tarde. Mas mesmo que haja fugas, serão dados parciais e não ponderados ou até, possivelmente, pura desinformação.

- Os dados que estarão disponíveis nos sites após o encerramento serão mais fiáveis, mas há uma razão para que esses dados, comuns e iguais para todas as estações, sejam trabalhados em cada uma delas por um batalhão de analistas. Quando dizem too close to call, é por que é too close to call. Já ninguém confia apenas nas sondagens à boca das urnas, a não ser que as vantagens sejam muito grandes. E se são muito grandes, não deverá ser em nenhum dos estados que interessam.

- O voto antecipado está a ser muito grande nalguns estados. Nalguns estados muito importantes para a decisão de amanhã, os números são incríveis. No Colorado, por exemplo, as pessoas que já votaram correspondem a 74% dos todos os que votaram em 2004. 54% na Florida. 61% na Georgia. 67% no Nevada. 73% no Novo México. Neste contexto, só se fossem atrasados mentais é que as pessoas na Edison-Mitofsky se limitavam a conduzir sondagens no dia das eleições. Como é óbvio, não são. O consórcio encarregado da sondagem à boca das urnas tem vindo a fazer sondagens em 18 estados de forma a medir o comportamento daqueles que já votaram, e ponderará esses elementos no dia das eleições. Mas seja como for, não é preciso ser-se atrasado mental para cometer erros e usar pressuposições erradas nessas ponderações.

- Também devido ao voto antecipado, será preciso ter cuidado com os primeiros dados "reais" a virem das assembleias de voto e que são usados para tomar decisões em conjugação com os dados das sondagens à boca da urnas. Como avisa Michael MacDonald,

Beware of election night results released at poll closing, as they may be misleading. Many states and localities quickly report results for their early voters. The reporting method varies widely among states. If these surveys are correct that Obama supporters are voting early at higher rates than McCain supporters, these early election results may give a false impression of what the actual election result will be once all votes are counted.

7. Finalmente: muito do que está acima presume que as centenas e centenas de sondagens divulgadas estão a dar informação fiável sobre as intenções de voto, ou pelo menos informação onde os enviesamentos são aleatórios ou, se não forem aleatórios, se cancelam mutuamente ou, se não se cancelarem mutuamente, são enviesamentos relativamente limitados. Há algumas razões para supor que isto não é necessariamente verdade. Estão muito bem resumidas e discutidas aqui por Anthony Wells, mas a ideia com que se fica é que não são suficientes para nos convencerem de que aquilo que julgamos estar a ver com as sondagens está fundamentalmente errado. E no entanto...

E é tudo. Sei que há muita gente interessada nisto por aí. Isto foi escrito um pouco à pressa. Logo, se encontrarem algum erro de raciocínio ou de contabilidade no que está acima, agradeço mesmo que me avisem.

sábado, novembro 01, 2008

If at first you don't succeed, try, try again.

1. "O CDS sobe, talvez por efeito dos ecos do bom resultado eleitoral nos Açores." Vem no site da SIC Notícias e foi dito em off na peça televisiva por uma jornalista. A subida consistiu em ter passado de 4,8 para 5,2%, ou seja, uma subida de uns espectaculares 0,4 pontos percentuais. Por outras palavras, nem sequer sabemos se o CDS subiu, desceu ou ficou na mesma. E a dos "ecos do bom resultado eleitoral dos Açores", então, é de truz. Uma relação causa-efeito tão credível como se ela tivesse dito que o CDS subiu na sondagem por causa do pastel de nata que eu comi ontem pela tarde.

2. A propósito dos rankings das escolas, reponho de seguida o que escrevi há um ano. Nada mudou, os disparates que se diziam continuam a ser ditos, continuam a ser refutados, e nada disto, pelos vistos, faz qualquer espécie de diferença. Não faz mal. 

A citação do W.C. Fields que dá o título a este post não acaba aqui. Continua assim: "Then quit. No use being a damn fool about it." Mas eu sou um damn fool.

Sobre os rankings e o cheque-escolar (5-11-2007):
No Público de ontem, sobre os rankings, para além de ser provavelmente o primeiro colunista na história da imprensa escrita a usar a expressão Hierarchical Linear Modelling num jornal de grande circulação, André Freire diz o óbvio, mas um óbvio que vale a pena repetir:

"Penso que é preciso ultrapassar este nível de discussão (até agora baseado numa troca de argumentos sustentada, na melhor das hipóteses, numa análise metodologicamente insuficiente dos dados) para passarmos a um debate alicerçado em evidência empírica avaliada com as metodologias adequadas."

Mas importa perceber o que significa "ultrapassar este nível de discussão". Em primeiro lugar, como assinala o próprio André Freire, significa que é imperioso recolher dados a nível individual de forma a que as "causas" (na medida em que qualquer estudo observacional possa apurar causas) do desempenho escolar individual, em particular as ligadas ao ambiente escolar, possam ser estimadas controlando os efeitos de variáveis ligadas ao capital escolar e económico dos pais.

Em segundo lugar, significa também perceber que os efeitos desse capital escolar e económico são, em certo sentido, triviais. É obvio que eles existem e estão mais do que demonstrados. Mas no que diz respeito às políticas públicas, esses efeitos são tão desinteressantes como os efeitos, por exemplo, do desenvolvimento económico na estabilidade dos regimes democráticos. Ou para irmos mais directamente ao tema, são quase tão desinteressantes como os efeitos das capacidades cognitivas inatas (que também existem) dos alunos no seu desempenho escolar. Aquilo que queremos saber é
que outros factores, cuja modificação a curto e médio-prazo esteja ao alcance da vontade dos educadores, dos pais, das escolas e dos decisores políticos, exercem efeitos para além e independentemente (ou em interacção com) esse capital escolar e económico ou essas capacidades inatas. É verdade que - voltando ao ponto anterior - só podemos saber que factores são esses se controlarmos os efeitos do capital escolar e económico das famílias (e seria bom termos medidas de capacidades inatas, mas como provavelmente nao podemos em contextos não experimentais, o que teremos no final é muita variância não explicada). Mas o ponto é este: se é verdade que essas variáveis de controlo não podem ser esquecidas, também não se pode pressupor que tudo é subsumido por elas. É preciso estudar o assunto como deve ser, e pronto.

Em terceiro lugar, ultrapassar o actual nível de discussão significa também assumir que a simples dicotomia público/privado é uma péssima e provavelmente inválida maneira de medir seja o que for de relevante sobre o ambiente escolar e os efeitos que esse ambiente pode induzir sobre o desempenho. Citando
o relatório que André Freire menciona no seu artigo:

"It should be borne in mind that private schools constitute a heterogeneous category and may differ from one another as much as they differ from public schools. Public schools also constitute a heterogeneous category. Consequently, an overall comparison of the two types of schools is of modest utility."

Como deveria ser óbvio - pensava eu - o que interessa é estimar os efeitos de atributos do ambiente escolar - condições físicas e materiais, práticas educativas, currículos, etc, etc, etc - que podem ou não estar correlacionados entre si ou com a dicotomia público/privado. Se não estimarmos os efeitos destes aspectos, não ficamos a saber nada de relevante no final. "Privado melhor do que público"? "Público não é pior que privado"? Frases úteis para discussões puramente ideológicas, inúteis para tudo o resto.

Em quarto lugar, ultrapassar o actual nível de discussão significa também pressupor que os bons modelos explicativos do desempenho escolar serão certamente muito complexos, incluindo efeitos de interacção entre características individuais, efeitos de características contextuais sobre desempenhos individuais e efeitos de interacção entre contextos e atributos individuais.

sexta-feira, outubro 31, 2008

Sondagens à la carte.

Quem está esperançoso ou angustiado com a possibilidade de as sondagens nos Estados Unidos estarem erradas, e muito especialmente quem acha que os resultados das sondagens são condicionados pelas preferências de quem as faz ou do meio de comunicação social que as encomenda e publica, pode ver todos os seus anseios ou receios confirmados por este paper: Evidence of Systematic Bias in 2008 Presidential Polling (via Andrew Gelman).

Claro que sou suspeito, mas por que não pensar que parte do enviesamento se deve ao próprio inquirido, recusando responder para certas sondagens ou ocultando-lhes o seu comportamento?

quarta-feira, outubro 29, 2008

Obamercial

Hoje, vai passar um anúncio/programa com a duração de meia-hora, publicidade da campanha da Barack Obama, na Fox, NBC, CBS, Univision, MSNBC e BET, em horário nobre. Só a ABC e a CNN ficam de fora. NBC e CBS vão receber um milhão de dólares cada. Não se via disto desde Ross Perot.

Ainda sobre "forecasting", a questão racial e as sondagens

Recebi hoje a PS, e voltei a olhar para os modelos de forecasting de que tenho falado várias vezes. E há uma coisa muito interessante de que não me tinha dado conta. O modelo de Lewis-Beck e Tien prevê, como eu dizia aqui, 43% dos votos para McCain na base de quatro variáveis: popularidade de Bush em Julho; crescimento real do PNB do último trimestre de 2007 até ao 2º trimestre de 2008; se o incumbent concorre ou não; e o crescimentos dos empregos.

Simplesmente, Lewis-Beck e Tien defendem que "Obama will lose a chunk of votes because he is black". Logo, estimam factores de correcção para a votação inicialmente prevista para Obama - 57%. Esses factores de correcção resultam de duas fontes:

1. Um estudo de 2007 sobre a prediposição para votar num presidente negro;
2. A comparação entre as votações, estado a estado, de Kerry e Obama nas primárias.

E concluem que Obama terá 50,1%. Ora aqui vamos ter uma boa oportunidade para perceber se Lewis-Beck e Tien deviam ter mexido no modelo original ou não por causa da questão "racial".

Outlier: chá e torradas

Há uns tempos, João Pinto e Castro sugeria à SEDES que, em vez de andar a dizer "renhaunau renhaunau" de seis em seis meses após reuniões com chá e torradas, desse ao pedal e criasse um blogue que "estimulasse a reflexão colectiva sobre temas de grande relevância para o país". Sobre "estimular a reflexão colectiva" ou a "grande relevância para o país" não sei, mas pelo menos o blogue já está. Agora deixa cá comer mais uma torradinha.

P.S.- E aí está, estimulada "a reflexão colectiva sobre temas de grande relevância para o país". Isto dos blogues é um bocadinho menos complicado do que parece :-)

segunda-feira, outubro 27, 2008

Vale a pena ler

James Stimson, sobre os resultados das sondagens nos Estados Unidos:

Saturday 10/25: Stability and Variability
Variability: This is a race of considerable variability in various organization's estimates of what should be the same quantity. And at the same time I have never seen such stability in my estimates of the daily lead. A typical day sees about ten organizations report an Obama lead varying between 1 and 14 points. Thirteen points difference is a lot, more than double what would be expected from sampling fluctuation alone. This arises chiefly, it appears, from two sources, (1) initial assumptions about the partisan makeup of the electorate, and (2) varying likely voter assumptions.

Ler o resto aqui.

domingo, outubro 26, 2008

Uma tempestade perfeita

O meu artigo de amanhã no Público é sobre - suspense - as eleições americanas. É o último que escrevo antes do dia 4 de Novembro. Quem se interesse poderá ler amanhã no jornal e depois de amanhã aqui. Mas quem se interesse muito - sim, estou a falar de vocês os três - pode descarregar isto, uma apresentação em Powerpoint que fiz há dias na Faculdade de Direito da UL e onde se coligem uma série de dados sobre os fundamentals desta eleição:

1. Mudanças na composição social do eleitorado (o famoso argumento Judis/Teixeira);
2. Mudanças na identificação partidária nos últimos anos;
3. Mudanças nas posições ideológicas nos últimos anos;
4. Avaliação do titular (incumbent);
5. Economia e percepções do estado da economia;

E ainda:
6. Temas da campanha;
7. Avaliação dos candidatos;
8. Mobilização.

Nada disto tem grandes pretensões nem grandes teorias por detrás a não ser as de coligir dados dispersos, ter uma visão das eleições que vá para além das sondagens de intenções de voto e presumir que há factores de médio e até longo prazo que ditam muito do que estamos a observar e cujo conhecimento ajuda a reduzir as incertezas.

sexta-feira, outubro 24, 2008

Bush apoia McCain e Palin.

Três perguntas.

Três perguntas num comentário ao post abaixo. Vou tentar responder, remetendo, sempre que possível, para quem sabe responder melhor do que eu:

1. Trata-se da fiabilidade das sondagens que são agregadas nos principais sites como o RCP, Pollster ou 538. No mesmo dia ou espaço curto de tempo, cerca de meia dúzia sondagens são capazes de ter 6 ou 8 pontos percentuais de diferença nos resultados (relativamente à distância entre candidatos), acontecendo isto com muita regularidade. Isto não compromete a confiança das sondagens?

Não devemos ficar surpreendidos com o facto de diferentes sondagens, conduzidas no mesmo momento, exibirem resultados cujas diferenças estão acima do que seria autorizado pelo erro amostral. Há uma multiplicidade de opções técnicas - amostragem, modelos de votantes prováveis, ponderadores, formato das perguntas, etc, etc, etc - que produzem essas diferenças. Há um livro muito bom de um antigo professor meu cujo título resume isso muito bem: The Total Survey Error Approach, em que "total" significa o erro amostral mais todas as outras fontes de erro. Como lidar com isto? Por um lado, importa procurar estimar em que medida há enviesamentos característicos trazidos por cada conjunto de opções metodológicas. Como essas opções tendem a ser estáveis em cada instituto, é possível estimar aquilo que se chama "house effects", ou seja, a tendência de cada instituto para favorecer/desfavorecer cada candidato ou partido. Mas isto mostra-nos apenas um determinado desvio em relação à (vamos chamar-lhe assim) "média", e não em relação à " realidade". O que é a realidade? Ninguém sabe. Mas o que o Nate Silver faz é tomar a prestação passada dos institutos de sondagens como indicador da sua aproximação a essa realidade, presumir que essa aproximação é um bom indicador da sua aproximação à realidade presente, e ponderar os resultados das sondagens na base disso. Aqui estão os indicadores do "track record" de cada instituto que o FiveThirtyEight usa nessas ponderações. É a abordagem mais "sofisticada" (mas também com alguns riscos. Nada garante que desempenho passado seja bom desempenho futuro, especialmente se as circunstâncias políticas e sociais mudarem. O próprio Nate Silver dá um exemplo). O Pollster.com e o RCP são mais agnósticos, o que também não é necessariamente boa ideia.

2ª A média das amostras penso que andam em cerca de 2000 pessoas por sondagem a nível nacional. Não será este um número demasiado baixo para um país de 300 milhões? Penso que 2000 é o número usado regularmente em Portugal, estou certo?

Não, não, e também não (sorry). Não sei o número médio, mas é fácil calcular olhando para esta lista. Sobre o - sempre intrigante - fenómeno de a dimensão do universo ser (quase completamente irrelevante para o erro amostral, ver aqui. Em Portugal, as amostras andam entre os 600 e os 1200. Só na véspera das eleições se costuma usar amostras maiores.

3º Esta já é de leitura de sondagens. Há já sondagens (em número e qualidade) suficientes para falarmos de uma tendência após o último debate presidencial, principalmente nos estados mais decisivos?

Sim, e parece que não teve efeitos.

quinta-feira, outubro 23, 2008

Ainda sobre os efeitos da "raça" no comportamento eleitoral nestas presidenciais.

Há muita gente (alguma dela particularmente competente) que se tem pronunciado sobre este assunto. Larry Bartels, por exemplo, usando dados do American National Election Survey de 2004, sugere que esse efeito pode andar por um custo de 3,7% para Obama.

Mas vejamos a questão por outro lado. Há meses que circulam modelos econométricos que prevêem, na base dos tais "fundamentals" - economia, cansaço/aprovação do incumbent, etc. - a percentagem de votos para candidatos do Partido Republicano (o incumbent). Estes modelos são "cegos" em relação à "raça" dos candidatos. Alguns deles podem tê-la indirectamente, se usarem sondagens sobre os candidatos -mesmo que distantes no tempo em relação às eleições - mas a maioria não tem. Os resultados estão no Pollyvote:


A vantagem máxima para o candidato Democrata é de 16 pontos, a mínima é de 0,2 pontos. Mas a média é de 5,4 pontos.

Agora olhem para aqui:

A estimativa actual da vantagem de Obama, excluídos indecisos e 3ºs candidatos, é de 8,3 pontos. Por outras palavras a vantagem de Obama é maior do que se poderia esperar "given the fundamentals". Claro que: ainda não é dia 4, e mesmo até à véspera do dia 4, as sondagens podem vir a revelar-se erradas. Mas se há alguma coisa que se possa dizer "given the fundamentals", é que o facto de Obama ser negro o favorece eleitoralmente. Absurdo, não é? Sim, mas o contrário, na base disto, também é.

quarta-feira, outubro 22, 2008

O Bartoon explica.

Este debate é interessante, e eu já tinha prometido que ia falar nisto. Um pretexto, então.

Também não gostei especialmente de ver Ronald Dworkin, depois de descrever (correctamente) as consequências (catastróficas) que uma vitória dos Republicanos e a designação de juízes para o Supremo com o perfil prometido por McCain teriam para a interpretação da Constituição Americana, terminar dizendo que "if a remarkably distinguished candidate like Obama loses, this can be for only one reason." Mas as razões porque não gostei são, eventualmente, diferentes das de Miguel Morgado:

1. Primeiro, não há nunca "only one reason".

2. Segundo, ao contrário do que também diz Mark Danner - e retoma João Galamba - , não me parece nada que, "given the 'fundamentals', (...) the contest is so close". So close? Dia 4 cá estaremos para ver. Mas isto não me parece nada close. Vantagens de 6-8 pontos no voto popular não é coisa de somenos e não aparecem todos os dias. Nixon ganhou a McGovern por 23 pontos em 1972, mas.. McGovern? De resto, esta vantagem - ou até bastante menos - é precisamente da ordem do que se poderia esperar given the fundamentals. Esta ideia de que Obama deveria estar a arrasar mas só não está por causa da raça perde sentido logo na parte do "arrasar", porque negligencia a actual polarização do eleitorado americano e tudo aquilo que dá estabilidade ao seu comportamento, independentemente de factores de mais curto-prazo, tais como a economia ou desempenho do incumbent (mas dia 4 espero de não ter de engolir isto tudo).

3. Finalmente, não gostei porque este discurso é exactamente o contrário daquele que Obama tem tido e exactamente o contrário daquilo que lhe convém ter. Ainda bem que a NYRB só é lida por intelectualóides como eu e vocês que estão a ler isto.

Claro que importa perceber por que razão "este discurso é exactamente o contrário daquele que Obama tem tido e exactamente o contrário daquilo que lhe convém ter." É porque, precisamente, o problema existe. Há quilómetros de estantes com coisas sérias escritas sobre o assunto: "Black and white voters do seem to prefer candidates of their own race in biracial elections and, consequently, it is exceedingly rare for black candidates to be elected outside of majority-minority political jurisdictions (Barker et al.1999, Canon 1999, Walton & Smith 2000)". De resto, o grande mérito estratégico da candidatura de Obama e o seu enorme pragmatismo tem residido em fazer com que o problema pareça não existir, desactivando-o como um elemento legítimo de contestação política e retirando-lhe saliência. Claro que os Republicanos têm tentando activá-lo subtilmente, como outros textos na NYRB sugerem (o de Andrew Delbanco, por exemplo). Mas não o podem activar explicitamente: Obama não lhes deu a oportunidade, e fazê-lo por iniciativa própria seria suicídio. Daí que Jeremiah Wright tenha estado ausente da galeria de ataques a Obama, e só surgirá, se surgir, como táctica última de desespero total por parte dos Republicanos.

Quanto ao resto, os meus textos preferidos neste NYRB são os de Joan Didion e de Paul Krugman. Didion, como sempre, para além da elegantíssima escrita, tem um dedo especial para desenterrar a forma como os temas reais e mais importantes na vida americana são retirados do debate político e mediático e substituídos ou misturados com temas fictícios:


"The presence of Barack Obama in the electoral process allowed us to talk as if "the race issue" had reached a happy ending. We did not need to talk about how the question of race has been and continues to be used to exacerbate the real issue in American life, which is class, or absence of equal opportunity."



"For a while, however, Democrats in general, and Barack Obama in particular, seemed to have lost the plot. Instead of running against the Republican economic record, Obama spent the primary season and the first few weeks of the general election campaign portraying himself as a "post-partisan" politician, someone who transcended the traditional party divide. In his speeches, he tended to hold both parties equally culpable for the country's woes, denouncing the failed policies of right and left equally. (...) But all of that has changed in the past few weeks. (...) These days, Obama doesn't try to place blame equally on right and left, he denounces "an economic philosophy that says we should give more and more to those with the most and hope that prosperity trickles down to everyone else," and describes the crisis as "a final verdict on this failed philosophy." He sounds, in other words, a lot like Bill Clinton in 1992. And that's a good thing."

Não acontece muitas vezes que a mensagem política "certa" seja "certa" de duas maneiras: por descrever correcta e profundamente a realidade, e por ser a mais adequada eleitoralmente. Mas desta vez aconteceu. Os Republicanos andam a agitar a frase "spread the wealth" que Obama disse a "Joe the Plumber", como se isso o fizesse perder votos. Um erro, parece-me. O Bartoon de hoje explica tudo isto muito bem.


terça-feira, outubro 21, 2008

Até na Science se fala do "Bradley effect"...

Do Voter Surveys Underestimate the Impact of Racial Bias?

Podemos acreditar no que estamos a ver? Depende.

Os textos no post abaixo sobre as possibilidades de recuperação de McCain pressupõem que aquilo que as sondagens nos estão a dizer é, "na média", verdade. Que Obama tem uma vantagem de mais de 5 pontos sobre McCain, que Obama subiu drasticamente desde a crise financeira, que McCain vem recuperando nos últimos dias.

Mas se isto tudo, ou parte disto, for mentira? E se houver um enviesamento sistemático nos resultados? Uma das fontes de enviesamento já aqui muito discutida é o chamado Bradley Effect, através do qual a vantagem de Obama sobre McCain poderá estar a ser sobrestimada. A segunda é o recurso a telefones fixos, através do qual a vantagem de Obama sobre McCain poderá estar a ser sistematicamente subestimada.

James Stimson, da UNC em Chapel Hill, recorda-nos um terceiro possível enviesamento, que desta vez tem repercussões naquilo que julgamos estar a observar nos últimos dias: as pressuposições sobre os votantes prováveis que estão inseridas nos modelos.

The entry of new tracking polls (with likely voter estimates) and the changeover of existing ones to likely voter estimates are confusing the situation this week. Because Republicans traditionally turn out at higher rates than do Democrats, the likely voter estimates shift the composition of samples in the Republican direction, producing better numbers for McCain. This is creating what appears to be an illusory trend toward McCain support, an apparent decline in the Obama lead. This is seen most clearly in the Gallup organization's now triple daily reports. With a pleasing transparency, Gallup is reporting registered voters numbers (as before) and two different likely voter estimates. One Gallup calls the traditional filter assumes that historic turnout patterns will prevail and thus African-Americans and young people, for example, are assumed to turn out at relatively low rates (compared to the perennial turnout champs, the middle-aged and middle class.) Knowing that such assumptions are likely to be inaccurate this year, Gallup is also using a filter (called Expanded) that is based only on what respondents say about voting intentions. I commend Gallup for leaving us free to make our own assumptions about turnout, rather than imposing its own on us (and usually without any information about what they are.) From its latest release (10/19) Gallup shows an Obama lead of 10 points (52-42) among registered voters, 7 points (51-44) among the Expanded likely voter set and only 3 points (49-46) with the Traditional likely voter filter. It makes quite a difference which one gets reported. There is no trend in the registered voter estimates. But if you compare the older registered voter numbers with the newer likely voter numbers the illusion of trend appears.

As possibilidades de McCain

The State of the Race, por Jay Cost: "This makes a comeback for McCain quite difficult, but not inconceivable."

Today's Polls, 10/20, por Nate Silver: "McCain needs to get those numbers down about twice as quickly as Obama got them up, and he does not have any debates or other major public events to assist him."

segunda-feira, outubro 20, 2008

O fim da "chatice"

Diogo Belford Henriques respondeu ao post abaixo. Espero não ser injusto se vir a coisa assim: DBH não gostou de uma sondagem pré-eleitoral da Eurosondagem que dava 4,8% ao CDS. Após as eleições, tendo o CDS-PP obtido 8,7%, exprimiu esse descontentamento, mas não tinha mais para argumentar que a simples constatação da discrepância. Mas lendo posteriormente o meu post onde descrevia alguns dos constrangimentos e dificuldades ligadas à realização de sondagens dos Açores, DBH descobriu um ângulo para criticar a sondagem que tanto o apoquentara, mesmo que vários aspectos do que descrevi nem sequer se apliquem ao estudo telefónico da Eurosondagem. E toca de transformar esses constrangimentos em omissões graves, acabando por acusar todos os que fizeram sondagens nos Açores de serem preguiçosos e incompetentes. E ainda houve tempo para levantar a hipótese de que tanta preguiça e incompetência não passassem de uma desconsideração aos açorianos.

Neste último post, o ângulo é algo diferente. DBH acha "grave" que as sondagens à boca das urnas nos Açores não tenham trabalho de campo em todas as ilhas e que o serviço público de televisão não pague tudo o que for preciso para garantir isso. Mas o que importa perceber é que todas as sondagens e todos os estudos deste género resultam de compromissos entre o ideal e o possível. Amostras de 15.000 inquiridos em vez de 5.000, ir a todos os locais de voto de uma freguesia ou ir a todas as freguesias em vez de ir apenas a algumas, incluir telefones celulares em sondagens telefónicas em vez de apenas telefones fixos, fazer 15 ou 20 tentativas de encontrar um inquirido aleatoriamente numa casa em vez de apenas 4 ou 5, dar um mês em vez de uma semana de formação aos inquiridores, etc, etc, etc,  a lista do "ideal" nas sondagens é interminável e inatingível. O importante é garantir que aquilo que se sacrifica não é suficientemente "grave" para impedir boas inferências. E manifestamente não foi, o que não nos impede de reconhecer e tentar descobrir os custos que esses sacrifícios podem ter imposto, até para se perceber que sacrifícios são legítimos da próxima vez.

Eu acho que este tipo de discussão até pode ser, em geral, saudável, e só acontece porque há cada vez mais transparência na maneira como se fazem sondagens. Sabem-se coisas intrigantes de que dantes nem se fazia ideia, aparecem novas perguntas, e conversa-se. Acho, se calhar com alguma pretensão, que não dei um contributo completamente irrelevante para isso. 
Mas acho também que há dois tipos de discussão sobre sondagens e duas opções para as pessoas, como DBH, que exercem funções políticas. Podem aprender alguma coisa sobre sondagens e passam a poder fazer questões e críticas interessantes a quem trabalha nisto. Eu conheço algumas pessoas assim em quase todos os partidos (uma delas tem um blogue e outra até foi Primeiro-Ministro). Mas também se podem limitar a ter um discurso estritamente político sobre sondagens. O segundo é perfeitamente legítimo, mas serve apenas para conversarem uns com os outros. Não serve para mais.