sexta-feira, março 20, 2009

Menções de políticos na imprensa

O Abrupto mostra um exercício interessante enviado por um leitor: uma pesquisa no DN pelas expressões "passos coelho" e "ferreira leite", revelando que, para a primeira, existem 2826 resultados, enquanto que, para a segunda, apenas 1308.

Fiquei a pensar por que razão nunca me teria lembrado disto, e comecei logo a congeminar um quadro comparativo para os vários jornais que permitissem essa pesquisa. Contudo, quando fui ao DN, aconteceu-me isto (pesquisas no motor de busca da página de abertura, expressões entre aspas, aspas essas que não sei se estão a funcionar, dado desaparecerem dos resultados da pesquisa):



Passos Coelho, 2826 resultados; Ferreira Leite, 9008. Ora bolas. Mas continua a ser interessante. Seria óptimo se houvesse maneira de obter estes dados de forma realmente fiável, em série temporal, e jornal a jornal. As empresas de recortes não terão isto? Os agregadores de notícias não permitirão este tipo de análise?

16 comentários:

jcd disse...

Parece-me que num dos casos está a pesquisar só Ferreira. (È a palavra que aparece marcada). Não sei porque será.

jcd disse...

Exacto. Se puser os nomes entre aspas, dá os resultados publicados no abrupto.

Miguel Carvalho disse...

Para os posts que vou fazendo no A pente-fino, descobri estas duas páginas interessantes, ambos com uma excelente base de dados de notícias em Portugal:

http://www.destakes.com/
http://noticias.esquillo.com/

Pedro Magalhães disse...

No meu browser, se puser os nomes entre aspas na página de abertura do DN acontece exactamente aquilo que mostrei no post. Se puser os nomes entre aspas na caixa própria que aparece na página de pesquisa, recebo "Acesso Negado
Não tem permissão para visualizar/fazer download deste item." Não me acontece, por isso, aquilo que jcd sugere...

Pedro Magalhães disse...

Bem, os destakes não desagregam automaticamente por jornal. O esquillo sim, mas fazendo a pesquisa nota-se que falta muita coisa. Realmente, se não existe já, era bom criar um agregador que acompanhasse saliência de temas e de pessoas nas notícias, com possibilidade de desagregação temporal e por orgão de comunicação...

Gabriel Silva disse...

A diferença entre os dois resultados é que no primeiro usou-se «Ferreira Leite» e no segundo «ferreira leite».

Podem testar e confirmar.

João Pereira da Silva disse...

Se a pesquisa for feita com maiúsculas, Ferreira Leite, obtêm-se 1308 resultados. Se for feita com minúsculas, ferreira leite, obtêm-se 9016.

Pedro Magalhães disse...

É isso: acabo também de ver no Twitter que o detalhe está nas maiúsculas: "Ferreira Leite" e não "ferreira leite". Mas repito: era bom ter uns motores e agregadores nos quais se pudesse confiar, mesmo sabendo que as menções são uma pequena parte do que interessa saber (acabo de ver uma notícia "Silva Pereira ataca Ferreira Leite", uma menção mas, não necessariamente positiva)...

Anónimo disse...

O Google fornece resultados que têm a vantagem de não serem manipuláveis pelo uso de maiúsculas ou minúsculas:

http://cli.gs/google-PC e
http://cli.gs/google-FL

Pedro Magalhães disse...

Do Twitter:
@PauloQuerido@PCMagalhaes @GabrielfSilva e @vascocampilho, blogai isto: http://cli.gs/google-FL e http://cli.gs/google-PC ao menos é o Google...

Andabata Mandelbrot disse...

O Google permite-nos fazer isto de forma controlável:
+"ferreira leite" +site:dn.sapo.pt
+"passos coelho" +site:dn.sapo.pt

O "+" indica que a expressão é obrigatória, ou seja, que não podem vir no resultado páginas onde ela não surja. As aspas indicam tratar-se, de facto, da expressão integral contida entre elas, não apenas das palavras separadas.

Sérgio Nunes disse...

Na Universidade do Porto estamos a trabalhar nesta área com um projecto que se iniciou recentemente.

Um pequeno "esboço":
http://irlab.fe.up.pt/p/mm/topicos

Outro exemplo de um trabalho recente que podem achar interessante: http://irlab.fe.up.pt/p/verbatim/

Pedro Magalhães disse...

Prometedor!

Guedes disse...

Não está relacionado com jornais, mas televisão: há uns tempos que a Marktest faz uma análise semelhante aos protagonistas das notícias de televisão, com análises semanais (http://www.marktest.com/wap/a/p/s~4/id~ea.aspx) ou anuais (http://www.marktest.com/wap/a/n/id~1276.aspx). Os resultados são interessantes.

Andabata Mandelbrot disse...

Já agora, a própria Google tem um serviço semelhante, o Google Trends:

http://www.google.com/trends?q="passos+coelho",+"ferreira+leite"

Anónimo disse...

Se colocar:
"pedro passos coelho": 10413 resultados
"manuela ferreira leite": 1626 (!) resultados

É verificar.