Aquivo do autor: Pedro Magalhães

Leitura recomendada

Muito recente e com relevância óbvia para o POPSTAR: Justin Grimmer e Brandon M. Stewart (2013), “Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts,” Political Analysis 21 (3), 267-297.

O abstract:

Politics and political conflict often occur in the written and spoken word. Scholars have long recognized this, but the massive costs of analyzing even moderately sized collections of texts have hindered their use in political science research. Here lies the promise of automated text analysis: it substantially reduces the costs of analyzing large collections of text. We provide a guide to this exciting new area of research and show how, in many instances, the methods have already obtained part of their promise. But there are pitfalls to using automated methods—they are no substitute for careful thought and close reading and require extensive and problem-specific validation. We survey a wide range of new methods, provide guidance on how to validate the output of the models, and clarify misconceptions and errors in the literature. To conclude, we argue that for automated text methods to become a standard tool for political scientists, methodologists must contribute new methods and new methods of validation.

POPSTAR is born

Screen shot 2013-10-09 at 09.33.12

POPSTAR significa Public Opinion and Sentiment Tracking, Analysis, and Research. É um projecto de investigação do Instituto de Ciências Sociais da ULisboa, do INESC-ID, da Faculdade de Engenharia da Universidade do Porto e do Núcleo de Investigação em Políticas Económicas da Universidade do Minho, financiado pela Fundação para Ciência e Tecnologia. O objectivo do POPSTAR é desenvolver ferramentas de recolha, medição e agregação de opiniões políticas e económicas veiculadas no Twitter, na blogosfera e nas notícias, assim como o de comparar os dados assim gerados com indicadores mais convencionais de opinião pública, nomeadamente os obtidos através de inquéritos por questionário (sondagens). O POPSTAR já tem uma casa: www.popstar.pt.

Aqui podem encontrar:

1. Tendências na opinião pública tal como captadas pelas sondagens, seja em termos de intenções de voto nos principais partidos seja de avaliação da actuação dos principais líderes políticos. A metodologia utilizada já foi abordada aqui neste blogue por mim e pelo Luís Aguiar-Conraria. Os dados serão actualizados sempre que saia uma nova sondagem e os todos os seus resultados sejam conhecidos, na imprensa ou no depósito na ERC.

2. Tendências no Buzz sobre os principais líderes político-partidários, ou seja, na frequência (absoluta e relativa) com que são mencionados no Twitter, nas notícias online ou na blogosfera. Os dados vêm de uma plataforma denominada POPmine, desenvolvida pela Faculdade de Engenharia da Universidade do Porto e os Labs Sapo UP. Com estes dados, podemos acompanhar dia a dia a “notoriedade” dos líderes políticos, determinar que dias foram “picos” de cobertura para cada um deles e perceber em que medida vão sendo mais ou menos mencionados em comparação uns com os outros e em três suportes distintos. Esta informação é actualizada diariamente.

3. Tendências no Sentimento em relação aos principais líderes político-partidários no Twitter. Analisando a polaridade de cada tweet, ou seja, determinando se este expressa um sentimento positivo, negativo ou neutro em relação a cada um dos alvos, é possível construir indicadores globais que indicam tendências. Nesta fase, utilizamos dois indicadores possíveis: um rácio (transformado) de menções positivas sobre negativas e o cálculo do share de menções negativas. Para determinar a polaridade de cada tweet, utiliza-se o Opinionizer, uma ferramenta de análise de sentimento em mensagens do Twitter, fruto de trabalho de Investigação e Desenvolvimento do grupo DMIR do INESC- ID Lisboa. Esta informação é actualizada diariamente.

É natural que surjam muitas questões. Procuramos antecipar algumas aqui neste Q&A e estamos ao dispor de todos para tentar esclarecer as restantes. Este é apenas o primeiro protótipo deste sistema, e muitas evoluções estão previstas: determinar a polaridade de outro tipo de textos para além de tweets; alargar o nosso objecto de estudo da política para a economia; fornecer ferramentas adicionais de análise aos utilizadores; e, mais importante, utilizar e disseminar os dados daqui decorrentes para a investigação.

Como muitos saberão, há quem deposite grandes esperanças na capacidade destas ferramentas para complementarem ou mesmos substituirem indicadores mais convencionais de opinião pública. Um artigo de opinião recente do Washington Post tinha como título “How Twitter can help predict an election“, baseado neste paper. É natural este entusiasmo, ditado quer pela novidade do meio quer pela crescente frustração com os problemas metodológicos dos inquéritos por questionário (baixas taxas de resposta, “cell-only” voters, etc.). É também natural (e parcialmente justificado) o cepticismo em relação a este tipo de alegações bombásticas, e muitas as falácias em que se pode cair ao fazê-las.

A nossa posição aqui, contudo, tende a ser um pouco diferente. Primeiro, antes de qualquer alegação de capacidades preditivas, os media sociais são interessantes em si mesmos como veículos e fontes de informação política. Que informação é veiculada neles? Conseguimos construir instrumentos de medida válidos e fiáveis e ferramentas que sejam capazes de lidar com a quantidade enorme de dados que se podem recolher nestes suportes?  ”Move away from trying to predict votes and move toward trying to understand tweets” é um bom conselho, da mesma maneira que os estudos sobre a comunicação social não precisam de alegar que o conteúdo dos media são “preditores” de eleições para serem relevantes.

Segundo, a mera comparação dos conteúdos dos media sociais e dos media convencionais é também interessante em si mesma. Que relações entre esses conteúdos? Quem influencia (ou pelo menos antecipa) quem, quando e como? Serão os media sociais capazes de compensar a assimetria de atenção e cobertura com que que diferentes ideias, pessoas, e partidos são tratados na comunicação social “convencional”? Ou reproduzem eles as mesmas assimetrias?

Finalmente, é perfeitamente possível imaginar relações entre os conteúdos dos media sociais e opiniões e comportamentos políticos de diferentes populações que não passam pelo relativo simplismo de “prever” eleições. E se, por exemplo, as opiniões veiculados na twittosfera ou na blogosfera forem “indicadores avançados” de mudanças nas atitudes políticas ou nas opiniões sobre a economia, fenómeno fácil de conceber tendo em conta o perfil sociográfico e político daqueles que usam essas plataformas para comunicar? Há todo um mundo a explorar para além da “previsão de eleições com o Twitter”. Essa exploração é o objectivo do POPSTAR. Ao longo dos próximos meses, o blogue do POPSTAR vai ser o local onde deixaremos as nossas ideias e análises.