Jornalismo de Dados

Foto: Sun_rise/Depositphotos

Como Entrevistar Indicadores​

Olhar para estatísticas, consultar dados quantitativos e investigar conjuntos de documentos sempre fizeram parte do trabalho de apuração jornalística. O que convencionou-se chamar de jornalismo de dados hoje usa essas técnicas e vai além.

Munido de ferramentas como planilhas digitais e de metodologias emprestadas de outras ciências, com acesso a bancos de dados públicos ou conjuntos de documentos obtidos via Lei de Acesso à Informação, o repórter consegue entrevistar os dados como entrevistaria especialistas ou autoridades na área que está investigando.

O jornalismo de dados é cada vez mais acessível, conforme mais e melhores ferramentas surgem e mais bases de dados são disponibilizadas. Mas, assim como é preciso saber ouvir qualquer fonte, é preciso saber identificar quais dados são relevantes e separar o que é um indício daquilo que é fato.

O processo de criação de uma reportagem baseada em dados segue uma espécie de pirâmide, como sugere Paul Bradshaw, da Universidade de Birmingham.   

A pirâmide invertida do jornalismo de dados proposta por Paul Bradshaw. (Adaptado de bit.ly/30L0NKI)

 

Pelo modelo de Bradshaw, a etapa mais difícil é a de organização e compilação das bases de dados que serão usadas na reportagem. Porque antes de pensar em qualquer matéria com dados, é preciso saber que números são relevantes para responder as perguntas ou validar uma hipótese, onde encontrá-los e quais as limitações desses dados.

Nem sempre é possível, por limitações de tempo, bases de dados limpas ou ferramentas, repetir todo este processo para cada pauta. Neste Manual, indicamos algumas das mais úteis e intuitivas ferramentas para acessar e visualizar dados relevantes dos municípios, além da localização das principais bases governamentais.

Para acelerar este processo e facilitar a obtenção e comparação de números diversos, criamos o Raio-X dos Municípios. Esta ferramenta reúne e organiza dados sobre Educação, Saúde, Habitação, Meio Ambiente, Mobilidade e Segurança de cada município brasileiro. A ferramenta traz comparações entre os indicadores de determinada cidade e as médias desses indicadores ao considerarmos municípios do mesmo porte populacional, do mesmo estado, da mesma região e, por fim, ao considerarmos cidades de todo o Brasil. Nela, você também encontrará alguns gráficos e tabelas que poderá reproduzir se considerar oportuno e, caso queira investigar mais a fundo, basta seguir os links para as bases públicas de onde retiramos os dados apresentados na ferramenta.

Trabalhando Com Dados em Planilhas Digitais

Agora que temos os dados em um formato legível por planilhas eletrônicas, vamos dar uma olhada em algumas operações básicas do Google Sheets (Planilhas do Google) que dão conta das necessidades que você poderá encontrar pelo caminho. Além disso, também indicamos outras ferramentas para as diversas etapas da apuração jornalística baseada em dados: obtenção, limpeza, análise e visualização de dados. 

O Google Sheets é semelhante ao Microsoft Excel em termos de configurações e funcionalidades, mas possui algumas particularidades. As planilhas podem ser acessadas de qualquer dispositivo conectado à internet e, dessa forma, é possível que várias pessoas trabalhem simultaneamente no mesmo documento. Além disso, a ferramenta conta com opções de visualização de dados e publicação na web. 

Ferramentas


Obter os dados
 
  • IFTTT — Por meio desta ferramenta é possível programar operações diversas que o software fará condicionado a alguma ação anterior. Por exemplo, podemos estabelecer que, assim que uma informação de interesse for publicada na web, o IFTTT acrescente automaticamente uma linha sobre essa informação numa planilha.​

  • Webscraper (Extensão do Google Chrome) — A partir desta ferramenta é possível criar um caminho e automatizar a extração de dados de um respectivo site ou plataforma. A ferramenta percorre o site e extrai automaticamente dados de tabelas e listas em formato CSV. A ferramenta também possui uma versão paga mais completa e que exige o download do software.

  • Aplicações de bases públicas de dados — As bases de dados do IBGE e do Ministério da Saúde, por exemplo, podem ser acessadas por meio de aplicações web como, respectivamente, o Sidra e o Tabnet. Apresentamos essas aplicações e explicamos como utilizá-las no tutorial disponível. ​

  • Tabula — Com esta ferramenta você consegue extrair tabelas de documentos em formato PDF e transformá-las em planilhas com as quais você pode trabalhar.

 

Limpar os Dados

  • OpenRefine — A ferramenta facilita a limpeza de dados em tabelas, ajudando quando, por exemplo, um determinado nome é grafado de formas diferentes no documento e você precisa encontrar todas as correspondências.​

Analisar os Dados

  • Qlik — A ferramenta é ideal para trabalhar com uma grande quantidade de dados e permite fazer comparações e criar métricas rapidamente. É utilizada para gestão empresarial, mas também pode ser adaptada para o jornalismo de dados, pois as funcionalidades de visualização são atraentes e de fácil criação.
     ​

  • Document Cloud — Faça buscas em conjuntos de documentos e organize os resultados. ​

  • WorkBench — Esta ferramenta usa conceitos de linguagens para bancos de dados como o SQL e aplica em um contexto mais amigável. Basta importar uma tabela para o serviço (gratuito) e é possível criar filtros, agrupamentos e outras operações, que demandariam o conhecimento de fórmulas complexas em outros aplicativos.​

Visualizar os Dados

 

  • Tableau Public — O Tableau é uma ferramenta robusta para análise de dados e visualização. Sua versão paga e software são bem parecidos com o Qlik, mas a versão gratuita permite criar gráficos e mapas interessantes de uma maneira rápida e prática.​

  • Infogr.am — A vantagem desta ferramenta é a simplicidade e maneira intuitiva de criar as visualizações. A versão gratuita limita a quantidade de dados, mas já permite criar infográficos interativos e esteticamente mais atraentes do que as outras ferramentas disponíveis gratuitamente. Também permite embedar os gráficos em páginas na web.​

  • Flourish — O Flourish facilita bastante a criação de visualizações pois traz uma série de templates prontos e o sistema de importação de dados é muito semelhante a uma planilha do Excel ou do Google Sheets. Além dos formatos de gráficos mais utilizados, o Flourish traz também opções de criação de animações e mapas. 

  • DataWrapper — É ótimo para a publicação de gráficos, tabelas e mapas, sem necessidade de conhecer programação. Uma de suas vantagens é, mesmo na versão gratuita, a facilidade de customização de cores e fontes, permitindo uma integração maior com o layout do site.​

É a primeira vez que você ouve falar em Jornalismo de Dados? 

 

Não se preocupe, este artigo da Escola de Dados resume os primeiros passos para quem pretende começar a usar dados em suas apurações. Se o que você procura são indicações sobre como estruturar uma equipe de dados em sua redação, vale a pena conferir o Manual de Jornalismo de Dados para Redações, do jornalista Sérgio Spagnuolo. Para entrar em contato com outros jornalistas de dados e tirar dúvidas, não deixe de visitar o Fórum Jornalismo de Dados do Brasil.

O que são Dados Abertos?

 

É possível fazer reportagem com dados de diversas fontes, e é cada vez mais comum ver matérias com números de redes sociais, por exemplo, ou informações de serviços de pagamentos. Mas nem sempre é possível ou prático obter dados de empresas privadas. 

 

No âmbito da cobertura de eleições municipais, é provável que a maior parte dos dados usados nas reportagens venha da administração pública. E uma enorme parte desses dados são abertos

 

Chamamos de dados abertos aqueles que obedecem a três critérios:

  1. Estão indexados e podem ser encontrados na web;
     

  2. São disponibilizados em formatos que podem ser lidos por máquinas;
     

  3. Podem ser livremente reproduzidos.

 

No entanto, nem sempre é assim que as bases de dados chegam às nossas mãos.

 

É comum encontrar, por exemplo, dados disponibilizados em arquivos PDF, que não podem ser abertos por programas de planilhas digitais como o Microsoft Excel ou o Google Sheets. Isso dificulta algumas consultas básicas como ordenar os dados para saber os valores mais altos ou mais baixos, calcular a soma ou média dos valores, selecionar apenas os indicadores acima ou abaixo de determinado valor, entre outras.

Por isso, é importante cobrar dos órgãos gestores de seu município que os dados sejam disponibilizados em formatos abertos, como arquivos com extensões .csv, .xls, .ods, entre outras. Para os casos em que os dados não estiverem disponíveis em formato aberto, consulte a seção Ferramentas, a seguir, para dicas sobre como torná-los legíveis e sobre como limpá-los para que você possa trabalhar com eles.