MINERAÇÃO E CURADORIA DE DADOS SOBRE QUEIMADAS NO CERRADO: UM RELATO DE EXPERIÊNCIA NO PROJETO FOGO NA FAKE

SANTOS, Arthur Ferreira dos; SANTOS, Marcio; ORAES, Lauro; MOURA, Dione Oliveira; COLLI, Guarino Rinaldi

Pesquisa na Graduação

25° Encontro Nacional de Ensino de Jornalismo

Faculdade de Comunicação de Brasília (UnB)

22/04/2026

Este relato de experiência detalha o fluxo de coleta, limpeza e curadoria técnica de dados midiáticos sobre o fogo no bioma Cerrado, oriundo dos resultados do projeto de pesquisa e extensão “Fogo na Fake: Lidando com a Desinformação sobre Queimadas no Cerrado”, da Rede Biota Cerrado (RBC), desenvolvido com apoio da Universidade de Brasília (Edital DEX/DEG/DGP/DPI nº 01/2025). A metodologia integrou a SerpApi à plataforma n8n para a extração automatizada de registros entre 2004 e 2025. O processo técnico envolveu a transição de formatos JSON para CSV e o desenvolvimento de uma pipeline em Python para extração de conteúdo textual e verificação de acessibilidade. Os resultados indicam que, de um universo de 27.190 registros brutos, apenas 5.097 foram validados, resultando em um descarte deliberado de 81,25% dos dados. Tal volume de ruído evidencia a complexidade da filtragem semântica necessária para o monitoramento da desinformação ambiental em larga escala.