Este relato de experiência detalha o fluxo de coleta, limpeza e curadoria técnica de dados midiáticos sobre o fogo no bioma Cerrado, oriundo dos resultados do projeto de pesquisa e extensão “Fogo na Fake: Lidando com a Desinformação sobre Queimadas no Cerrado”, da Rede Biota Cerrado (RBC), desenvolvido com apoio da Universidade de Brasília (Edital DEX/DEG/DGP/DPI nº 01/2025). A metodologia integrou a SerpApi à plataforma n8n para a extração automatizada de registros entre 2004 e 2025. O processo técnico envolveu a transição de formatos JSON para CSV e o desenvolvimento de uma pipeline em Python para extração de conteúdo textual e verificação de acessibilidade. Os resultados indicam que, de um universo de 27.190 registros brutos, apenas 5.097 foram validados, resultando em um descarte deliberado de 81,25% dos dados. Tal volume de ruído evidencia a complexidade da filtragem semântica necessária para o monitoramento da desinformação ambiental em larga escala.