Última alteração: 2025-07-15
Resumo
A qualidade dos dados administrativos é um desafio central para a produção estatística em Moçambique. Este estudo propõe o uso de técnicas de Machine Learning e Deep Learning para detectar outliers em dados de Comércio Externo. A abordagem visa modernizar os processos de validação e análise no Instituto Nacional de Estatistica.
ObjetivosAplicação de técnicas de Machine Learning e Deep Learning, especificamente Clustering Hierárquico e Redes Neurais, para a detecção de outliers (dados atípicos) em dados de Comércio Externo.
MetodologiaAdopta-se uma abordagem quantitativa e exploratória, com revisão bibliográfica, entrevistas semiestruturadas aos técnicos de estatistica do Instituto Nacional de Estatistica. Para a fase experimental são utilizados dados reais de Comércio Externo referentes as declarações desembaraças em todos os regimes, nos meses de novembro e desembro de 2024.
ResultadosA aplicação dessas técnicas permite a identificação mais precisa e eficiente de registros atípicos, melhorando significativamente os processos de validação dos dados de Comércio Externo. A análise comparativa entre os métodos deverá fornecer subsídios para a escolha da técnica mais adequada ao contexto institucional do INE, considerando não apenas o desempenho técnico, mas também aspectos operacionais. Os resultados também poderão evidenciar a viabilidade de incorporar tecnologias de ciência de dados aos sistemas estatísticos nacionais.
ConclusãoA utilização desses métodos reduzirá o tempo gasto em realizar essa tarefa manualmente e o risco de considerar transações erradas como sendo normais. A experiência obtida com a aplicação em dados de Comércio Externo poderá ser replicada em outras áreas temáticas como demografia, saúde, educação e mercado de trabalho. Assim, este estudo contribui para o fortalecimento da governança de dados, promovendo a produção de estatísticas oficiais mais confiáveis.
Palavras-chaves: Mineração de Dados; Clustering Hierárquico; Redes Neurais; Detecção de Outliers; Comércio Externo;