Conferências UEM, XIII CONFERÊNCIA CIENTÍFICA DA UEM: 50 anos de Independência de Moçambique

Tamanho da fonte: 
MINERAÇÃO DE DADOS PARA A DETECÇÃO DE ERROS EM TRANSAÇÕES DO COMÉRCIO EXTERNO
Mercido Bernardo Huo

Última alteração: 2025-07-15

Resumo


Introdução:

A qualidade dos dados administrativos é um desafio central para a produção estatística em Moçambique. Este estudo propõe o uso de técnicas de Machine Learning e Deep Learning para detectar outliers em dados de Comércio Externo. A abordagem visa modernizar os processos de validação e análise no Instituto Nacional de Estatistica.

Objetivos

Aplicação de técnicas de Machine Learning e Deep Learning, especificamente Clustering Hierárquico e Redes Neurais, para a detecção de outliers (dados atípicos) em dados de Comércio Externo.

Metodologia

Adopta-se uma abordagem quantitativa e exploratória, com revisão bibliográfica, entrevistas semiestruturadas aos técnicos de estatistica do Instituto Nacional de Estatistica. Para a fase experimental são utilizados dados reais de Comércio Externo referentes as declarações desembaraças em todos os regimes, nos meses de novembro e desembro de 2024.

Resultados

A aplicação dessas técnicas permite a identificação mais precisa e eficiente de registros atípicos, melhorando significativamente os processos de validação dos dados de Comércio Externo. A análise comparativa entre os métodos deverá fornecer subsídios para a escolha da técnica mais adequada ao contexto institucional do INE, considerando não apenas o desempenho técnico, mas também aspectos operacionais. Os resultados também poderão evidenciar a viabilidade de incorporar tecnologias de ciência de dados aos sistemas estatísticos nacionais.

Conclusão

A utilização desses métodos reduzirá o tempo gasto em realizar essa tarefa manualmente e o risco de considerar transações erradas como sendo normais. A experiência obtida com a aplicação em dados de Comércio Externo poderá ser replicada em outras áreas temáticas como demografia, saúde, educação e mercado de trabalho. Assim, este estudo contribui para o fortalecimento da governança de dados, promovendo a produção de estatísticas oficiais mais confiáveis.

Palavras-chaves: Mineração de Dados; Clustering Hierárquico; Redes Neurais; Detecção de Outliers; Comércio Externo;