Conferências UEM, XIII CONFERÊNCIA CIENTÍFICA DA UEM: 50 anos de Independência de Moçambique

Tamanho da fonte: 
Inferência pós-seleção para modelos esparsos: novos intervalos de confiança sob alta dimensionalidade
Einstein Mahangue

Última alteração: 2025-06-06

Resumo


A seleção de variáveis em contextos de alta dimensionalidade, como em estudos genômicos ou predições financeiras, è fundamental para identificar fatores relevantes. No entanto, métodos tradicionais de seleção, como o Lasso, tendem a introduzir viés, resultando em interpretações estatísticas equivocadas se a inferência subsequente não for devidamente corrigida. Um dos principais riscos è a identificação de associações espúrias — variáveis que parecem significativas apenas devido à seleção adaptativa, mas que não possuem relevância verdadeira no fenômeno estudado. Este trabalho propõe métodos de inferência pós-seleçãopara construção de intervalos de confiança ajustados, capazes de manter níveis de confiança nominais mesmo após a seleção de variáveis. Ao aplicar essas técnicas, mitigamos o risco de falsas descobertas, garantindo conclusões estatísticas mais confiáveis em ambientes de alta dimensão. Este avanço è crucial para aplicações práticas em biomedicina, finanças, engenharia e outras áreas críticas onde decisões estratégicas dependem da validade da análise estatística.Palavras chave: níveis de confiança, associações espúrias, seleção adptativa, Lasso clássico