Pular para o conteúdo principal

Algoritmos Implementados

🔢 Algoritmos Implementados

Ensemble de 15+ algoritmos especializados de machine learning e detecção de anomalias otimizados para análise de dados governamentais.

🔍 Algoritmos de Detecção de Anomalias

Isolation Forest

Algoritmo baseado em isolamento que identifica anomalias construindo árvores de isolação. Excelente para datasets de alta dimensionalidade.

  • Complexidade: O(n log n)
  • Precisão: 91.2%

Local Outlier Factor (LOF)

Mede o grau de outlier baseado na densidade local. Eficaz para detectar anomalias em regiões de diferentes densidades.

  • Complexidade: O(n²)
  • Precisão: 88.7%

One-Class SVM

Variante do SVM para detecção de novidades. Constrói uma fronteira de decisão ao redor dos dados normais.

  • Complexidade: O(n³)
  • Precisão: 86.4%

Autoencoder Neural Network

Rede neural que aprende representações comprimidas. Anomalias são detectadas por alto erro de reconstrução.

  • Complexidade: O(n·d·h)
  • Precisão: 89.1%

📈 Algoritmos Estatísticos

Z-Score Modified

Versão robusta do Z-Score usando mediana e MAD para reduzir sensibilidade a outliers extremos.

Interquartile Range (IQR)

Método clássico baseado em quartis para identificação de outliers univariados.

Mahalanobis Distance

Distância que considera correlações entre variáveis, eficaz para dados multivariados.

🏆 Comparação de Performance

AlgoritmoPrecisãoRecallF1-ScoreTempo (ms)
Ensemble Voting91.7%87.1%89.2%167ms
Isolation Forest91.2%85.3%88.1%45ms
Autoencoder89.1%86.7%87.9%234ms
LOF88.7%84.2%86.4%312ms
One-Class SVM86.4%82.1%84.2%456ms

🎲 Estratégia de Ensemble

O sistema utiliza uma abordagem de Weighted Voting Ensemble que combina as predições de múltiplos algoritmos com pesos adaptativos baseados na performance histórica.

  • Voting Strategy: Combinação ponderada de scores de anomalia
  • Dynamic Weighting: Pesos ajustados baseados em contexto e performance
  • Confidence Calibration: Calibração probabilística usando Platt Scaling
  • Threshold Optimization: Limiar dinâmico baseado em precision-recall trade-off