Pular para o conteúdo principal

Conjuntos de Dados Utilizados

📊 Datasets Utilizados Conjunto abrangente de datasets governamentais brasileiros utilizados para treinamento, validação e teste do sistema Cidadão.AI.

🏛️ Datasets Governamentais Primários

Portal da Transparência

Volume: 2.1TB | Período: 2019-2024 | Registros: 45M+ Contratos públicos federais (3.2M registros) Despesas governamentais (12.8M transações) Convênios e parcerias (1.1M acordos) Licitações e processos (2.9M processos)

Diário Oficial da União

Volume: 890GB | Período: 2015-2024 | Documentos: 2.8M+ Atos normativos e portarias Nomeações e exonerações Editais de licitação Contratos e aditivos

📈 Datasets de Validação

150GB Dados de Treino Anotados 50GB Conjunto de Validação 25GB Dados de Teste

✅ Qualidade dos Dados

Todos os datasets passaram por processo rigoroso de limpeza, validação e anotação especializada. Taxa de qualidade: 98.7% com auditoria contínua.