Conjuntos de Dados Utilizados
📊 Datasets Utilizados Conjunto abrangente de datasets governamentais brasileiros utilizados para treinamento, validação e teste do sistema Cidadão.AI.
🏛️ Datasets Governamentais Primários
Portal da Transparência
Volume: 2.1TB | Período: 2019-2024 | Registros: 45M+ Contratos públicos federais (3.2M registros) Despesas governamentais (12.8M transações) Convênios e parcerias (1.1M acordos) Licitações e processos (2.9M processos)
Diário Oficial da União
Volume: 890GB | Período: 2015-2024 | Documentos: 2.8M+ Atos normativos e portarias Nomeações e exonerações Editais de licitação Contratos e aditivos
📈 Datasets de Validação
150GB Dados de Treino Anotados 50GB Conjunto de Validação 25GB Dados de Teste
✅ Qualidade dos Dados
Todos os datasets passaram por processo rigoroso de limpeza, validação e anotação especializada. Taxa de qualidade: 98.7% com auditoria contínua.