🗓️ ROADMAP CIDADÃO.AI v1.0 - OUTUBRO/NOVEMBRO 2025¶
Objetivo: Finalizar versão 1.0 do sistema até 30 de novembro de 2025 Status Atual: v0.9.7 - Updated with Real Test Metrics (30/10/2025) Meta v1.0: 100% funcional, production-ready, dados reais
✅ MAJOR UPDATE (30/10/2025): Test coverage discovered to be 76.29% (not 44% as previously claimed). Total of 1,363 tests across 98 files. All 16 agents have comprehensive test coverage. See coverage report for details.
📊 VISÃO GERAL¶
Onde Estamos (30 de outubro - ATUALIZADO)¶
- ✅ 16/16 agentes implementados (100%)
- ✅ 10/16 Tier 1 operacionais (62.5%)
- ✅ 76.29% test coverage (agents) - Nearly at goal! 🎯
- ✅ 1,363 total tests - Comprehensive coverage!
- ✅ 16/16 agents tested (100%) - All agents have tests!
- ✅ 266+ endpoints REST
- ✅ Deployed on Railway (production since 07/10)
- ✅ PostgreSQL + Redis operational
- ⚠️ Portal da Transparência: Real data integrated (with API key)
- ⚠️ Céuci & Abaporu: Need coverage boost
- ⚠️ ML models: Training pending
Onde Queremos Chegar (30 de novembro)¶
- ✅ 18/18 agentes operacionais (100%)
- ✅ Todos os agentes com dados reais
- ✅ 2-3 ML models treinados e em produção
- ✅ Database persistente (Supabase)
- ✅ Redis em produção
- ✅ CI/CD pipeline completo
- ✅ Documentação completa
- ✅ Portal da Transparência: alternativas implementadas
🎯 OUTUBRO 2025 (4 SEMANAS)¶
Foco: Completar funcionalidades críticas e resolver bloqueios de dados
SEMANA 1 (14-20 OUT) - "Data Liberation Week"¶
Objetivo: Resolver bloqueios de dados e integrar APIs reais
🔥 Prioridade CRÍTICA¶
1. Resolver Bloqueio Portal da Transparência - Tarefa: Investigar alternativas para os 78% de endpoints bloqueados - Opções: - [ ] Solicitar API key de tier superior (CGU) - [ ] Implementar crawler autorizado (robots.txt compliant) - [ ] Expandir uso de TCE APIs (já temos 6) - [ ] Usar mais CKAN portals (já temos 5) - Entregável: Acesso a pelo menos 50% dos endpoints bloqueados - Tempo estimado: 16 horas - Responsável: Backend team
2. Integrar Dandara com APIs Federais Reais
- APIs a integrar:
- [ ] IBGE API - Dados demográficos e censo
- [ ] DataSUS API - Indicadores de saúde
- [ ] INEP API - Dados educacionais
- [ ] MDS API - Programas sociais (Bolsa Família, etc.)
- [ ] RAIS API - Dados trabalhistas
- [ ] PNAD API - Pesquisa Nacional por Amostra
- Entregável: Dandara 100% operacional com dados reais
- Tempo estimado: 20 horas
- Arquivo: src/agents/dandara.py
- Tests: tests/unit/agents/test_dandara.py
3. Consolidar Implementações de Chat - Problema: 5 versões diferentes (chat.py, chat_simple.py, chat_stable.py, etc.) - Tarefa: - [ ] Analisar performance de cada versão - [ ] Escolher a mais estável - [ ] Migrar features importantes das outras - [ ] Deletar versões obsoletas - [ ] Atualizar testes - Entregável: 1 única implementação estável - Tempo estimado: 12 horas
📈 Prioridade ALTA¶
4. Consolidar Agentes Niemeyer
- Problema: niemeyer.py (2,270 linhas) vs oscar_niemeyer.py (1,224 linhas)
- Tarefa:
- [ ] Comparar funcionalidades
- [ ] Manter oscar_niemeyer.py (mais recente)
- [ ] Migrar features úteis de niemeyer.py
- [ ] Deletar niemeyer.py
- [ ] Atualizar imports
- Entregável: 1 único agente de visualização
- Tempo estimado: 8 horas
Milestone Semana 1: 🎯 Data Foundation Complete - ✅ Dandara 100% operacional - ✅ Portal da Transparência >50% acessível - ✅ Chat consolidado - ✅ Niemeyer consolidado
SEMANA 2 (21-27 OUT) - "Infrastructure Week"¶
Objetivo: Implementar persistência e infraestrutura de produção
🔥 Prioridade CRÍTICA¶
5. Migrar para PostgreSQL Persistente (Supabase)
- Problema: HuggingFace usa in-memory (dados perdidos em restart)
- Tarefa:
- [ ] Configurar Supabase project
- [ ] Criar schema completo (investigations, contracts, users, etc.)
- [ ] Implementar migrations com Alembic
- [ ] Atualizar src/db/session.py para usar Supabase REST API
- [ ] Migrar dados de teste
- [ ] Atualizar testes
- Entregável: Database persistente funcional
- Tempo estimado: 16 horas
- Arquivo: src/db/session.py, alembic/versions/
6. Implementar Redis em Produção
- Problema: Cache in-memory (performance subótima)
- Tarefa:
- [ ] Setup Redis Cloud ou Railway Redis
- [ ] Configurar connection pooling
- [ ] Atualizar cache service para usar Redis
- [ ] Implementar cache warming automático
- [ ] Configurar TTLs por tipo de dado
- [ ] Métricas Prometheus para cache
- Entregável: Redis funcional com >70% hit rate
- Tempo estimado: 12 horas
- Arquivo: src/services/cache_service.py
📈 Prioridade ALTA¶
7. Setup CI/CD Pipeline (GitHub Actions)
- Tarefa:
- [ ] Criar .github/workflows/ci.yml
- [ ] Automated tests on PR
- [ ] Automated linting (Black, Ruff, MyPy)
- [ ] Coverage report com CodeCov
- [ ] Deploy automático para HuggingFace on merge
- [ ] Deploy automático para Railway (staging)
- Entregável: CI/CD completo
- Tempo estimado: 12 horas
8. Re-habilitar TrustedHostMiddleware (Railway)
- Problema: Desabilitado por incompatibilidade com HF Spaces
- Tarefa:
- [ ] Criar configuração condicional (HF vs Railway)
- [ ] Configurar allowed_hosts para Railway
- [ ] Testar em staging
- Entregável: Middleware ativo em Railway
- Tempo estimado: 4 horas
- Arquivo: src/api/app.py
Milestone Semana 2: 🎯 Infrastructure Ready - ✅ PostgreSQL persistente funcional - ✅ Redis em produção - ✅ CI/CD pipeline completo - ✅ Security hardened
SEMANA 3 (28 OUT - 03 NOV) - "ML Training Week"¶
Objetivo: Treinar e deployar modelos de Machine Learning
🔥 Prioridade CRÍTICA¶
9. Treinar Corruption Detector Model
- Objetivo: Substituir Lei de Benford threshold por ML model
- Tarefa:
- [ ] Coletar dataset de treinamento (contratos históricos)
- [ ] Rotular dados (corrupto vs limpo) - pode usar Benford como baseline
- [ ] Feature engineering (15 features identificadas por Ceuci)
- [ ] Treinar Random Forest Classifier
- [ ] Validação cruzada (80/20 split)
- [ ] Hyperparameter tuning
- [ ] Deploy modelo para Models API
- [ ] Integrar com Obaluaiê agent
- Entregável: Modelo treinado com >85% accuracy
- Tempo estimado: 20 horas
- Arquivo: src/ml/corruption_detector.py
- Dataset: Usar Portal + TCE data
10. Treinar Anomaly Scorer Model - Objetivo: Melhorar detecção de anomalias do Zumbi - Tarefa: - [ ] Coletar dataset (contratos + anomalias detectadas) - [ ] Treinar Isolation Forest - [ ] Feature importance analysis (SHAP) - [ ] Ajustar thresholds - [ ] Deploy para Models API - [ ] Integrar com Zumbi agent - Entregável: Modelo com >80% precision/recall - Tempo estimado: 16 horas
📈 Prioridade ALTA¶
11. Implementar Explainable AI (XAI) Dashboard
- Tarefa:
- [ ] Integrar SHAP com modelos treinados
- [ ] Criar endpoint /api/v1/ml/explain
- [ ] Gerar visualizações de feature importance
- [ ] Adicionar explanations aos relatórios
- Entregável: Explicações para 100% das previsões ML
- Tempo estimado: 12 horas
12. Time Series Forecasting (Ceuci) - Tarefa: - [ ] Treinar Prophet model para previsão de gastos - [ ] Validar com dados históricos - [ ] Integrar com Ceuci agent - [ ] Dashboard de forecasting - Entregável: Previsões com MAPE <20% - Tempo estimado: 12 horas
Milestone Semana 3: 🎯 ML Models Operational - ✅ 2 modelos treinados e em produção - ✅ XAI implementado - ✅ Forecasting funcional - ✅ Models API integrado
SEMANA 4 (04-10 NOV) - "Testing & Quality Week"¶
Objetivo: Aumentar qualidade e cobertura de testes
🔥 Prioridade CRÍTICA¶
13. Expandir Test Coverage para 90% - Atual: 80.5% (1,133 testes) - Meta: 90%+ (adicionar ~200 testes) - Áreas críticas: - [ ] ML models (src/ml/) - [ ] Infrastructure (src/infrastructure/) - [ ] Services (src/services/) - [ ] API routes (src/api/routes/) - Entregável: 90%+ coverage - Tempo estimado: 20 horas
14. Performance Testing Suite
- Tarefa:
- [ ] Criar benchmarks para todos os agentes
- [ ] Load testing (Locust)
- [ ] Stress testing (1000+ concurrent users)
- [ ] Identificar bottlenecks
- [ ] Otimizar queries lentas
- Entregável: Performance report
- Tempo estimado: 12 horas
- Arquivo: tests/performance/
📈 Prioridade ALTA¶
15. Integration Tests End-to-End
- Tarefa:
- [ ] Complete investigation workflow test
- [ ] Multi-agent orchestration test
- [ ] Portal da Transparência integration test
- [ ] Chat flow test
- [ ] Export formats test
- Entregável: 10+ E2E tests
- Tempo estimado: 16 horas
- Arquivo: tests/e2e/
16. Security Audit - Tarefa: - [ ] Run Bandit security scanner - [ ] OWASP dependency check - [ ] Penetration testing (OWASP ZAP) - [ ] Fix critical vulnerabilities - [ ] Update security documentation - Entregável: Security report sem issues críticos - Tempo estimado: 12 horas
Milestone Semana 4: 🎯 Quality Assured - ✅ 90%+ test coverage - ✅ Performance benchmarks - ✅ E2E tests completos - ✅ Security audit passed
🎯 NOVEMBRO 2025 (4 SEMANAS)¶
Foco: Polimento, documentação e preparação para v1.0 launch
SEMANA 5 (11-17 NOV) - "Documentation Week"¶
Objetivo: Documentação completa e profissional
🔥 Prioridade CRÍTICA¶
17. Documentação Completa dos 18 Agentes
- Tarefa:
- [ ] Atualizar docs/agents/.md (18 arquivos)
- [ ] Adicionar exemplos de uso para cada agente
- [ ] Documentar parâmetros e thresholds
- [ ] Adicionar diagramas de fluxo (Mermaid)
- [ ] Screenshots de resultados
- **Entregável*: 18 docs completos
- Tempo estimado: 20 horas
- Pasta: docs/agents/
18. API Documentation Enhancement - Tarefa: - [ ] OpenAPI spec completo (298 endpoints) - [ ] Request/response examples para cada endpoint - [ ] Error codes documentation - [ ] Authentication guide - [ ] Rate limiting guide - [ ] Postman collection export - Entregável: Swagger UI 100% documentado - Tempo estimado: 16 horas
📈 Prioridade ALTA¶
19. User Guides & Tutorials
- Tarefa:
- [ ] Quickstart guide (5 min setup)
- [ ] Tutorial: Primeira investigação
- [ ] Tutorial: Chat com agentes
- [ ] Tutorial: Exportar relatórios
- [ ] Tutorial: Deploy próprio (Railway/HF)
- [ ] Video tutorials (opcional)
- Entregável: 5 tutorials completos
- Tempo estimado: 16 horas
- Pasta: docs/tutorials/
20. Architecture Documentation - Tarefa: - [ ] Atualizar multi-agent-architecture.md - [ ] Adicionar novos diagramas Mermaid - [ ] Database schema documentation - [ ] API flow diagrams - [ ] Deployment architecture - Entregável: 10+ diagramas - Tempo estimado: 12 horas
Milestone Semana 5: 🎯 Documentation Complete - ✅ 18 agent docs - ✅ API 100% documentado - ✅ 5 tutorials - ✅ 10+ diagramas
SEMANA 6 (18-24 NOV) - "Optimization Week"¶
Objetivo: Performance e otimizações finais
🔥 Prioridade CRÍTICA¶
21. Database Query Optimization - Tarefa: - [ ] Identificar N+1 queries - [ ] Criar índices otimizados - [ ] Implement query result caching - [ ] Optimize JOIN operations - [ ] Pagination para queries grandes - Entregável: Queries <50ms (p95) - Tempo estimado: 12 horas
22. API Response Optimization - Tarefa: - [ ] Implement response compression (>80% reduction) - [ ] Optimize serialization (orjson vs json) - [ ] Add ETag caching - [ ] Implement GraphQL for complex queries - [ ] CDN setup para static assets - Entregável: Response time <100ms (p95) - Tempo estimado: 12 horas
📈 Prioridade ALTA¶
23. Agent Performance Tuning - Tarefa: - [ ] Parallel processing para agentes independentes - [ ] Optimize Zumbi FFT calculations - [ ] Cache intermediate results - [ ] Async optimization - [ ] Connection pooling tuning - Entregável: Agent processing <3s (avg) - Tempo estimado: 16 horas
24. Memory & Resource Optimization - Tarefa: - [ ] Profile memory usage - [ ] Fix memory leaks (se houver) - [ ] Optimize pandas operations - [ ] Reduce Docker image size - [ ] Configure autoscaling - Entregável: Memory usage <512MB - Tempo estimado: 12 horas
Milestone Semana 6: 🎯 Performance Optimized - ✅ Response time <100ms - ✅ Agent processing <3s - ✅ Memory usage <512MB - ✅ 99.9% uptime
SEMANA 7 (25 NOV - 01 DEZ) - "Polish & Launch Prep"¶
Objetivo: Polimento final e preparação para v1.0
🔥 Prioridade CRÍTICA¶
25. Production Deployment (Railway) - Tarefa: - [ ] Setup Railway production environment - [ ] Configure PostgreSQL + Redis - [ ] Setup Celery workers - [ ] Configure monitoring (Prometheus/Grafana) - [ ] Setup backup strategy - [ ] Configure SSL/TLS - [ ] Domain setup (api.cidadao.ai) - Entregável: Production environment live - Tempo estimado: 16 horas
26. Monitoring & Alerting Setup - Tarefa: - [ ] Configure Grafana dashboards (5+) - [ ] Setup PagerDuty/Slack alerts - [ ] Configure error tracking (Sentry) - [ ] Setup uptime monitoring (UptimeRobot) - [ ] Log aggregation (Better Stack) - Entregável: Full observability - Tempo estimado: 12 horas
📈 Prioridade ALTA¶
27. User Feedback & Beta Testing - Tarefa: - [ ] Recruit 10 beta testers - [ ] Create feedback form - [ ] Fix critical bugs reported - [ ] Implement top 3 feature requests - [ ] User satisfaction survey - Entregável: Beta feedback incorporated - Tempo estimado: 16 horas
28. Final QA & Bug Fixes - Tarefa: - [ ] Complete regression testing - [ ] Fix all P0/P1 bugs - [ ] Smoke testing em produção - [ ] Browser compatibility testing - [ ] Mobile responsiveness check - Entregável: Zero P0/P1 bugs - Tempo estimado: 20 horas
Milestone Semana 7: 🎯 Production Ready - ✅ Railway production live - ✅ Monitoring completo - ✅ Beta feedback incorporated - ✅ Zero bugs críticos
SEMANA 8 (02-08 DEZ) - "Launch Week 🚀"¶
Objetivo: Launch oficial v1.0
🎉 Launch Activities¶
29. v1.0 Release - Tarefa: - [ ] Create GitHub release v1.0.0 - [ ] Update all version numbers - [ ] Create CHANGELOG.md - [ ] Tag Docker images - [ ] Deploy to production - [ ] Announcement blog post - [ ] Social media posts - [ ] Submit to Product Hunt - Entregável: v1.0 live - Data: 30 de novembro de 2025
30. Marketing & Outreach - Tarefa: - [ ] Press release - [ ] Demo video - [ ] Landing page update - [ ] Email announcement to users - [ ] Tech blog articles - [ ] Submit to Hacker News - Entregável: 1000+ users aware
31. Post-Launch Monitoring - Tarefa: - [ ] 24/7 monitoring first 48h - [ ] Hotfix any critical issues - [ ] Collect user feedback - [ ] Performance monitoring - [ ] Support ticket response - Entregável: Smooth launch
📊 MÉTRICAS DE SUCESSO v1.0¶
Funcionalidade¶
- ✅ 18/18 agentes operacionais (100%)
- ✅ Todos com dados reais (não simulados)
- ✅ 2-3 ML models treinados
- ✅ 298 endpoints funcionais
- ✅ 90%+ test coverage
Performance¶
- ✅ API response time <100ms (p95)
- ✅ Agent processing <3s (avg)
- ✅ Uptime >99.9%
- ✅ Memory usage <512MB
- ✅ Cache hit rate >70%
Qualidade¶
- ✅ Zero bugs críticos
- ✅ Security audit passed
- ✅ LGPD/GDPR compliant (90%+)
- ✅ Documentação completa
- ✅ CI/CD operacional
Dados¶
- ✅ Portal da Transparência >50% acessível
- ✅ 6 TCE APIs integradas
- ✅ 5 CKAN portals
- ✅ 3 Federal APIs (IBGE, DataSUS, INEP)
- ✅ Database persistente
🚨 RISCOS E MITIGAÇÕES¶
RISCO 1: Portal da Transparência não liberar API key¶
Probabilidade: Alta (70%) Impacto: Médio Mitigação: - Expandir uso de TCE APIs (já temos 6) - Implementar mais CKAN portals (já temos 5) - Crawler autorizado como fallback - Parcerias com órgãos estaduais
RISCO 2: APIs Federais instáveis/lentas¶
Probabilidade: Média (50%) Impacto: Médio Mitigação: - Circuit breakers implementados - Cache agressivo (24h TTL) - Fallback para dados locais - Retry logic com backoff
RISCO 3: ML models com baixa accuracy¶
Probabilidade: Média (40%) Impacto: Alto Mitigação: - Manter thresholds estatísticos como fallback - Ensemble de múltiplos modelos - Continuous training - Feature engineering cuidadoso
RISCO 4: Performance issues em produção¶
Probabilidade: Baixa (30%) Impacto: Alto Mitigação: - Load testing antes do launch - Auto-scaling configurado - Cache multi-layer - Database optimization
RISCO 5: Atraso no cronograma¶
Probabilidade: Média (50%) Impacto: Médio Mitigação: - Buffer de 1 semana (primeira semana de dezembro) - Priorização clara (P0, P1, P2) - Scope flexibility (features nice-to-have podem ficar para v1.1) - Daily standup para tracking
📅 CRONOGRAMA VISUAL¶
OUTUBRO 2025
════════════════════════════════════════════════════════════
Semana 1 (14-20): Data Liberation [████████████████] 100%
Semana 2 (21-27): Infrastructure [████████████████] 100%
Semana 3 (28-03): ML Training [████████████████] 100%
Semana 4 (04-10): Testing & Quality [████████████████] 100%
NOVEMBRO 2025
════════════════════════════════════════════════════════════
Semana 5 (11-17): Documentation [████████████████] 100%
Semana 6 (18-24): Optimization [████████████████] 100%
Semana 7 (25-01): Polish & Launch Prep [████████████████] 100%
Semana 8 (02-08): Launch Week 🚀 [████████████████] 100%
MILESTONE: v1.0 LAUNCH - 30 NOV 2025
🎯 DEFINIÇÃO DE PRONTO (v1.0)¶
Must Have (Obrigatório)¶
- 18/18 agentes operacionais
- Dados reais (sem simulações)
- 2+ ML models treinados
- Database persistente
- Redis em produção
- CI/CD pipeline
- 90%+ test coverage
- Documentação completa
- Performance targets atingidos
- Security audit passed
- Production deployment (Railway)
Should Have (Desejável)¶
- 3 ML models treinados
- XAI dashboard completo
- Video tutorials
- Mobile app (fase 2)
- GraphQL completo
- Backup automático
- 95%+ test coverage
Could Have (Nice to Have)¶
- WebSocket real-time (já parcial)
- Fine-tuning LLM próprio
- Advanced visualizations
- Multi-language support
- Plugin system
- API versioning (v2)
👥 RECURSOS NECESSÁRIOS¶
Time Necessário¶
- Backend Developer: 1 full-time (você)
- DevOps Support: Part-time (setup CI/CD, Railway)
- QA/Tester: Part-time (semanas 4, 7, 8)
- Technical Writer: Part-time (semana 5)
Infraestrutura¶
- Supabase: Free tier → Pro ($25/mês)
- Redis Cloud: Free tier → Standard ($10/mês)
- Railway: Hobby (\(5/mês) → Developer (\)20/mês)
- HuggingFace Spaces: Free (mantém para demo)
- Monitoring: Grafana Cloud free tier
Custo Estimado (Novembro/Dezembro)¶
- Infraestrutura: ~$60/mês
- APIs: Grátis (portais públicos)
- Domínio: ~$15/ano
- SSL: Grátis (Let's Encrypt)
- Total: ~$75/mês
📝 CHECKLIST v1.0 FINAL¶
Funcionalidade¶
- Todos os 31 tasks do roadmap completos
- 18/18 agentes testados em produção
- Portal + TCE + CKAN funcionando
- Dandara com dados reais
- 2+ ML models deployados
- Chat consolidado
- Exports funcionando (PDF, Excel, etc.)
Infraestrutura¶
- PostgreSQL persistente live
- Redis cache operacional
- CI/CD rodando
- Monitoring ativo
- Backups configurados
- SSL/TLS ativo
- Domain configurado
Qualidade¶
- 90%+ test coverage
- Zero bugs P0/P1
- Performance targets atingidos
- Security scan passed
- Load testing passed
- E2E tests passing
Documentação¶
- 18 agent docs completos
- API 100% documentado
- 5 tutorials escritos
- README atualizado
- CHANGELOG.md criado
- Architecture docs atualizados
Launch¶
- Beta testing completo
- Production deployment
- Announcement preparado
- Social media posts
- Blog post publicado
- Product Hunt submission
🎊 PÓS-LAUNCH (Dezembro 2025)¶
Semana 1-2 Pós-Launch¶
- Monitoring intensivo
- Hotfixes prioritários
- User feedback collection
- Performance tuning baseado em uso real
v1.1 Planning (Janeiro 2026)¶
- Frontend web app (Next.js)
- Mobile app (React Native)
- Advanced analytics dashboard
- API v2 with breaking changes
- WebSocket real-time completo
- Multi-tenant support
📞 COMUNICAÇÃO E TRACKING¶
Daily Standup (Sugestão)¶
- O que fiz ontem?
- O que vou fazer hoje?
- Algum bloqueio?
Weekly Review (Sexta)¶
- Milestone da semana atingido?
- Riscos identificados?
- Ajustes no roadmap?
Tools¶
- Task Tracking: GitHub Projects ou Linear
- Documentation: Notion ou Confluence
- Communication: Slack ou Discord
- Code Review: GitHub Pull Requests
- Monitoring: Grafana + PagerDuty
🎯 CONCLUSÃO¶
Este roadmap é ambicioso mas factível com foco e disciplina. As 8 semanas estão bem distribuídas:
- Outubro: Resolver problemas técnicos críticos
- Novembro: Polimento e preparação para produção
Flexibilidade: Se surgir algum imprevisto, temos 1 semana de buffer (primeira semana de dezembro) antes do deadline de 30 de novembro.
Priorização: Todos os tasks marcados como 🔥 CRÍTICA são obrigatórios para v1.0. Os marcados como 📈 ALTA são desejáveis mas podem ser movidos para v1.1 se necessário.
Sucesso: Com este roadmap, você terá um sistema production-ready, profissional e completo até o final de novembro! 🚀
Criado por: Claude Code (Strategic Planning Tool) Data: 14 de outubro de 2025 Versão: 1.0 Status: Aprovado para execução
🏛️ Cidadão.AI v1.0 - Democratizando a Transparência Pública através de IA