"A nuvem ficou cara" quase nunca é verdade. O que ficou caro foi uma arquitetura que trata recursos elásticos como se fossem um servidor físico ligado 24/7. A boa notícia: dá para ter performance e previsibilidade ao mesmo tempo. Quatro decisões resolvem a maior parte dos sustos.
1. Separe o que escala do que fica parado
Junte uma API que recebe picos com um banco que precisa de memória constante no mesmo servidor e você paga o pico o mês inteiro. Separar responsabilidades — compute efêmero para o que escala, recurso reservado para o que é estável — corta desperdício sem tocar na experiência do usuário.
2. Edge e cache antes de mais máquina
Boa parte do tráfego de um site institucional é conteúdo que não muda. Servir isso a partir do edge (CDN) é mais rápido para o usuário e ordens de magnitude mais barato do que processar a mesma resposta repetidamente. Foi exatamente essa a decisão por trás de migrar este próprio site para o Cloudflare Pages.
Antes de aumentar a instância, pergunte: essa resposta precisava ter sido calculada de novo?
3. Observabilidade é controle de custo
Não dá para otimizar o que você não enxerga. Métricas por serviço, alerta de gasto anômalo e um dashboard que qualquer pessoa do time entende transformam "a conta veio alta" em "esse job aqui dobrou de custo na terça". O problema vira concreto — e concreto se resolve.
4. Defina o teto antes de precisar dele
Limites de orçamento, autoscaling com máximo e políticas de expiração de recursos não são burocracia: são o cinto de segurança que evita que um loop esquecido vire uma fatura de cinco dígitos. Configure no dia um, não depois do susto.
Resumindo
| Decisão | O que evita |
|---|---|
| Separar escala de estável | Pagar pico o mês todo |
| Edge + cache | Recalcular o que não muda |
| Observabilidade | Descobrir custo só na fatura |
| Tetos e limites | Loop esquecido virar prejuízo |
Nuvem previsível não é sorte — é arquitetura. Se a sua fatura anda te surpreendendo, quase sempre tem uma dessas quatro decisões faltando.

