Runbooks¶
Procedimientos paso a paso para operaciones de mantenimiento e incidentes.
Cuándo escribir un runbook: cada vez que resolvés un incidente o ejecutás una operación no trivial. La próxima persona (o vos en 6 meses) te lo agradece.
Runbooks disponibles¶
(Aún no hay runbooks formalizados. Sumá uno acá la próxima vez que resuelvas algo no trivial.)
Template para runbook nuevo¶
Crear un archivo runbooks/<nombre>.md con este formato:
```markdown
Título del runbook¶
Cuándo usar: [síntoma observable o evento que dispara este runbook]
Tiempo estimado: [ej: 5 min]
Requiere: [permisos sudo / acceso a Cloudflare / token X / etc.]
Pasos¶
- ...
- ...
Verificación¶
[Cómo confirmás que el problema está resuelto]
Si falla¶
[Plan B / quién avisar / link a runbook de escalación] ```
Sugerencias de runbooks a futuro¶
A medida que el equipo crezca, vale escribir:
- Reset completo de la BD de testing (
bootstrap-db.sh) - Reinicio individual de servicios (
mm-restart-*) - Onboarding nuevo teammate (referencia a
equipo.md+mm-add-teammate) - Off-boarding teammate
- Migración DNS / cambio de proveedor
- Recuperación de Cloudflare Access en caso de lockout
- Rotación de SSH keys / API tokens
- Dump y restore de Postgres prod ↔ staging