Saltar a contenido

Runbooks

Procedimientos paso a paso para operaciones de mantenimiento e incidentes.

Cuándo escribir un runbook: cada vez que resolvés un incidente o ejecutás una operación no trivial. La próxima persona (o vos en 6 meses) te lo agradece.

Runbooks disponibles

(Aún no hay runbooks formalizados. Sumá uno acá la próxima vez que resuelvas algo no trivial.)

Template para runbook nuevo

Crear un archivo runbooks/<nombre>.md con este formato:

```markdown

Título del runbook

Cuándo usar: [síntoma observable o evento que dispara este runbook]

Tiempo estimado: [ej: 5 min]

Requiere: [permisos sudo / acceso a Cloudflare / token X / etc.]

Pasos

  1. ...
  2. ...

Verificación

[Cómo confirmás que el problema está resuelto]

Si falla

[Plan B / quién avisar / link a runbook de escalación] ```

Sugerencias de runbooks a futuro

A medida que el equipo crezca, vale escribir:

  • Reset completo de la BD de testing (bootstrap-db.sh)
  • Reinicio individual de servicios (mm-restart-*)
  • Onboarding nuevo teammate (referencia a equipo.md + mm-add-teammate)
  • Off-boarding teammate
  • Migración DNS / cambio de proveedor
  • Recuperación de Cloudflare Access en caso de lockout
  • Rotación de SSH keys / API tokens
  • Dump y restore de Postgres prod ↔ staging