La columna: cómo resuelve

Un solo motor.
Tú eliges el control.

El mismo motor de resolución en todo. Lo único que cambia es quién aprieta el botón: tú, o el propio clúster.

Kobi (Copilot)

Quién actúa Kobi + tú

Quién aprueba Tú pulsas Ejecutar

Velocidad Segundos hasta el fix

Mismo motor detectar → diagnosticar → remediar. Solo cambia el modelo de control.

01

Resolución asistida · Disponible hoy

Kobi resuelve.
Enseña. Y nunca te deja atascado.

Pulsa ⌘ J y describe qué falla. Kobi consulta tu cluster en vivo con 17+ herramientas, halla la causa raíz y propone el fix exacto, tú pulsas Ejecutar. Explica cada paso, y cuando un fix queda fuera de lo que puede ejecutar, te entrega los comandos precisos para la consola.

01 · Resuelve

De la alerta al fix, con tu clic

Kobi halla la causa raíz y propone el comando exacto: rollback, escalar, ajustar limits. Tú apruebas; ejecuta con RBAC completo y registro de auditoría. El humano sigue en el loop.

02 · Enseña

Muestra su razonamiento, siempre

Cada diagnóstico viene con el razonamiento y los comandos detrás. Tu equipo aprende Kubernetes, no solo KubeBolt. Onboarding y respuesta a incidentes en uno.

03 · Guía a consola

Nunca un callejón sin salida

Cuando un fix queda fuera de lo que Kobi puede ejecutar, no se encoge de hombros: te da el paso a paso exacto para hacerlo a mano, así nunca te bloqueas.

04 · Anywhere

UI, IDE, CLI vía MCP

Kobi expone un servidor Model Context Protocol. Conéctalo a Cursor o Claude Code y tu asistente obtiene contexto del cluster en vivo sin salir del editor.

Kobi · KubeBolt's Copilot ANTHROPIC · CLAUDE-SONNET-4-6

My deployment demo/demo-web just rolled out and pods are crashing. What's going on?

🤖

New pods are crashing. Checking logs from the CrashLoopBackOff pod to find the root cause.

🤖

Clear diagnosis. Here's the summary:

🔴 Problem: New deploy broken (Revision 21)

What's happening?

The RollingUpdate is in progress but the new pods from revision 21 (demo-web-b7c7c876b) are failing immediately on startup. The container log confirms it:

CODE ⎘ Copy

bad deploy

The container exits with error and Kubernetes restarts it continuously → CrashLoopBackOff.

Current state

REPLICASETREVISIONREADYSTATUS

demo-web-b7c7c876b21 (new)0/2🔴 CrashLoopBackOff

demo-web-7d746ccd4520 (prev)3/3✅ Running

Good news: thanks to RollingUpdate, the 3 pods from revision 20 are still active and serving traffic. The service is not fully down.

✅ Recommended fix: Rollback to revision 20

The fastest and safest action is to revert to the previous state (revision 20), which was working correctly.

🔧

KOBI PROPOSES MEDIUM RISK

Roll back deployment demo/demo-web from revision 21 to revision 20

deployments·demo/demo-web ↗

Revision 21 (ReplicaSet demo-web-b7c7c876b) is failing with "bad deploy" — new pods enter CrashLoopBackOff immediately. Revision 20 (demo-web-7d746ccd45) has 3 healthy pods serving traffic. Reverting eliminates the failing pods and restores the stable state.

fromRevision: 21 toRevision: 20

🤖

Confirm the rollback above to revert the deployment to revision 20. Once executed, Kubernetes will eliminate the failing pods and the deployment will be fully stable.

💡 Next step: Before redeploying, investigate what changed in revision 21 (config, entrypoint, env vars) that causes the container to exit with "bad deploy".

AI can make mistakes. Verify important information before acting on it.
⌘+Enter to send · ⌘J to toggle

Multi-modelo

Trae tu propio modelo

Para el trabajo interactivo aprobado por humano, Kobi te deja elegir proveedor: Anthropic Claude, OpenAI GPT, xAI Grok, o cualquier endpoint compatible con OpenAI (Llama / Qwen / Mistral self-hosted vía vLLM, Ollama, LM Studio). Pon uno como fallback ante 429 / 5xx. El prompt caching mantiene la factura predecible. (Autopilot, actuando sin supervisión, usa Claude exclusivamente.)

→ Anthropic · Claude Sonnet / Opus / Haiku
→ OpenAI · GPT-5 / serie o
→ xAI · familia Grok 4
→ Compatible OpenAI · self-hosted, gateways custom

Donde sea, vía MCP

Cursor. Claude Code. Tu terminal.

Kobi expone un servidor de Model Context Protocol. Conéctalo a tu IDE y tu asistente de IA tendrá acceso de lectura a tu cluster, sin salir del editor.

# claude code
/mcp add kubebolt

02

Resolución autónoma

MVP · Acceso anticipado

Autopilot.
El mismo motor. Sin manos. Auditable.

Autopilot despierta solo cuando algo importa: un crash loop se propaga, el budget de un SLO se quema, un nodo se degrada. Abre una sesión, reúne contexto, decide y actúa. En nuestro MVP ya resuelve incidentes reales de extremo a extremo en menos de 90 segundos, a unos $0.30 cada uno, y lo hemos demostrado en vivo. Construido sobre el Claude Agent SDK con failover multi-región, llegando con KubeBolt Cloud.

< 90s para resolver

$0.30 por incidente

100% auditable

autopilot · operación autónoma LIVE · session 4f8a

● CRITICAL AUTONOMOUS

Image Pull Failed

Pod/image-app · ns autopilot-demo

1m 10sresolved

296ktokens

$0.335 stages

✓ Triage Haiku 4.5 $0.027

rule image-pull-backoff · severity critical · should route yes

Pod can't pull its container image (ImagePullBackOff), blocking the workload. Routing for investigation into image tag, registry creds, and network.
✓ Investigate 97% confidence Sonnet 4.6 $0.073

Deployment image-app was rolled to revision 116 with a non-existent tag nginx:does-not-exist-2099 — Docker Hub returns a hard 404. Revision 115 still serves 1/1, so there's no full outage.

Docker Hub 404 ImagePullBackOff ×3 rev 115 available
✓ Plan 2 actions · high risk Sonnet 4.6 $0.033

#1 rollback_deployment HIGH RISK APPROVAL
image-app → revision 115 (nginx:1.27-alpine)

#2 verify_pods_ready LOW RISK
confirm pods Running/Ready after rollback
✓ Execute Sonnet 4.6 $0.055

✓ rollback_deployment succeeded · toRevision 115 · 5.3s

✓ verify_pods_ready succeeded · 128ms

verification ✓ passed · all pods Running nginx:1.27-alpine
✓ Postmortem Opus 4.7 $0.144

image-app ImagePullBackOff from non-existent tag. Bad image-tag deployment, not a registry or network fault. Autopilot rolled back to rev 115; pods returned Ready and the rollout converged in ~5s. User-visible impact: a stuck rollout, no outage.

TIMELINE live

✓ TRIA

✓ INVE

✓ PLAN

✓ EXEC

✓ POST

7:58:58 · run

incident detected · run started
7:58:58 · message

rule image-pull-backoff → route
7:59:11 · tool call

get_events image-app
7:59:11 · tool result

Docker Hub 404 · ImagePullBackOff ×3
7:59:23 · message

evidence conclusive · 97% confidence
7:59:36 · message

2 actions · risk=high
7:59:55 · message

executing: rollback first, then verify
7:59:56 · tool call

rollback_deployment
7:59:56 · approval

awaiting approval
8:00:01 · approval

operator approved
8:00:01 · tool result

rollback_deployment · 5.3s
8:00:05 · tool result

verify_pods_ready · 128ms
8:00:08 · message

both actions completed · pods healthy
8:00:08 · message

post-incident report generated
8:00:49 · run

run.completed

01

Análisis de causa raíz

Cuando se dispara un incidente, Autopilot lanza una sesión larga de investigación. Correlaciona eventos, logs, despliegues e incidentes previos, y escribe un veredicto que puedes auditar.

02

Remediación guiada

Propone un parche, lo pasa por un ejecutor determinista con guardrails de política, y hace rollback si rompe el SLO. Apruebas una vez; lo recuerda.

03

Postmortems en piloto automático

Genera un borrador de postmortem desde la línea de tiempo del incidente. Action items enlazados a PRs. Five-whys incluidos. Editas, no escribes desde cero.

04

Operación del lifecycle del cluster

Programa power-on / power-off en EKS, AKS, GKE, OpenShift y node pools. Se paga a sí mismo en la mayoría de los entornos.

Por qué Claude exclusivamente, para Autopilot

Para la acción no supervisada usamos Claude exclusivamente, con failover multi-región entre Anthropic API, AWS Bedrock y Google Vertex AI. La remediación autónoma exige el modelo más fiable: sin router, sin zoo de modelos, sin ambigüedad en un postmortem. Kobi, contigo en el loop, es donde vive el multi-modelo.

03

Módulo: Cluster Lifecycle

Roadmap · 2026 · Business / Enterprise

El módulo
que se paga solo.

La mayoría de clusters corren 24/7 aunque las personas no. El módulo de lifecycle de KubeBolt programará power-on / power-off en toda tu flota (entornos preview, clusters de dev, downtime de fin de semana) y rastreará los ahorros. Llega con el tier KubeBolt Business en 2026.

Ahorro típico

~65%

en gasto de clusters non-prod, programando noches y fines de semana con calentamiento inteligente antes de horas laborales.

El ahorro de infraestructura suele superar la propia suscripción a KubeBolt.

Plataformas soportadas

→ EKS
→ AKS
→ GKE
→ OpenShift
→ Generic node pools

Schedules por cluster, reglas semana / fin de semana, override manual, audit log de cada transición de power. Diseñado para no interrumpir CI runs en vuelo.

04

Arquitectura: Determinismo primero

L1 + L5 parcial · L2–L4, L6 roadmap 2026

Skills.
La llamada al LLM más barata
es la que no haces.

Una Skill es una rutina diagnóstica declarativa y determinista: una receta para un patrón de fallo conocido. L1 Detectores está disponible hoy como el Insights Engine de 24 reglas de abajo. L5 Ejecutor está parcialmente disponible como el surface de write-ops determinista de arriba (Set image, Set resources, Secret reveal con audit, Apply manifest). Las capas restantes llegan con Autopilot en 2026.

L1

SHIPPED

Detectores

Determinista. Sin IA.

L2

ROADMAP

Router

Tipo Haiku. Triage.

L3

ROADMAP

Investigador

Tipo Sonnet. RCA.

L4

ROADMAP

Planificador

Sonnet / Opus.

L5

PARTIAL

Ejecutor

Determinista. Guardrails.

L6

ROADMAP

Postmortem

Sonnet / Opus.

05

Insights Engine

24 reglas. Cero configuración.

Evaluación continua contra heurísticas probadas. Recomendaciones accionables, no PromQL crudo. Cada regla es una Skill, así que el motor funciona incluso antes de configurar un modelo.

Crash loop detectado Crítico

OOM killed Crítico

Image pull backoff Crítico

Nodo no listo Crítico

Cero réplicas Crítico

Release de Helm fallida Crítico

Riesgo de CPU throttle Advertencia

Memory pressure Advertencia

HPA al máximo Advertencia

Certificado por expirar Advertencia

App de ArgoCD no sana Advertencia

+13 reglas más Catálogo completo →

06

Módulo: Operaciones del cluster

Disponible hoy

Opera.
No solo observes.

Cada verbo equivalente de kubectl es un click. Set image, scale, drain de un nodo, editar env, revelar un secret, aplicar un manifest nuevo: todo desde el dashboard con RBAC enforcement en cada endpoint, una entrada de audit log en cada mutación y un switch de governance para acotar o desactivar las acciones de escritura. Sin terminal.

demo · demo-web DEPLOYMENT

Set image

Container

web

Imagen actual ghcr.io/clm-cloud-solutions/web:1.4.2

Imagen nueva ghcr.io/clm-cloud-solutions/web:1.5.0

tracing-agent INIT

Imagen actual ghcr.io/clm-cloud-solutions/tracing:0.3.1

Imagen nueva ghcr.io/clm-cloud-solutions/tracing:0.4.0

Historial de rollout

#23 activa 2s ago
#22 v1.4.2 14m ago
#21 v1.4.1 1h ago
#20 v1.4.0 3h ago
#19 v1.3.4 1d ago

ROLLOUT EN CURSO 2 de 3 pods actualizados

Audit log Registrado · rol Editor · hace 2s

01

Edición de workloads

Set image, ajustar CPU/memoria (requests y limits), set env (literal, ref de ConfigMap, ref de Secret), editar labels y anotaciones. Strategic-merge patches con soporte de init-containers y validación de limit ≥ request.

02

Reveal de Secret con audit

Razón del operador obligatoria (≥10 chars) antes de cualquier reveal. Gate de namespace prod que escala a Admin. Auto-hide por key a los 60s. Audit log registra quién/qué/cuándo/por qué, nunca los valores.

03

Mantenimiento de nodos

Cordon, uncordon y drain con progreso SSE en vivo de los pods siendo evictados. Cancelable mid-flight. Misma paridad de toolbar desde Node detail y el listado de Nodes.

04

Aplicar manifest nuevo

Pega YAML o elige entre 18 starter templates por kind. Editor CodeMirror con validación pre-flight: consistencia de kind / apiVersion / namespace, guard de documento único, status / managedFields se eliminan automáticamente.

05

Diff de revisiones y rollback

La pestaña History de cada rollout muestra un diff YAML lado a lado (qué cambió, línea por línea), venga de kubectl, GitOps o KubeBolt. Vuelve a cualquier revisión con un click.

06

Releases de Helm, de extremo a extremo

Ve cada release de Helm del cluster: chart, values, manifest renderizado, historial de revisiones y dependencias. Decodificado directo de los Secrets de Helm, sin SDK y sin terminal.

07

Surface: UI del operador

Mira tu cluster.
En movimiento.

Un mapa en tiempo real de cada pod, servicio y ruta de petición. Mini-dashboards en cada recurso. Flujo de tráfico que puedes observar de verdad. Pensado para ingenieros que prefieren ver la topología antes que escribir otro kubectl get.

kind-kubebolt-dev

LIVE · 2 nodes

◉

ingress-nginx-controller

SERVICE

⬢

ingress-nginx-controller-7f8

POD

◉

demo-web

SERVICE

⬢

demo-web-8d657b-1

POD

⬢

demo-web-8d657b-2

POD

⬢

demo-web-8d657b-3

POD

32.43 ev/s FORWARDED

HTTP 9.24 req/s

2xx 4.77/s

4xx 4.48/s

avg latency 0.4 ms

01

30+ vistas de recursos

Pods, Deployments, Services, Ingresses, ConfigMaps, Secrets, Jobs, Nodes. Cada tipo tiene una vista diseñada con las columnas, las acciones y los paneles de detalle correctos.

02

Live, sin polling

Cada lista, gráfico y arista se mueve por Watch streams contra la K8s API. Los cambios de estado aparecen en milisegundos: sin F5, sin filas viejas, sin sorpresas.

03

⌘K para todo

Escribe para saltar a cualquier recurso en cualquier namespace. Búsqueda fuzzy entre tipos. Contexto reciente fijado. Funciona como tu editor, porque así es como ya piensas.

04

Tres lentes en el dashboard

Overview para salud de un vistazo, Capacity para recomendaciones de right-sizing y top consumers, Reliability con error rates L7, hot-spots y Network Drops vía Hubble.

08

Stack

Liviano por diseño.

Origen

Kubernetes

API Server
Metrics Server
OTel Collector (forked)

Core

Motor KubeBolt

Go · Auth · RBAC
BoltDB embedded
Insights Engine · 24 rules
MCP servers

Superficies

Donde trabajas

Web UI · 30+ views
Slack · Discord · Email
Cursor · Claude Code (MCP)

Go 1.25+ · client-go · BoltDB · Anthropic API · OpenAI API · OpenTelemetry · Hubble flows · Model Context Protocol · React 18 · TypeScript · Go 1.25+ · client-go · BoltDB · Anthropic API · OpenAI API · OpenTelemetry · Hubble flows · Model Context Protocol · React 18 · TypeScript ·

Por qué KubeBolt

La mayoría observa.
KubeBolt opera.

Dashboards, métricas y alertas son lo mínimo, todos los tienen. La diferencia es lo que pasa después de que salta la alerta.

Lo mínimo: todos lo tienen

Lo que hace un dashboard

Dashboards y visualización de recursos
Agregación de métricas y logs
Alertas cuando algo se rompe
Un chat pegado al clúster

Solo KubeBolt

Lo que ningún dashboard tiene

Remediación autónoma con guardarraíles No solo te avisa: resuelve el incidente, con política de grado operador y auditoría completa.
Una flota de agentes especializados Red, almacenamiento, workloads, seguridad: cada capa vigilada y diagnosticada de extremo a extremo, no un bot genérico.
Todo el ciclo del incidente Detectar → diagnosticar → remediar → verificar → postmortem. Un solo bucle, cerrado automáticamente.
Tu API server sigue privado El agente marca hacia afuera; nada entra. Funciona en GKE/EKS privados, tras bastiones, air-gapped: sin VPN, sin clúster expuesto.

09

Instalar

Un comando.
Cualquier cluster.

Chart OCI en GHCR. RBAC, Ingress, auth y recursos configurables.

helm install kubebolt \
  oci://ghcr.io/clm-cloud-solutions/kubebolt/helm/kubebolt

kubectl port-forward svc/kubebolt 3000:80

Contenedor único con frontend embebido. Multi-arch (amd64/arm64).

docker run -p 3000:3000 \
  -v ~/.kube:/root/.kube:ro \
  ghcr.io/clm-cloud-solutions/kubebolt:latest

Ejecutable único, UI embebida, un puerto. Auto-carga .env.

curl -LO https://github.com/clm-cloud-solutions/kubebolt/releases/latest/download/kubebolt-darwin-arm64
chmod +x kubebolt-darwin-arm64
./kubebolt-darwin-arm64 --kubeconfig ~/.kube/config

Tap e instala. Gestión automática de versiones.

brew install clm-cloud-solutions/tap/kubebolt
kubebolt --kubeconfig ~/.kube/config

¿Necesitas la referencia completa? Lee la documentación →

Roadmap: lo que viene

No es un producto terminado. Es uno vivo.

KubeBolt evoluciona sin parar. Esto es lo que funciona hoy y hacia dónde va, para que sepas exactamente a qué te sumas.

01 Disponible ahora

Resolución, hoy

Copilot Kobi: resolución asistida con acciones auditadas
Operaciones kubectl + visibilidad de Helm vía agente
Insights Engine de 24 reglas, sin configuración

02 En beta

Hacia lo autónomo

Autopilot MVP: remediación autónoma
Detección predictiva de fallos
Insights de optimización de costos

03 Próximamente

Listo para empresa

Cloud gestionado: Autopilot + Lifecycle
SSO, RBAC avanzado, auditoría
Gestión multi-clúster de la flota

04 Investigación

La frontera

Remediación multi-paso entre servicios
Sub-agentes especializados por dominio
Auto-tuning predictivo

Planes: un solo lugar para elegir tu camino

Gratis para siempre,
o totalmente hosteado.

El agente open-source es gratis para siempre bajo Apache 2.0. KubeBolt Cloud añade Autopilot hosteado, Lifecycle Management y SSO de equipo. Únete a la waitlist para precios de founding-customer.

OSS · Self-Hosted Disponible hoy

Gratis para siempre. Sin topes.

Apache 2.0. Tú operas la infra. KubeBolt no opera nada.

Clusters ilimitados
Nodos / pods ilimitados
Usuarios ilimitados
Retención tu disco
AI Copilot BYOK · ilimitado
Soporte GitHub · Comunidad

Instala en 60 segundos →

SaaS · Cloud Llega en 2026

Tier hosted gratis. Con caps.

Nosotros operamos el control plane. Tú solo despliegas el agent. Límites de lead-magnet.

Clusters 2
Nodos / pods 10 / 150
Usuarios activos 3 (cap duro)
Retención 15 días
AI credits / mes 500 (cutoff)
Webhooks · reglas custom 3 · 3

Únete a la waitlist →

Acceso anticipado

Sé de los primeros en
el cloud comercial.

El agente open-source es gratis para siempre. KubeBolt Cloud (Autopilot hosted, Lifecycle Management y SSO de equipo) se lanza en 2026. Únete a la waitlist para acceso anticipado y precios de founding-customer.

10+ ya en la waitlist 12 estrellas en GitHub

Sin spam. Te das de baja con un click. Solo enviamos updates de producto.

Incidentes de Kubernetes, resueltos.

Un solo motor. Tú eliges el control.

Kobi resuelve. Enseña. Y nunca te deja atascado.

De la alerta al fix, con tu clic

Muestra su razonamiento, siempre

Nunca un callejón sin salida

UI, IDE, CLI vía MCP

Trae tu propio modelo

Cursor. Claude Code. Tu terminal.

Autopilot. El mismo motor. Sin manos. Auditable.

Análisis de causa raíz

Remediación guiada

Postmortems en piloto automático

Operación del lifecycle del cluster

El módulo que se paga solo.

Skills. La llamada al LLM más barata es la que no haces.

24 reglas. Cero configuración.

Opera. No solo observes.

Edición de workloads

Reveal de Secret con audit

Mantenimiento de nodos

Aplicar manifest nuevo

Diff de revisiones y rollback

Releases de Helm, de extremo a extremo

Mira tu cluster. En movimiento.

30+ vistas de recursos

Live, sin polling

⌘K para todo

Tres lentes en el dashboard

Liviano por diseño.

La mayoría observa. KubeBolt opera.

Lo que hace un dashboard

Lo que ningún dashboard tiene

Un comando. Cualquier cluster.

No es un producto terminado. Es uno vivo.

Resolución, hoy

Hacia lo autónomo

Listo para empresa

La frontera

Gratis para siempre, o totalmente hosteado.

Gratis para siempre. Sin topes.

Tier hosted gratis. Con caps.

Sé de los primeros en el cloud comercial.

Un solo motor.
Tú eliges el control.

Kobi resuelve.
Enseña. Y nunca te deja atascado.

Autopilot.
El mismo motor. Sin manos. Auditable.

El módulo
que se paga solo.

Skills.
La llamada al LLM más barata
es la que no haces.

Opera.
No solo observes.

Mira tu cluster.
En movimiento.

La mayoría observa.
KubeBolt opera.

Un comando.
Cualquier cluster.

Gratis para siempre,
o totalmente hosteado.

Sé de los primeros en
el cloud comercial.