Míralo arreglarse solo

Incidentes de Kubernetes, resueltos.

Un motor de resolución, dos modos. Kobi lo arregla con tu clic; Autopilot lo arregla solo.

87s tiempo medio de resolución
24/7 agente de guardia
0-touch en Autopilot
cluster / prod-eu-west Monitoreando

La columna: cómo resuelve

Un solo motor.
Tú eliges el control.

El mismo motor de resolución en todo. Lo único que cambia es quién aprieta el botón: tú, o el propio clúster.

Kobi (Copilot)
Quién actúa Kobi + tú
Quién aprueba Tú pulsas Ejecutar
Velocidad Segundos hasta el fix

Mismo motor detectar → diagnosticar → remediar. Solo cambia el modelo de control.

01

Resolución asistida · Disponible hoy

Kobi resuelve.
Enseña. Y nunca te deja atascado.

Pulsa ⌘ J y describe qué falla. Kobi consulta tu cluster en vivo con 17+ herramientas, halla la causa raíz y propone el fix exacto, tú pulsas Ejecutar. Explica cada paso, y cuando un fix queda fuera de lo que puede ejecutar, te entrega los comandos precisos para la consola.

01 · Resuelve

De la alerta al fix, con tu clic

Kobi halla la causa raíz y propone el comando exacto: rollback, escalar, ajustar limits. Tú apruebas; ejecuta con RBAC completo y registro de auditoría. El humano sigue en el loop.

02 · Enseña

Muestra su razonamiento, siempre

Cada diagnóstico viene con el razonamiento y los comandos detrás. Tu equipo aprende Kubernetes, no solo KubeBolt. Onboarding y respuesta a incidentes en uno.

03 · Guía a consola

Nunca un callejón sin salida

Cuando un fix queda fuera de lo que Kobi puede ejecutar, no se encoge de hombros: te da el paso a paso exacto para hacerlo a mano, así nunca te bloqueas.

04 · Anywhere

UI, IDE, CLI vía MCP

Kobi expone un servidor Model Context Protocol. Conéctalo a Cursor o Claude Code y tu asistente obtiene contexto del cluster en vivo sin salir del editor.

Multi-modelo

Trae tu propio modelo

Para el trabajo interactivo aprobado por humano, Kobi te deja elegir proveedor: Anthropic Claude, OpenAI GPT, xAI Grok, o cualquier endpoint compatible con OpenAI (Llama / Qwen / Mistral self-hosted vía vLLM, Ollama, LM Studio). Pon uno como fallback ante 429 / 5xx. El prompt caching mantiene la factura predecible. (Autopilot, actuando sin supervisión, usa Claude exclusivamente.)

  • → Anthropic · Claude Sonnet / Opus / Haiku
  • → OpenAI · GPT-5 / serie o
  • → xAI · familia Grok 4
  • → Compatible OpenAI · self-hosted, gateways custom

Donde sea, vía MCP

Cursor. Claude Code. Tu terminal.

Kobi expone un servidor de Model Context Protocol. Conéctalo a tu IDE y tu asistente de IA tendrá acceso de lectura a tu cluster, sin salir del editor.

# claude code
/mcp add kubebolt
02

Resolución autónoma

MVP · Acceso anticipado

Autopilot.
El mismo motor. Sin manos. Auditable.

Autopilot despierta solo cuando algo importa: un crash loop se propaga, el budget de un SLO se quema, un nodo se degrada. Abre una sesión, reúne contexto, decide y actúa. En nuestro MVP ya resuelve incidentes reales de extremo a extremo en menos de 90 segundos, a unos $0.30 cada uno, y lo hemos demostrado en vivo. Construido sobre el Claude Agent SDK con failover multi-región, llegando con KubeBolt Cloud.

< 90s para resolver
$0.30 por incidente
100% auditable
01

Análisis de causa raíz

Cuando se dispara un incidente, Autopilot lanza una sesión larga de investigación. Correlaciona eventos, logs, despliegues e incidentes previos, y escribe un veredicto que puedes auditar.

02

Remediación guiada

Propone un parche, lo pasa por un ejecutor determinista con guardrails de política, y hace rollback si rompe el SLO. Apruebas una vez; lo recuerda.

03

Postmortems en piloto automático

Genera un borrador de postmortem desde la línea de tiempo del incidente. Action items enlazados a PRs. Five-whys incluidos. Editas, no escribes desde cero.

04

Operación del lifecycle del cluster

Programa power-on / power-off en EKS, AKS, GKE, OpenShift y node pools. Se paga a sí mismo en la mayoría de los entornos.

Por qué Claude exclusivamente, para Autopilot

Para la acción no supervisada usamos Claude exclusivamente, con failover multi-región entre Anthropic API, AWS Bedrock y Google Vertex AI. La remediación autónoma exige el modelo más fiable: sin router, sin zoo de modelos, sin ambigüedad en un postmortem. Kobi, contigo en el loop, es donde vive el multi-modelo.

03

Módulo: Cluster Lifecycle

Roadmap · 2026 · Business / Enterprise

El módulo
que se paga solo.

La mayoría de clusters corren 24/7 aunque las personas no. El módulo de lifecycle de KubeBolt programará power-on / power-off en toda tu flota (entornos preview, clusters de dev, downtime de fin de semana) y rastreará los ahorros. Llega con el tier KubeBolt Business en 2026.

Ahorro típico

~65%

en gasto de clusters non-prod, programando noches y fines de semana con calentamiento inteligente antes de horas laborales.

El ahorro de infraestructura suele superar la propia suscripción a KubeBolt.

Plataformas soportadas

  • EKS
  • AKS
  • GKE
  • OpenShift
  • Generic node pools

Schedules por cluster, reglas semana / fin de semana, override manual, audit log de cada transición de power. Diseñado para no interrumpir CI runs en vuelo.

04

Arquitectura: Determinismo primero

L1 + L5 parcial · L2–L4, L6 roadmap 2026

Skills.
La llamada al LLM más barata
es la que no haces.

Una Skill es una rutina diagnóstica declarativa y determinista: una receta para un patrón de fallo conocido. L1 Detectores está disponible hoy como el Insights Engine de 24 reglas de abajo. L5 Ejecutor está parcialmente disponible como el surface de write-ops determinista de arriba (Set image, Set resources, Secret reveal con audit, Apply manifest). Las capas restantes llegan con Autopilot en 2026.

L1

SHIPPED

Detectores

Determinista. Sin IA.

L2

ROADMAP

Router

Tipo Haiku. Triage.

L3

ROADMAP

Investigador

Tipo Sonnet. RCA.

L4

ROADMAP

Planificador

Sonnet / Opus.

L5

PARTIAL

Ejecutor

Determinista. Guardrails.

L6

ROADMAP

Postmortem

Sonnet / Opus.

05

Insights Engine

24 reglas. Cero configuración.

Evaluación continua contra heurísticas probadas. Recomendaciones accionables, no PromQL crudo. Cada regla es una Skill, así que el motor funciona incluso antes de configurar un modelo.

Crash loop detectado Crítico
OOM killed Crítico
Image pull backoff Crítico
Nodo no listo Crítico
Cero réplicas Crítico
Release de Helm fallida Crítico
Riesgo de CPU throttle Advertencia
Memory pressure Advertencia
HPA al máximo Advertencia
Certificado por expirar Advertencia
App de ArgoCD no sana Advertencia
+13 reglas más Catálogo completo →
06

Módulo: Operaciones del cluster

Disponible hoy

Opera.
No solo observes.

Cada verbo equivalente de kubectl es un click. Set image, scale, drain de un nodo, editar env, revelar un secret, aplicar un manifest nuevo: todo desde el dashboard con RBAC enforcement en cada endpoint, una entrada de audit log en cada mutación y un switch de governance para acotar o desactivar las acciones de escritura. Sin terminal.

01

Edición de workloads

Set image, ajustar CPU/memoria (requests y limits), set env (literal, ref de ConfigMap, ref de Secret), editar labels y anotaciones. Strategic-merge patches con soporte de init-containers y validación de limit ≥ request.

02

Reveal de Secret con audit

Razón del operador obligatoria (≥10 chars) antes de cualquier reveal. Gate de namespace prod que escala a Admin. Auto-hide por key a los 60s. Audit log registra quién/qué/cuándo/por qué, nunca los valores.

03

Mantenimiento de nodos

Cordon, uncordon y drain con progreso SSE en vivo de los pods siendo evictados. Cancelable mid-flight. Misma paridad de toolbar desde Node detail y el listado de Nodes.

04

Aplicar manifest nuevo

Pega YAML o elige entre 18 starter templates por kind. Editor CodeMirror con validación pre-flight: consistencia de kind / apiVersion / namespace, guard de documento único, status / managedFields se eliminan automáticamente.

05

Diff de revisiones y rollback

La pestaña History de cada rollout muestra un diff YAML lado a lado (qué cambió, línea por línea), venga de kubectl, GitOps o KubeBolt. Vuelve a cualquier revisión con un click.

06

Releases de Helm, de extremo a extremo

Ve cada release de Helm del cluster: chart, values, manifest renderizado, historial de revisiones y dependencias. Decodificado directo de los Secrets de Helm, sin SDK y sin terminal.

07

Surface: UI del operador

Mira tu cluster.
En movimiento.

Un mapa en tiempo real de cada pod, servicio y ruta de petición. Mini-dashboards en cada recurso. Flujo de tráfico que puedes observar de verdad. Pensado para ingenieros que prefieren ver la topología antes que escribir otro kubectl get.

01

30+ vistas de recursos

Pods, Deployments, Services, Ingresses, ConfigMaps, Secrets, Jobs, Nodes. Cada tipo tiene una vista diseñada con las columnas, las acciones y los paneles de detalle correctos.

02

Live, sin polling

Cada lista, gráfico y arista se mueve por Watch streams contra la K8s API. Los cambios de estado aparecen en milisegundos: sin F5, sin filas viejas, sin sorpresas.

03

⌘K para todo

Escribe para saltar a cualquier recurso en cualquier namespace. Búsqueda fuzzy entre tipos. Contexto reciente fijado. Funciona como tu editor, porque así es como ya piensas.

04

Tres lentes en el dashboard

Overview para salud de un vistazo, Capacity para recomendaciones de right-sizing y top consumers, Reliability con error rates L7, hot-spots y Network Drops vía Hubble.

08

Stack

Liviano por diseño.

Origen

Kubernetes

  • API Server
  • Metrics Server
  • OTel Collector (forked)

Core

Motor KubeBolt

  • Go · Auth · RBAC
  • BoltDB embedded
  • Insights Engine · 24 rules
  • MCP servers

Superficies

Donde trabajas

  • Web UI · 30+ views
  • Slack · Discord · Email
  • Cursor · Claude Code (MCP)
Go 1.25+ · client-go · BoltDB · Anthropic API · OpenAI API · OpenTelemetry · Hubble flows · Model Context Protocol · React 18 · TypeScript · Go 1.25+ · client-go · BoltDB · Anthropic API · OpenAI API · OpenTelemetry · Hubble flows · Model Context Protocol · React 18 · TypeScript ·

Por qué KubeBolt

La mayoría observa.
KubeBolt opera.

Dashboards, métricas y alertas son lo mínimo, todos los tienen. La diferencia es lo que pasa después de que salta la alerta.

Lo mínimo: todos lo tienen

Lo que hace un dashboard

  • Dashboards y visualización de recursos
  • Agregación de métricas y logs
  • Alertas cuando algo se rompe
  • Un chat pegado al clúster
Solo KubeBolt

Lo que ningún dashboard tiene

  • Remediación autónoma con guardarraíles No solo te avisa: resuelve el incidente, con política de grado operador y auditoría completa.
  • Una flota de agentes especializados Red, almacenamiento, workloads, seguridad: cada capa vigilada y diagnosticada de extremo a extremo, no un bot genérico.
  • Todo el ciclo del incidente Detectar → diagnosticar → remediar → verificar → postmortem. Un solo bucle, cerrado automáticamente.
  • Tu API server sigue privado El agente marca hacia afuera; nada entra. Funciona en GKE/EKS privados, tras bastiones, air-gapped: sin VPN, sin clúster expuesto.
09

Instalar

Un comando.
Cualquier cluster.

Chart OCI en GHCR. RBAC, Ingress, auth y recursos configurables.

helm install kubebolt \
  oci://ghcr.io/clm-cloud-solutions/kubebolt/helm/kubebolt

kubectl port-forward svc/kubebolt 3000:80

¿Necesitas la referencia completa? Lee la documentación →

Roadmap: lo que viene

No es un producto terminado. Es uno vivo.

KubeBolt evoluciona sin parar. Esto es lo que funciona hoy y hacia dónde va, para que sepas exactamente a qué te sumas.

01 Disponible ahora

Resolución, hoy

  • Copilot Kobi: resolución asistida con acciones auditadas
  • Operaciones kubectl + visibilidad de Helm vía agente
  • Insights Engine de 24 reglas, sin configuración
02 En beta

Hacia lo autónomo

  • Autopilot MVP: remediación autónoma
  • Detección predictiva de fallos
  • Insights de optimización de costos
03 Próximamente

Listo para empresa

  • Cloud gestionado: Autopilot + Lifecycle
  • SSO, RBAC avanzado, auditoría
  • Gestión multi-clúster de la flota
04 Investigación

La frontera

  • Remediación multi-paso entre servicios
  • Sub-agentes especializados por dominio
  • Auto-tuning predictivo

Planes: un solo lugar para elegir tu camino

Gratis para siempre,
o totalmente hosteado.

El agente open-source es gratis para siempre bajo Apache 2.0. KubeBolt Cloud añade Autopilot hosteado, Lifecycle Management y SSO de equipo. Únete a la waitlist para precios de founding-customer.

OSS · Self-Hosted Disponible hoy

Gratis para siempre. Sin topes.

Apache 2.0. Tú operas la infra. KubeBolt no opera nada.

  • Clusters ilimitados
  • Nodos / pods ilimitados
  • Usuarios ilimitados
  • Retención tu disco
  • AI Copilot BYOK · ilimitado
  • Soporte GitHub · Comunidad
Instala en 60 segundos →

Acceso anticipado

Sé de los primeros en
el cloud comercial.

El agente open-source es gratis para siempre. KubeBolt Cloud (Autopilot hosted, Lifecycle Management y SSO de equipo) se lanza en 2026. Únete a la waitlist para acceso anticipado y precios de founding-customer.

10+ ya en la waitlist 12 estrellas en GitHub

Sin spam. Te das de baja con un click. Solo enviamos updates de producto.