
Última actualización 06-28-2026
Categoría:
Reviews:
Join thousands of AI enthusiasts in the World of AI!
Kubeflow
Kubeflow es la base de herramientas para construir plataformas de IA en Kubernetes. Los equipos de plataformas de IA pueden desplegar subproyectos individuales o la distribución completa de la comunidad Kubeflow para ejecutar cargas de trabajo de aprendizaje automático e IA generativa dondequiera que Kubernetes esté funcionando. Es un proyecto de código abierto bajo la Cloud Native Computing Foundation con más de 33,000 estrellas en GitHub y 3,000 contribuidores.
La plataforma es componible y modular: cada subproyecto cubre una etapa distinta del ciclo de vida de la IA, desde la preparación de datos hasta el servicio de modelos. Kubeflow Pipelines orquesta flujos de trabajo de ML portátiles, Kubeflow Trainer maneja entrenamiento distribuido y ajuste fino de LLM en PyTorch, DeepSpeed, JAX y otros marcos, y Katib automatiza la sintonización de hiperparámetros y la búsqueda de arquitecturas neuronales.
Ingenieros de plataformas, ingenieros de ML y equipos de ciencia de datos usan Kubeflow para estandarizar cómo los modelos pasan de la experimentación a la producción en clústeres de Kubernetes. Los adoptantes incluyen a AWS, Oracle y Red Hat, y el proyecto se integra con herramientas del ecosistema como KServe para inferencia, Feast para almacenes de características, y el Spark Operator para procesamiento de datos a gran escala.
Kubeflow Pipelines crea flujos de trabajo ML portátiles que se ejecutan en cualquier clúster de Kubernetes
Trainer afina LLMs con PyTorch, DeepSpeed, MLX y Megatron a escala distribuida
Katib ejecuta ajuste de hiperparámetros, detención temprana y búsqueda de arquitectura neuronal
Notebooks inician entornos Jupyter y VS Code para desarrollo interactivo de ML
Hub indexa versiones de modelos, artefactos y metadatos en un único registro
Spark Operator ejecuta trabajos Spark distribuidos para preparación de datos a gran escala e incrustaciones
Central Dashboard conecta interfaces autenticadas para cada componente de Kubeflow en un solo hub
Los subproyectos modulares permiten a los equipos adoptar solo los componentes que necesitan en la infraestructura Kubernetes existente.
Respaldado por más de 3,000 contribuyentes y adoptado por AWS, Oracle y Red Hat para plataformas ML en producción.
Kubeflow SDK proporciona APIs en Python para ejecutar cargas de trabajo de entrenamiento sin necesidad de un profundo conocimiento de Kubernetes.
Cubre todo el ciclo de vida de la IA, desde la preparación de datos hasta el entrenamiento, ajuste, registro y servicio.
Proyecto CNCF con canales activos en Slack, listas de correo y llamadas comunitarias semanales.
Requiere experiencia operativa en Kubernetes para instalar y mantener en producción.
No existe una oferta SaaS gestionada por el propio proyecto; los equipos alojan en sus propios clústeres.
La amplitud de subproyectos puede hacer que la configuración inicial y la selección de componentes sean abrumadoras para los recién llegados.
¿Es Kubeflow gratuito para usar?
Sí. Kubeflow es un proyecto de código abierto bajo la Cloud Native Computing Foundation. Puedes desplegar subproyectos de forma individual o la distribución completa de la comunidad Kubeflow en cualquier clúster de Kubernetes sin costos de licencia.
¿Qué plataformas de Kubernetes soportan Kubeflow?
Kubeflow se puede desplegar donde sea que Kubernetes funcione. La documentación de instalación cubre clústeres locales, proveedores en la nube y las versiones de la distribución comunitaria Kubeflow (desde la 1.0 hasta la 26.03).
¿Puede Kubeflow ajustar finamente modelos de lenguaje grandes?
Sí. Kubeflow Trainer soporta fine-tuning de LLM con PyTorch, DeepSpeed, MLX y los blueprints de BuiltinTrainers. La documentación de GenAI cubre workflows de ajuste supervisado, DPO, PPO, GRPO y entrenamiento con conciencia de cuantización.
¿Cuáles son los principales subproyectos de Kubeflow?
Los subproyectos principales incluyen Kubeflow Pipelines para orquestación de flujos de trabajo, Trainer para entrenamiento distribuido, Katib para AutoML, Notebooks para desarrollo interactivo, Hub para registro de modelos, Spark Operator para procesamiento de datos, y el Central Dashboard como un núcleo UI unificado.
¿Cómo obtengo soporte para Kubeflow?
Kubeflow ofrece soporte comunitario a través de canales CNCF Slack, una lista de correo en Google Group llamada kubeflow-discuss, llamadas comunitarias semanales y documentación en kubeflow.org/docs/started/support/.
¿Kubeflow soporta casos de uso de GenAI como RAG?
Sí. Kubeflow documenta workflows de GenAI incluyendo generación aumentada por recuperación, generación de datos sintéticos, fine-tuning de LLM, optimización de hiperparámetros e inferencia a escala usando Pipelines, Trainer, Katib y KServe.
