Agentes de IA Generación de Imágenes RAG Claude

Phopet

Una plataforma impulsada por IA que transforma fotos de mascotas en retratos estilizados. Detrás de una experiencia de usuario sencilla se encuentra un sistema multi-agente con recomendaciones de estilo basadas en RAG, evaluación de calidad con Claude, orquestación autónoma de GPU y un chatbot de soporte — todo procesando más de 10.000 imágenes sin intervención humana.

Visitar phopet.com

10K+

Imágenes generadas

40+

Álbumes temáticos

Agentes autónomos

Pasos manuales

Ilustración de la plataforma IA de Phopet

El desafío

Escalar la producción creativa de horas a segundos.

Los retratos personalizados de mascotas son inmensamente populares pero fundamentalmente no escalables. Cada retrato requiere un diseñador cualificado: comprender las características de la mascota, seleccionar el estilo artístico adecuado, componer la imagen, iterar en los detalles y entregar la pieza final. Son más de 4 horas de trabajo manual por imagen — un puñado al día como máximo, con acumulaciones creciendo semanalmente.

El desafío no era solo automatizar la generación de imágenes — esa es la parte fácil. La verdadera complejidad fue construir un sistema capaz de: validar que las fotos subidas son realmente utilizables para el entrenamiento, entrenar un modelo personalizado que capture las características únicas de cada mascota individual, recomendar estilos que funcionen bien para la raza y coloración de cada mascota, evaluar la calidad de los resultados sin revisión humana, gestionar el procesamiento de pagos y la entrega, y proporcionar soporte al cliente — todo de forma autónoma.

Necesitábamos reemplazar un estudio creativo completo con un pipeline impulsado por IA que gestiona cada paso desde la subida de fotos hasta la entrega — con una calidad que iguala o supera el trabajo manual.

Arquitectura

Seis agentes, un orquestador, cero humanos en el proceso.

El sistema funciona con una arquitectura multi-agente donde cada agente gestiona un dominio específico. Un orquestador central — construido sobre Claude — coordina el pipeline y gestiona los casos excepcionales de forma autónoma.

Agent 01

Agente de validación

Analiza las fotos subidas mediante visión artificial. Verifica la resolución mínima, detecta si el sujeto es realmente una mascota, evalúa la calidad de iluminación y enfoque, identifica subidas duplicadas, y rechaza imágenes que no producirán buenos resultados de entrenamiento. Utiliza una evaluación impulsada por Claude para casos límite — "¿es esta foto utilizable?" — con salida estructurada para una toma de decisiones consistente.

Agent 02

Agente de entrenamiento

Gestiona el pipeline de entrenamiento de modelos personalizados. Preprocesa las fotos validadas (eliminación de fondo, normalización, aumento de datos), configura parámetros de entrenamiento según el tipo de mascota y el tamaño del conjunto de fotos, envía trabajos de entrenamiento a workers GPU, monitorea el progreso del entrenamiento y valida el modelo resultante con generaciones de prueba antes de marcarlo como listo.

Agent 03

Agente de generación

Gestiona el pipeline de generación de imágenes real. Combina el modelo personalizado de la mascota con prompts específicos del álbum y parámetros de estilo, administra la asignación de recursos GPU, implementa el procesamiento por lotes para mayor eficiencia, ejecuta la puntuación automática de calidad en los resultados usando las capacidades de visión de Claude, y reintenta o ajusta parámetros cuando los resultados no alcanzan el umbral de calidad.

Agent 05

Agente de entrega

Gestiona el procesamiento post-generación: escalado de imágenes para salida con calidad de impresión, aplicación de marcas de agua para vistas previas, subida a CDN y optimización de caché, envío de notificaciones al usuario, e integración con la API de merchandising para cuadros y pedidos de productos. Gestiona el ciclo de vida completo desde la generación en bruto hasta los recursos listos para el usuario.

Agent 06

Chatbot de soporte

Un chatbot de soporte al cliente impulsado por Claude que gestiona consultas de usuarios sobre sus pedidos, estado de generación, requisitos de fotos y preguntas de facturación. Utiliza RAG para recuperar contexto específico del pedido e historial de la cuenta, permitiendo respuestas personalizadas. Escala los problemas complejos al soporte humano con el contexto completo de la conversación. Compatible con inglés, español y japonés.

El pipeline

De la subida de fotos a los retratos entregados.

Step 01 — Subida y validación

Ingesta inteligente de fotos

Los usuarios suben de 10 a 20 fotos de referencia. El Agente de Validación ejecuta cada una a través de una verificación de múltiples etapas: validación de resolución, detección de mascota mediante visión artificial, puntuación de enfoque e iluminación, detección de duplicados, y una evaluación final impulsada por Claude para casos límite. Los usuarios reciben retroalimentación en tiempo real sobre qué fotos fueron aprobadas y por qué algunas fueron rechazadas — con sugerencias específicas de mejores alternativas.

Step 02 — Entrenamiento del modelo

Modelo personalizado por mascota

El Agente de Entrenamiento preprocesa las fotos aprobadas — eliminación de fondo, normalización de color, aumento de datos — y entrena un modelo LoRA específico para esa mascota. Los parámetros de entrenamiento se ajustan dinámicamente según la cantidad y calidad de las fotos de entrada. El agente monitorea las curvas de pérdida en tiempo real y detiene el entrenamiento en la convergencia óptima. Una generación de validación confirma que el modelo captura las características distintivas de la mascota antes de marcarlo como listo.

Step 03 — Generación

Producción por lotes orquestada por GPU

Cuando el usuario selecciona un álbum, el Agente de Generación combina el modelo de la mascota con prompts curados y parámetros de estilo. Los trabajos se encolan con puntuación de prioridad, se agrupan por lotes para eficiencia de GPU y se envían al pool de workers. Cada resultado obtiene una puntuación de calidad automática de la API de visión de Claude — las imágenes por debajo del umbral se regeneran con parámetros ajustados. El álbum completo (más de 50 imágenes) se genera en minutos, no en horas.

Step 04 — Entrega y comercio

De lo digital a lo físico

Las imágenes generadas se escalan a resolución de impresión, se optimizan para entrega web y se suben al CDN. Los usuarios navegan por su galería, marcan imágenes como favoritas y pueden pedir productos físicos — impresiones en lienzo, cuadros, merchandising — a través del comercio integrado. El Agente de Entrega gestiona la cadena completa desde la salida de generación en bruto hasta los recursos listos para el usuario y el cumplimiento de pedidos.

Integración con Claude

Claude como componente de primera clase del sistema.

Claude no se usa solo para una tarea — está integrado en todo el sistema como motor de toma de decisiones, puerta de calidad e interfaz con el cliente.

Evaluación de calidad

Las capacidades de visión de Claude puntúan cada imagen generada en calidad, consistencia con las características de la mascota y mérito artístico. Las imágenes por debajo del umbral se regeneran automáticamente.

Validación de fotos

Para subidas en el límite, Claude proporciona una evaluación matizada — "esta foto tiene buena pose pero iluminación insuficiente" — con salida estructurada que guía las decisiones de validación.

Optimización de prompts

Claude analiza los resultados de generación y ajusta dinámicamente los prompts para mejorar la calidad de salida para tipos de mascotas y estilos específicos. Un ciclo de retroalimentación que mejora con el tiempo.

Soporte al cliente

El chatbot de soporte utiliza Claude con contexto de pedidos recuperado por RAG para gestionar consultas en tres idiomas, resolviendo más del 80% de los tickets sin escalamiento humano.

Decisiones de orquestación

El orquestador central utiliza Claude para el enrutamiento de casos excepcionales — cuando un trabajo falla, cuando la calidad es límite, cuando una solicitud del usuario no encaja en los patrones estándar.

Desarrollo

Construido con Claude Code.

Todo el sistema fue desarrollado utilizando Claude Code como herramienta de ingeniería principal — desde el diseño de arquitectura hasta el despliegue en producción.

Planificación de arquitectura

Utilizamos el modo plan de Claude Code para diseñar la arquitectura multi-agente, definir las responsabilidades de cada agente y mapear los flujos de datos antes de escribir una sola línea de código.

Comandos slash personalizados

Creamos skills específicos del proyecto para operaciones comunes: /deploy para despliegues sin tiempo de inactividad, /test-agent para ejecutar pruebas de integración de agentes, /gpu-status para monitorear el pool de workers.

Reglas CLAUDE.md

Las reglas del proyecto imponen estándares de código, aseguran el manejo adecuado de errores en el código de agentes, exigen logging estructurado y mantienen la consistencia en toda la base de código multi-agente.

Desarrollo paralelo de agentes

Las capacidades de subagentes de Claude Code permitieron el desarrollo paralelo de agentes independientes — construyendo y probando el Agente de Validación y el Agente de Entrenamiento simultáneamente.

Stack tecnológico

El sistema completo.

Backend e infraestructura

Laravel Python Redis PostgreSQL Queue Workers GPU Orchestration

IA y ML

Claude API Stable Diffusion LoRA Training Pinecone Computer Vision RAG Pipeline

Plataforma

Stripe CDN Image Upscaling i18n (EN/ES/JP) Merchandise API Claude Code

¿Necesitas un pipeline
de IA autónomo?

Construimos sistemas multi-agente que gestionan cargas de trabajo de IA de alto volumen de principio a fin. Hablemos de tu caso de uso.

Reservar una llamada de descubrimiento Ver todos los proyectos →