Phopet
Una plataforma impulsada por IA que transforma fotos de mascotas en retratos estilizados. Detrás de una experiencia de usuario sencilla se encuentra un sistema multi-agente con recomendaciones de estilo basadas en RAG, evaluación de calidad con Claude, orquestación autónoma de GPU y un chatbot de soporte — todo procesando más de 10.000 imágenes sin intervención humana.
Visitar phopet.comEscalar la producción creativa de horas a segundos.
Los retratos personalizados de mascotas son inmensamente populares pero fundamentalmente no escalables. Cada retrato requiere un diseñador cualificado: comprender las características de la mascota, seleccionar el estilo artístico adecuado, componer la imagen, iterar en los detalles y entregar la pieza final. Son más de 4 horas de trabajo manual por imagen — un puñado al día como máximo, con acumulaciones creciendo semanalmente.
El desafío no era solo automatizar la generación de imágenes — esa es la parte fácil. La verdadera complejidad fue construir un sistema capaz de: validar que las fotos subidas son realmente utilizables para el entrenamiento, entrenar un modelo personalizado que capture las características únicas de cada mascota individual, recomendar estilos que funcionen bien para la raza y coloración de cada mascota, evaluar la calidad de los resultados sin revisión humana, gestionar el procesamiento de pagos y la entrega, y proporcionar soporte al cliente — todo de forma autónoma.
Necesitábamos reemplazar un estudio creativo completo con un pipeline impulsado por IA que gestiona cada paso desde la subida de fotos hasta la entrega — con una calidad que iguala o supera el trabajo manual.
Seis agentes, un orquestador, cero humanos en el proceso.
El sistema funciona con una arquitectura multi-agente donde cada agente gestiona un dominio específico. Un orquestador central — construido sobre Claude — coordina el pipeline y gestiona los casos excepcionales de forma autónoma.
Agente de validación
Analiza las fotos subidas mediante visión artificial. Verifica la resolución mínima, detecta si el sujeto es realmente una mascota, evalúa la calidad de iluminación y enfoque, identifica subidas duplicadas, y rechaza imágenes que no producirán buenos resultados de entrenamiento. Utiliza una evaluación impulsada por Claude para casos límite — "¿es esta foto utilizable?" — con salida estructurada para una toma de decisiones consistente.
Agente de entrenamiento
Gestiona el pipeline de entrenamiento de modelos personalizados. Preprocesa las fotos validadas (eliminación de fondo, normalización, aumento de datos), configura parámetros de entrenamiento según el tipo de mascota y el tamaño del conjunto de fotos, envía trabajos de entrenamiento a workers GPU, monitorea el progreso del entrenamiento y valida el modelo resultante con generaciones de prueba antes de marcarlo como listo.
Recomendador de estilos (RAG)
Un agente impulsado por RAG que recomienda temas de álbum basándose en las características de la mascota. Recupera información de una base de conocimiento con datos de estilo específicos por raza, resultados de generaciones anteriores y patrones de preferencia del usuario. Un Golden Retriever recibe recomendaciones de estilo diferentes a las de un gato persa. El sistema utiliza embeddings vectoriales de las características de la mascota comparados contra una base de datos de estilos curada con Pinecone.
Agente de generación
Gestiona el pipeline de generación de imágenes real. Combina el modelo personalizado de la mascota con prompts específicos del álbum y parámetros de estilo, administra la asignación de recursos GPU, implementa el procesamiento por lotes para mayor eficiencia, ejecuta la puntuación automática de calidad en los resultados usando las capacidades de visión de Claude, y reintenta o ajusta parámetros cuando los resultados no alcanzan el umbral de calidad.
Agente de entrega
Gestiona el procesamiento post-generación: escalado de imágenes para salida con calidad de impresión, aplicación de marcas de agua para vistas previas, subida a CDN y optimización de caché, envío de notificaciones al usuario, e integración con la API de merchandising para cuadros y pedidos de productos. Gestiona el ciclo de vida completo desde la generación en bruto hasta los recursos listos para el usuario.
Chatbot de soporte
Un chatbot de soporte al cliente impulsado por Claude que gestiona consultas de usuarios sobre sus pedidos, estado de generación, requisitos de fotos y preguntas de facturación. Utiliza RAG para recuperar contexto específico del pedido e historial de la cuenta, permitiendo respuestas personalizadas. Escala los problemas complejos al soporte humano con el contexto completo de la conversación. Compatible con inglés, español y japonés.
De la subida de fotos a los retratos entregados.
Ingesta inteligente de fotos
Los usuarios suben de 10 a 20 fotos de referencia. El Agente de Validación ejecuta cada una a través de una verificación de múltiples etapas: validación de resolución, detección de mascota mediante visión artificial, puntuación de enfoque e iluminación, detección de duplicados, y una evaluación final impulsada por Claude para casos límite. Los usuarios reciben retroalimentación en tiempo real sobre qué fotos fueron aprobadas y por qué algunas fueron rechazadas — con sugerencias específicas de mejores alternativas.
Modelo personalizado por mascota
El Agente de Entrenamiento preprocesa las fotos aprobadas — eliminación de fondo, normalización de color, aumento de datos — y entrena un modelo LoRA específico para esa mascota. Los parámetros de entrenamiento se ajustan dinámicamente según la cantidad y calidad de las fotos de entrada. El agente monitorea las curvas de pérdida en tiempo real y detiene el entrenamiento en la convergencia óptima. Una generación de validación confirma que el modelo captura las características distintivas de la mascota antes de marcarlo como listo.
Producción por lotes orquestada por GPU
Cuando el usuario selecciona un álbum, el Agente de Generación combina el modelo de la mascota con prompts curados y parámetros de estilo. Los trabajos se encolan con puntuación de prioridad, se agrupan por lotes para eficiencia de GPU y se envían al pool de workers. Cada resultado obtiene una puntuación de calidad automática de la API de visión de Claude — las imágenes por debajo del umbral se regeneran con parámetros ajustados. El álbum completo (más de 50 imágenes) se genera en minutos, no en horas.
De lo digital a lo físico
Las imágenes generadas se escalan a resolución de impresión, se optimizan para entrega web y se suben al CDN. Los usuarios navegan por su galería, marcan imágenes como favoritas y pueden pedir productos físicos — impresiones en lienzo, cuadros, merchandising — a través del comercio integrado. El Agente de Entrega gestiona la cadena completa desde la salida de generación en bruto hasta los recursos listos para el usuario y el cumplimiento de pedidos.
Claude como componente de primera clase del sistema.
Claude no se usa solo para una tarea — está integrado en todo el sistema como motor de toma de decisiones, puerta de calidad e interfaz con el cliente.
Las capacidades de visión de Claude puntúan cada imagen generada en calidad, consistencia con las características de la mascota y mérito artístico. Las imágenes por debajo del umbral se regeneran automáticamente.
Para subidas en el límite, Claude proporciona una evaluación matizada — "esta foto tiene buena pose pero iluminación insuficiente" — con salida estructurada que guía las decisiones de validación.
Claude analiza los resultados de generación y ajusta dinámicamente los prompts para mejorar la calidad de salida para tipos de mascotas y estilos específicos. Un ciclo de retroalimentación que mejora con el tiempo.
El chatbot de soporte utiliza Claude con contexto de pedidos recuperado por RAG para gestionar consultas en tres idiomas, resolviendo más del 80% de los tickets sin escalamiento humano.
El orquestador central utiliza Claude para el enrutamiento de casos excepcionales — cuando un trabajo falla, cuando la calidad es límite, cuando una solicitud del usuario no encaja en los patrones estándar.
Construido con Claude Code.
Todo el sistema fue desarrollado utilizando Claude Code como herramienta de ingeniería principal — desde el diseño de arquitectura hasta el despliegue en producción.
Utilizamos el modo plan de Claude Code para diseñar la arquitectura multi-agente, definir las responsabilidades de cada agente y mapear los flujos de datos antes de escribir una sola línea de código.
Creamos skills específicos del proyecto para operaciones comunes: /deploy para despliegues sin tiempo de inactividad, /test-agent para ejecutar pruebas de integración de agentes, /gpu-status para monitorear el pool de workers.
Las reglas del proyecto imponen estándares de código, aseguran el manejo adecuado de errores en el código de agentes, exigen logging estructurado y mantienen la consistencia en toda la base de código multi-agente.
Las capacidades de subagentes de Claude Code permitieron el desarrollo paralelo de agentes independientes — construyendo y probando el Agente de Validación y el Agente de Entrenamiento simultáneamente.
El sistema completo.
Backend e infraestructura
IA y ML
Plataforma
¿Necesitas un pipeline
de IA autónomo?
Construimos sistemas multi-agente que gestionan cargas de trabajo de IA de alto volumen de principio a fin. Hablemos de tu caso de uso.