Vidix
Una aplicación nativa de macOS que integra la IA directamente en tu flujo de trabajo. Selecciona texto o una imagen en cualquier aplicación, activa un atajo y obtén resultados impulsados por IA sin cambiar de contexto. Construida sobre una arquitectura multi-agente con recetas impulsadas por RAG, integración de servidores MCP, soporte multi-proveedor, y un estricto enfoque de privacidad ante todo donde cero datos tocan nuestros servidores.
Visitar vidix.appcompatibles
& agentes
en nuestros servidores
(replace, type, editor)
Eliminando el coste del cambio de contexto.
Cada vez que usas una herramienta de IA, pagas un impuesto por cambio de contexto: dejas tu aplicación, abres un navegador, navegas a una interfaz de chat, pegas tu contenido, esperas la respuesta, copias el resultado, vuelves a tu aplicación, lo pegas. Son 8 pasos como mínimo, repetidos docenas de veces al día. Para trabajadores del conocimiento — desarrolladores, escritores, analistas, gestores de proyectos — esta fricción se acumula en horas de productividad perdida semanalmente.
Las soluciones existentes eran basadas en web (aún requiriendo un cambio) o limitadas a un solo proveedor de IA. Ninguna ofrecía la profunda integración a nivel de sistema necesaria para hacer la IA verdaderamente invisible: capturar contenido de cualquier aplicación, procesarlo con el modelo adecuado y el prompt correcto, y entregar los resultados exactamente donde los necesitas.
Necesitábamos construir una herramienta que viviera a nivel del sistema operativo — accesible desde cualquier aplicación mediante un solo atajo, compatible con múltiples proveedores de IA y flujos de trabajo personalizados, con un compromiso absoluto con la privacidad: sin almacenamiento de datos, sin servidores intermediarios, sin rastreo. Solo IA donde trabajas.
Un sistema multi-agente dentro de tu Mac.
Vidix no es un simple wrapper de API. Es un sistema coordinado de agentes especializados, cada uno responsable de un aspecto diferente del flujo de trabajo de IA, orquestado por un motor central que enruta las solicitudes al agente correcto con el contexto adecuado.
Agente de captura
Se conecta con las APIs de Accesibilidad de macOS para capturar texto seleccionado, imágenes o regiones de pantalla de cualquier aplicación en ejecución. Maneja la complejidad de diferentes frameworks de aplicaciones — Cocoa nativo, Electron, web views, Terminal — con estrategias de respaldo para aplicaciones que no exponen hooks de accesibilidad estándar. Detecta el tipo de contenido automáticamente y lo enruta al pipeline de procesamiento apropiado.
Agente de enrutamiento
La capa de orquestación. Recibe el contenido capturado y determina cómo procesarlo: qué receta aplicar, qué proveedor de IA usar, qué prompt de sistema inyectar. Utiliza una biblioteca de recetas indexada por RAG para asociar el tipo de contenido y la intención del usuario con el pipeline de procesamiento correcto. Gestiona la conmutación por error de proveedores — si Claude no está disponible, puede enrutar a GPT o a un modelo local de Ollama según las preferencias de respaldo definidas por el usuario.
Agentes de recetas
Cada receta es efectivamente un mini-agente con su propio prompt de sistema, preferencia de proveedor, configuración de temperatura y formato de salida. Las recetas integradas cubren casos de uso comunes: "Mejorar escritura", "Explicar código", "Traducir al español", "Extraer puntos clave". Los usuarios crean agentes de recetas personalizados sin código — definiendo el prompt, seleccionando un proveedor y asignando un atajo de teclado. Cada agente de receta gestiona su propio contexto de conversación.
Agente de visión
Gestiona entradas de imágenes usando las capacidades de visión de Claude y GPT-4V. Los usuarios pueden capturar una región de pantalla y hacer preguntas sobre ella, extraer texto de imágenes (OCR), describir contenido visual, analizar gráficos y diagramas, o convertir mockups en código. El agente selecciona automáticamente el mejor proveedor con capacidad de visión según la tarea y la disponibilidad de claves API del usuario.
Agente de salida
Gestiona cómo se entregan las respuestas de IA al usuario. Tres modos: reemplazo directo (sustituye el texto seleccionado), escritura carácter por carácter (para aplicaciones que bloquean el pegado, como ciertos terminales y campos de formulario), y modo editor (abre un buffer de markdown donde los usuarios pueden iterar — "hazlo más corto", "añade viñetas" — antes de insertar). Gestiona la preservación del formato y la administración del portapapeles.
Agente puente MCP
Se integra con servidores Model Context Protocol (MCP) para extender las capacidades de Vidix más allá del procesamiento de texto e imágenes. Los usuarios pueden conectar servidores MCP para consultas de bases de datos, llamadas API, operaciones del sistema de archivos y herramientas personalizadas — todo accesible a través de la misma interfaz basada en atajos. El agente puente gestiona el descubrimiento de servidores MCP, la administración de conexiones y el enrutamiento de herramientas.
Un motor de recetas impulsado por conocimiento.
El sistema de recetas está impulsado por RAG, permitiendo coincidencia inteligente de recetas y sugerencias conscientes del contexto que van más allá de la simple búsqueda por palabras clave.
La Paleta (lanzador de comandos) utiliza búsqueda vectorial para asociar las consultas del usuario con recetas. Escribir "haz este email más profesional" encuentra la receta "Mejorar escritura" incluso sin coincidencias exactas de palabras clave. La biblioteca de recetas está indexada en un almacén de vectores local para recuperación instantánea.
El Router Agent analiza el contenido capturado y sugiere las recetas más relevantes. Selecciona código y muestra recetas relacionadas con desarrollo; selecciona prosa y sugiere recetas de escritura. Las sugerencias se clasifican por tipo de contenido, frecuencia de uso y la aplicación activa.
Los usuarios crean sus propios agentes de recetas sin escribir código: definen un prompt de sistema, eligen un proveedor, configuran parámetros y asignan un atajo. Las recetas personalizadas se indexan automáticamente en el almacén RAG para búsqueda semántica junto a las recetas integradas.
El modo editor mantiene el contexto de conversación, permitiendo el refinamiento iterativo. El sistema almacena el historial de interacciones recientes en un índice RAG local, permitiendo que prompts de seguimiento como "ahora traduce eso al francés" funcionen sin problemas entre sesiones.
Confianza cero. Retención de datos cero.
Vidix fue diseñado desde cero con una restricción de privacidad innegociable: nunca vemos, almacenamos ni procesamos datos del usuario. Toda la arquitectura impone esto en cada nivel.
Todo el procesamiento ocurre localmente en el Mac del usuario. Cuando se necesita IA, el contenido se enruta directamente desde la aplicación al proveedor elegido por el usuario — Claude, GPT, Gemini o un modelo local vía Ollama. Sin servidor intermediario, sin proxy, sin logging. Los usuarios usan sus propias claves API, almacenadas en el macOS Keychain.
Para usuarios que no pueden enviar datos a ninguna API externa, el soporte de Ollama permite el procesamiento de IA completamente offline con modelos locales. Las mismas recetas, la misma interfaz, el mismo flujo de trabajo — pero nada sale de la máquina.
Construido con Claude Code.
Una aplicación nativa en Swift construida con Claude Code impulsando todo el flujo de trabajo de desarrollo — desde el diseño de arquitectura hasta la publicación en la App Store.
Utilizamos el modo plan de Claude Code para diseñar la arquitectura de agentes en Swift, mapeando cómo las APIs nativas de macOS (Accessibility, Keychain, Pasteboard) se integrarían con la capa de IA multi-proveedor.
Un comando slash específico del proyecto que genera la estructura de nuevos agentes de recetas: crea la plantilla de prompt, configura los ajustes del proveedor, genera fixtures de prueba e indexa la receta en el almacén de vectores local.
Las reglas del proyecto imponen las convenciones de nomenclatura de Swift, aseguran patrones adecuados de async/await para llamadas API, exigen manejo de errores para todas las interacciones con proveedores, y mantienen patrones de privacidad ante todo en toda la base de código.
Las capacidades de subagentes de Claude Code permitieron el desarrollo paralelo del MCP Bridge Agent junto a la aplicación principal, probando el descubrimiento de servidores y el enrutamiento de herramientas de forma aislada.
El sistema completo.
macOS nativo
IA y proveedores
Desarrollo
¿Necesitas IA integrada en
tu flujo de trabajo?
Construimos aplicaciones nativas con integración profunda de IA, soporte multi-proveedor y arquitectura de privacidad ante todo. Hablemos de tu caso de uso.