macOS Agent Claude Integration RAG MCP

Vidix

Una aplicación nativa de macOS que integra la IA directamente en tu flujo de trabajo. Selecciona texto o una imagen en cualquier aplicación, activa un atajo y obtén resultados impulsados por IA sin cambiar de contexto. Construida sobre una arquitectura multi-agente con recetas impulsadas por RAG, integración de servidores MCP, soporte multi-proveedor, y un estricto enfoque de privacidad ante todo donde cero datos tocan nuestros servidores.

Visitar vidix.app

Proveedores de IA
compatibles

50+

Recetas integradas
& agentes

Datos almacenados
en nuestros servidores

Modos de salida
(replace, type, editor)

El desafío

Eliminando el coste del cambio de contexto.

Cada vez que usas una herramienta de IA, pagas un impuesto por cambio de contexto: dejas tu aplicación, abres un navegador, navegas a una interfaz de chat, pegas tu contenido, esperas la respuesta, copias el resultado, vuelves a tu aplicación, lo pegas. Son 8 pasos como mínimo, repetidos docenas de veces al día. Para trabajadores del conocimiento — desarrolladores, escritores, analistas, gestores de proyectos — esta fricción se acumula en horas de productividad perdida semanalmente.

Las soluciones existentes eran basadas en web (aún requiriendo un cambio) o limitadas a un solo proveedor de IA. Ninguna ofrecía la profunda integración a nivel de sistema necesaria para hacer la IA verdaderamente invisible: capturar contenido de cualquier aplicación, procesarlo con el modelo adecuado y el prompt correcto, y entregar los resultados exactamente donde los necesitas.

Necesitábamos construir una herramienta que viviera a nivel del sistema operativo — accesible desde cualquier aplicación mediante un solo atajo, compatible con múltiples proveedores de IA y flujos de trabajo personalizados, con un compromiso absoluto con la privacidad: sin almacenamiento de datos, sin servidores intermediarios, sin rastreo. Solo IA donde trabajas.

Arquitectura

Un sistema multi-agente dentro de tu Mac.

Vidix no es un simple wrapper de API. Es un sistema coordinado de agentes especializados, cada uno responsable de un aspecto diferente del flujo de trabajo de IA, orquestado por un motor central que enruta las solicitudes al agente correcto con el contexto adecuado.

Agent 01

Agente de captura

Se conecta con las APIs de Accesibilidad de macOS para capturar texto seleccionado, imágenes o regiones de pantalla de cualquier aplicación en ejecución. Maneja la complejidad de diferentes frameworks de aplicaciones — Cocoa nativo, Electron, web views, Terminal — con estrategias de respaldo para aplicaciones que no exponen hooks de accesibilidad estándar. Detecta el tipo de contenido automáticamente y lo enruta al pipeline de procesamiento apropiado.

Agent 02

Agente de enrutamiento

La capa de orquestación. Recibe el contenido capturado y determina cómo procesarlo: qué receta aplicar, qué proveedor de IA usar, qué prompt de sistema inyectar. Utiliza una biblioteca de recetas indexada por RAG para asociar el tipo de contenido y la intención del usuario con el pipeline de procesamiento correcto. Gestiona la conmutación por error de proveedores — si Claude no está disponible, puede enrutar a GPT o a un modelo local de Ollama según las preferencias de respaldo definidas por el usuario.

Agent 03

Agentes de recetas

Cada receta es efectivamente un mini-agente con su propio prompt de sistema, preferencia de proveedor, configuración de temperatura y formato de salida. Las recetas integradas cubren casos de uso comunes: "Mejorar escritura", "Explicar código", "Traducir al español", "Extraer puntos clave". Los usuarios crean agentes de recetas personalizados sin código — definiendo el prompt, seleccionando un proveedor y asignando un atajo de teclado. Cada agente de receta gestiona su propio contexto de conversación.

Agent 04

Agente de visión

Gestiona entradas de imágenes usando las capacidades de visión de Claude y GPT-4V. Los usuarios pueden capturar una región de pantalla y hacer preguntas sobre ella, extraer texto de imágenes (OCR), describir contenido visual, analizar gráficos y diagramas, o convertir mockups en código. El agente selecciona automáticamente el mejor proveedor con capacidad de visión según la tarea y la disponibilidad de claves API del usuario.

Agent 05

Agente de salida

Gestiona cómo se entregan las respuestas de IA al usuario. Tres modos: reemplazo directo (sustituye el texto seleccionado), escritura carácter por carácter (para aplicaciones que bloquean el pegado, como ciertos terminales y campos de formulario), y modo editor (abre un buffer de markdown donde los usuarios pueden iterar — "hazlo más corto", "añade viñetas" — antes de insertar). Gestiona la preservación del formato y la administración del portapapeles.

Agent 06

Agente puente MCP

Se integra con servidores Model Context Protocol (MCP) para extender las capacidades de Vidix más allá del procesamiento de texto e imágenes. Los usuarios pueden conectar servidores MCP para consultas de bases de datos, llamadas API, operaciones del sistema de archivos y herramientas personalizadas — todo accesible a través de la misma interfaz basada en atajos. El agente puente gestiona el descubrimiento de servidores MCP, la administración de conexiones y el enrutamiento de herramientas.

Ilustración de activación de atajo de Vidix

RAG & Recipes

Un motor de recetas impulsado por conocimiento.

El sistema de recetas está impulsado por RAG, permitiendo coincidencia inteligente de recetas y sugerencias conscientes del contexto que van más allá de la simple búsqueda por palabras clave.

Búsqueda semántica de recetas

La Paleta (lanzador de comandos) utiliza búsqueda vectorial para asociar las consultas del usuario con recetas. Escribir "haz este email más profesional" encuentra la receta "Mejorar escritura" incluso sin coincidencias exactas de palabras clave. La biblioteca de recetas está indexada en un almacén de vectores local para recuperación instantánea.

Sugerencias conscientes del contexto

El Router Agent analiza el contenido capturado y sugiere las recetas más relevantes. Selecciona código y muestra recetas relacionadas con desarrollo; selecciona prosa y sugiere recetas de escritura. Las sugerencias se clasifican por tipo de contenido, frecuencia de uso y la aplicación activa.

Creación de recetas personalizadas

Los usuarios crean sus propios agentes de recetas sin escribir código: definen un prompt de sistema, eligen un proveedor, configuran parámetros y asignan un atajo. Las recetas personalizadas se indexan automáticamente en el almacén RAG para búsqueda semántica junto a las recetas integradas.

Contexto de conversación

El modo editor mantiene el contexto de conversación, permitiendo el refinamiento iterativo. El sistema almacena el historial de interacciones recientes en un índice RAG local, permitiendo que prompts de seguimiento como "ahora traduce eso al francés" funcionen sin problemas entre sesiones.

Arquitectura de privacidad

Confianza cero. Retención de datos cero.

Vidix fue diseñado desde cero con una restricción de privacidad innegociable: nunca vemos, almacenamos ni procesamos datos del usuario. Toda la arquitectura impone esto en cada nivel.

Todo el procesamiento ocurre localmente en el Mac del usuario. Cuando se necesita IA, el contenido se enruta directamente desde la aplicación al proveedor elegido por el usuario — Claude, GPT, Gemini o un modelo local vía Ollama. Sin servidor intermediario, sin proxy, sin logging. Los usuarios usan sus propias claves API, almacenadas en el macOS Keychain.

Para usuarios que no pueden enviar datos a ninguna API externa, el soporte de Ollama permite el procesamiento de IA completamente offline con modelos locales. Las mismas recetas, la misma interfaz, el mismo flujo de trabajo — pero nada sale de la máquina.

Sin servidores intermediarios — solo llamadas API directas

Claves API almacenadas en macOS Keychain

Sin analíticas, sin telemetría, sin rastreo

Soporte de Ollama para operación completamente offline

Almacén de vectores local para indexación de recetas

Ilustración de integración de apps de Vidix

Desarrollo

Construido con Claude Code.

Una aplicación nativa en Swift construida con Claude Code impulsando todo el flujo de trabajo de desarrollo — desde el diseño de arquitectura hasta la publicación en la App Store.

Arquitectura Swift + IA

Utilizamos el modo plan de Claude Code para diseñar la arquitectura de agentes en Swift, mapeando cómo las APIs nativas de macOS (Accessibility, Keychain, Pasteboard) se integrarían con la capa de IA multi-proveedor.

Skill personalizado /build-recipe

Un comando slash específico del proyecto que genera la estructura de nuevos agentes de recetas: crea la plantilla de prompt, configura los ajustes del proveedor, genera fixtures de prueba e indexa la receta en el almacén de vectores local.

CLAUDE.md para convenciones Swift

Las reglas del proyecto imponen las convenciones de nomenclatura de Swift, aseguran patrones adecuados de async/await para llamadas API, exigen manejo de errores para todas las interacciones con proveedores, y mantienen patrones de privacidad ante todo en toda la base de código.

Pruebas de integración MCP

Las capacidades de subagentes de Claude Code permitieron el desarrollo paralelo del MCP Bridge Agent junto a la aplicación principal, probando el descubrimiento de servidores y el enrutamiento de herramientas de forma aislada.

Stack tecnológico

El sistema completo.

macOS nativo

Swift SwiftUI Accessibility API Keychain Pasteboard App Store

IA y proveedores

Claude API OpenAI API Gemini API Ollama MCP Protocol Local Vector Store

Desarrollo

Claude Code CLAUDE.md Rules Custom Skills Markdown Rendering RAG Pipeline Agent Architecture

¿Necesitas IA integrada en
tu flujo de trabajo?

Construimos aplicaciones nativas con integración profunda de IA, soporte multi-proveedor y arquitectura de privacidad ante todo. Hablemos de tu caso de uso.

Reservar una llamada de descubrimiento Ver todos los proyectos →

Vidix

Eliminando el coste del cambio de contexto.

Un sistema multi-agente dentro de tu Mac.

Agente de captura

Agente de enrutamiento

Agentes de recetas

Agente de visión

Agente de salida

Agente puente MCP

Un motor de recetas impulsado por conocimiento.

Confianza cero. Retención de datos cero.

Construido con Claude Code.

El sistema completo.

macOS nativo

IA y proveedores

Desarrollo

¿Necesitas IA integrada entu flujo de trabajo?

¿Necesitas IA integrada en
tu flujo de trabajo?