Todo agente de IA que investiga sigue el mismo ritual cansino: escribe una consulta, llama a la API de búsqueda, recibe diez enlaces azules, los lee, sintetiza, repite. Este bucle funciona, pero es fundamentalmente derrochador. El buscador está diseñado para humanos que navegan con un navegador, no para un LLM que intenta ingerir cien páginas por minuto. La mayor parte de lo que devuelve es ruido, y el agente no tiene forma de filtrarlo salvo mediante un razonamiento que consume aún más tokens. La nueva arquitectura «Search as Code» de Perplexity rompe este patrón al permitir que el modelo escriba su propio pipeline de búsqueda en Python en lugar de llamar a una API fija. Esto no es una mejora incremental. Es un cambio de paradigma en cómo los agentes interactúan con los sistemas de información.
La ventaja práctica salta a la vista con los números. En una tarea de investigación de CVEs que implicaba 200 vulnerabilidades críticas, el agente Search as Code usó un 85 % menos de tokens que el pipeline estándar de la propia Perplexity. No es una optimización menor; es una reconsideración fundamental de la relación del agente con la capa de búsqueda. En vez de meter a paladas los resultados en bruto en la ventana de contexto y esperar que el modelo separe la señal del ruido, el agente escribe código que filtra en origen. Ejecuta consultas en paralelo adaptadas a formatos concretos de cada vendor, desduplica programáticamente y verifica esquemas antes de que nada entre en el contexto. El modelo deja de ser un mero consumidor de resultados de búsqueda para convertirse en el arquitecto de la propia búsqueda.
Hablemos de lo que hace funcionar esta arquitectura. Perplexity describe tres capas: el modelo que decide una estrategia, un sandbox que ejecuta el código generado y un Agentic Search SDK que expone primitivas de búsqueda como funciones componibles. La clave está en que el modelo no escribe Python arbitrario; orquesta una biblioteca de bloques de construcción. Retrieve, filter, deduplicate, rerank: cada uno es una llamada simple al SDK. El trabajo del modelo es secuenciarlos y parametrizarlos correctamente. Es exactamente el mismo patrón que hemos visto en los benchmarks de codificación de IA durante años: los modelos más capaces no son los que memorizan respuestas, sino los que saben componer funciones para resolver problemas nuevos. Aquí, esa misma habilidad se aplica al propio proceso de búsqueda.
Las implicaciones para los desarrolladores son profundas. Primero, este enfoque elimina la contaminación del contexto que ha plagado a los agentes de investigación. Las herramientas de búsqueda estándar rellenan la ventana con enlaces irrelevantes; el modelo malgasta tokens intentando ignorarlos. Cuando el agente escribe sus propios filtros, puede ser quirúrgico. Segundo, traslada la carga de la optimización del diseñador de la API al modelo. Si una nueva estrategia de búsqueda funciona mejor para un dominio concreto, el modelo puede descubrirla y codificarla directamente, sin esperar a una actualización de la API. Esto es un paso hacia agentes que pueden construir sus propias herramientas sobre la marcha, adaptando su infraestructura a la tarea en lugar de estar atrapados en una interfaz rígida.
Pero no pretendamos que esto está exento de riesgo. Generar código que se comunica con un backend de búsqueda introduce una superficie de ataque completamente nueva. Incluso con un sandbox, surgen preguntas sobre la inyección de prompt: ¿puede una página web maliciosa engañar al script generado para que filtre datos? Perplexity parece ser consciente de ello al aislar la ejecución, pero la complejidad es real. Los modelos también cometen errores. Un modelo que escribe un filtro defectuoso puede descartar resultados cruciales, y depurar código generado es mucho más difícil que depurar un prompt. La reducción del 85 % en tokens es impresionante, pero proviene de una tarea específica de ciberseguridad. ¿Hasta qué punto se generaliza esto a otros dominios con datos más desordenados? En los propios benchmarks de Perplexity, SaC lidera en cuatro de cinco categorías, pero las cifras auto-reportadas siempre merecen escepticismo.
Aun así, la dirección es inconfundible. Un artículo de revisión independiente citado en el artículo sostiene que el código se está convirtiendo en la capa operativa de los agentes: los modelos manejan la estrategia, los runtimes deterministas manejan la ejecución, y la infraestructura de sandboxes y verificación se convierte en el verdadero cuello de botella. Search as Code de Perplexity es una materialización concreta de esa visión. Trata al modelo como un programador, no como un usuario de herramientas. Y cuando los modelos pueden programar su propia infraestructura de búsqueda, los límites de lo que pueden investigar de forma autónoma se expanden enormemente. La era de las APIs para agentes está terminando. La era de la generación de código acaba de empezar.