Inicio Servicios Proceso Proyectos Open Source Blog en Reservar llamada
ai agents journalism data-storytelling automation

Siete agentes de IA construyen una redacción a partir de un CSV. Los artículos son mejores que los humanos.

Investigadores de Oxford y Stanford construyeron Data2Story, un pipeline de siete agentes que convierte datos CSV en artículos periodísticos interactivos y verificables, mejor valorados por los lectores que los originales humanos.

junio 2026 5 min
Siete agentes de IA construyen una redacción a partir de un CSV. Los artículos son mejores que los humanos.

El trabajo más tedioso y que más tiempo consume en el periodismo no es escribir, sino la maquinaria invisible de la verificación. Verificar hechos, buscar fuentes, recalcular estadísticas, rastrear una afirmación hasta su origen en una hoja de cálculo. Un equipo de investigadores de Oxford y Stanford acaba de automatizar toda esa cadena con un sistema que toma un CSV en bruto y genera un artículo periodístico totalmente interactivo y verificable. Y los lectores prefieren lo que producen los agentes.

Data2Story no es un único modelo que genera texto. Es una redacción virtual de siete agentes que replica un flujo de trabajo editorial real. Hay un Detective que ejecuta búsquedas web para obtener contexto, un Analyst que escribe y ejecuta código en lugar de alucinar números, un Editor que selecciona el arco narrativo, un Designer que elige el medio visual adecuado, un Programmer que construye la página HTML, un Auditor que revisa la maquetación y un Inspector que vincula cada frase, gráfico y elemento interactivo con su fuente original. El modelo base es Claude Opus 4.7 ejecutándose en Claude Code, con modelos de OpenRouter para imágenes, vídeo y audio.

El verdadero avance no es la calidad del resultado, aunque eso también sorprendió a los investigadores. Es el panel del Inspector, que alcanza una cobertura de enlaces a fuentes del 93 %. Cada afirmación recibe una tarjeta de evidencia: o bien la línea exacta de código que calculó la cifra, o bien la URL externa que la respalda. No es corrección —los investigadores tienen cuidado en decir que es verificabilidad—. Si dudas de un número, puedes ejecutar el script tú mismo. En el caso de los artículos escritos por humanos, la referencia base es del 25 %, sobre todo porque los periodistas no publican su código de análisis. La brecha es una condena de la práctica actual, y Data2Story la cierra por diseño.

Esto es importante porque la alucinación de atribución es el problema de confianza que define el contenido generado por IA. Los modelos a menudo dan la respuesta correcta pero citan la fuente equivocada, un modo de fallo que afecta a los sistemas de recuperación aumentada. Data2Story lo evita haciendo que el Analyst calcule las cifras a partir de los propios datos con código ejecutable, y vinculando de forma rígida cada resultado a su procedencia. Es el primer sistema integral que he visto que trata la verificabilidad como una restricción arquitectónica de primer orden, no como un filtro a posteriori.

En un estudio ciego con 53 lectores reclutados y 18 pares de conjunto de datos-artículo de The Economist, The Pudding y TidyTuesday, los artículos de los agentes ganaron en las cinco categorías evaluadas: diseño visual, ritmo narrativo, transparencia de datos, verificabilidad y conocimiento adquirido. La mayor ventaja fue en transparencia, con +1,49 en una escala de siete puntos. En conjunto, el 74 % de los lectores prefirió el artículo del agente. Frente a los elaborados reportajes hechos a mano de The Pudding, fue un empate estadístico, lo que resulta asombroso si se tiene en cuenta que The Pudding dedica semanas a cada pieza.

Sin embargo, las debilidades del sistema revelan dónde siguen dominando los periodistas humanos. El agente puede decirte qué hay en los datos, pero no por qué. Un reportaje humano sobre cafés de reparación explica que los fabricantes bloquean deliberadamente el acceso a las herramientas de diagnóstico: una teoría de investigación basada en el periodismo, no en hojas de cálculo. El agente representa gráficamente las tasas de reparación por tipo de producto y se detiene ahí. En diseño creativo, no puede igualar las interfaces a medida que construye The Pudding, como convertir una transcripción de comedia en una línea de tiempo interactiva de la duración de las risas. Y cuando los datos exigen un único gráfico densamente anotado, el agente dispersa los conocimientos en múltiples gráficos y pierde el sentido.

Para los desarrolladores, la arquitectura es el verdadero manual de instrucciones. La descomposición en siete roles no es arbitraria; refleja la carga cognitiva que exige la atribución. El Detective investiga, el Analyst calcula, el Editor decide lo que importa, el Inspector verifica. Cada agente tiene una responsabilidad limitada y comprobable, y los traspasos son explícitos. Ese es el patrón a copiar: cuando necesites un resultado que deba estar respaldado por pruebas, divide el pipeline en roles que puedan demostrar su trabajo de forma independiente. El Inspector no es una idea tardía, es la columna vertebral.

También hay una asimetría fascinante en la cobertura. Data2Story captura aproximadamente la mitad de las afirmaciones del artículo humano, pero los artículos humanos solo capturan el 35 % de las del agente. El agente añade muchos ángulos propios, especialmente en informes con gran densidad de datos, pero se pierde el núcleo editorial que requiere conocimiento externo. Esto sugiere un futuro híbrido en el que el agente redacta el esqueleto rico en datos y el humano inyecta interpretación, narrativa y contexto. El piloto automático total es un truco de salón; el humano en el circuito es donde vive la verdadera redacción del mañana.

Me interesa menos si Data2Story sustituye a los periodistas que qué es lo que sustituye. No hará investigaciones ni crítica cultural, pero engullirá el trabajo rutinario de las noticias —los resúmenes de resultados trimestrales, los recuentos de estadísticas deportivas, los volcados de datos medioambientales que las redacciones no pueden cubrir porque no hay suficientes personas—. Eso es una ganancia neta. Un artículo verificable generado por máquina sobre el riesgo de calor en la Copa Mundial de la FIFA es mejor que ningún artículo. Y cuando el panel del Inspector ofrezca a los lectores un botón para ver exactamente cómo se ha producido cada número, quizá acabemos teniendo un periodismo más fiable que el humano.

Toni Soriano
Toni Soriano
Principal AI Engineer at Cloudstudio. 18+ years building production systems. Creator of Ollama Laravel (87K+ downloads).
LinkedIn →

¿Necesitas un agente IA?

Diseñamos y construimos agentes autónomos para procesos de negocio complejos. Hablemos de tu caso de uso.

Recurso gratuito

Obtén el checklist de implementación de IA

10 preguntas que todo equipo debería responder antes de construir sistemas de IA. Evita los errores más comunes que vemos en proyectos de producción.

¡Revisa tu bandeja de entrada!

Te hemos enviado el checklist de implementación de IA.

Sin spam. Cancela cuando quieras.