Extrae Automáticamente la Información Clave de un CV con un Agente IA (Workflow n8n Gratis + Video + Tutorial + Descarga)

Este tutorial te muestra cómo automatizar la extracción de la información clave de un CV gracias a un agente IA integrado en n8n. En pocos segundos, transforma un CV en una ficha estructurada lista para usar, sin esfuerzo manual ni procesamiento tedioso.

Puedes copiar y pegar el workflow listo para usar, probarlo gratis y adaptarlo fácilmente a tu proceso de reclutamiento o calificación, sin necesidad de programar.

Este workflow de n8n gratuito utiliza un Agente IA para extraer automáticamente los datos clave de un CV en PDF y guardarlos en una base de Google Sheets.

Hack’celeration: Lo que los expertos nunca te enseñan… nosotros te lo damos.

Logotipo de Qonto, solución bancaria online para profesionales.
Logotipo de Gymlib, plataforma de fitness y bienestar para empresas.
Solución de firma electrónica segura.
Plataforma todo en uno para la gestión de gastos.
Comparador de viajes para vuelos, trenes y hoteles.
Plataforma online para reservar restaurantes.

Lo que permite la Automatización con n8n para extraer automáticamente la información clave de un CV con un Agente IA

¿Quieres extraer automáticamente la información de un CV sin perder horas copiando y pegando? Esta automatización con n8n te ahorra tiempo gracias a un Agente IA que estructura todos los datos por ti.

Así funciona: descargas el workflow listo para usar, lanzas el procesamiento de los CV en PDF y, en segundos, obtienes toda la información organizada en Google Sheets.

Bonus: puedes personalizar el disparador (por ejemplo, para procesar automáticamente los CV recibidos por Gmail o activar el escenario vía API) y enviar los datos donde quieras: Notion, Airtable, tu CRM o una base de datos.

Olvídate de la introducción manual y el copia-pega: con n8n y este Agente IA, automatizas el análisis de CV de forma sencilla, rápida y totalmente gratuita.

Para facilitarte la vida, el workflow que descargas está completamente listo para usar: cada etapa del escenario está documentada con notas explicativas integradas directamente en n8n. Entiendes de un vistazo cómo el Agente IA extrae los datos del CV.

Además del workflow, obtienes una guía en vídeo completa y un tutorial paso a paso que te acompaña desde la instalación hasta la personalización. Puedes usarlo tal cual o adaptarlo fácilmente a tus herramientas.

El objetivo: ayudarte a automatizar el análisis de CV sin programar, dándote las claves para personalizar el escenario según tu stack (Gmail, API, Notion, Airtable, CRM…).

Demostración del workflow completo en n8n: extracción de un CV desde Google Drive, conversión a texto con terminal y análisis automatizado con un Agente IA conectado a OpenAI.

Tutorial en vídeo – Extraer datos de un CV con un Agente IA y n8n

Detalle del workflow n8n: Guía paso a paso con capturas de pantalla (Extracción de CV con Agente IA)

Este video muestra un terminal Linux en acción para ilustrar el requisito esencial: contar con un n8n self-hosted con acceso al terminal para instalar los módulos necesarios para la automatización.

Requisito previo: Tener una instancia de n8n self-hosted con acceso al terminal

Antes de usar este workflow, necesitas contar con una instancia de n8n autoalojada (self-hosted) que tenga acceso al terminal. Esto es esencial para ejecutar el comando que extrae el texto desde archivos PDF.

La extracción del contenido del CV se basa en la herramienta de línea de comandos pdftotext, que debe estar instalada en tu servidor. Su instalación depende de tu sistema (Ubuntu, Mac, Docker, etc.).

  • Si sabes manejar tu terminal, puedes instalar pdftotext manualmente siguiendo la documentación de Poppler.
  • Si no, lo más fácil es preguntarle a ChatGPT cómo instalar pdftotext según tu sistema. Te lo explicará paso a paso.
  • También puedes contactarnos a través del formulario de contacto del sitio si prefieres recibir ayuda para la configuración.

Importante: este requisito es indispensable para que el workflow pueda leer y transformar los CV en PDF en texto utilizable por el agente IA.

Este video muestra el inicio del paso Manual Trigger en el workflow n8n. Es el punto de partida para probar manualmente la extracción de datos de un CV en PDF.

Paso 1: Iniciar el Workflow (Manual Trigger)

Esta primera etapa te permite probar el workflow manualmente. Gracias al módulo Manual Trigger de n8n, puedes ejecutar el flujo bajo demanda para verificar que funciona correctamente antes de automatizarlo en producción.

El disparador manual es muy útil para probar cada paso en tiempo real y detectar fácilmente posibles errores. Una vez que validas tus pruebas, puedes reemplazar este disparador por uno automático (ej.: cron, webhook…) si lo necesitas.

➡️ Parámetros:

  • Tipo de disparador: Manual Trigger
  • Uso: Ejecución manual del workflow desde la interfaz de n8n

Para empezar: haz clic en «Run Workflow» dentro de n8n para iniciar el proceso.

En esta etapa, el workflow busca automáticamente un CV en PDF dentro de una carpeta de Google Drive. El video muestra la apertura del nodo Google Drive y la visualización de sus parámetros.

Paso 2 : Obtener la Lista de CV desde Google Drive

Este paso permite listar automáticamente todos los archivos PDF que están en una carpeta específica de tu Google Drive. Cada archivo corresponde a un CV que será procesado individualmente por el agente IA.

💡 Consejo : puedes obtener el ID de tu carpeta Drive en la URL cuando estés dentro de la carpeta. Es la parte que sigue a /folders/.

➡️ Parámetros :

  • Módulo : Google Drive
  • Operación : Listar todos los archivos en una carpeta
  • Carpeta : ID de tu carpeta Google Drive que contiene los CV
  • Autenticación : Tu cuenta Google conectada a n8n
Este bucle en n8n permite procesar cada CV individualmente. El video muestra la configuración del nodo con una iteración definida para un archivo PDF a la vez.

Paso 3 : Procesar los CV uno por uno (Loop)

Esta etapa utiliza el módulo Split In Batches para procesar cada CV de forma independiente. Se realiza un bucle sobre cada archivo PDF recuperado para ejecutarlo en un flujo aislado.

Esto garantiza un procesamiento limpio y evita confusiones si hay varios archivos en la carpeta.

➡️ Parámetros:

  • Tamaño del lote (Batch Size): 1 (para procesar un solo archivo a la vez)
  • Salida utilizada: Salida 1 (hacia la descarga)
En este paso se descarga automáticamente el archivo PDF del CV desde Google Drive. El nodo Google Drive se muestra abierto con sus parámetros configurados en n8n.

Paso 4: Descargar el CV desde Google Drive

Esta acción descarga el archivo PDF del CV desde tu carpeta de Google Drive, utilizando el ID del archivo obtenido en el loop.

➡️ Configuración:

  • Módulo: Google Drive
  • Operación: Descargar un archivo
  • Archivo: ID dinámico del archivo (proveniente del loop)
  • Autenticación: Tu propia cuenta de Google conectada a n8n

💡 También puedes reemplazar esta fuente por un disparador de Gmail, una API o cualquier otro sistema que reciba CVs.

Este nodo permite leer y escribir el archivo PDF del CV en el disco local para luego ejecutar un comando en terminal. Parámetros mostrados en el video.

Paso 5: Guardar el PDF localmente

Se guarda el archivo PDF en el servidor en una ruta temporal (/tmp/doc.pdf) para poder utilizarlo con un comando de extracción de texto.

➡️ Parámetros:

  • Archivo: /tmp/doc.pdf
  • Contenido: Datos binarios del PDF descargado
Este paso utiliza un nodo terminal en n8n para ejecutar el comando pdftotext y extraer el contenido en texto plano del archivo PDF del CV. Requisito: instancia n8n auto-hospedada.

Paso 6: Extraer el texto del CV (PDFtoText)

En este paso se utiliza el comando pdftotext (proporcionado por Poppler) para convertir el PDF en un archivo de texto plano que el agente IA pueda leer. Este comando debe estar instalado en tu servidor.

➡️ Comando ejecutado: pdftotext /tmp/doc.pdf /tmp/doc.txt

💡 Si no sabes cómo instalar este comando, pide ayuda a ChatGPT según tu sistema (Linux, Docker, Mac…), o contáctanos para asistencia.

El nodo Read File from Disk recupera el contenido de texto generado por el comando pdftotext. El texto sin procesar del CV ya está listo para ser procesado.

Paso 7: Leer el contenido del archivo de texto

Leemos el archivo /tmp/doc.txt generado por pdftotext. El contenido se carga en n8n para enviarlo al agente IA en el siguiente paso.

El nodo Information Extractor usa un agente IA de OpenAI para analizar el contenido bruto del CV y extraer datos estructurados como nombre, email, experiencia, idiomas, etc.

Paso 8: Preparar el Texto para el Análisis

Esta etapa limpia y estructura el contenido de texto bruto para que pueda ser analizado correctamente por el agente IA. El texto procesado estará disponible en $json.data.

Este video muestra el prompt completo utilizado en Information Extractor, junto con el formato JSON estructurado esperado. Todo está listo para extraer y organizar automáticamente los datos del CV.

Paso 9: Analizar el CV con un Agente IA (GPT-4o)

El contenido de texto se envía a un agente IA basado en GPT-4o a través de LangChain. Extrae toda la información clave del CV, como nombre, correo electrónico, experiencia, habilidades y más.

➡️ Prompt: estructura fija, nombres de columnas predefinidos, apóstrofes añadidos a los números para compatibilidad con Google Sheets.

Este paso demuestra el módulo Set que se utiliza para estructurar los datos extraídos del CV. Cada campo está claramente definido para su uso directo en Sheets, Notion, Airtable y más.

Paso 10: Aplanar la estructura de datos

Convertimos el JSON devuelto por el agente IA en una estructura plana compatible con la importación automática en Google Sheets. Cada propiedad (por ejemplo, lang_1, edu_1_degree) está mapeada explícitamente.

💡 Si quieres enviar los datos a otro lugar (Notion, Airtable, base de datos SQL…), puedes adaptar fácilmente este bloque.

Este paso final muestra cómo guardar automáticamente los datos del CV en Google Sheets. Los campos están mapeados manualmente usando el formato del módulo Set.

Paso 11 : Añadir los Datos Estructurados a Google Sheets

La información extraída se añade automáticamente como una nueva fila en tu Google Sheet. Cada columna corresponde a un campo claramente definido del CV.

➡️ Conexión : Google Sheets conectado a tu cuenta

💡 También puedes modificar este paso para enviar los datos a Notion, Airtable o cualquier otra base de datos.

Último paso del workflow: limpiar automáticamente los archivos temporales creados durante el procesamiento. El servidor queda limpio y listo para el siguiente CV.

Paso 12: Limpiar el Servidor

Este comando elimina todos los archivos temporales (/tmp/doc.pdf y /tmp/doc.txt) después de cada ciclo para mantener el entorno limpio.

➡️ Comando: rm -rf /tmp/doc.pdf /tmp/doc.txt

Este vídeo muestra la extensión del flujo de trabajo en n8n: una vez extraído el CV, el agente IA analiza su compatibilidad con una oferta, calcula una puntuación de coincidencia y envía automáticamente un correo al candidato o al reclutador según los resultados.

Ir más allá: Análisis IA entre CV y Oferta

Puedes ir más allá de la simple extracción analizando automáticamente la compatibilidad entre un CV y una oferta de empleo. Este análisis es una extensión directa del workflow actual: se conecta al final del escenario de extracción y te permite obtener una puntuación de compatibilidad junto con un resumen claro de los puntos fuertes y las discrepancias.

Por qué Extraer Automáticamente la Información de un CV es Esencial para tu Proceso de Reclutamiento

Gestionar eficientemente las candidaturas o perfiles en tu CRM o ATS es fundamental para automatizar tu proceso de reclutamiento y evitar pérdidas de información. Analizar manualmente los CV en PDF consume tiempo, retrasa la toma de decisiones e introduce errores humanos. Problemas comunes en la extracción manual:
  • Información faltante o mal registrada (emails, experiencia, idiomas…)
  • Pérdida de tiempo copiando y pegando cada CV en un archivo o base de datos.
  • Dificultad para filtrar y clasificar perfiles según criterios específicos.
  • Retrasos en el procesamiento de candidaturas y oportunidades perdidas.
Ventajas de extraer automáticamente los datos de los CV:
  • Estructuración limpia y estandarizada de todos los perfiles recibidos.
  • Ahorro significativo de tiempo en la selección y calificación de candidatos.
  • Automatización fluida con Google Sheets, Notion, Airtable o tu CRM.
  • Posibilidad de activar acciones personalizadas (envío de emails, scoring, etiquetado, etc.).
Automatizando la extracción de información desde CV en PDF con un agente IA, eliminas tareas tediosas, aseguras la fiabilidad de tus datos y ganas en rapidez. Este escenario n8n se convierte en un activo estratégico para escalar tu proceso de reclutamiento sin esfuerzo.