Agente IA para extraer automáticamente los datos de un CV (con n8n)

¿Quieres extraer automáticamente la información de un CV sin perder horas copiando y pegando? Esta automatización con n8n te ahorra tiempo gracias a un Agente IA que estructura todos los datos por ti.

Gratis

La automatización completa, en tu bandeja

Sin spam · Cancela cuando quieras

Resumen · 12 pasos

Agente IA para extraer automáticamente los datos de un CV (con n8n)

Extrae Automáticamente la Información Clave de un CV con un Agente IA (Workflow n8n Gratis + Video + Tutorial + Descarga)

Antes de empezar

Requisito previo: Tener una instancia de n8n self-hosted con acceso al terminal

!
Necesitas
Requisito previo: Tener una instancia de n8n self-hosted con acceso al terminal
- A self-hosted n8n instance with terminal access.
- API credentials for the services used in this workflow.
- Probar n8n gratis
- Self-host con Hostinger

Gratis

La automatización completa, en tu bandeja

Sin spam · Cancela cuando quieras

Paso 01 → 12

Detalle del workflow n8n.

12 pasos, 0 líneas de código. Esto es exactamente lo que corre bajo el capó.

01
Paso 01
Iniciar el Workflow (Manual Trigger).
Esta primera etapa te permite probar el workflow manualmente. Gracias al módulo Manual Trigger de n8n, puedes ejecutar el flujo bajo demanda para verificar que funciona correctamente antes de automatizarlo en producción.

El disparador manual es muy útil para probar cada paso en tiempo real y detectar fácilmente posibles errores. Una vez que validas tus pruebas, puedes reemplazar este disparador por uno automático (ej.: cron, webhook…) si lo necesitas.

Para empezar: haz clic en "Run Workflow" dentro de n8n para iniciar el proceso.
Parámetros
- Tipo de disparador: Manual Trigger
- Uso: Ejecución manual del workflow desde la interfaz de n8n
02
Paso 02
Obtener la Lista de CV desde Google Drive.
Este paso permite listar automáticamente todos los archivos PDF que están en una carpeta específica de tu Google Drive. Cada archivo corresponde a un CV que será procesado individualmente por el agente IA.

💡 Consejo : puedes obtener el ID de tu carpeta Drive en la URL cuando estés dentro de la carpeta. Es la parte que sigue a /folders/.
Parámetros
- Módulo : Google Drive
- Operación : Listar todos los archivos en una carpeta
- Carpeta : ID de tu carpeta Google Drive que contiene los CV
- Autenticación : Tu cuenta Google conectada a n8n
03
Paso 03
Procesar los CV uno por uno (Loop).
Esta etapa utiliza el módulo Split In Batches para procesar cada CV de forma independiente. Se realiza un bucle sobre cada archivo PDF recuperado para ejecutarlo en un flujo aislado.

Esto garantiza un procesamiento limpio y evita confusiones si hay varios archivos en la carpeta.
Parámetros
- Tamaño del lote (Batch Size): 1 (para procesar un solo archivo a la vez)
- Salida utilizada: Salida 1 (hacia la descarga)
04
Paso 04
Descargar el CV desde Google Drive.
Esta acción descarga el archivo PDF del CV desde tu carpeta de Google Drive, utilizando el ID del archivo obtenido en el loop.

➡️ Configuración:
- Módulo: Google Drive
- Operación: Descargar un archivo
- Archivo: ID dinámico del archivo (proveniente del loop)
- Autenticación: Tu propia cuenta de Google conectada a n8n
💡 También puedes reemplazar esta fuente por un disparador de Gmail, una API o cualquier otro sistema que reciba CVs.
05
Paso 05
Guardar el PDF localmente.
Se guarda el archivo PDF en el servidor en una ruta temporal (/tmp/doc.pdf) para poder utilizarlo con un comando de extracción de texto.
Parámetros
- Archivo: /tmp/doc.pdf
- Contenido: Datos binarios del PDF descargado
06
Paso 06
Extraer el texto del CV (PDFtoText).
En este paso se utiliza el comando pdftotext (proporcionado por Poppler) para convertir el PDF en un archivo de texto plano que el agente IA pueda leer. Este comando debe estar instalado en tu servidor.

➡️ Comando ejecutado: pdftotext /tmp/doc.pdf /tmp/doc.txt

💡 Si no sabes cómo instalar este comando, pide ayuda a ChatGPT según tu sistema (Linux, Docker, Mac…), o contáctanos para asistencia.
07
Paso 07
Leer el contenido del archivo de texto.
Leemos el archivo /tmp/doc.txt generado por pdftotext. El contenido se carga en n8n para enviarlo al agente IA en el siguiente paso.
08
Paso 08
Preparar el Texto para el Análisis.
Esta etapa limpia y estructura el contenido de texto bruto para que pueda ser analizado correctamente por el agente IA. El texto procesado estará disponible en $json.data.
09
Paso 09
Analizar el CV con un Agente IA (GPT-4o).
El contenido de texto se envía a un agente IA basado en GPT-4o a través de LangChain. Extrae toda la información clave del CV, como nombre, correo electrónico, experiencia, habilidades y más.

➡️ Prompt: estructura fija, nombres de columnas predefinidos, apóstrofes añadidos a los números para compatibilidad con Google Sheets.
10
Paso 10
Aplanar la estructura de datos.
Convertimos el JSON devuelto por el agente IA en una estructura plana compatible con la importación automática en Google Sheets. Cada propiedad (por ejemplo, lang_1, edu_1_degree) está mapeada explícitamente.

💡 Si quieres enviar los datos a otro lugar (Notion, Airtable, base de datos SQL…), puedes adaptar fácilmente este bloque.
11
Paso 11
Añadir los Datos Estructurados a Google Sheets.
La información extraída se añade automáticamente como una nueva fila en tu Google Sheet. Cada columna corresponde a un campo claramente definido del CV.

➡️ Conexión : Google Sheets conectado a tu cuenta

💡 También puedes modificar este paso para enviar los datos a Notion, Airtable o cualquier otra base de datos.
12
Paso 12
Limpiar el Servidor.
Este comando elimina todos los archivos temporales (/tmp/doc.pdf y /tmp/doc.txt) después de cada ciclo para mantener el entorno limpio.

➡️ Comando: rm -rf /tmp/doc.pdf /tmp/doc.txt

Has visto el workflow completo

Consigue el JSON n8n listo para importar + la guía

Deja tu email y te enviamos el escenario completo.

JSON n8n listo para importar
Guía de setup escrita
Tutorial en video incluido

2.400+ makers descargaron este workflow este mes.

Why this matters

Por qué Extraer Automáticamente la Información de un CV es Esencial para tu Proceso de Reclutamiento

Gestionar eficientemente las candidaturas o perfiles en tu CRM o ATS es fundamental para automatizar tu proceso de reclutamiento y evitar pérdidas de información. Analizar manualmente los CV en PDF consume tiempo, retrasa la toma de decisiones e introduce errores humanos. Problemas comunes en la extracción manual: Información faltante o mal registrada (emails, experiencia, idiomas…) Pérdida de tiempo copiando y pegando cada CV en un archivo o base de datos. Dificultad para filtrar y clasificar perfiles según criterios específicos. Retrasos en el procesamiento de candidaturas y oportunidades perdidas. Ventajas de extraer automáticamente los datos de los CV: Estructuración limpia y estandarizada de todos los perfiles recibidos. Ahorro significativo de tiempo en la selección y calificación de candidatos. Automatización fluida con Google Sheets, Notion, Airtable o tu CRM. Posibilidad de activar acciones personalizadas (envío de emails, scoring, etiquetado, etc.). Automatizando la extracción de información desde CV en PDF con un agente IA, eliminas tareas tediosas, aseguras la fiabilidad de tus datos y ganas en rapidez. Este escenario n8n se convierte en un activo estratégico para escalar tu proceso de reclutamiento sin esfuerzo.

Descargar el workflow

La automatización completa, en tu bandeja.

JSON n8n, guía escrita y tutorial en video, todo para desplegar en menos de 15 minutos.

Escenario n8n JSON completo
Documentación de setup paso a paso
Tutorial en video completo