Question 1

¿Que hace exactamente una agencia prompting?

Accepted Answer

Una agencia prompting disena la capa de instruccion detras de tus features de IA para que sean fiables en produccion, no solo impresionantes en una demo. Disenamos los system prompts, los ejemplos few-shot y la salida JSON estructurada, cableamos el contexto con RAG y tool use, elegimos el modelo que encaja con la tarea, y construimos un harness de evals que puntua cada cambio contra tus casos reales. Tambien versionamos los prompts y seguimos el coste en tokens. El objetivo son features de IA en las que tus usuarios confian, no prompts que funcionan una vez y rompen a la siguiente entrada.

Question 2

¿En que se diferencia el prompt engineering de solo escribir un buen prompt?

Accepted Answer

Escribir un buen prompt te da una respuesta bonita una vez. El prompt engineering te da la misma calidad en la llamada mil, sobre las entradas que no previste. Eso significa un system prompt apretado, few-shot y chain-of-thought usados solo donde ayudan, salida estructurada que tu codigo puede parsear, el contexto correcto inyectado via RAG, guardarrailes, y un harness de evals que prueba que un cambio mejoro las cosas en vez de romper un caso limite en silencio. Es la diferencia entre una frase ingeniosa y un componente que puedes enviar.

Question 3

¿Cuando una agencia prompting NO es la opcion adecuada?

Accepted Answer

Cuando el problema no es el prompt. Un mejor prompt no arregla datos malos o faltantes, un proceso roto aguas arriba, o el modelo equivocado para el trabajo, y te lo diremos en la auditoria en vez de venderte una reescritura. Algunas tareas piden codigo, una pipeline de retrieval, o fine-tuning en vez de una instruccion mas lista. Si tu feature falla porque el modelo nunca ve el contexto correcto, ningun pulido de prompt la salvara. Preferimos acotar el arreglo real que cobrarte el equivocado.

Question 4

¿Que es un harness de evals y por que importa para el prompting?

Accepted Answer

Un harness de evals es un set de tests de tus casos reales mas una forma de puntuar como maneja un prompt cada uno. Importa porque sin el envias a ojo: un ejemplo se vio bien, asi que sale a produccion, y encuentras las regresiones con tus usuarios. Con evals, cada cambio de prompt y cada actualizacion de modelo (Claude, GPT, Gemini) se puntua contra una calidad que definiste, asi que envias con pruebas. Es la razon mas grande por la que las features LLM de produccion siguen fiables mientras los prompts de playground se caen.

Question 5

¿Podeis reducir nuestro coste en tokens y en modelo?

Accepted Answer

Si, y suele ser la ganancia mas rapida. Seguimos el coste en tokens por llamada, recortamos el contexto que quema tokens sin mejorar la respuesta, cortamos el chain-of-thought donde no aporta, y elegimos un modelo mas barato para los pasos que no necesitan el flagship. La salida estructurada reduce los reintentos, y un prompt mas apretado significa menos tokens malgastados por peticion. Optimizamos el coste contra el harness de evals, para que la factura baje sin que la calidad baje con ella.

Question 6

¿Con que modelos trabajais, y como elegis?

Accepted Answer

Trabajamos con Claude, GPT y Gemini, y la eleccion es parte del trabajo, no un reflejo. Algunas tareas quieren el mejor razonamiento, otras velocidad y coste bajo, otras una ventana de contexto larga o un comportamiento de tool use concreto. Probamos las opciones realistas contra tu harness de evals y elegimos por resultados, no por el proveedor que nos guste. Como los prompts y los evals son conscientes del modelo, cambiarlo despues es un cambio medido, no una reescritura desde cero.

Question 7

¿Un mejor prompt va a reemplazar el fine-tuning o construir en codigo?

Accepted Answer

No, y no vamos a fingir que el prompting es magia. El prompt engineering te lleva muy lejos y es mucho mas barato y rapido de iterar que el fine-tuning, asi que es el primer movimiento correcto para la mayoria de las features. Pero algunas tareas de verdad necesitan fine-tuning, una pipeline de retrieval, o codigo plano, y un prompt no sustituye eso. Usamos el prompting donde es la herramienta correcta y te decimos con honestidad cuando el trabajo pide otra cosa, para que no sobreinviertas en instrucciones que tocan techo.

Question 8

¿Formais a nuestro equipo o solo entregais los prompts?

Accepted Answer

Ambos, porque un prompting que solo vive en nuestras cabezas muere en cuanto nos vamos. Entregamos una prompt library versionada, el harness de evals, y la doc sobre por que cada prompt tiene esa forma, luego formamos a tu equipo para cambiar un prompt sin romper el eval que lo protege. Si quieres ir mas a fondo, nuestro curso de IA cubre system prompts, few-shot, context engineering, RAG y evals de principio a fin, para que tu equipo construya y mida la siguiente feature sin nosotros.

La agencia de prompting.Fiable, no a corazonadas.

Una agencia prompting disena fiabilidad, no frases ingeniosas.

System prompts que hacen un solo trabajo, predecible

Prompts en los que confias porque estan medidos

El contexto correcto, no todo el pajar

Una prompt library que tu equipo puede poseer

Disenamos los prompts como software, no como hechizos.

Nosotros enviamos features LLM a diario.

Los prompts en el centro, la ingenieria alrededor.

System y task prompts

Few-shot y chain-of-thought

Salida estructurada / JSON

RAG y context engineering

Harness de evals

Prompt library y versionado

Diagnosticamos tu feature de IA, te llevas un plan.

Como llevamos una mision de prompt engineering.

Encontrar si es el prompt, el contexto o el modelo

Construir la capa de instruccion que aguanta

Darle al modelo con que acertar

Medir la calidad para enviar con pruebas

Versionarla, documentarla, y luego quitarse de en medio

Nos juzgan por las features que aguantan.

Las preguntas que nos hacen en bucle.

Deja de enviar prompts a corazonadas. Disenalos.