Hack'celeration Academy · Llama · 1:1

Curso Llama, 1:1.Los LLM de Meta, en tu casa.

Un experto en Llama abre tus casos de uso contigo y arregla lo que importa: elegir el modelo Meta open-weight adecuado, ejecutarlo en local con Ollama, hacerle fine-tuning con tus datos y self-hostearlo para la privacidad. Partimos de tus tareas reales y tu hardware, no de teoría.

★★★★★ 4,7/5 · +300 pros formados · Certificada France Num

ActivecampaignActivecampaignAdaloAdaloAdCreative.aiAdCreative.aiAgencia Hermes AgentAgencia Hermes AgentAhrefAhrefAirtableAirtableAllo-The-Mobile-First-CompanyAllo-The-Mobile-First-CompanyAnthropicAnthropicApifyApifyApolloioApolloioAttioAttioBase44Base44BaserowBaserowBrevoBrevoBright-DataBright-DataBrowse-AiBrowse-AiBubbleBubbleCaptaindataCaptaindataChatGPTChatGPTClaudeClaudeClaude CodeClaude CodeClaude CoworkClaude CoworkClaude DesignClaude DesignClayClayClickupClickupCursorCursorDeepSeekDeepSeekDepuración MakeDepuración MakeDepuración n8nDepuración n8nDepuración ZapierDepuración ZapierDustDustElevenLabsElevenLabsFilloutFilloutFlutterflowFlutterflowFolk-CrmFolk-CrmFreepik SpacesFreepik Spaces
Quién te forma

Desplegamos Llama en stacks de clientes, no solo en teoría.

La mayoría de los cursos de Llama son tutoriales grabados por gente que arrancó el modelo la víspera. En Hack'celeration es al revés: ejecutar Llama en local con Ollama, servirlo con vLLM, hacerle fine-tuning con los datos de un cliente, self-hostearlo para empresas cuyos datos no pueden salir, es nuestro día a día de agencia. Todo lo que te enseñamos lo practicamos sobre stacks en producción. Conocemos las trampas (el modelo demasiado grande para tu GPU, la quantization que degrada más de lo previsto) porque ya las hemos resuelto.

  • Desplegamos Llama en stacks de clientes cada semana, no solo en teoría
  • Formato 1:1: el formador se adapta a tu nivel, de principiante en prompts a dev experimentado
  • Te decimos cuándo Llama no es la mejor opción (a veces GPT o Claude vale su precio)
  • Partimos de tus casos de uso reales y tu hardware, no de un ejemplo de mentira
Descubre a los formadores
Lo que dominas

Cuatro pilares para que Llama corra de verdad en tu casa.

Un Llama mal usado son el modelo equivocado en cada tarea, una máquina que se arrastra, y datos enviados donde no deberían ir. La mayoría de los líos vienen de las decisiones alrededor del modelo, no del modelo en sí. Retomamos tus casos de uso reales y recorremos los cuatro pilares juntos.

Formadores certificados Hack'celeration

Descubre a los formadores, sal con un plan.

Deja tu email. Volvemos a ti para ponerte en contacto con un formador certificado por Hack'celeration: miramos tus casos de uso, detectamos dónde Llama puede correr en tu casa sin perder calidad, y te decimos por dónde empezar. Sin compromiso, aunque no hagas el curso.

  • Un diagnóstico de tus tareas y el hardware que tienes
  • Las primeras tareas que confiar a Llama, por orden de prioridad
  • El formato 1:1 adecuado para tu nivel y tu stack
  • Una opinión honesta: Llama o un modelo cerrado según tu caso
Cómo se desarrolla

Tu acompañamiento Llama, paso a paso.

Cinco pasos, sin saltarse ninguno. Cada uno sobre tus casos de uso reales, con un entregable claro. Desde la primera sesión mapeamos tus tareas y tus restricciones. Al final, ejecutas Llama en tu trabajo sin nosotros.

  1. Paso 1 · Auditoría del caso de uso y las restricciones

    Mapeamos tu necesidad real y tu hardware

    Primera sesión, miramos qué esperas de un modelo: chat, código, extracción, clasificación, resumen. Verificamos tus restricciones reales: privacidad de los datos, presupuesto y el hardware que tienes (un portátil, una GPU, una instancia en la nube). Somos sinceros sobre dónde gana Llama frente a una API cerrada y dónde no. Sales con una lista clara de las tareas que confiar a Llama, por orden de prioridad, y el modelo adecuado para cada una. Sin teoría, tu caso real.

  2. Paso 2 · Lo ponemos en marcha

    Llama corre en local, luego preparamos el escalado

    Elegimos el modelo adecuado y su quantization, y lo ponemos a correr en tu máquina con Ollama, a menudo en minutos en un equipo decente. Probamos tus prompts encima para confirmar que la calidad aguanta en tus tareas. Si necesitas servir a varios usuarios, preparamos vLLM o TGI en una GPU en la nube. Como la superficie es compatible con OpenAI, tu código de desarrollo funcionará en producción sin reescritura. Al final, tienes un Llama que responde sobre tus tareas reales.

  3. Paso 3 · Fine-tuning

    Especializamos Llama con tus datos

    Si el modelo de base no basta, le hacemos fine-tuning con tus datos. Preparamos tu dataset (el trabajo de verdad está aquí), lanzamos un entrenamiento LoRA o QLoRA con Unsloth o Hugging Face TRL para caber en una sola GPU, y evaluamos el modelo resultante sobre tus casos. Exportamos a GGUF para volver a conectarlo en Ollama. Practicas sobre tu propio dataset, no un ejemplo de juguete. Terminas con un Llama que habla tu sector y tu tono. Este paso es opcional si el modelo de base ya hace el trabajo.

  4. Paso 4 · Despliegue y self-hosting

    Self-hosteamos Llama si tus datos no pueden salir

    Si tus prompts no pueden ir a una API de terceros (datos sensibles, cumplimiento), pasamos a self-hosted en tu infraestructura. Recorremos el hardware realista que necesitas, el servidor de inferencia (vLLM, TGI) y los compromisos de calidad de las versiones quantizadas más ligeras. Lo conectamos a tu stack para que viva junto a tus otras herramientas, con una API estable para tu app. Somos sinceros sobre el coste de un equipo con GPU y sobre los casos en que una API gestionada sigue siendo más simple y barata.

  5. Paso 5 · Autonomía

    Ejecutas Llama en tu trabajo sin nosotros

    El objetivo número uno: que seas autónomo. Al final del acompañamiento, sabes elegir el modelo Llama adecuado, ejecutarlo en local o en la nube, hacerle fine-tuning con tus datos y self-hostearlo si hace falta. Ya no necesitas una agencia para ejecutar un LLM open-weight en tu casa. Y si quieres delegar un proyecto más grande más adelante, también tenemos una agencia Llama, pero ese no es el objetivo aquí.

La prueba

Por qué formarte en 1:1 con nosotros.

  • +300Pros ya formados en IA

    Más de 300 personas han pasado por nuestras formaciones en Francia y Europa. Devs, fundadores, equipos de datos y ops. No son cifras de vanidad: gente que ejecuta Llama en tareas reales y bajó su factura de IA, en vez de pagar el precio alto por un trabajo que un modelo open-weight resuelve de sobra.

  • 4,7/5Nota sobre 334 reseñas verificadas

    Nota media de 4,7 sobre 5, sobre 334 reseñas. No vamos a pretender que Llama gana a todos los modelos en todo: en cierta escritura fina, GPT o Claude siguen por delante. Pero el formato 1:1 marca la diferencia para saber exactamente cuándo el open-weight de Meta es la opción correcta.

  • 1:1Un experto dedicado, no una clase de 100

    No eres un número en un webinar. Un formador abre tus casos de uso reales, mira tu stack y tu hardware, y avanza sobre tus tareas concretas. Programamos las sesiones según tu disponibilidad, repeticiones incluidas.

Reconocida y valorada

Una agencia en activo, reconocida por el Estado francés.

Hack'celeration está certificada Activateur France Numérique y ostenta el título de Embajadora de la IA, otorgados por France Num a las estructuras que impulsan de verdad la transformación digital de las empresas. Sobre el terreno, desplegamos Llama en stacks de clientes cada semana: más de 300 pros formados y una nota de 4,7/5 sobre 334 reseñas verificadas, dejadas por quienes hicieron nuestros acompañamientos, no solo por el comprador.

  • Certificada Activateur France Numérique
  • Embajadora de la IA (France Num)
  • +300 pros formados en Francia y Europa
  • 4,7/5 sobre 334 reseñas verificadas
Descubre a los formadores
FAQ · Curso Llama

Las preguntas que más nos hacen.

  • ¿Qué es un curso de Llama en 1:1?
    Un acompañamiento individual con un experto en Llama, no una clase de 100 personas. Abrimos tus casos de uso reales, miramos tu stack y tu hardware, y avanzamos sobre tus tareas concretas: elegir el modelo adecuado, ejecutarlo en local con Ollama, hacerle fine-tuning con tus datos, servirlo con vLLM y self-hostearlo si hace falta. Haces tus preguntas en directo, el formador adapta el ritmo a tu nivel. Programamos las sesiones según tu disponibilidad, y sales con acciones concretas cada vez. Es la diferencia entre ver un tutorial y de verdad ejecutar Llama en tu trabajo.
  • ¿Cuánto cuesta el curso de Llama?
    No hay un precio único. Te ponemos en contacto con un formador certificado por Hack'celeration, según tu necesidad y tu nivel. El precio varía de un formador a otro, según su perfil y el formato que encaje con tu proyecto.
  • Llama, ChatGPT o Claude: ¿cuál usar?
    Depende de la tarea y de tus restricciones. Llama es open-weight: lo ejecutas en tu casa, tus datos siguen privados y no pagas por token una vez montado tu servidor. ChatGPT y Claude mantienen la ventaja en cierta escritura fina, el contexto muy largo y el pulido de su ecosistema (herramientas, visión, integraciones listas para usar). El buen movimiento rara vez es un solo modelo para todo: te ayudamos a enrutar a Llama lo que gana por quedarse en casa y bajar el coste, y a guardar un modelo cerrado para los trabajos que lo merecen. Somos sinceros sobre dónde gana cada uno.
  • ¿Hace falta una GPU para ejecutar Llama?
    No siempre. Los modelos Llama pequeños (1B, 3B, 8B) corren en un buen portátil vía Ollama, quantizados, a una velocidad cómoda para desarrollo y prototipado, a veces incluso en CPU con paciencia. Para modelos más grandes (70B) o para servir a varios usuarios rápido, necesitas una GPU con suficiente memoria, o una instancia en la nube bajo demanda. En el curso miramos tu hardware real y elegimos el tamaño de modelo y la quantization que de verdad corren en tu máquina, sin venderte un equipo que no necesitas.
  • ¿Cuánto cuesta el self-hosting de Llama?
    Depende del modelo y del volumen. El self-hosting elimina la factura por token: una vez montado el servidor, solo pagas el hardware y la electricidad. Para un modelo pequeño en local, el coste es casi cero más allá de tu máquina. Para servir un 70B en continuo, cuenta un equipo con GPU de verdad o una instancia en la nube, que aun así puede salir mucho más barato que una API a gran volumen. Calculamos tu caso durante el curso y te decimos con franqueza el punto de equilibrio en que el self-hosting supera a una API gestionada.
  • ¿Se puede hacer fine-tuning de Llama con tus propios datos?
    Sí, es una de las grandes ventajas del open-weight. Hacemos fine-tuning de Llama con tus datos para que hable tu sector, tu vocabulario y tu tono. Usamos LoRA y QLoRA (PEFT: solo entrenamos una pequeña parte de los pesos) con herramientas como Unsloth o Hugging Face TRL, lo que permite entrenar en una sola GPU decente en vez de un clúster. El trabajo de verdad es preparar un buen dataset, y te ayudamos ahí. Luego exportamos a GGUF para volver a conectar tu modelo en Ollama. Somos sinceros: a veces un buen prompt o RAG basta y el fine-tuning no hace falta.
  • ¿La licencia de Llama permite el uso comercial?
    Sí en la gran mayoría de los casos. Llama se publica bajo la licencia comunitaria de Meta, que permite el uso comercial, incluido el self-hosting. El límite principal apunta a plataformas muy grandes (por encima de un umbral alto de usuarios activos mensuales), que tienen que solicitar una licencia aparte. Para una pyme, una pequeña empresa o un producto en lanzamiento, estás de sobra dentro de los límites. En el curso te señalamos la cláusula exacta según tu caso, pero no somos abogados: para un uso masivo o ambiguo, te recomendamos una validación legal.
  • ¿Es seguro Llama con mis datos?
    Sí, si lo self-hosteas, y ahí está todo el interés. Al ejecutar Llama en tu propia infraestructura (en local o en tu nube privada), tus prompts y tus datos nunca van a una API de terceros: no se envía nada a Meta ni a nadie. Es el argumento número uno frente a una API cerrada cuando tienes datos sensibles o restricciones de cumplimiento. Si pasas por un proveedor de nube de terceros que sirve Llama, se aplican las reglas habituales de ese proveedor. En el curso planteamos las dos opciones con franqueza y te ayudamos a elegir según tu sensibilidad real.
  • ¿Hay que ser técnico para hacer el curso de Llama?
    No para todo. Ejecutar Llama vía Ollama o una interfaz de chat casi no requiere código, y podemos empezar ahí. Para servir con vLLM, hacer fine-tuning o self-hosting como es debido, ayuda algo de soltura técnica, pero el formato 1:1 parte de tu nivel exacto: principiante, vamos paso a paso por el arranque en local; dev experimentado, saltamos directo al fine-tuning, el servidor de inferencia y el despliegue. Aprendes justo la capa que necesitas, no más.
  • ¿El curso es online o presencial?
    100% online, por vídeo, en 1:1. Te unes a las sesiones desde donde estés, compartimos tu pantalla y tus casos de uso reales en directo. Las sesiones se graban por si quieres repasarlas. El formato individual significa interacción real: no eres un número en un webinar de 100, el formador responde a tus preguntas sobre tu stack y tu hardware. Eso hace que el aprendizaje sea concreto en un ecosistema que se mueve tan rápido como el de Llama.
Habla con un formador

Llama merece correr en tu casa. Conoce a tu formador.

Deja tu email. Un experto que despliega Llama a diario mira tus casos de uso y te enseña cómo ejecutarlo en tu casa sin perder calidad. Sin compromiso, aunque no hagas el curso.

o solo deja tu email