Question 1

Quelle différence entre une agence IA et un cabinet de conseil IT générique ?

Accepted Answer

Un cabinet de conseil IT te livre un deck, une roadmap et un engagement à 6 mois qui finit en « recommandations ». Une agence IA te livre des features IA dans ton produit. Sortie concrète : un panel dans ton CRM qui rédige des réponses, une slash command Slack qui résume un thread, un webhook qui score les appels d'offres entrants, un panel de chat embarqué dans ton app. Mesuré par features en prod et coût unitaire par appel, pas par heures facturées. Si la proposition cite « stratégie IA » plus que « features IA livrées », c'est du conseil déguisé en IA.

Question 2

Combien coûte une agence IA en 2026 ?

Accepted Answer

Ça dépend du périmètre. Une mission focalisée (une feature IA, une surface produit, audit + design + build + deploy) tourne entre 8 000 et 25 000 € selon la complexité des intégrations. Un retainer mensuel couvrant 3-8 features en prod (extensions, evals, migration de modèle, monitoring de coût) démarre autour de 4 000-8 000 €/mois. Méfie-toi des agences qui facturent à « l'heure IA » ou pitchent une vague transformation IA à 6 mois. Notre approche : audit gratuit d'abord, puis prix par feature shippée, pas par heure parlée.

Question 3

Quel modèle choisir : Claude, GPT-4o, Mistral ou open-weights ?

Accepted Answer

Ça dépend de la tâche et de la contrainte. Claude Sonnet 4.x domine sur le reasoning long-contexte, l'usage propre des outils et les refus nets. GPT-4o est plus rapide sur le multimodal (vision, voice) et a le tooling function-calling le plus mature. Mistral Large est compétitif sur le français et la résidence data EU. Les open-weights (Llama 3.x, DeepSeek, Qwen) marchent quand tu dois garder la data on-premises ou que ton plafond de coût unitaire est sous 0,01 €. On benchmark par cas d'usage et on re-benchmark tous les 6 mois. Le modèle, c'est un choix, pas une religion.

Question 4

RAG, fine-tuning ou prompt engineering : on a besoin de quoi ?

Accepted Answer

Prompt engineering d'abord : 70 % des features shippent avec juste un system prompt bien structuré et de bons exemples. RAG (retrieval-augmented generation) ensuite : quand le modèle a besoin de lire ton corpus spécifique avant de répondre (docs, tickets support, notes CRM, wiki interne). Fine-tuning en dernier : seulement quand le retrieval seul plafonne en qualité ou en coût, typiquement sur des tâches étroites à fort volume (classification, output schéma fixe). On commence par la couche la moins chère et on n'escalade que si l'eval le dit. La plupart des pitchs fine-tuning qu'on voit sont en fait un problème de RAG déguisé.

Question 5

Combien de temps pour shipper une première feature IA en prod ?

Accepted Answer

Honnête : 4 à 6 semaines pour une première feature sur un cas bien scopé. Semaine 1 audit + scoring. Semaines 2-3 design (system prompt, schéma RAG, jeu d'eval, plafond coût). Semaines 4-5 build + intégration dans ta surface produit. Semaine 6 beta interne, passe d'eval, deploy prod avec kill switch. Si une agence te promet une feature IA en prod en 1 semaine, elle saute les evals — bien pour une démo, dangereux devant des utilisateurs qui payent.

Question 6

L'IA va remplacer l'équipe ?

Accepted Answer

Augmente. Chaque feature IA qu'on livre a un fallback vers un opérateur humain — pour les edge cases, les clients en colère, les décisions à fort enjeu. Ce qui change : l'équipe arrête de faire les 80 % de boulot répétitif que l'IA écrase et se recentre sur les 20 % qui demandent vraiment du jugement. Sur les cohortes qu'on a shippées : sales ops passe de l'hygiène CRM à la construction du playbook, support N1 passe du copier-coller de réponses au fix de la root cause, content passe du draft à l'édition et l'idéation. Effectif stable, sortie multipliée.

Question 7

La data est-elle safe avec les providers LLM ?

Accepted Answer

Dépend du provider et du contrat. Anthropic et OpenAI offrent tous les deux du zero-data-retention sur leurs APIs entreprise : tes prompts et outputs ne sont jamais utilisés pour le training et ne sont pas stockés au-delà de la requête. Azure OpenAI, AWS Bedrock et Google Vertex AI te donnent les mêmes modèles dans ton propre compte cloud, avec résidence data EU ou US que tu contrôles. Pour les charges où la data ne peut légalement pas quitter ton périmètre (finance, défense, santé), on déploie des open-weights on-premise via vLLM ou TGI. On choisit le pattern qui matche ton profil de risque, pas le moins cher par défaut.

Question 8

À quels outils et CRM vous câblez les features IA ?

Accepted Answer

Outil-agnostique. On a livré des features IA câblées à HubSpot, Pipedrive, Salesforce, Attio, Folk, Airtable, Notion, Zendesk, Intercom, Slack, Gmail, Outlook, Stripe, Linear, GitHub, Webflow, Make, n8n et des systèmes internes custom via REST APIs ou Postgres. Le câblage vit derrière un serveur MCP ou un workflow no-code (Make / n8n) quand l'équipe va devoir l'étendre sans code. Si tu as une API documentée et des webhooks, on peut câbler de l'IA dessus.

Question 9

Comment vous mesurez le ROI d'une mission IA ?

Accepted Answer

On track 6 KPI principaux par feature shippée, reportés mensuellement dans un dashboard partagé : usage (appels par jour, DAU), temps gagné par appel (vs. status quo), coût unitaire par appel, taux de passage de l'eval, taux de refus / fallback, et revenue ou économies attribuables à la feature. On refuse de tracker les vanity metrics (paramètres modèle, comptes de tokens prompt) sauf si elles servent un objectif business direct. Si une feature ne bouge pas l'aiguille après 8 semaines d'itération, on la retire au lieu de la traîner.

Question 10

On signe pour combien de temps avec vous ?

Accepted Answer

Trois formats. (1) Audit seul : forfait one-shot, 2 semaines, livrable = liste rankée des cas + design doc de la première feature. (2) Sprint de build : 4 à 8 semaines par feature shippée, scope fixe, prix fixe. (3) Accompagnement récurrent : engagement minimum 6 mois pour les équipes qui font tourner 3+ features IA en prod et veulent eval continu, migration de modèle et extension de cas. Pas d'engagement annuel forcé, pas de clauses de sortie alambiquées. Si on ne livre pas, tu arrêtes.

L'agence IAqui shippe, retrieve, score, drafte, monitordes features IA, pas des decks.

Une feature IA qui shippe vraiment tient sur 4 piliers.

Cas d'usage + choix du modèle

RAG, retrieval + fine-tuning

Dans le produit, pas à côté

Evals, coût + garde-fous

Ce qu'une feature IA en prod bouge vraiment.

Notre build en 4 étapes, du cas d'usage à la prod.

On shippe des features dans ton produit, pas des slides dans ta boîte mail.

On score tes cas d'usage IA, tu repars avec un plan.

Comment on fait tourner une mission IA.

Auditer où l'IA bouge vraiment l'aiguille

Choisir le modèle, designer le pipeline data

Builder la feature avec une suite d'eval dès le jour un

Déployer la feature dans le produit, pas en SaaS à côté

Faire tourner l'eval, surveiller le coût, itérer chaque mois

La même stack, sur plusieurs features clients.

Les 10 questions qu'on nous pose en boucle.

Arrête de pitcher la roadmap IA. Shippe la première feature.

L'agence IAqui shippequi retrievequi scorequi draftequi monitorqui shippe, retrieve, score, drafte, monitordes features IA, pas des decks.