Skip to content

Choix de la Verticale (FR)

Décision #1 du parcours. À faire en semaine 1. Tout le reste (LinkedIn, projets, certifs, cold outreach) dépend de ce choix.


Pourquoi c'est critique

Un "AI Engineer freelance" coûte 600€/jour. Un "AI Engineer pour Direction Financière de PME ETI" coûte 1300€/jour. Même personne. Même skills. Positionnement différent.

Raisons :

  1. Le client paye la compréhension métier, pas juste la tech
  2. Tu deviens trouvable sur Google / LinkedIn quand tu es spécialisé
  3. Tu attires un seul type de mission — plus facile de vendre
  4. Tu peux écrire du contenu pertinent (généraliste = contenu plat)
  5. Le bouche-à-oreille fonctionne — un client legaltech t'enverra un autre

Les 5 verticales viables pour toi en 2026

TJM 2026 : 1000-1600€/jour

Pourquoi maintenant :

  • Boom massif : EvenUp $2B, Legora $5.55B (USA), mais le marché FR est sous-équipé
  • Cabinets d'avocats moyens (50-200 personnes) commencent à investir
  • Cas d'usage clairs : contract review, due diligence, recherche jurisprudence, mémo client
  • Gros budgets (le legal facture cher, peut payer cher)

Cas d'usage typiques :

  • RAG sur jurisprudence + contrats clients
  • Agent de revue de contrats avec MCP server pour DocuSign/iManage
  • Génération de mémos avec citations vérifiables
  • Voice agent pour prise de RDV / pré-qualification clients

Acteurs FR à suivre/follow : Doctrine, Lefebvre Dalloz, Predictice, Hyperlex, Septeo, Legalstart, Defacto

Tu te positionnes comme : "AI Engineer pour cabinets d'avocats — RAG + Agents pour contract review, due diligence, knowledge base"

Risque : Sensibilité données / confidentialité → impose self-hosted ou sovereignty (Mistral, Qdrant). C'est aussi une barrière à l'entrée → ton moat.

2. 🥇 Finance / Compta / RegTech

TJM 2026 : 900-1400€/jour

Pourquoi maintenant :

  • Direction financière sous pression compliance (CSRD, DORA, MiCA)
  • RegTech FR explose
  • Cabinets compta (TPE/PME) tous en transformation IA
  • Budgets enterprise, achats récurrents

Cas d'usage typiques :

  • RAG sur textes réglementaires (BCE, AMF, ACPR)
  • Agent qui prépare des reportings ESG / DPEF automatiquement
  • Analyse de factures fournisseurs + détection anomalies
  • Voice agent IVR pour service comptable

Acteurs FR : Pennylane, Qonto, Spendesk, Indy, Dougs, Tiime, Margo

Tu te positionnes comme : "AI Engineer pour direction financière PME / cabinets comptables — automatisation reporting + compliance"

Risque : secteur conservateur, longs cycles de vente.

3. 🥈 Recrutement / RH Tech

TJM 2026 : 700-1100€/jour

Pourquoi maintenant :

  • Tous les ATS doivent intégrer de l'IA pour rester compétitifs
  • Cabinets de recrutement perdent leur valeur si ne sont pas augmentés AI
  • Volume énorme de missions (chaque cabinet RH veut son agent)
  • Tu as Loxira → un projet pour démontrer

Cas d'usage typiques :

  • RAG sur base CV + matching offres
  • Agent de pré-qualification candidats (voice ou chat)
  • Génération de fiches de poste / annonces
  • Agent de sourcing LinkedIn / GitHub
  • ATS augmenté

Acteurs FR : Welcome to the Jungle, HelloWork, Yagora, Datxa, Mistertemp', Indeed France

Tu te positionnes comme : "AI Engineer pour cabinets de recrutement et RH tech — agents de sourcing + matching candidats / offres"

Avantage unique pour toi : tu as déjà construit un ATS (Loxira). C'est un cas d'usage parfait à mettre en avant.

Risque : TJM plus bas que finance/legal, plus de concurrence.

4. 🥈 E-commerce / Retail

TJM 2026 : 700-1000€/jour

Pourquoi maintenant :

  • Catalogues énormes à organiser/chercher
  • Support client coûteux à automatiser
  • Personnalisation est devenue impossible sans IA
  • Volume énorme de PME e-com FR (Shopify Plus, PrestaShop)

Cas d'usage typiques :

  • RAG sur fiche produits + retours clients
  • Agent support client (chat + voice) avec actions (refund, tracking, etc.)
  • Recommandations perso multi-modales
  • Génération auto de descriptions produits

Acteurs : énorme — toutes les boutiques Shopify Plus FR, marques DNVB

Tu te positionnes comme : "AI Engineer pour e-commerce / DNVB — agents support client + recommandations"

Risque : marges écrasées (e-commerce est radin), beaucoup de concurrence agences.

5. 🥉 Médical / Santé / Pharma

TJM 2026 : 1000-1500€/jour

Pourquoi pas n°1 : régulation lourde (RGPD santé, MDR, CE marking), cycle de vente très long, demande expertise réglementaire.

Pourquoi à considérer : budgets énormes, peu de concurrents qualifiés, sticky clients.

Cas d'usage typiques :

  • RAG sur bases de connaissance médicale (notes, guidelines)
  • Agent de pré-screening patients
  • Aide à la prescription / interactions médicamenteuses
  • Recherche clinique / synthèse études

Acteurs FR : OpenEvidence (US mais arrive FR), Doctolib, Alan, Lifen, Owkin, Posos

Si tu vises ça : prévoir 6 mois supplémentaires pour comprendre le régulatoire avant de pitcher.


Comment décider — framework 5 minutes

Note de 0 à 10 sur chaque critère pour chaque verticale :

CritèrePoidsLegalFinanceRHE-comSanté
Intérêt personnel (tu vas y passer 12 mois)
Réseau existant (tu connais quelqu'un dedans)
Track record que tu peux activer
TJM cible1097710
Maturité marché (clients prêts à acheter)89885
Barrière à l'entrée (haute = bon moat)874310
TOTAL

Le winner = ton choix. Tu peux pivoter à mois 6, mais 1 verticale 6 mois minimum.

Piège du scoring. Ce tableau n'est pas une vérité objective, c'est un outil pour forcer une décision et casser la paralysie. Le danger : tweaker les poids jusqu'à ce que le tableau "valide" ce que tu voulais déjà faire (motivated reasoning). Anti-pattern de staff : décide d'abord à l'instinct, écris ton choix sur un papier, PUIS remplis le tableau. Si le tableau contredit ton instinct, l'écart est l'information la plus précieuse — creuse-le au lieu de l'ignorer.


Comment un staff y réfléchit — le positionnement comme distribution, pas comme étiquette

La plupart des freelances pensent le positionnement comme un titre LinkedIn. Un senior le pense comme une fonction de distribution : où arrivent les leads, à quel coût d'acquisition (CAC), avec quelle probabilité de conversion, à quel panier moyen (ACV).

Le modèle mental : niche = compression du tunnel de vente.

Un généraliste a un tunnel large et plat : beaucoup d'impressions, conversion ~0. Un spécialiste a un tunnel étroit et profond : moins de prospects mais chaque prospect te perçoit comme le choix évident. La spécialisation n'augmente pas ton marché total — elle augmente ta part du marché que tu touches (Serviceable Obtainable Market). C'est contre-intuitif : tu gagnes plus en t'adressant à moins de gens.

Trois couches de positionnement (la plupart s'arrêtent à la couche 1) :

CoucheExempleEffetDéfendabilité
1. Verticale (secteur)"AI Engineer pour le legal"Te rend trouvable, filtre les leadsFaible — copiable en 1 LinkedIn headline
2. Cas d'usage (job-to-be-done)"Je réduis le temps de revue de contrats de 70%"Tu parles ROI, pas techMoyenne
3. Mécanisme propriétaire (comment)"RAG souverain self-hosted + eval harness sur jurisprudence FR, conforme RGPD-santé"Tu deviens non-substituableForte — c'est ton moat réel

Le TJM ne vient pas de la couche 1. Il vient de la couche 3 combinée à un ROI quantifié pour le client. "Je fais du RAG" → commodité. "J'ai économisé 2 ETP juristes à un cabinet de 80 personnes, voici le calcul" → tu nommes ton prix.

L'économie unitaire d'une mission (ce que le client achète vraiment)

Un client n'achète pas tes jours. Il achète un delta de P&L. Apprends à le formuler avant de pitcher :

Valeur annuelle pour le client = (coût actuel du process) − (coût après ton agent) − (coût d'exploitation de l'agent)

Exemple legal — revue de contrats :
  Coût actuel    : 3 juristes × 0.5 ETP × 90k€      = 135k€/an
  Coût après     : 1 juriste × 0.3 ETP (supervision) = 27k€/an
  Coût LLM/an    : voir ci-dessous                   = ~6k€/an
  ───────────────────────────────────────────────────────────
  Valeur créée   ≈ 102k€/an récurrents

Si tu crées 100k€/an de valeur, facturer 40-60k€ pour le build (≈ 40-50 jours à 1200€) n'est plus "cher" — c'est un ROI de 2x la première année. Le TJM est une conséquence de cette équation, jamais une négociation sur le nombre de jours.

Coin coût LLM, à savoir défendre en clientèle : sur le stack Anthropic 2026, le triage/classification tourne sur claude-haiku-4-5 (1 USD / 5 USD par M tokens, in/out), la synthèse et le raisonnement métier sur claude-sonnet-4-6 (3 USD / 15 USD), et seuls les arbitrages critiques (revue finale de contrat, raisonnement multi-étapes long) tapent claude-opus-4-8 (5 USD / 25 USD par M tokens, contexte 1M, sans premium long-contexte). Un agent de revue de contrats bien architecturé (cache sur le préfixe stable system+tools, Haiku en première passe, escalade sélective vers Opus) coûte quelques centaines d'euros/mois, pas des milliers — c'est ce chiffre qui rend ton ROI crédible face à une direction financière. Voir ai-engineer/10-cost-latency.md pour le calcul détaillé du caching.

Le calcul que tu poses devant le DAF (modélise-le, ne le devine pas)

Le DAF ne croira pas "quelques centaines d'euros/mois" si tu ne sais pas d'où ça sort. Voici le calcul de base d'un agent de revue de contrats — c'est exactement le livrable de l'Exercice 3.

Hypothèses de charge (un cabinet de taille moyenne) :

Volume               : 1 000 contrats/mois
Taille moyenne        : ~15 000 tokens d'entrée (contrat + clauses de référence)
Sortie moyenne        : ~2 000 tokens (mémo de revue + flags)
Préfixe stable        : ~8 000 tokens (system prompt + définitions d'outils + grille d'analyse)
                        → identique sur chaque appel → candidat parfait au cache
Partie variable       : ~7 000 tokens (le contrat lui-même, jamais caché)

Architecture naïve (tout sur Opus, zéro cache) — l'anti-pattern :

Entrée  : 1 000 × 15 000 tok = 15,0 M tok × 5 USD/M  = 75,00 USD
Sortie  : 1 000 ×  2 000 tok =  2,0 M tok × 25 USD/M = 50,00 USD
                                              TOTAL  ≈ 125 USD/mois

Architecture de staff (routage + prompt caching sur le préfixe stable) :

Passe 1 — triage Haiku sur 100 % du volume (le contrat est-il standard ?)
  Entrée : 15,0 M tok × 1 USD/M    = 15,00 USD
  Sortie : 1 000 × 300 tok = 0,3 M × 5 USD/M = 1,50 USD

Passe 2 — Sonnet sur ~70 % (revue métier des contrats non triviaux)
  Préfixe caché : 700 × 8 000 = 5,6 M tok → lecture cache ≈ 0,1× = 3 USD/M
       5,6 M × 0,30 USD/M (cache read)      = 1,68 USD
  Partie variable : 700 × 7 000 = 4,9 M × 3 USD/M = 14,70 USD
  Sortie : 700 × 2 000 = 1,4 M × 15 USD/M  = 21,00 USD

Passe 3 — Opus sur ~10 % (arbitrages critiques, clauses à risque)
  Préfixe caché : 100 × 8 000 = 0,8 M × 0,50 USD/M (cache read) = 0,40 USD
  Variable : 100 × 7 000 = 0,7 M × 5 USD/M = 3,50 USD
  Sortie : 100 × 2 000 = 0,2 M × 25 USD/M  = 5,00 USD

  + écriture du cache (~1,25× le prix d'entrée, amortie sur le mois) ≈ qq USD
                                              TOTAL  ≈ 55-60 USD/mois

Deux enseignements à savoir verbaliser :

  1. Le routage Haiku/Sonnet/Opus divise la facture par ~2 vs le tout-Opus, et le caching du préfixe stable divise le coût d'entrée de ce préfixe par ~10 (lecture cache ≈ 0,1× le prix d'entrée ; l'écriture coûte ~1,25× mais est amortie). Le préfixe doit être byte-identique à chaque appel pour que le cache touche — une datetime.now() ou un JSON non trié dans le system prompt invalide tout (vérifie usage.cache_read_input_tokens ≠ 0).
  2. Le coût LLM (~55 USD/mois) pèse < 0,1 % de la valeur créée (102k€/an ≈ 8,5k€/mois). C'est ce ratio qui clôt la discussion : un DAF qui voit le coût d'exploitation représenter une fraction négligeable du gain ne négocie plus le build, il signe.

Garde-fou de staff : si ton coût LLM dépasse 5 % de la valeur créée, ton architecture est cassée — tu routes trop vers Opus, ou ton préfixe n'est pas caché. Re-route et re-mesure avant de pitcher. Le mauvais réflexe junior est de "tout passer sur Opus parce que c'est le meilleur modèle" : tu multiplies la facture par 2-3 sans gain de qualité mesurable sur le triage, et tu détruis la marge qui finance ta crédibilité.

Moat : pourquoi 90% des freelances IA seront commoditisés en 18 mois

Le risque existentiel de cette carrière : le tooling rattrape les compétences. "Faire un RAG" était un skill rare en 2024, c'est un template npx en 2026. Si ton offre = "je sais brancher un LLM", tu es en compétition avec un junior + Cursor, et le prix tend vers zéro.

Ce qui ne se commoditise PAS (ton vrai capital) :

  1. L'accès aux données propriétaires du secteur — jurisprudence annotée, référentiels comptables, ontologies métier. Personne ne peut npm install ça.
  2. La confiance réglementaire — savoir architecturer pour RGPD-santé / DORA / souveraineté, et pouvoir le défendre devant un DPO. Barrière humaine, pas technique.
  3. Le réseau et le track record vertical — le 3e client legal vient du 1er. Effet de réseau impossible à acheter.
  4. L'eval harness métier — savoir prouver que l'agent est fiable à 98% sur les contrats de ce client, avec un jeu de tests gold. C'est ce que personne ne fait et ce qui fait passer un POC en prod.

Le staff move : choisis la verticale où ces quatre moats sont les plus hauts ET les plus accessibles pour toi. C'est exactement pourquoi legal et santé ont les TJM les plus élevés du tableau — les barrières y sont les plus fortes.

Le moat caché que personne ne pitche : l'observabilité comme preuve. Un POC qui "marche en démo" et un système qui passe en prod sont séparés par une seule chose : la capacité à prouver le comportement sous charge. Sur le stack Anthropic, ça veut dire logger resp.usage (input/output/cache tokens) sur chaque appel pour défendre la facture, tracer le stop_reason (refusal, max_tokens, end_turn) pour distinguer un refus de sécurité d'une troncature, et capturer le routage modèle réel (combien de % a vraiment escaladé vers Opus ce mois-ci ?). Le freelance qui arrive avec un dashboard "coût/contrat, latence p95, taux de refus, drift de l'eval" n'est pas en concurrence avec un junior + Cursor — il est en concurrence avec personne. C'est la couche 3 (mécanisme propriétaire) rendue visible et auditable devant un DAF ou un DPO.

Failure modes du positionnement (vus en vrai)

ErreurSymptômeCorrectif
Niche trop large"AI Engineer pour les entreprises" → 0 inboundDescends d'un cran : secteur + taille + cas d'usage
Niche trop étroite trop tôt"Agents RAG pour notaires lyonnais bilingues" → SOM de 4 prospectsVise une niche que tu peux saturer en ~50 comptes nommables
Positionnement tech, pas businessTu pitches "LangGraph + Qdrant", le client décrochePitch le delta P&L, la tech est un détail d'implémentation
Pivot trop rapideTu changes de verticale tous les 2 mois → aucun compounding6 mois minimum, le réseau et le SEO compound lentement
Confondre intérêt et marchéTu choisis la verticale "cool" sans demandeVérifie qu'au moins 3 acteurs FR ont déjà budgété de l'IA
Pas de proof point"Je peux faire X" sans l'avoir faitUn projet portfolio thématique > 10 certifications

Comment valider une verticale en 1 semaine (avant de s'engager 6 mois)

Ne choisis pas en chambre. Test de désirabilité, façon discovery produit :

  1. 10 conversations de découverte (pas de vente) avec des décideurs de la verticale. Question clé : "Qu'est-ce qui vous fait perdre le plus de temps aujourd'hui ?" — tais-toi et écoute.
  2. Compte les budgets existants. Si 3+ acteurs FR ont déjà acheté de l'IA dans ce secteur (offres d'emploi "AI", levées de fonds, posts LinkedIn), le marché est éduqué → cycle de vente plus court.
  3. Cherche le signal de douleur récurrent. Si le même mot revient dans 7/10 conversations (ex : "revue de contrats", "rapprochement factures"), tu as trouvé ton cas d'usage tête de pont.
  4. Vérifie que tu peux livrer un POC en < 2 semaines. Si le premier cas d'usage demande 3 mois, tu n'auras jamais de référence pour vendre le suivant.

Le but : transformer une intuition ("le legal a l'air payant") en conviction étayée par des données terrain avant d'y mettre 6 mois de ta vie.


Pour TOI (avis tranché)

Sans connaître tes goûts, top 2 logique pour Achref :

  1. Recrutement / RH — parce que tu as Loxira (ton ATS) comme proof point. Tu peux dire "j'ai construit un ATS avec IA, j'aide les cabinets RH à industrialiser leurs outils IA". TJM 700-1100 mais entrée plus facile, missions plus accessibles.

  2. Legal Tech — TJM le plus haut, marché FR sous-équipé, ton profil dev senior + infra colle bien (cabinets veulent self-hosted/sovereign). Plus dur à pénétrer (réseau requis) mais ROI excellent.

Recommandation : commence par RH (acceleration via Loxira), accumule 2-3 missions, puis pivote vers Legal quand tu as la crédibilité et le track record. Stratégie en 2 temps.


Une fois choisi — actions immédiates

  • [ ] Update headline LinkedIn avec la verticale
  • [ ] 50 CTOs/Decision Makers FR de la verticale à follow
  • [ ] 5 podcasts / newsletters de la verticale à suivre
  • [ ] 1 SaaS leader de la verticale dont tu lis la doc / blog
  • [ ] 1 acteur FR avec qui prendre un café (réseau) sous 30 jours
  • [ ] Tous tes futurs projets portfolio doivent être thematiques sur la verticale

🏋️ Exercices

Ces exercices ne se "lisent" pas — ils produisent des artefacts (un doc, un calcul, un repo, un message envoyé). Le but est de transformer le positionnement de slogan en machine de distribution défendable.

Exercice 1 — Le scoring honnête (facile, mais sans tricher)

Objectif : remplir le tableau de décision sans motivated reasoning, et défendre l'écart.

Écris d'abord ton choix instinctif sur un papier (scellé). PUIS remplis les 7 colonnes des 5 verticales avec des chiffres sourcés (pas inventés) : intérêt = honnête, réseau = nombre réel de contacts, track record = projets réels. Calcule les totaux pondérés.

Indice/Solution : si le winner du tableau ≠ ton instinct, écris 5 lignes sur pourquoi. 9 fois sur 10, soit ton instinct connaît un facteur non modélisé (ex : tu détestes le secteur gagnant), soit tu as gonflé un poids. Les deux cas sont des découvertes. Le livrable : un choix + une justification écrite qui résisterait à un associé sceptique.

Exercice 2 — Le pitch à trois couches

Objectif : écrire ton positionnement aux 3 couches (verticale → cas d'usage → mécanisme propriétaire) et tester la couche 3.

Rédige 3 versions d'une phrase de positionnement. Pour la couche 3, tu dois nommer un mécanisme que tu peux réellement livrer (ex : "eval harness gold-set sur 200 contrats FR + RAG souverain Qdrant self-hosted, conforme RGPD"). Envoie la couche 3 à un dev senior qui ne connaît pas ton secteur : s'il ne comprend pas en quoi c'est dur, c'est trop vague.

Indice/Solution : la couche 3 valide doit contenir au moins un élément que tu ne peux PAS apprendre en 1 week-end (donnée propriétaire, contrainte réglementaire maîtrisée, ou jeu d'eval métier). Si elle est copiable par un junior + un template, tu n'as pas de moat — recommence.

Exercice 3 — Défendre le TJM par l'économie unitaire

Objectif : construire un calcul de ROI client qui justifie un TJM de 1200€ sans que ce soit un nombre sorti du chapeau.

Choisis UN cas d'usage de ta verticale. Modélise : coût actuel du process (ETP × salaire chargé), coût après agent, et le coût LLM réel sur le stack Anthropic 2026. Pour le coût LLM, estime le volume de tokens/mois, choisis le bon modèle par tâche (Haiku pour triage, Sonnet pour synthèse, Opus pour arbitrage critique), applique le prompt caching sur le préfixe stable system+tools, et sors un coût mensuel. Reproduis la structure du calcul "devant le DAF" plus haut, mais avec tes volumes et ton cas d'usage. Conclus par : "je crée X€/an, je facture Y, ROI = Z".

Indice/Solution : prix Anthropic 2026 — claude-haiku-4-5 1/5 USD, claude-sonnet-4-6 3/15 USD, claude-opus-4-8 5/25 USD par M tokens (in/out) à 1M de contexte. La lecture cache coûte ~0,1× le prix d'entrée, l'écriture ~1,25× (amortie). Trois pièges qui font dérailler le chiffre : (1) tu oublies que la sortie coûte 5× l'entrée — un agent verbeux explose la facture côté output, pas input ; (2) ton préfixe n'est pas byte-identique (timestamp, JSON non trié) donc le cache ne touche jamais — vérifie usage.cache_read_input_tokens ; (3) tu routes 100 % vers Opus "par sécurité". Si ton coût LLM dépasse 5 % de la valeur créée, re-route. Le livrable est un one-pager chiffré que tu pourrais mettre devant un DAF, ligne par ligne.

Exercice 3bis — Casser ton propre modèle de coût (production-grade)

Objectif : prendre ton calcul de l'Exercice 3 et le faire exploser de trois façons réalistes, puis le blinder — c'est le travail qui sépare un POC d'un système qui survit à un audit.

Pars de ton one-pager. Injecte trois chocs et recalcule : (a) le volume ×3 (le client adore l'outil et lui balance tout) ; (b) un préfixe qui dérive — quelqu'un ajoute current_date dans le system prompt et le cache passe de ~90 % de hits à 0 % ; (c) le mix de routage qui glisse — au lieu de 10 % vers Opus, le triage Haiku est mal calibré et 40 % escalade. Pour chaque choc : de combien la facture augmente, comment tu le détectes (quelle métrique sur resp.usage / stop_reason), et le correctif.

Indice/Solution : (a) le coût scale linéairement avec le volume sauf le préfixe caché qui s'amortit mieux à l'échelle — le coût/contrat baisse légèrement, argument de vente. (b) un préfixe qui dérive est invisible sans monitoring : cache_read_input_tokens tombe à 0 et la facture d'entrée est multipliée par ~10 sur la part préfixe ; le correctif est de figer le system prompt et de déplacer le volatile (date, ID) après le dernier breakpoint de cache. (c) un mauvais triage est le tueur silencieux de marge — instrumente le taux d'escalade réel et alerte si > seuil. Le livrable : un mini-runbook "si la facture dérape, voici les 3 causes par ordre de probabilité et la métrique qui les distingue".

Exercice 4 — Casser sa propre niche (le red-team du positionnement)

Objectif : identifier comment ta niche sera commoditisée en 18 mois, puis la blinder.

Joue l'avocat du diable contre ton propre positionnement. Liste 5 façons dont un junior + Cursor, une agence offshore, ou un produit SaaS pourrait te remplacer dans 18 mois. Pour chacune, écris la contre-mesure (le moat que tu construis). Classe tes moats de "se commoditise dans 6 mois" à "tient 5 ans".

Indice/Solution : tout ce qui est "savoir brancher un LLM / faire un RAG" tombe en < 12 mois. Ce qui tient : accès données propriétaires, confiance réglementaire défendable devant un DPO, réseau vertical, eval harness métier. Si après l'exercice tu n'as AUCUN moat en colonne "5 ans", ta verticale ou ton angle sont mauvais — c'est le moment de le découvrir, pas dans 6 mois.

Exercice 5 — Validation terrain (production-grade, le plus dur)

Objectif : transformer une intuition de marché en conviction étayée par 10 conversations réelles.

Avant de t'engager 6 mois : programme et mène 10 entretiens de découverte avec des décideurs de ta verticale cible (pas de pitch, que de l'écoute). Objectif unique : trouver le signal de douleur récurrent. Tiens un tableau : qui, douleur n°1 citée, a-t-il déjà budgété de l'IA (oui/non), serait-il prêt à payer pour le résoudre. Synthétise : ton cas d'usage tête de pont = la douleur citée par ≥ 6/10.

Indice/Solution : le piège est de pitcher au lieu d'écouter — tu rentreras avec "ils ont aimé mon idée" (biais de complaisance) au lieu de la vraie douleur. Pose une seule question ouverte et compte les silences. Si moins de 4/10 ont déjà budgété de l'IA, le marché n'est pas éduqué → cycle de vente long → réajuste tes attentes de cash-flow. Le livrable : une décision GO/NO-GO documentée par 10 data points terrain.

Exercice 6 — Le portfolio thématique (synthèse)

Objectif : spécifier un projet portfolio qui prouve les couches 2 et 3 de ton positionnement.

Conçois (puis construis) UN projet vertical qui démontre ton mécanisme propriétaire. Spécifie : le cas d'usage, le jeu d'eval gold-set, l'architecture (modèles par tâche, RAG, garde-fous), la métrique de succès chiffrée, et le coût d'exploitation. Le README doit pouvoir servir d'étude de cas commerciale.

Indice/Solution : un projet qui prouve un ROI mesuré (ex : "98% de précision sur 200 contrats gold, 0.04€/contrat") vaut dix projets "démo". Inclus un eval harness reproductible — c'est ce qui te distingue du junior qui montre un happy-path. Réutilise Loxira si ta verticale est RH : tu as déjà l'asset, transforme-le en étude de cas.


🎤 En entretien

Même en freelance, ces questions tombent en entretien client / due diligence d'agence. Réponds en business, pas en tech.

Q : Pourquoi se spécialiser sur une verticale plutôt que rester généraliste et capter plus de marché ? R : La spécialisation ne réduit pas mon marché, elle compresse mon tunnel de vente — je deviens le choix évident pour un segment, ce qui monte le taux de conversion et l'ACV bien plus que la largeur du généraliste, dont le taux de conversion tend vers zéro.

Q : Comment tu justifies un TJM de 1200€ quand un junior + Cursor coûte 10x moins ? R : Je ne vends pas des jours, je vends un delta de P&L chiffré : si je crée 100k€/an de valeur récurrente et que je facture 50k€ de build, c'est un ROI de 2x — le TJM est une conséquence de l'économie unitaire, pas une négociation.

Q : Ton offre "RAG + agents" ne va-t-elle pas être commoditisée par les templates dans 18 mois ? R : Oui, la couche technique se commoditise — c'est pourquoi mon moat n'est pas le RAG mais l'accès aux données propriétaires du secteur, la conformité réglementaire défendable devant un DPO, le réseau vertical et un eval harness métier qui prouve la fiabilité en prod.

Q : Comment tu choisis quel modèle utiliser pour rester rentable sur une mission ? R : Routage par coût/tâche — claude-haiku-4-5 (1/5 USD) pour le triage, claude-sonnet-4-6 (3/15) pour la synthèse, claude-opus-4-8 (5/25) uniquement pour les arbitrages critiques, avec prompt caching sur le préfixe stable system+tools (lecture cache ≈ 0,1× l'entrée) ; objectif : coût LLM < 5 % de la valeur créée, sinon je re-route. Le réflexe "tout sur Opus" double la facture sans gain de qualité sur le triage.

Q : Un client dit "votre démo marche, mais comment je sais que ça tient en prod sur mes 1 000 contrats/mois ?" — tu réponds quoi ? R : Je ne réponds pas avec une promesse, je réponds avec un eval harness — un jeu de tests gold métier (200 contrats annotés) qui chiffre la précision (ex : 98 %), plus un dashboard d'observabilité qui logge resp.usage, le stop_reason (pour distinguer refus de sécurité et troncature) et le taux d'escalade modèle réel ; c'est la différence entre un POC happy-path et un système auditable, et c'est exactement le moat que le junior + Cursor n'a pas.

Q : Le client te pousse à baisser ton TJM parce que "l'IA fait le gros du travail maintenant". Réponse ? R : L'IA a commoditisé le branchement d'un LLM, pas l'architecture qui rend le coût d'exploitation 1000× inférieur au gain ni l'eval qui prouve la fiabilité devant un régulateur — je facture ce delta de valeur défendable, pas des heures de prompt ; si le client veut juste un wrapper d'API, je ne suis pas le bon prestataire et c'est tant mieux pour nous deux.


Mise à jour : 2026-06-16

Bibliothèque tech perso — Achref