Certifications — Que viser et pourquoi
Reality check
Portfolio > certifications. Personne ne te recrute parce que tu as une cert AWS si tu n'as pas de projet déployé. MAIS :
- Les certs cloud passent les filtres ATS chez les ESN/grands comptes
- Cloud certs = 20-35% de salaire en plus (Global Knowledge 2025)
- C'est un signal de discipline (tu peux étudier seul et tenir un objectif)
- À ne pas négliger pour les missions enterprise (banques, assurances, secteur public)
Règle : 1 cert cloud, pas plus. Maximiser ROI, pas accumuler.
Le mental model du staff engineer : une cert est un signal, pas une compétence
Tu viens de 7 ans d'ingénierie (PHP/TS). Tu sais déjà que le marché ne paie pas un diplôme, il paie une réduction d'incertitude. Une certification est un instrument financier : elle achète de la crédibilité auprès d'un acteur qui ne peut pas (ou ne veut pas) évaluer ton code. Raisonne-la comme un investissement avec un asymmetric payoff :
| Dimension | Ce qu'une cert achète réellement |
|---|---|
| Signal ATS | Passe le filtre par mots-clés des ESN/grands comptes. Pur jeu de keyword matching, zéro évaluation de fond. |
| Signal recruteur non-tech | Le RH/staffing manager qui ne lit pas ton GitHub coche une case. Maximal en France sur les missions bancaires/publiques. |
| Réduction d'incertitude côté client | Sur une mission enterprise, le client veut une preuve tierce qu'il ne perd pas son budget. La cert dérisque ta candidature à ses yeux. |
| Discipline démontrée | Marginal pour un dev senior (ton portfolio le prouve déjà mieux), mais non nul pour une reconversion AI. |
Le piège classique du senior en reconversion : sur-investir dans les certs parce que c'est un terrain familier et confortable (un examen QCM ressemble à ce qu'on connaît) au lieu de livrer un projet déployé qui fait peur. C'est de la procrastination productive. La cert ne remplace jamais le projet — elle le complète comme passe-filtre. Le bon ratio de temps pour ta cible (freelance AI senior) : 80% portfolio + déploiement, 20% cert. Si tu inverses ce ratio, tu construis le mauvais asset.
Comment un staff engineer arbitre une dépense de cert : il ne compare pas le prix de l'examen au plaisir d'avoir un badge. Il compare le coût total (examen + heures de prep × ton taux horaire perdu) au bénéfice marginal espéré (probabilité que la cert débloque une mission × valeur de la mission). 3 semaines de prep à 5h/sem = 15h ; à un TJM freelance de 500€ (≈ 70€/h), c'est ~1000€ de coût d'opportunité, bien au-dessus des ~99$ de l'examen. La vraie question n'est donc jamais « est-ce que la cert vaut 99$ ? » mais « est-ce que ces 15h sont mieux investies ici qu'à finir mon RAG déployé ? ».
La cert à viser (mai 2026)
Tableau de décision — choisir EN FONCTION de ta cible de mission
Ne choisis pas la cert « la plus prestigieuse » dans l'absolu : choisis celle qui dérisque ta candidature auprès de tes clients cibles. Le bon choix dépend du segment de marché que tu vises, pas d'un classement universel.
| Cert | Coût examen | Prep | Profil technique | Filtre client idéal | ROI signal |
|---|---|---|---|---|---|
| GCP Generative AI Leader | ~$99 | 2-3 sem | Business + tech (léger) | Startups/scale-ups GCP, missions « stratégie GenAI » | ⭐⭐⭐⭐ |
| Azure AI Engineer (AI-102) | ~$165 | 2-3 mois | Technique (lourd) | Banque/assurance FR, grands comptes Microsoft | ⭐⭐⭐⭐ |
| AWS AI Practitioner | ~$100 | 1-2 sem | Foundation (léger) | Clients AWS-natifs, startups Bedrock | ⭐⭐⭐ |
| AWS ML Engineer Associate | ~$150 | 2-3 mois | Technique ML (lourd) | Missions MLOps/ML classique, pas pur GenAI | ⭐⭐ (pour ta cible) |
Comment lire ce tableau comme un architecte : les deux axes qui comptent sont (1) où sont tes clients (quel cloud domine leur stack) et (2) quel signal ils cherchent (business « je comprends la GenAI » vs technique « je sais implémenter »). Une cert GCP Leader devant un comité d'achat bancaire francophone signale moins qu'une AI-102, même si GCP est techniquement supérieur sur la GenAI — parce que la banque tourne sur Azure et que c'est ça qu'elle dérisque. Le prestige absolu de la cert est secondaire au fit avec l'acheteur.
Heuristique du staff engineer : si tu ne sais pas où seront tes clients, prends la cert la plus transférable et la moins chère en temps — c'est GCP Leader. Si tu sais déjà que tu vises le secteur bancaire/public FR, prends AI-102 d'emblée malgré le coût en temps : le fit Azure dérisque mieux ta candidature.
🥇 GCP Generative AI Leader (RECOMMANDÉ)
Pourquoi :
- GCP est le top-paying cloud pour AI/ML en 2026
- Vertex AI + Gemini sont largement adoptés en enterprise
- Cert "Leader" → orientée business + tech, plus pertinente que les certs purement techniques
- 2-4 semaines de prep, ~$99 de passage
Liens :
Plan de prep (3 semaines, 5h/sem) :
- Sem 1 : Skills Boost path complet (15 modules)
- Sem 2 : Practice tests + Vertex AI hands-on
- Sem 3 : Exam practice + passage
🥈 Azure AI Engineer Associate (AI-102) — Alternative
Pourquoi alternative :
- Azure = 95% Fortune 500 → bon filtre pour missions corporate / banque
- Si tu cibles le secteur bancaire FR, c'est plus pertinent que GCP
- Cert plus technique (utile pour coding interview)
Coût : ~$165, 2-3 mois de prep, plus dense.
Lien : AI-102 Microsoft Learn
🥉 AWS Certified AI Practitioner — Backup
Pourquoi backup :
- Cert "fondation" — moins prestigieuse mais facile (1-2 sem prep)
- AWS Bedrock est moins adopté en FR que GCP/Azure pour gen AI
- À considérer si tu vises spécifiquement des clients AWS-natifs (souvent startups)
Coût : ~$100.
Lien : AWS AI Practitioner
Ce que tu NE FAIS PAS
- ❌ Plusieurs certs cloud simultanées — perte de temps, signal flou
- ❌ Certifs "AI bootcamp" payantes (Le Wagon, etc.) — pas reconnues, $5-10k pour zéro valeur portfolio
- ❌ LangChain Academy "certificate" — c'est un badge de complétion, pas une cert. À faire pour le contenu, pas pour la cert.
- ❌ "Anthropic certification" / "OpenAI certification" de provider — aucun éditeur de LLM (Anthropic, OpenAI) ne délivre de certification d'ingénieur reconnue (état mai 2026). Anthropic publie d'excellentes ressources gratuites (Prompt Engineering Tutorial, cookbooks, docs
platform.claude.com) mais pas de cert payante avec credential ID — si quelqu'un t'en vend une, c'est un scam. Ce qui existe et a une vraie valeur de signal, ce sont les completions de cours d'éditeurs tiers (DeepLearning.AI, Coursera) qui couvrent le tooling Anthropic/OpenAI — voir la section « Cours certifiants gratuits ». Ne confonds pas « j'ai suivi le tutoriel Anthropic » (badge mineur, à mentionner) avec « je suis certifié Anthropic » (n'existe pas). - ❌ PMP, Scrum, etc. — hors sujet pour AI engineer freelance
Cours certifiants gratuits (signal mineur, mais à faire pour le contenu)
Ces "cert" n'ont pas la valeur d'une cert cloud mais valent mention dans le CV :
| Cours | Durée | Coût | Notes |
|---|---|---|---|
| DeepLearning.AI Generative AI with LLMs specialization | 3 sem | $49/mois | Badge Coursera, très respecté |
| HuggingFace NLP Course | 2 sem | Gratuit | Badge à la fin, signal "j'ai bossé" |
| Anthropic Prompt Engineering Tutorial | 1 sem | Gratuit | Pas de badge mais à mentionner |
| LangChain Academy | Var | Gratuit | Badges de complétion |
| Google AI Essentials | 2 sem | $49 | Cert Coursera, plus marketing que tech |
Ce qu'une cert NE teste PAS (et que l'entretien technique testera)
C'est la section la plus importante du doc, et celle que personne ne lit. Une cert GenAI t'apprend le vocabulaire et le mapping de services (« Vertex AI fait X », « Bedrock fait Y »). Elle ne te rend pas un AI engineer senior. L'écart entre « certifié » et « embauchable comme senior » est exactement la liste des sujets ci-dessous — ceux qu'un comité technique va creuser pendant que la cert ne fait que passer le filtre RH.
| Ce que la cert valide | Ce que la production exige (et que l'entretien teste) |
|---|---|
| « Un LLM peut résumer du texte » | Coût/latence à l'échelle : combien coûte 1M de requêtes ? Où mets-tu le prompt caching ? Quand bascules-tu Opus → Haiku ? |
| « Le RAG améliore la pertinence » | Failure modes du RAG : chunking pourri, retrieval qui rate, hallucination malgré le contexte, contexte qui explose la fenêtre, re-ranking, évaluation offline |
| « On peut appeler des outils » | Orchestration d'agents : boucle d'outils, gestion des erreurs/retries typés, exécution parallèle (asyncio.gather), idempotence, garde-fous sur les actions destructrices |
| « Il faut évaluer un modèle » | LLM-as-judge, eval sets, régression : comment tu prouves qu'un changement de prompt améliore vraiment, sans te mentir à toi-même |
| « La sécurité est importante » | Prompt injection, data exfiltration, PII, secrets dans le contexte, least-privilege sur les tools |
| « Il y a de l'observabilité » | Tracing, logging de usage pour le coût, alerting sur les refus/timeouts, p95 de latence |
Le raisonnement du staff engineer : la cert est le ticket d'entrée, l'entretien est le vrai filtre. Si tu passes la cert sans avoir construit ces compétences, tu décroches l'entretien et tu le rates. C'est pour ça que la règle « portfolio d'abord » n'est pas un slogan : ton RAG déployé est ton terrain d'entraînement pour ces questions. Prépare la cert pour le signal, mais prépare ces sujets pour gagner la mission.
Production concerns qu'un AI engineer senior maîtrise (et qu'aucune cert ne couvre sérieusement)
- Coût : modèle par défaut sensé (
claude-opus-4-8pour le hard à 5 $/25 $ par M tokens,claude-sonnet-4-6pour l'équilibre,claude-haiku-4-5pour le volume à 1 $/5 $), prompt caching sur le préfixe stable (système + tools) — lecture cache ≈ 0,1× le prix input —, logging deresp.usagepour suivre le coût réel, Batches API pour le non-temps-réel (-50%). - Latence : streaming pour les sorties longues,
thinkingadaptatif couplé àoutput_config.effort(low/medium/high — deux leviers distincts : l'un décide quand réfléchir, l'autre combien), timeout par appel, exécution parallèle des tool calls viaasyncio.gather. - Robustesse :
max_retries+ exceptions typées (RateLimitError429,OverloadedError529,APITimeoutError), backoff exponentiel géré par le SDK, fallback model (ex. Opus → Haiku sous surcharge). - Observabilité : tracing bout-en-bout, métriques (tokens, coût, latence p95, taux de refus), reproductibilité des évals.
- Sécurité : least-privilege sur les outils, jamais de secret dans le prompt/historique, défense contre l'injection, gestion de la PII (RGPD).
Aucune de ces lignes n'est dans le programme d'examen GCP Leader ou AI-102. C'est précisément pour ça que le marché paie les seniors et pas les certifiés.
Le livrable qui bat le badge : à quoi ressemble la preuve (référence Anthropic 2026)
Tout ce doc répète « un repo déployé bat n'importe quelle cert ». Voici à quoi ressemble concrètement la preuve, parce qu'un comité technique ne te croit pas sur parole — il regarde le code et y cherche les patterns qu'un certifié ne sait pas produire. Ce squelette n'est pas le projet ; c'est la checklist d'embauchabilité rendue exécutable. Chaque ligne correspond à une question d'entretien de la section précédente.
import asyncio
import logging
from anthropic import (
AsyncAnthropic,
APITimeoutError,
OverloadedError,
RateLimitError,
)
from pydantic import BaseModel
logger = logging.getLogger("agent")
# AsyncAnthropic pour un serveur (NestJS/FastAPI) : I/O non bloquante.
# max_retries + timeout par appel : la robustesse qu'aucune cert ne teste.
client = AsyncAnthropic(max_retries=3, timeout=30.0)
# Modèle par défaut sensé. Opus 4.8 pour le raisonnement dur ;
# bascule Haiku 4.5 sur le volume/classification quand la qualité le permet.
MODEL = "claude-opus-4-8" # 5 $/25 $ par M tokens (input/output), contexte 1M
# Préfixe STABLE (système + outils) => prompt caching. Tout ce qui varie
# (question, timestamp, id de requête) reste APRÈS ce bloc, jamais dedans.
SYSTEM = [
{
"type": "text",
"text": "Tu es un assistant de support produit. Cite tes sources.",
"cache_control": {"type": "ephemeral"}, # cache lecture ≈ 0,1× le prix input
}
]
class Triage(BaseModel):
intent: str
urgent: bool
summary: str
async def triage(question: str) -> Triage:
"""Un seul appel, sortie structurée native (pas de XML/JSON bricolé)."""
try:
resp = await client.messages.parse(
model=MODEL,
max_tokens=1024,
system=SYSTEM,
thinking={"type": "adaptive"}, # PAS de budget_tokens (retiré, 400)
output_config={"effort": "low"}, # low/medium/high : effort adaptatif
messages=[{"role": "user", "content": question}],
output_format=Triage, # validé contre le schéma Pydantic
)
except RateLimitError:
logger.warning("429 — le SDK a déjà retenté ; on remonte au caller")
raise
except (OverloadedError, APITimeoutError) as e:
logger.warning("dégradé récupérable: %s — fallback possible ici", type(e).__name__)
raise
# Logging de usage = observabilité du COÛT réel, ligne que personne ne pense à écrire.
u = resp.usage
logger.info(
"tokens in=%d out=%d cache_read=%d",
u.input_tokens, u.output_tokens, u.cache_read_input_tokens or 0,
)
return resp.parsed
async def triage_batch(questions: list[str]) -> list[Triage]:
"""Exécution parallèle : la latence d'un lot ≈ la latence du plus lent, pas la somme."""
return await asyncio.gather(*(triage(q) for q in questions))Pourquoi ce code est le signal de séniorité (et la cert ne l'est pas) :
| Ligne du code | Question d'entretien qu'elle prouve que tu sais répondre |
|---|---|
AsyncAnthropic + asyncio.gather | « Tu as 200 tickets à classer, comment tu tiens la latence ? » |
cache_control sur le préfixe stable | « Où mets-tu le prompt caching et qu'est-ce qui l'invalide ? » |
except RateLimitError / OverloadedError | « Que fait ton code quand l'API te renvoie 429 ou 529 ? » |
max_retries + timeout | « Un appel se bloque 2 minutes en prod. Que se passe-t-il ? » |
thinking adaptive + effort: low | « Tu paies trop cher sur une tâche simple. Quel levier ? » |
logger.info(... usage ...) | « Comment tu sais combien te coûte vraiment 1M de requêtes ? » |
messages.parse(... output_format=...) | « Comment tu garantis une sortie parseable sans bricoler du prompt ? » |
MODEL = "claude-opus-4-8" + commentaire Haiku | « Quand bascules-tu Opus → Haiku, et qu'est-ce que tu perds ? » |
Un certifié GCP Leader sait dire « Vertex AI fait du RAG ». Le candidat qui a écrit ces 60 lignes peut défendre chaque arbitrage. C'est exactement l'écart de prix sur le marché — et c'est cet écart que ton portfolio doit matérialiser, pas un badge.
Quand passer la cert
Pas avant Phase 5 (mois 5-6 du parcours).
Pourquoi attendre :
- Tu auras une bien meilleure compréhension après les phases 1-4
- Le coût ($99-$165) doit venir après que tu sois certain de continuer
- Cert seule sans projet portfolio = signal faible
Sauf si : tu as une opportunité de mission qui demande explicitement la cert. Là tu accélères.
Mention dans le CV / LinkedIn
Format idéal :
Certifications
- GCP Generative AI Leader — [date] — Credential ID xxx
- DeepLearning.AI Generative AI with LLMs (Coursera, [date])Sur LinkedIn :
- Section "Licenses & certifications" pour la cert cloud officielle
- Section "Courses" pour les Coursera / DL.AI / HF
Coût total estimé pour TOUT le pack cert + cours
| Élément | Coût |
|---|---|
| GCP Generative AI Leader exam | ~$99 |
| GCP Skills Boost (1 mois pendant prep) | ~$30 |
| DL.AI specialization (3 mois Coursera) | ~$147 |
| HuggingFace | $0 |
| Anthropic / LangChain Academy | $0 |
| TOTAL | ~$280 |
→ ROI : si ça t'aide à closer 1 mission de plus à 5k€, ROI 18×.
⚠️ Le coût caché que ce tableau ne montre pas
Ce ~$280 est le coût comptable, pas le coût réel. Le vrai coût est le temps, et un senior le valorise. Reprenons le calcul en coût total de possession :
| Poste | Coût cash | Coût temps | Coût d'opportunité (≈70€/h) |
|---|---|---|---|
| GCP Leader (examen + prep 15h) | ~$129 | 15h | ~1050€ |
| DL.AI specialization (3 mois, ~30h) | ~$147 | 30h | ~2100€ |
| HuggingFace / Anthropic / LangChain | $0 | ~20h | ~1400€ |
| TOTAL réel | ~$280 | ~65h | ~4550€ |
Le coût réel du « pack cert » n'est pas 280$, c'est ~4800€ une fois le temps valorisé. Ça ne veut pas dire « ne fais rien » — ça veut dire sois chirurgical : prends la seule cert qui dérisque ta cible (GCP Leader OU AI-102, jamais les deux), et traite les cours gratuits comme du contenu d'apprentissage, pas comme une collection de badges. Le ROI 18× n'est vrai que si la cert est le facteur marginal qui débloque la mission — ce qui n'arrive que quand ton portfolio est déjà solide. Cert sans portfolio = badge décoratif à 4800€.
🏋️ Exercices
Ces exercices ne sont pas des QCM. Ils t'entraînent à défendre des décisions de carrière et d'architecture comme un senior — exactement ce qu'un client ou un comité technique va tester. Réponds par écrit, comme si tu devais convaincre un sceptique.
Exercice 1 — Construire ton business case de cert (chiffré)
Objectif : transformer « je devrais passer une cert » en une décision financière défendable. Écris un mini business case : choisis 1 cert, estime le coût cash + le coût d'opportunité (temps × ton TJM cible), estime la probabilité qu'elle débloque une mission et la valeur de cette mission, et calcule l'expected value. Conclus par GO/NO-GO chiffré. Indice/Solution : EV = P(débloque mission) × valeur_mission − (coût_cash + heures × taux_horaire). Si l'EV est négatif ou marginal, la vraie réponse est probablement « finis ton portfolio d'abord ». Un senior qui ne sait pas poser ce calcul ne sait pas arbitrer ses propres investissements.
Exercice 2 — Choisir la cert pour un client donné
Objectif : prouver que tu choisis la cert par fit-acheteur, pas par prestige. Pour chacun de ces 3 clients, choisis la cert ET justifie : (a) une fintech parisienne sur Azure qui veut un copilote interne, (b) une startup SF sur GCP/Vertex qui veut un agent RAG, (c) une ESN qui te place chez un grand compte AWS sur du Bedrock. Indice/Solution : (a) AI-102 — le fit Azure dérisque devant un comité bancaire ; (b) GCP Leader — fit Vertex + signal « je comprends la GenAI business » ; (c) AWS AI Practitioner — passe-filtre AWS suffisant, l'ESN veut juste cocher la case. La leçon : le « meilleur » choix change à chaque ligne. Une seule cert universelle n'existe pas.
Exercice 3 — Combler le gap cert → production
Objectif : identifier ce qu'une cert ne t'apprend pas, et le couvrir avec ton projet. Prends le programme officiel de GCP Generative AI Leader (ou AI-102). Pour chaque grand thème, écris une question d'entretien technique senior que la cert n'arme PAS — puis indique quelle partie de ton projet portfolio répond à cette question. Indice/Solution : la cert dit « Vertex AI fait du RAG » ; l'entretien demande « ton retrieval rate à 5%, comment tu débugges ? ». Mappe chaque thème vers un failure mode concret (chunking, eval, coût, injection). Si ton projet ne couvre pas un thème, c'est une lacune de portfolio à combler, pas une lacune de cert.
Exercice 4 — Démonter le piège du sceptique anti-cert
Objectif : défendre la cert face à un senior qui dit « les certs ça vaut rien ». Un lead dev expérimenté te dit : « Les certs c'est du bullshit, j'ai jamais eu besoin de ça. » Il a raison et tort. Écris une réponse de 5 lignes qui distingue les contextes où il a raison de ceux où il a tort. Indice/Solution : il a raison pour son contexte (salarié, réseau établi, on évalue son code). Il a tort pour le tien (freelance en reconversion, pas encore de réseau AI, le client ne peut pas évaluer ton code et achète de la réduction d'incertitude). La cert n'est pas une compétence, c'est un instrument de signalisation contextuel — sa valeur dépend de qui regarde. Savoir nommer ce contexte EST le signal de séniorité.
Exercice 5 — Casser puis réparer ta stratégie de cert
Objectif : stress-tester ton plan contre le scénario réaliste « je n'ai pas le temps ». Pose ton plan idéal (1 cert + 2 cours en 6 mois). Maintenant casse-le : tu décroches une mission au mois 3, tu n'as plus que 2h/semaine. Que coupes-tu, que gardes-tu, dans quel ordre, et pourquoi ? Indice/Solution : tu coupes les cours « contenu » (le portfolio en mission t'apprend plus vite), tu gardes UNIQUEMENT la cert si elle est demandée par un futur client ou par l'ESN qui te place. Si rien ne l'exige, tu reportes toute cert : une mission en cours est le meilleur signal possible, supérieur à n'importe quel badge. Le piège à éviter : finir la cert « parce que je l'avais commencée » (sunk cost fallacy) au lieu de capitaliser sur la mission.
Exercice 6 (hard) — Construire le credential qui n'existe pas
Objectif : créer un signal supérieur à une cert quand aucune cert ne couvre ton expertise. Aucune cert sérieuse ne valide « je sais construire des agents Claude en production ». Conçois le livrable de remplacement : qu'est-ce qui prouve mieux cette compétence à un client qu'un badge ? Spécifie le livrable, où il vit, et comment tu le rends découvrable. Indice/Solution : un repo public déployé (agent multi-tool avec retries typés, prompt caching, eval set, logging de coût) + un write-up technique (blog/README) qui explique tes tradeoffs (choix de modèle, coût/latence, failure modes) + une démo live. Ce trio bat n'importe quelle cert provider parce qu'il montre le raisonnement, pas juste la reconnaissance de vocabulaire. C'est exactement le signal que les seniors auto-construisent quand le marché des certs ne suit pas le rythme de la techno. La référence de code de la section « Le livrable qui bat le badge » est le point de départ exact de ce repo.
Exercice 7 (hard) — Défends le chiffre de coût devant un CFO sceptique
Objectif : chiffrer le coût réel d'un agent en prod et le défendre sans hand-waving — exactement ce qu'un client te demandera avant de signer. Ton agent de support traite 50 000 tickets/mois. Prompt système stable de 2 000 tokens, question moyenne 300 tokens, réponse moyenne 400 tokens, sur claude-opus-4-8 (5 $/25 $ par M tokens). Calcule le coût mensuel sans prompt caching, avec caching (lecture ≈ 0,1× input), puis avec bascule des 70% de tickets « faciles » vers claude-haiku-4-5 (1 $/5 $). Donne les trois chiffres et la décision d'architecture qui en découle. Indice/Solution : sans cache, l'input = (2000+300) tokens × 50k = 115M tokens input + 20M output ≈ 575 $ + 500 $ = ~1075 $/mois. Avec caching, le préfixe de 2000 tokens passe de 1× à ≈0,1× sur ~100M tokens cachés → tu économises ~450 $ d'input. Avec la bascule Haiku sur 70% du volume, l'essentiel des 35k tickets faciles passe de 5 $/25 $ à 1 $/5 $ → division par ~5 sur ce segment. Le piège à éviter : confondre input_tokens (le reste non caché) avec le total — vérifie toujours input_tokens + cache_read_input_tokens. La leçon senior : le coût en prod n'est pas « le prix du modèle », c'est une fonction de ton architecture de caching et de routing. Un certifié ne sait pas poser ce calcul ; c'est précisément pourquoi on te paie.
Exercice 8 (hard) — Casse la référence de code, puis répare-la
Objectif : prouver que tu sais reconnaître et corriger les failure modes que la référence « livrable qui bat le badge » prévient. Prends le squelette Python de la section « Le livrable qui bat le badge ». Introduis volontairement les quatre régressions suivantes, explique pour chacune ce qui casse en prod (pas juste « ça marche pas »), puis répare : (a) tu interpoles datetime.now() dans le bloc SYSTEM ; (b) tu remplaces thinking={"type": "adaptive"} par thinking={"type": "enabled", "budget_tokens": 8000} ; (c) tu remplaces asyncio.gather par une boucle for séquentielle await ; (d) tu supprimes le except RateLimitError. Indice/Solution : (a) un timestamp dans le préfixe invalide le prompt cache à chaque requête — cache_read_input_tokens tombe à 0 et ton coût explose silencieusement ; déplace tout ce qui varie après le dernier breakpoint. (b) budget_tokens est retiré sur Opus 4.8/4.7 et renvoie un HTTP 400 — l'appel ne part même pas ; le contrôle de profondeur passe par output_config.effort. (c) la boucle séquentielle fait que la latence du lot = la somme des latences au lieu du max → un lot de 200 tickets devient inutilisable. (d) sans handler 429, un pic de trafic fait remonter l'exception non gérée jusqu'à crasher la requête utilisateur au lieu de la dégrader proprement. Savoir nommer la conséquence prod de chacune, c'est la différence entre « j'ai vu ce code » et « je sais l'exploiter ».
🎤 En entretien
Questions que ce sujet invite côté senior — et la réponse d'une ligne.
« Pourquoi tu n'as qu'une seule cert / pas de cert AWS ML Engineer ? » Parce que je choisis mes certs par fit-acheteur et ROI temps, pas par accumulation : une cert qui ne dérisque pas ma cible client est un coût d'opportunité, pas un asset.
« Une cert GenAI prouve quoi exactement selon toi ? » Qu'on connaît le vocabulaire et le mapping de services — c'est un passe-filtre RH/ATS, pas une preuve qu'on sait gérer le coût, la latence, les failure modes du RAG ou la sécurité en prod ; ça, c'est le portfolio qui le prouve.
« Comment tu prouves une compétence pour laquelle aucune cert n'existe (ex: agents en prod) ? » Avec un livrable supérieur au badge : un repo déployé qui montre mes tradeoffs (choix de modèle, prompt caching, retries typés, eval set, logging de coût) plus un write-up — le raisonnement explicite bat la reconnaissance de vocabulaire.
« Le marché bouge plus vite que les certs. Comment tu restes à jour ? » Je traite les certs comme un signal ponctuel et la veille comme un process continu : docs des providers, cookbooks, et surtout des projets jetables où je teste les nouveautés — la cert date du jour de l'examen, le projet date d'aujourd'hui.
« Une cert te dit "un LLM résume du texte". En prod, combien coûte 1M de requêtes, et comment tu baisses ce chiffre ? » Le coût n'est pas le prix du modèle, c'est une fonction de mon architecture : prompt caching sur le préfixe stable (lecture ≈ 0,1× input), routing Opus → Haiku sur le volume facile, Batches API (-50%) sur le non-temps-réel, et logging de
resp.usagepour mesurer le réel plutôt que l'estimer — une cert n'apprend aucun de ces quatre leviers.
Mise à jour : 2026-06-16