Cas d'usage 1
Prototype rapide · POC
Valider une idée d'agent en moins de deux semaines.
Stack recommandée
CrewAI + Claude API + Mem0
CrewAI minimise le code pour des agents qui coopèrent, abstractions intuitives (Crew, Agent, Task), maturité v1.14 stable. Idéal quand l'objectif est de montrer une démo, pas de produire une architecture. Le code écrit ici sera très probablement réécrit pour la production, et c'est très bien : le POC sert à apprendre, pas à scaler.
À éviter ici · LangGraph (sur-architecturé pour 2 semaines), Temporal (infra disproportionnée), Mastra (réservé aux équipes TS-only).
Cas d'usage 2
Multi-agent production en santé régulée
PREDICARE, OCTOPUS, parcours patient. Signabilité obligatoire.
Stack recommandée
Pydantic AI ou LangGraph + Temporal ou DBOS + NATS + OTel
Pydantic AI pour la type-safety stricte qui simplifie l'audit. LangGraph si la logique de state machine est complexe. Le moteur durable (Temporal ou DBOS) porte le workflow signable conformément à la doctrine composite. NATS comme bus événementiel léger en environnement souverain. OTel pour l'observabilité réglementaire. Aucune de ces briques n'est négociable pour un environnement régulé.
À éviter ici · Frameworks sans state explicite (CrewAI), agents sans moteur durable (silent crashes inacceptables), LLM hosted sans audit de version (drift de comportement non maîtrisable).
Cas d'usage 3
Agent codant · coding agent
Génération de code, refactoring, exécution sandbox.
Stack recommandée
Claude Agent SDK + MCP servers + E2B sandbox
Le Claude Agent SDK (ex-Claude Code SDK, rebaptisé début 2026) est conçu autour de l'usage codant, optimisé pour Claude. Patterns Compact et WarpGrep qui économisent 60% de tokens. MCP servers pour outils de filesystem, git, search. E2B (ou Modal) pour l'exécution sandbox isolée. Pour un coding agent, c'est la combinaison qui domine en 2026.
À éviter ici · OpenAI Agents SDK si vous voulez Claude (incompatible logique). Exécution de code sans sandbox (risque de sécurité inacceptable).
Cas d'usage 4
Customer support haut volume
Milliers d'interactions par jour, latence et coût critiques.
Stack recommandée
Inngest ou Trigger.dev + Pydantic AI + Mem0 + routing model multi-tier
Inngest event-first natif avec `step.ai.infer` qui économise la compute serverless. Pydantic AI pour la structure typée des réponses. Mem0 pour la mémoire persistante par utilisateur. Model routing critique : small LLM (8B) en première intention, escalade vers Claude Sonnet ou GPT-5 sur les cas complexes. Vise un coût par interaction sous 2 centimes.
À éviter ici · Temporal (surdimensionné pour des sessions courtes), modèle unique premium (coût prohibitif à haut volume), agents long-running (les sessions doivent être courtes par design).
Cas d'usage 5
Recherche complexe multi-source
Veille, due diligence, synthèse longue.
Stack recommandée
LangGraph + Claude / GPT-5 + Zep + Graphiti + MCP search tools
LangGraph pour le state machine de recherche multi-étapes avec backtracking et branches parallèles. Modèles haut de gamme pour la qualité de raisonnement. Zep avec Graphiti pour la mémoire en knowledge graph temporel, supérieure au RAG vectoriel pur sur les requêtes multi-hop. MCP search tools (Brave, Tavily, ou search custom métier) pour les sources. Le pattern Anthropic orchestrator-worker s'applique bien ici.
À éviter ici · RAG vectoriel pur (insuffisant pour multi-hop), single-agent (perd la parallélisation), modèles small (qualité de synthèse insuffisante).
Cas d'usage 6
Agent autonome long-running
Surveillance, instruction de dossier, parcours patient sur des jours ou semaines.
Stack recommandée
Temporal + LangGraph ou Pydantic AI + NATS JetStream + BPMN signé
Temporal indispensable pour les workflows multi-jours avec reprise après crash, signals humains, et compensations. LangGraph ou Pydantic AI comme couche agentique invoquée comme activity. NATS JetStream pour les événements de progression et la coordination avec d'autres composants du SI. BPMN signé (Flowable, Camunda) pour les règles d'éligibilité et de gouvernance qui restent déterministes. La saga devient explicite, ce qui rend le système auditable.
À éviter ici · Agents sans durable execution (perte d'état au premier crash), saga implicite (cauchemar de debug), modèles hosted sans seed pinning (rejeu impossible).