Frameworks agentiques 2026
matrice de décision

Douze frameworks, douze critères, six cas d'usage canoniques. Évaluation tranchée, validity domain explicite, et le minimum d'illusions sur la pérennité du paysage.

REF TI-MATRIX-AGT-2026.05

DATE MAI 2026

SUITE DE PL.01 → PL.05

USAGE CTO / COMEX / RFP

VALIDITY DOMAIN Matrice destinée à orienter un choix de framework pour un nouveau projet agentique. Calibrée pour environnements régulés mais informative pour tout contexte production. Aucune entrée du tableau ne reste valide plus d'un trimestre : le paysage évolue, refaire l'exercice tous les six mois est une discipline, pas une option.

MÉTHODOLOGIE Scoring relatif sur quatre niveaux. ◆ excellent (référence du marché). ◇ adapté (production-ready avec compromis acceptables). ◌ partiel (utilisable sur sous-périmètre, ou capacité immature). − non couvert ou inadapté. Cliquer un framework pour son verdict détaillé, survoler une cellule pour le rationnel du score.

I · Matrice Douze frameworks × douze critères survoler · cliquer pour détail

FRAMEWORK	C1MCP natif	C2État explicite	C3Durable execution	C4Multi- agent	C5Tool ecosystem	C6Type safety	C7OTel natif	C8Modèle portable	C9Maturité prod	C10Licence OSS	C11Apte composite	C12EDA native

◆ Excellent (référence)

◇ Adapté (compromis OK)

◌ Partiel / immature

− Non couvert

Tout score est relatif au paysage 2026, et révisable au trimestre.

II · Cas d'usage Six recommandations tranchées stack · rationale · pièges

Cas d'usage 1

Prototype rapide · POC

Valider une idée d'agent en moins de deux semaines.

Stack recommandée

CrewAI + Claude API + Mem0

CrewAI minimise le code pour des agents qui coopèrent, abstractions intuitives (Crew, Agent, Task), maturité v1.14 stable. Idéal quand l'objectif est de montrer une démo, pas de produire une architecture. Le code écrit ici sera très probablement réécrit pour la production, et c'est très bien : le POC sert à apprendre, pas à scaler.

À éviter ici · LangGraph (sur-architecturé pour 2 semaines), Temporal (infra disproportionnée), Mastra (réservé aux équipes TS-only).

Cas d'usage 2

Multi-agent production en santé régulée

PREDICARE, OCTOPUS, parcours patient. Signabilité obligatoire.

Stack recommandée

Pydantic AI ou LangGraph + Temporal ou DBOS + NATS + OTel

Pydantic AI pour la type-safety stricte qui simplifie l'audit. LangGraph si la logique de state machine est complexe. Le moteur durable (Temporal ou DBOS) porte le workflow signable conformément à la doctrine composite. NATS comme bus événementiel léger en environnement souverain. OTel pour l'observabilité réglementaire. Aucune de ces briques n'est négociable pour un environnement régulé.

À éviter ici · Frameworks sans state explicite (CrewAI), agents sans moteur durable (silent crashes inacceptables), LLM hosted sans audit de version (drift de comportement non maîtrisable).

Cas d'usage 3

Agent codant · coding agent

Génération de code, refactoring, exécution sandbox.

Stack recommandée

Claude Agent SDK + MCP servers + E2B sandbox

Le Claude Agent SDK (ex-Claude Code SDK, rebaptisé début 2026) est conçu autour de l'usage codant, optimisé pour Claude. Patterns Compact et WarpGrep qui économisent 60% de tokens. MCP servers pour outils de filesystem, git, search. E2B (ou Modal) pour l'exécution sandbox isolée. Pour un coding agent, c'est la combinaison qui domine en 2026.

À éviter ici · OpenAI Agents SDK si vous voulez Claude (incompatible logique). Exécution de code sans sandbox (risque de sécurité inacceptable).

Cas d'usage 4

Customer support haut volume

Milliers d'interactions par jour, latence et coût critiques.

Stack recommandée

Inngest ou Trigger.dev + Pydantic AI + Mem0 + routing model multi-tier

Inngest event-first natif avec `step.ai.infer` qui économise la compute serverless. Pydantic AI pour la structure typée des réponses. Mem0 pour la mémoire persistante par utilisateur. Model routing critique : small LLM (8B) en première intention, escalade vers Claude Sonnet ou GPT-5 sur les cas complexes. Vise un coût par interaction sous 2 centimes.

À éviter ici · Temporal (surdimensionné pour des sessions courtes), modèle unique premium (coût prohibitif à haut volume), agents long-running (les sessions doivent être courtes par design).

Cas d'usage 5

Recherche complexe multi-source

Veille, due diligence, synthèse longue.

Stack recommandée

LangGraph + Claude / GPT-5 + Zep + Graphiti + MCP search tools

LangGraph pour le state machine de recherche multi-étapes avec backtracking et branches parallèles. Modèles haut de gamme pour la qualité de raisonnement. Zep avec Graphiti pour la mémoire en knowledge graph temporel, supérieure au RAG vectoriel pur sur les requêtes multi-hop. MCP search tools (Brave, Tavily, ou search custom métier) pour les sources. Le pattern Anthropic orchestrator-worker s'applique bien ici.

À éviter ici · RAG vectoriel pur (insuffisant pour multi-hop), single-agent (perd la parallélisation), modèles small (qualité de synthèse insuffisante).

Cas d'usage 6

Agent autonome long-running

Surveillance, instruction de dossier, parcours patient sur des jours ou semaines.

Stack recommandée

Temporal + LangGraph ou Pydantic AI + NATS JetStream + BPMN signé

Temporal indispensable pour les workflows multi-jours avec reprise après crash, signals humains, et compensations. LangGraph ou Pydantic AI comme couche agentique invoquée comme activity. NATS JetStream pour les événements de progression et la coordination avec d'autres composants du SI. BPMN signé (Flowable, Camunda) pour les règles d'éligibilité et de gouvernance qui restent déterministes. La saga devient explicite, ce qui rend le système auditable.

À éviter ici · Agents sans durable execution (perte d'état au premier crash), saga implicite (cauchemar de debug), modèles hosted sans seed pinning (rejeu impossible).

PRINCIPE I

Le bon framework dépend du cas, du contexte, et de la maturité de l'équipe. Aucun ne domine universellement.

PRINCIPE II

Le framework de construction et le moteur d'exécution durable sont deux choix distincts. Les confondre est la source la plus fréquente d'erreurs d'architecture.

PRINCIPE III

Aucune entrée de cette matrice n'est neutre sur l'aptitude à porter la doctrine composite. Le critère C11 est celui que la plupart des frameworks de marché négligent.