Twingital Institute · Matrice de décision · Mai 2026

Frameworks agentiques 2026
matrice de décision

Douze frameworks, douze critères, six cas d'usage canoniques. Évaluation tranchée, validity domain explicite, et le minimum d'illusions sur la pérennité du paysage.

REF TI-MATRIX-AGT-2026.05
DATE MAI 2026
SUITE DE PL.01 → PL.05
USAGE CTO / COMEX / RFP
VALIDITY DOMAIN Matrice destinée à orienter un choix de framework pour un nouveau projet agentique. Calibrée pour environnements régulés mais informative pour tout contexte production. Aucune entrée du tableau ne reste valide plus d'un trimestre : le paysage évolue, refaire l'exercice tous les six mois est une discipline, pas une option.
MÉTHODOLOGIE Scoring relatif sur quatre niveaux. ◆ excellent (référence du marché). ◇ adapté (production-ready avec compromis acceptables). ◌ partiel (utilisable sur sous-périmètre, ou capacité immature). − non couvert ou inadapté. Cliquer un framework pour son verdict détaillé, survoler une cellule pour le rationnel du score.
I · Matrice Douze frameworks × douze critères
FRAMEWORK C1MCP
natif
C2État
explicite
C3Durable
execution
C4Multi-
agent
C5Tool
ecosystem
C6Type
safety
C7OTel
natif
C8Modèle
portable
C9Maturité
prod
C10Licence
OSS
C11Apte
composite
C12EDA
native
Excellent (référence)
Adapté (compromis OK)
Partiel / immature
Non couvert
Tout score est relatif au paysage 2026, et révisable au trimestre.
II · Cas d'usage Six recommandations tranchées
Cas d'usage 1
Prototype rapide · POC
Valider une idée d'agent en moins de deux semaines.
Stack recommandée
CrewAI + Claude API + Mem0
CrewAI minimise le code pour des agents qui coopèrent, abstractions intuitives (Crew, Agent, Task), maturité v1.14 stable. Idéal quand l'objectif est de montrer une démo, pas de produire une architecture. Le code écrit ici sera très probablement réécrit pour la production, et c'est très bien : le POC sert à apprendre, pas à scaler.
À éviter ici · LangGraph (sur-architecturé pour 2 semaines), Temporal (infra disproportionnée), Mastra (réservé aux équipes TS-only).
Cas d'usage 2
Multi-agent production en santé régulée
PREDICARE, OCTOPUS, parcours patient. Signabilité obligatoire.
Stack recommandée
Pydantic AI ou LangGraph + Temporal ou DBOS + NATS + OTel
Pydantic AI pour la type-safety stricte qui simplifie l'audit. LangGraph si la logique de state machine est complexe. Le moteur durable (Temporal ou DBOS) porte le workflow signable conformément à la doctrine composite. NATS comme bus événementiel léger en environnement souverain. OTel pour l'observabilité réglementaire. Aucune de ces briques n'est négociable pour un environnement régulé.
À éviter ici · Frameworks sans state explicite (CrewAI), agents sans moteur durable (silent crashes inacceptables), LLM hosted sans audit de version (drift de comportement non maîtrisable).
Cas d'usage 3
Agent codant · coding agent
Génération de code, refactoring, exécution sandbox.
Stack recommandée
Claude Agent SDK + MCP servers + E2B sandbox
Le Claude Agent SDK (ex-Claude Code SDK, rebaptisé début 2026) est conçu autour de l'usage codant, optimisé pour Claude. Patterns Compact et WarpGrep qui économisent 60% de tokens. MCP servers pour outils de filesystem, git, search. E2B (ou Modal) pour l'exécution sandbox isolée. Pour un coding agent, c'est la combinaison qui domine en 2026.
À éviter ici · OpenAI Agents SDK si vous voulez Claude (incompatible logique). Exécution de code sans sandbox (risque de sécurité inacceptable).
Cas d'usage 4
Customer support haut volume
Milliers d'interactions par jour, latence et coût critiques.
Stack recommandée
Inngest ou Trigger.dev + Pydantic AI + Mem0 + routing model multi-tier
Inngest event-first natif avec `step.ai.infer` qui économise la compute serverless. Pydantic AI pour la structure typée des réponses. Mem0 pour la mémoire persistante par utilisateur. Model routing critique : small LLM (8B) en première intention, escalade vers Claude Sonnet ou GPT-5 sur les cas complexes. Vise un coût par interaction sous 2 centimes.
À éviter ici · Temporal (surdimensionné pour des sessions courtes), modèle unique premium (coût prohibitif à haut volume), agents long-running (les sessions doivent être courtes par design).
Cas d'usage 5
Recherche complexe multi-source
Veille, due diligence, synthèse longue.
Stack recommandée
LangGraph + Claude / GPT-5 + Zep + Graphiti + MCP search tools
LangGraph pour le state machine de recherche multi-étapes avec backtracking et branches parallèles. Modèles haut de gamme pour la qualité de raisonnement. Zep avec Graphiti pour la mémoire en knowledge graph temporel, supérieure au RAG vectoriel pur sur les requêtes multi-hop. MCP search tools (Brave, Tavily, ou search custom métier) pour les sources. Le pattern Anthropic orchestrator-worker s'applique bien ici.
À éviter ici · RAG vectoriel pur (insuffisant pour multi-hop), single-agent (perd la parallélisation), modèles small (qualité de synthèse insuffisante).
Cas d'usage 6
Agent autonome long-running
Surveillance, instruction de dossier, parcours patient sur des jours ou semaines.
Stack recommandée
Temporal + LangGraph ou Pydantic AI + NATS JetStream + BPMN signé
Temporal indispensable pour les workflows multi-jours avec reprise après crash, signals humains, et compensations. LangGraph ou Pydantic AI comme couche agentique invoquée comme activity. NATS JetStream pour les événements de progression et la coordination avec d'autres composants du SI. BPMN signé (Flowable, Camunda) pour les règles d'éligibilité et de gouvernance qui restent déterministes. La saga devient explicite, ce qui rend le système auditable.
À éviter ici · Agents sans durable execution (perte d'état au premier crash), saga implicite (cauchemar de debug), modèles hosted sans seed pinning (rejeu impossible).
PRINCIPE I
Le bon framework dépend du cas, du contexte, et de la maturité de l'équipe. Aucun ne domine universellement.
PRINCIPE II
Le framework de construction et le moteur d'exécution durable sont deux choix distincts. Les confondre est la source la plus fréquente d'erreurs d'architecture.
PRINCIPE III
Aucune entrée de cette matrice n'est neutre sur l'aptitude à porter la doctrine composite. Le critère C11 est celui que la plupart des frameworks de marché négligent.