Axe I · D1

Architecture des systèmes IA à l'échelle

Thèse. L'architecture à l'échelle ne se mesure pas à la performance du modèle, mais à la capacité du système à rester gouvernable, observable et réversible une fois confronté aux conditions opérationnelles.

La distinction qui tranche

Architecture de modèle vs architecture de système. La première produit un AUC ; la seconde produit un dispositif déployable. Confondre les deux est l'erreur structurelle dominante des projets IA en environnement régulé.

Erreur typique

Traiter le passage à l'échelle comme un problème d'infrastructure (GPU, throughput, latence) alors qu'il est d'abord un problème d'intégration : couplage au SI métier, supervision humaine effective, plan de bascule, traçabilité décisionnelle séparée du calcul du modèle. Un système qui scale au sens MLOps peut être structurellement non-déployable au sens MDR ou EU AI Act.

Signaux de défaillance

Aucune procédure documentée de désactivation en moins de 24 h sans rupture de service métier. Couplage fort entre runtime du modèle et système d'information aval, sans port d'isolation. Journal d'audit qui confond inférence et décision, donc impossible à produire en cas de litige. SLO unique sur la disponibilité, aucun SLO distinct sur la fiabilité décisionnelle. Absence de politique explicite de withhold en sortie de domaine d'applicabilité.

Référentiels mobilisés

ISO/IEC 42001 (AI management system) ; NIST AI RMF 1.0 ; ISO/IEC 5469 (functional safety, AI elements) ; pour le médical, IEC 62304 et IEC 82304-1 ; EU AI Act art. 9 (risk management) et art. 15 (accuracy, robustness, cybersecurity).

Terrain d'implémentation

TweenMe a fait l'objet d'un refactor hexagonal explicitant quatre ports de fiabilité (calibration, applicability domain, traceability, decision policy) et trois ports fonctionnels. Le port decision_policy retient le résultat lorsque is_in_domain = False plutôt que de le diffuser dégradé. Cette instance illustre la séparation inférence/décision ; elle ne prouve pas que tout système IA doive adopter cette architecture, mais elle démontre qu'un AUC publiable et un système gouvernable ne sont pas le même objet d'ingénierie.

Articulation

Voir l'article Architecture hexagonale pour l'inférence (Twingital Institute, mars 2026) pour la doctrine, et le domaine D3 Cycle de vie et dégradation pour le pendant temporel. Une architecture gouvernable au déploiement reste à re-gouverner à chaque dérive.