Axe I · D3
Cycle de vie et dégradation des systèmes
Thèse. La dégradation n'est pas un accident à éviter mais un régime de fonctionnement à gouverner. Tout système IA en production dérive ; la question opérationnelle est la latence entre dérive et revalidation, pas l'existence de la dérive.
La distinction qui tranche
Disponibilité du modèle vs fiabilité du système. Un modèle peut être disponible 99,99 % du temps tout en étant structurellement non fiable depuis trois mois. Le SLO de l'un ne couvre pas l'autre.
Erreur typique
Importer la doctrine SRE sans la transposer. MTTR, error budget et post-mortem fonctionnent pour des systèmes déterministes ; ils ne capturent ni la dérive distributionnelle, ni la dérive concept, ni la dérive de population. Un dashboard qui montre 200 OK pendant qu'un modèle prédit faux passe l'audit technique et rate l'audit clinique.
Signaux de défaillance
Pas de baseline statistique des inputs en production (PSI, KS, Wasserstein non calculés). Aucune procédure de revalidation déclenchable hors release planifiée. Absence d'historique long de prédictions calibrées : il faut au moins six mois pour qu'une dérive concept devienne lisible. Aucune politique de withhold documentée en cas de dépassement de seuil. Confusion entre alerte d'infrastructure et alerte de fiabilité décisionnelle dans le même canal d'astreinte.
Référentiels mobilisés
ISO/IEC 25059 (qualité des systèmes IA, extension de 25010) ; FDA Predetermined Change Control Plans, Final Guidance, décembre 2024 ; EMA Reflection paper on the use of AI in the medicinal product lifecycle (2024) ; littérature sur le concept drift, notamment Gama et al., A survey on concept drift adaptation, ACM CSur, 2014 ; MDCG 2019-11 pour la qualification SaMD.
Terrain d'implémentation
ToxTwin V2.4 implémente une calibration par régression isotonique, un applicability domain monitoré, un holdout figé (SHA256 publié) servant de référentiel de stabilité versionnelle. La trajectoire V1.3, V2.3, V2.4, incluant la correction du bug GINConv/GINEConv et le refactor hexagonal, constitue une chronique documentée de dégradation et revalidation. L'instance illustre une discipline de versionnement-validation ; elle ne prouve pas que cette discipline soit suffisante en environnement réglementé sans procédure formelle de PCCP côté autorité de santé.
Articulation
Continuum logique avec D1 : l'architecture gouvernable au déploiement doit rester gouvernable dans le temps, sinon elle ne l'a jamais été. Continuum avec D7, dont la métrologie alimente le système de détection.