82 %. La régulation IA en assurance santé et la variable qu'elle refuse de mesurer

Le chiffre, dans son cadre

L’étude Mello, Trotsyuk, Djiberou Mahamadou, Char publiée dans Health Affairs en janvier 2026, The AI Arms Race in Health Insurance Utilization Review, livre un chiffre que la doctrine régulatoire devra digérer : 81 % des refus d’autorisation préalable émis dans les plans Medicare Advantage et appelés par les bénéficiaires sont infirmés en révision. Les données 2024 publiées par KFF à partir des reportings CMS donnent 80,7 % d’appels partiellement ou totalement infirmés sur 4,1 millions de refus. Ordre de grandeur stable : environ quatre appels sur cinq aboutissent à infirmation. Sur 4,1 millions de refus, 11,5 % seulement font l’objet d’un appel ; le complaint Estate of Lokken v. UnitedHealth Group allègue 0,2 % dans le segment post-acute care géré par nH Predict. Les deux chiffres ne mesurent pas la même chose ; ils décrivent la même structure à deux résolutions. Sur 4,1 millions de refus, 3,63 millions ne sont jamais contestés. Combien auraient été infirmés s’ils l’avaient été ? Le système ne le mesure pas, et c’est précisément l’argument central : cette inobservabilité n’est pas un accident méthodologique, c’est une propriété structurelle du dispositif.

La thèse, et la précision doctrinale qui la renforce

La régulation IA dans l’assurance santé américaine n’opère pas par garantie de qualité algorithmique. Elle opère par friction d’usage. La conformité réglementaire du système est compatible avec un taux élevé de décisions initiales non soutenues après contestation, dès lors que le coût d’appel pour le bénéficiaire reste prohibitif. Le terme de calibration suggère une intention centralisée — assertion plus forte rhétoriquement, plus faible empiriquement. La position défendable est plus fine : le système n’a pas besoin d’être conçu pour le non-recours pour fonctionner par lui. Une optimisation distribuée de l’industrie est plus difficile à régler qu’une intention centralisée, précisément parce qu’elle n’a pas d’auteur identifiable. Et un système qui n’a pas d’auteur n’a pas non plus de responsable régulatoire désigné. Le système est structurellement équivalent à un calibrage : il fonctionne comme si calibré, sans qu’il soit nécessaire de prouver une intention centrale. Cette nuance ne l’affaiblit pas — elle déplace ce qui est régulable, de l’intention vers la propriété structurelle.

Friction : trois composantes non substituables

Pour qu’un bénéficiaire passe du refus à l’infirmation, il faut franchir une chaîne d’obstacles documentés. La friction se décompose en trois composantes qu’il importe de distinguer sans préjuger de leur poids relatif : friction administrative (délais, formulaires, niveaux d’appel, formats de soumission), friction informationnelle (fragmentation du dossier clinique, coût de récupération, traduction en grammaire d’utilization review, certification de la trajectoire), friction cognitive (compréhension du droit au recours, mobilisation du prescripteur, épuisement du bénéficiaire, asymétrie de littératie face à la lettre de refus). Réduire l’une ne réduit pas mécaniquement les autres. Pour les soins post-aigus, le délai d’appel excède souvent la fenêtre clinique pertinente : l’appel arrive après que le besoin a cessé d’exister. Côté soignants, le tableau est complémentaire : 12 heures hebdomadaires en moyenne consacrées aux PA selon l’AMA, 19,7 milliards de dollars par an pour les providers à plaider des refus.

L’inobservabilité comme variable politique

Un taux d’erreur observable est régulable. Un taux d’erreur non observable ne l’est pas. Le système actuel ne mesure pas combien de refus non contestés auraient été réversibles après contestation, et il ne le mesure pas par construction : la non-contestation est précisément l’événement qui empêche la mesure. Une norme de qualité ne peut s’appliquer qu’à ce qui se laisse observer ; elle ne s’applique donc qu’aux 11,5 % de refus contestés, et dans ce segment, à un sous-ensemble biaisé par sélection vers les cas où la contestation paraissait viable. La part régulatoirement mesurable se concentre sur des cas marginaux ; le réel échappe à l’instrument qu’on lui applique. Le défaut régulatoire n’est pas que le modèle refuse trop ; le défaut est que le système ne mesure pas le coût nécessaire pour transformer un refus en objet contestable. La question n’est pas seulement qui décide, c’est qui détient l’architecture de preuve au moment du refus.

La friction ex post n’est pas le tout du dispositif

L’autre moitié du système est la dissuasion ex ante : la non-demande de soins anticipée. Ce que d’anciens cadres de l’industrie nomment le sentinel effect désigne le médecin qui, ayant intégré le coût statistique d’une demande susceptible d’être refusée, cesse de la formuler ; le bénéficiaire qui, ayant intégré l’historique de refus dans sa catégorie, ne demande plus l’intervention. Aucune de ces non-demandes n’apparaît dans les statistiques de PA, parce qu’il n’existe pas de catégorie comptable pour les soins jamais demandés. Le système ne se contente pas de refuser : il modifie la distribution des demandes. Le rapport entre demandes initiales et demandes potentielles n’est jamais publié — parce qu’il n’est jamais calculé. À chaque étage du dispositif, le segment politiquement décisif est celui qui ne laisse pas de trace.

L’économie politique du non-recours, sous contraintes

L’équation simplifiée du rendement, Profit ≈ f(refus × (1 − taux_appel × taux_infirmation)), supposait implicitement que maximiser les refus est toujours optimal. Ce n’est pas le cas. Plusieurs contraintes pèsent sur l’équilibre : Medical Loss Ratio (la règle ACA imposant qu’une part minimale des primes soit reversée en soins), coût administratif, risque juridique (class actions à la Lokken), risque réputationnel et CMS Star Ratings. L’équation pertinente est marginale et sous contraintes. À cet équilibre, le non-recours reste un facteur stabilisateur central : un refus non contesté est, toutes choses égales par ailleurs, le refus économiquement le plus favorable — il ne génère ni jurisprudence ni précédent, et n’expose pas au risque réputationnel. C’est cet équilibre qui se reproduit, sans qu’aucun acteur n’ait à le concevoir comme tel.

Le pattern : Lokken, PxDx, EviCore — et la régulation qui ne touche pas l’équilibre

Trois affaires illustrent le motif, à statut probatoire différent. Estate of Lokken v. UnitedHealth Group : le complaint allègue 90 % d’erreur et 0,2 % d’appel sur nH Predict (naviHealth, 2,5 milliards en 2020) ; l’investigation du Senate PSI (octobre 2024) — constat publiquement établi distinct de l’allégation — documente que le taux de refus de UnitedHealth en post-acute care est passé de 8,7 % à 22,7 % entre 2019 et 2022, après déploiement de nH Predict. Kisting-Leung v. Cigna : ProPublica (mars 2023) établit que PxDx a rejeté plus de 300 000 demandes en deux mois à 1,2 seconde par décision. EviCore by Evernorth : argumentaire commercial public promettant 3 dollars d’économie pour 1 dollar dépensé (source primaire) ; le seuil paramétrable interne the dial relève d’éléments d’enquête sur sources testimoniales. Le motif est commun : un dispositif algorithmique optimisé pour un volume de refus excédant la capacité humaine d’examen, adossé à un mécanisme d’appel dont la friction garantit l’usage marginal. Le levier régulatoire qui compte n’est pas la qualité de la décision initiale : une revue humaine en aval ne change pas l’équilibre tant que la revue n’est mobilisée que par 11,5 % des refusés. Pire : l’exigence de motivation spécifique a deux effets opposés — pression baissière sur le volume de refus, mais hausse symétrique du coût de réfutation pour qui n’a pas les ressources documentaires. Si l’effet net penche du second côté, la régulation aggrave la friction qu’elle entend corriger.

Le concept : déshérence administrative, et ce qu’il faudrait réguler

La déshérence médicale désigne la situation où le patient est laissé sans suivi par défaut de chaîne de soins. Le 82 %, le 11,5 %, le 0,2 % décrivent une déshérence administrative : la situation où le bénéficiaire est laissé sans recours par défaut de chaîne de contestation. Ce n’est pas le même phénomène, mais c’est la même structure : le système fonctionne parce que l’usager ne peut pas en négocier les sorties. Deux concepts annexes : le biais de périmètre (la régulation évalue ce qu’elle nomme, pas ce qui produit l’effet — la qualité de l’IA est régulée, la qualité de la friction ne l’est pas) ; la dette de gouvernabilité (un système peut être conforme localement et ingouvernable globalement). Que faudrait-il réguler ? Le coût de reconstruction probatoire — composante informationnelle de la friction. Concrètement : portabilité effective du dossier clinique, accès en temps réel aux données nécessaires à la contestation, pré-instruction automatique d’un appel par le système qui a produit le refus, transparence sur les seuils paramétriques du modèle de denial, publication non agrégée des taux de refus et d’infirmation par cohorte clinique. La FHIR Prior Authorization API prévue par CMS pour 2027 va dans la bonne direction, à condition que son périmètre couvre la contestation et pas seulement la soumission. Aucune de ces mesures n’agit sur la qualité du modèle — toutes agissent sur la mécanique informationnelle de la reconstruction de preuve. Le 82 % n’est pas une statistique de défaillance ; c’est l’expression chiffrée d’une zone hors métrique, et d’un système auto-stabilisé par l’inobservabilité qu’il entretient. Reste à savoir qui paie pour qu’il se reproduise. La réponse arithmétique est connue.

Sources principales

Mello M.M., Trotsyuk A.A., Djiberou Mahamadou A.J., Char D., The AI Arms Race in Health Insurance Utilization Review, Health Affairs 2026;45(1):6-13. DOI: 10.1377/hlthaff.2025.00897. — Fuglesten Biniek J. et al., Medicare Advantage Insurers Made Nearly 53 Million Prior Authorization Determinations in 2024, KFF, janvier 2026. — Estate of Gene B. Lokken et al. v. UnitedHealth Group, Inc., 0:23-cv-03514 (D. Minn.) ; ordre de discovery du 9 mars 2026, 2026 WL 658883. — Kisting-Leung v. Cigna Corporation, 2:23-cv-01477 (E.D. Cal.). — ProPublica & Capitol Forum, Inside the Company Helping America’s Biggest Health Insurers Deny Coverage, octobre 2024 (EviCore). — U.S. Senate Permanent Subcommittee on Investigations, Refusal of Recovery, octobre 2024. — CMS Interoperability and Prior Authorization Final Rule, CMS-0057-F. — CMMI, WISeR Model Operational Guide, 1er janvier 2026. — California SB 1120 (en vigueur 1er janvier 2025). — Sunstein C.R., Sludge: What Stops Us From Getting Things Done and What to Do About It, MIT Press, 2021.

Lire le document

↓ Télécharger en PDF

Ce qu'il faut retenir

80,7 % des refus d'autorisation préalable Medicare Advantage appelés sont infirmés en révision (KFF/CMS, 2024). Sur 4,1 millions de refus, 11,5 % seulement sont contestés ; 0,2 % dans le complaint Lokken sur post-acute care. Ce n'est pas un défaut, c'est un point de fonctionnement.
La régulation IA en assurance santé US n'opère pas par garantie de qualité algorithmique. Elle opère par friction d'usage. La conformité réglementaire est compatible avec un taux élevé de décisions initiales non soutenues, dès lors que le coût d'appel pour le bénéficiaire reste prohibitif.
Le système n'a pas besoin d'être conçu pour le non-recours pour fonctionner par lui. Optimisation distribuée de l'industrie, pas commandement central : structurellement équivalent à un calibrage, sans qu'il soit nécessaire de prouver une intention centrale.
Trois composantes de friction non substituables : administrative, informationnelle, cognitive. Réduire l'une ne réduit pas mécaniquement les autres ; la distinction conditionne la portée de toute intervention régulatoire.
Inobservabilité comme variable politique : un taux d'erreur non observable n'est pas régulable. La non-contestation est précisément l'événement qui empêche la mesure ; l'angle mort est la condition de stabilité du système.
Dissuasion ex ante (sentinel effect) précède friction ex post. Le segment politiquement décisif est celui qui ne laisse pas de trace : refus non contestés, demandes jamais formulées.
Concept doctrinal proposé : la déshérence administrative, distincte de la déshérence médicale mais structurellement analogue. L'usager est laissé sans recours par défaut de chaîne de contestation, comme il l'est sans suivi par défaut de chaîne de soin.
Le levier régulatoire qui compte est le coût de reconstruction probatoire — composante informationnelle de la friction —, non la qualité du modèle. La FHIR Prior Authorization API (CMS, 2027) va dans la bonne direction à condition que son périmètre couvre la contestation et pas seulement la soumission.