Projet technique Étude de cas

TweenMe — Générateur universel de jumeaux numériques de santé

Premier générateur « Do It Yourself » de jumeaux numériques pour le secteur de la santé

Qualees · VP R&D Engineering & CPO · 2023–présent ·France

Contexte

Les jumeaux numériques en santé restent artisanaux, spécifiques, coûteux et réservés aux grands acteurs disposant de gros volumes de données.

Approche

Conception d'un générateur universel de jumeaux numériques : plateforme permettant à l'expert métier de créer ses propres jumeaux sans prérequis algorithmique, à partir de données compactes.

Le problème

Les jumeaux numériques en santé sont aujourd’hui artisanaux : chaque jumeau est conçu pour un usage spécifique, nécessite d’importants volumes de données, des équipes de data science dédiées, et des investissements lourds. Le résultat est souvent un modèle à usage restreint, au domaine d’utilisation limité et à la qualité de résultat aléatoire. Seuls les grands acteurs peuvent se le permettre.

L’approche TweenMe

TweenMe est un générateur universel de jumeaux numériques : à partir d’un même moteur, la plateforme peut traiter autant de jeux de données que nécessaire pour créer autant de jumeaux numériques que souhaités, dans des domaines variés (épidémiologie, recherche médicale, R&D pharmaceutique, modélisation économique).

L’architecture repose sur un réseau d’IA spécifiques reconfigurables plutôt qu’un grand modèle unique. Le pipeline comprend cinq modules : l’Ontology Modeler (qualification et structuration du patrimoine de données), le Smart Data Fertilizer (enrichissement dimensionnel et augmentation volumétrique par IA générative limitant les hallucinations statistiques), la Bakery (packaging du modèle dans une application utilisable par l’expert métier), le DT Show Room (utilisation des modèles produits en inférence via une interface de type Open WebUI ou FastAPI), et le Cockpit (centre de commande des différents pipelines en cours d’exécution).

Résultats

L’étude OCTOPUS (mNSCLC BRAF V600E, cohorte N=184) démontre les capacités du pipeline sur un problème HDLSS (High Dimension, Low Sample Size). La modélisation de survie par SurvTRACE (transformer attention-based) et la validation TSTR (Train on Synthetic, Test on Real) atteignent une ML Utility de 95,2 %. Un simulateur contrefactuel permet l’exploration de scénarios thérapeutiques alternatifs. Ces travaux sont sélectionnés dans le top 5 % des posters ISPOR Europe 2025.

Les enseignements

TweenMe démontre qu’il est possible d’industrialiser la production de jumeaux numériques en santé avec une approche fondamentalement différente : travailler sur des données compactes, qualifier avant de modéliser, et emballer le résultat dans une interface accessible à l’expert métier non familier de l’IA. L’approche downscale (peu de données, qualification poussée) s’oppose au paradigme dominant du upscale (beaucoup de données, qualification minimale).


Vidéos et présentations

Introduction à TweenMe

▶ Regarder sur YouTube →

Pitch AFCRO 2024 — Forum d’Innovation en Recherche Clinique

Pitch elevator au Forum AFCROs, 25 janvier 2024. Première présentation publique du concept de générateur universel de jumeaux numériques.

▶ Regarder sur YouTube → · Lire la fiche →

Présentation compétitive AFCRO 2025 — TweenMe était un concept en 2024, c’est désormais une plateforme opérationnelle en 2025

▶ Regarder sur YouTube → · Lire la fiche →


Publications associées

Pitch AFCRO 2024 — Forum d'Innovation en Recherche Clinique — Première présentation publique de TweenMe, concept de générateur universel, architecture réseau d'IA reconfigurables.
Présentation AFCRO 2025 — TweenMe, plateforme opérationnelle — Après le concept en 2024, présentation de la plateforme TweenMe opérationnelle : 5 modules (Ontology Modeler, Smart Data Fertilizer, Bakery, DT Show Room, Cockpit), 4 POC payants.
ISPOR Europe 2025 — Poster #8471 · TVAE Synthetic NSCLC (Top 5 %) — Génération et validation de patients synthétiques haute fidélité par TVAE. ML Utility 0.907, corrélation 0.935. Pierre Fabre / Qualees.
ISPOR Europe 2025 — Poster #8400 · Ensemble ML — TweenMe Single/Best/Ensemble : optimisation bayésienne OptiTween, Accuracy 99.50 %, ROC AUC 99.97 %.