Article de conférence · PHUSE 2024 · Paper CM05 · Sciences de la vie & IA

GPTs and LLMs in the context of Life Sciences and Clinical Trials

Jérôme Vétillard (Microsoft) & Mark Lambrecht (SAS) · 16 pages · Anglais

L'IA générative — GANs, VAEs et transformers — redessine la chaîne de valeur des sciences de la vie, de la conception moléculaire à l'automatisation des données cliniques. Mais un déploiement responsable exige explicabilité, conformité réglementaire et supervision humaine à chaque étape.

Résumé

Cet article, présenté à la conférence PHUSE 2024, propose une revue approfondie des technologies d'IA générative et de leurs applications dans la chaîne de valeur des sciences de la vie. Les auteurs examinent trois architectures fondamentales — Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs) et Transformers — et cartographient leurs capacités sur des cas d'usage concrets en découverte de médicaments, génomique & protéomique, médecine personnalisée, automatisation des données cliniques et essais cliniques décentralisés.

L'article aborde également les défis critiques de la qualité des données, des considérations éthiques, de l'explicabilité des modèles et de la conformité réglementaire. Il explore les paradigmes émergents comme le Retrieval Augmented Generation (RAG), le calcul quantique pour la simulation moléculaire, et l'IA embarquée (edge AI) pour l'aide à la décision au lit du patient.

Sommaire

GANs, VAEs, Transformers — architecture, principes d'entraînement et forces comparées. De l'entraînement adversarial aux mécanismes d'auto-attention.

Découverte de médicaments (SMILES, conception moléculaire, criblage virtuel), génomique & protéomique (génération de séquences, AlphaFold, RoseTTAFold), criblage in silico (docking moléculaire, simulations MD, QM/MM).

Profilage de précision par intégration multi-omique, trajectoires prédictives de soins, pharmacogénomique et collaboration humain-IA pour la validation clinique.

Génération de données synthétiques, augmentation de données, modélisation prédictive et fonctionnalité copilot de SAS pour la génération automatisée de code statistique sur SAS Viya.

Participation à distance via ECOA, monitoring en temps réel, inclusion & diversité, et rôle de l'IA générative dans la conception d'essais adaptatifs.

Principes d'IA de confiance, techniques d'explicabilité des LLMs, architecture RAG, perspectives du calcul quantique et IA embarquée pour la décision au chevet du patient.

Contexte et portée

Rédigé alors que l'auteur était chez Microsoft Health & Life Sciences, cet article reflète sa double expertise en biotechnologie (PhD ENS Ulm / AgroParisTech) et en déploiement technologique au sein d'industries régulées. La collaboration avec Mark Lambrecht (SAS) construit un pont entre infrastructure d'IA et pratique biostatistique — une tension centrale dans l'industrialisation responsable de l'IA en recherche clinique.

L'article anticipe plusieurs thèmes développés ultérieurement dans les travaux de l'auteur sur TweenMe (génération de jumeaux numériques), PREDICARE (médecine prédictive territoriale) et l'architecture CINN (Clinically-Informed Neural Networks) — notamment l'intégration de connaissances métier dans les pipelines génératifs et la primauté de la conformité réglementaire dans le déploiement de l'IA.

PHUSE 2024 · Paper CM05 · GPTs and LLMs in Life Sciences ↓ Télécharger le PDF

Lecteur PDF non disponible sur cet appareil.

↓ Télécharger le PDF