Les modèles d’apprentissage comme le Machine Learning, le Deep Learning et l’IA générative sont aujourd’hui largement utilisés dans de nombreux domaines scientifiques et industriels, notamment pour l’analyse de données, la simulation et la conception. Leur succès repose sur leurs performances et leur capacité à traiter des problèmes complexes, notamment de grande dimension.
Cependant, ces modèles présentent des limites importantes, notamment en termes de reproductibilité, de vérification et d’explicabilité des résultats. Malgré les avancées de la recherche, il n’existe pas encore de méthodologie universelle permettant de quantifier de manière fiable les erreurs de ces modèles.
Dans ce contexte, il devient essentiel d’évaluer la fiabilité et les incertitudes associées aux prédictions. En s’appuyant sur le cadre VVUQ (Verification, Validation and Uncertainty Quantification), déjà utilisé en simulation numérique, celui-ci est un élément qui peut permettre de vérifier le bon fonctionnement des modèles, de valider leur adéquation avec la réalité et de mesurer les incertitudes.
Dans cet exposé nous ferons la synthèse d’un workshop organisé au CEA sur ce sujet qui aura permis de faire un état de l’art des méthodes existantes, d’explorer leurs limites, d’identifier des domaines d’application pertinents et de proposer des pistes de recherche et des cas d’usage pour améliorer la validation des modèles d’IA.
|