data synthétique

Une donnée synthétique (synthetic data en anglais) est une donnée qui n’est pas issue d’une observation réelle, mais qui a été créée artificiellement via des simulations (simulation numérique et de plus en plus souvent par une IA). Le but de cette production de « fausses données » est souvent de générer des jeux de données ayant des propriétés statistiques et structurelles prédictives aussi proches que possible des données réelles, mais plus faciles à acquérir, et/ou ne contenant pas d’informations personnelles ni sensibles, ou ne nécessitant pas de mettre des biens ou personnes en danger à la suite de l’utilisation de données personnelles.