L’objectif global est de comprendre et maitriser les enjeux des nouveaux flux de données massifs provenant de la multiplication de nos activités numériques. Les verrous scientifiques et technologiques relatifs à la maitrise de la gestion de très gros volumes de données (atteignant des téraoctets ou des pétaoctets), sont identifiés et reconnus dans les communautés concernées :
- Acquisition, filtrage, nettoyage, agrégation, intégration, stockage ;
- Traitement de requêtes et analyse ;
- Interprétation ;
- Modélisation structurelle et temporelle ;
- Passage à l’échelle sur toutes les frontières énoncées ci-dessus ;
- Visualisation (en masse, hétérogène).