Le rôle central des données dans l’IA
Niveau IntermédiaireGarbage In, Garbage Out
L'IA moderne est un moteur, et la donnée est son carburant. Si vous entraînez une IA avec des données erronées (Garbage In), elle produira des résultats erronés (Garbage Out), peu importe la qualité de l'algorithme.
Le cycle de vie de la donnée
- Collecte : IoT, bases de données, scraping.
- Nettoyage : Enlever les erreurs et les doublons (80% du travail).
- Labellisation : Dire à la machine "Ceci est un chat" (pour l'apprentissage supervisé).
- Entraînement : L'algorithme digère les données.
Enjeux Organisationnels
Pour faire de l'IA, une entreprise doit avoir une gouvernance des données mature. Les silos de données (Marketing vs Logistique) et les systèmes "Legacy" sont les principaux freins.