L'IA va-t-elle remplacer les data scientists ? L'ironie de la profession IA qui croit le plus vite
Les data scientists font face a un risque de 40/100 avec 64 % d'exposition IA, et pourtant le BLS projette une croissance extraordinaire de 36 % d'ici 2034. Le metier le plus expose a l'IA est aussi l'un des plus demandes.
La grande ironie de la data science et de l'IA
La data science presente peut-etre le cas d'etude le plus ironique de l'automatisation IA : les professionnels qui construisent les outils IA font face a une automatisation significative de leurs propres taches, et pourtant leur profession devrait croitre plus vite que presque toutes les autres. Allez comprendre.
Avec un risque d'automatisation de 40 sur 100 et une exposition globale de 64 % en 2025, les data scientists ont une forte exposition IA [Fait]. Pourtant, le Bureau of Labor Statistics projette une croissance extraordinaire de 36 % d'ici 2034 -- la plus elevee parmi les metiers tech -- avec 192 000 data scientists actuellement employes a un salaire annuel median de 108 020 $ (environ 99 500 EUR).
Les taches en cours d'automatisation
L'analyse de jeux de donnees mene avec 60 % d'automatisation [Fait]. Les outils IA peuvent desormais effectuer des analyses exploratoires, generer des statistiques sommaires, identifier les valeurs aberrantes et creer des visualisations avec un minimum d'intervention humaine. Les plateformes AutoML comme H2O.ai, DataRobot et Google AutoML selectionnent automatiquement les algorithmes, ajustent les hyperparametres et generent l'ingenierie de features -- des taches qui necessitaient autrefois une expertise approfondie.
La construction de modeles ML se situe a 50 % d'automatisation [Fait]. Les grands modeles de langage peuvent maintenant ecrire du code de pipeline de donnees, deboguer des scripts et meme construire des modeles ML de bout en bout a partir de descriptions en langage naturel.
Ces niveaux d'automatisation augmentent rapidement. L'exposition theorique pour les data scientists devrait atteindre 94 % d'ici 2028 [Estimation], suggerant que l'IA sera eventuellement capable d'effectuer presque toutes les taches techniques d'un data scientist.
Pourquoi une croissance de 36 % malgre une forte automatisation ?
La projection de croissance explosive semble contredire les donnees d'automatisation, mais plusieurs facteurs l'expliquent :
La demande depasse l'automatisation. Chaque industrie -- sante, finance, manufacturing, retail, gouvernement -- veut des decisions basees sur les donnees. La demande totale de travail data science croit plus vite que l'IA ne peut automatiser les postes existants.
L'IA cree plus de travail en data science. Deployer, surveiller et ameliorer les systemes IA necessite des data scientists. Plus l'IA est adoptee, plus on a besoin de data scientists pour la gerer. C'est le serpent qui se mord la queue, mais dans le bon sens.
La democratisation eleve le plancher. Les outils IA permettent aux data scientists juniors d'etre productifs plus vite, mais ils creent aussi une demande pour les seniors qui peuvent architecturer des systemes complexes.
Le probleme du "dernier kilometre". L'AutoML peut construire des modeles, mais traduire des problemes business en problemes de donnees, valider les resultats dans le contexte metier et deployer en production necessitent toujours une expertise humaine [Avis].
La gouvernance et l'ethique IA. Les preoccupations croissantes autour du biais, de la transparence et de la conformite reglementaire creent une demande pour les data scientists specialises en IA responsable.
La journee type de Mei : comment l'IA change vraiment ce metier
Il est 9h et Mei, data scientist senior dans une entreprise d'analytique sante, ouvre son portable sur un message Slack du VP Produit : "Est-ce qu'on peut predire quels patients vont rater leurs rendez-vous de suivi ? On perd 2 millions par an a cause des no-shows." Il y a cinq ans, cette demande aurait occupe l'equipe de Mei pendant six semaines. Aujourd'hui, le calendrier est radicalement different.
Mei commence par demander a Claude d'ecrire une requete SQL extrayant les donnees patients pertinentes. La requete est prete en deux minutes. Elle la revise (l'IA a rate une condition de jointure sur la table assurance -- un probleme de schema subtil qu'elle ne pouvait pas connaitre), la corrige et lance l'extraction.
Ensuite, elle alimente le jeu de donnees dans une plateforme AutoML. En une heure, elle a teste des dizaines d'architectures de modeles et retourne un modele gradient-boosted avec 87 % de precision. Il y a trois ans, cette seule etape aurait pris deux semaines.
Mais c'est la que l'expertise reelle de Mei entre en jeu. Elle revise les importances de features et remarque quelque chose de troublant : le code postal est le deuxieme facteur le plus predictif. Elle sait d'experience que le code postal dans les donnees de sante est souvent un proxy pour la race et le statut socio-economique [Avis]. Deployer ce modele tel quel pourrait signifier que la clinique investit moins d'efforts de sensibilisation dans les communautes mal desservies -- exactement les populations qui ont le plus besoin de suivi.
Mei passe les trois heures suivantes sur l'analyse d'equite, teste le modele a travers les sous-groupes demographiques, consulte l'equipe de sante communautaire et reconçoit le jeu de features. Elle construit un second modele legerement moins precis (83 %) mais equitable a travers les populations de patients.
L'apres-midi est une presentation au comite executif. Mei ne parle pas de gradient boosting. Elle explique l'impact business : implementer ce modele avec des interventions ciblees (bons de covoiturage, planification flexible, rappels SMS) pourrait recuperer 1,4 million EUR sur les 2 millions de perte annuelle. Les dirigeants n'ont pas besoin de comprendre les maths. Ils ont besoin de faire confiance au data scientist qui a compris a la fois les donnees et les implications ethiques.
Voila le data scientist moderne : moins de temps a ecrire du code, plus de temps a s'assurer que le code fait la bonne chose.
Timeline : a quoi s'attendre d'ici 2028, 2030 et 2035
D'ici 2028 : l'AutoML gere la routine, les humains gerent le jugement
Les plateformes AutoML gereront environ 70-80 % des taches de modelisation standard [Estimation]. Les offres d'emploi exigeant a la fois des competences de collaboration IA et des competences traditionnelles de data science ont augmente de 220 % d'une annee sur l'autre en 2024-2025 [Fait].
D'ici 2030 : le data scientist devient un architecte IA
Le titre persistera, mais la fiche de poste sera fondamentalement differente. Les data scientists en 2030 passeront la majorite de leur temps sur la conception de systemes, la validation et la gouvernance, et la communication avec les parties prenantes. Le codage deviendra une portion plus petite du travail.
D'ici 2035 : les data scientists de domaine dominent
Le generaliste "data scientist qui peut tout faire" cedera la place aux praticiens specialises par domaine. Un data scientist en sante devra comprendre les workflows cliniques, la conformite HIPAA et l'equite en sante. En finance, les cadres reglementaires et la microstructure de marche.
Competences qui vous rendent irremplacable
1. Cadrage de problemes et traduction business. La competence la plus precieuse en data science n'est pas le code -- c'est la capacite a prendre une question business vague et a la traduire en un probleme de donnees precis et resolvable.
2. Ethique et gouvernance IA. Les outils d'explicabilite (SHAP, LIME) et les exigences reglementaires (AI Act de l'UE, RGPD) font de cette competence l'une des plus demandees.
3. MLOps et ingenierie de production. Les competences ML apparaissent dans environ 69 % des offres d'emploi de data scientist [Fait], mais l'attente croissante est de pouvoir amener un modele du prototype a la production. Docker, Kubernetes, Airflow, MLflow -- ce sont les outils du data scientist moderne.
4. Expertise de domaine. Choisissez une industrie et allez en profondeur. Un data scientist qui comprend vraiment les donnees de sinistres en sante, ou les metriques de qualite en manufacturing, vaut bien plus qu'un generaliste.
5. Communication et leadership. La capacite a presenter des resultats a des dirigeants non techniques et a defendre des pratiques IA responsables devient le facteur de differenciation.
Ou developper ces competences :
- Stanford Machine Learning Specialization (Coursera)
- Certification MLOps de Google
- Cours fast.ai pour le deep learning pratique
- Conferences industrielles (NeurIPS, KDD)
Ce que voient les autres pays
Inde : le plus grand reservoir de talents data science au monde. L'Inde produit plus de diplomes en data science que n'importe quel autre pays. L'Inde mene mondialement en deploiement IA au niveau entreprise a 59 % [Fait]. Le defi pour les data scientists indiens est la differenciation : a mesure que l'AutoML rend la modelisation routine accessible, la competition sur la seule competence technique devient une course vers le bas.
Allemagne : la rigueur ingenierique rencontre l'IA. L'investissement massif dans l'"Industrie 4.0" cree une forte demande pour les data scientists qui comprennent les processus industriels. Le RGPD cree aussi une demande pour la specialisation en machine learning preservant la vie privee.
Coree du Sud : strategie nationale IA. La Coree est passee de la 25e a la 18e place en adoption IA mondiale en 2025 [Fait]. Samsung, LG et Naver sont de gros employeurs de data scientists. La force du pays en semi-conducteurs cree des opportunites uniques en IA optimisee pour le hardware.
Le schema mondial. A travers tous les marches, la tendance est coherente : la demande pour les data scientists qui font de la modelisation basique stagne. La demande pour ceux qui combinent competences techniques avec expertise de domaine, raisonnement ethique et ingenierie de production accelere [Avis].
Articles connexes
- L'IA va-t-elle remplacer les programmeurs ? -- Les outils de generation de code changent la donne
- L'IA va-t-elle remplacer les ingenieurs logiciels ? -- Le CEO d'Anthropic dit que l'IA ecrit tout le code d'ici 2026
- L'IA va-t-elle remplacer les analystes financiers ? -- Un autre metier data-heavy face a des schemas similaires
Decouvrez toutes les analyses de metiers sur notre blog.
Sources
- Anthropic. (2026). The Anthropic Labor Market Impact Report.
- U.S. Bureau of Labor Statistics. Data Scientists -- Occupational Outlook Handbook.
- Eloundou, T., et al. (2023). GPTs are GPTs.
Cette analyse est basee sur les donnees du Rapport Anthropic (2026), Eloundou et al. (2023), et les projections BLS. Une analyse assistee par IA a ete utilisee dans la production de cet article.