Métier
Data Engineer
Ingénieur Data · Data Pipeline Engineer · Analytics Engineer
Mis à jour le 25 avril 2026
Missions
Le Data Engineer construit et maintient les pipelines qui collectent, transforment et livrent la donnée à ceux qui en ont besoin : analystes, data scientists, équipes produit. Son rôle est moins visible que celui d’un data scientist, mais il en est le prérequis. Sans infrastructure de données fiable, les modèles et les analyses ne valent rien.
Dans la pratique, il conçoit des workflows ETL ou ELT, modélise les entrepôts de données, surveille la qualité des données en production et collabore avec les équipes data aval pour s’assurer que les schémas et les contrats sont respectés. L’observabilité des flux de données — détection des anomalies, lineage, SLA de fraîcheur — est de plus en plus centrale au rôle.
Compétences clés
Python est le langage dominant du domaine, couplé à SQL pour la transformation et la modélisation analytique. Les orchestrateurs de pipelines — Apache Airflow, Prefect, Dagster — sont des standards. La maîtrise de dbt pour les transformations SQL en couche analytique est devenue une compétence différenciante sur le marché. Du côté des plateformes cloud, BigQuery, Snowflake et Databricks dominent la majorité des stacks modernes.
Un Data Engineer solide comprend aussi les systèmes de streaming (Kafka, Kinesis) pour les cas temps réel, les concepts de partitioning et de clustering pour les tables analytiques à grande échelle, et les principes de gouvernance des données — catalogage, contrôle d’accès, data contracts.
Trajectoire d’évolution
Un junior Data Engineer commence par implémenter des pipelines sous supervision, comprendre les données existantes et s’approprier les outils de l’entreprise. Confirmé, il conçoit des architectures de pipelines, prend en charge des migrations de plateforme et commence à collaborer avec les data scientists sur le déploiement de modèles.
Un senior influence le choix des outils, la stratégie de modélisation et les standards de qualité à l’échelle de l’organisation. Les évolutions possibles incluent le Data Platform Engineer (infrastructure), l’Analytics Engineer (modélisation SQL/dbt) ou le Data Architect dans les grandes organisations.
En entretien
Les entretiens Data Engineering mélangent SQL avancé — window functions, CTEs complexes, optimisation de requêtes — des questions de design système orientées données et des discussions sur la gestion des incidents de qualité. Les recruteurs cherchent à évaluer votre compréhension du cycle de vie de la donnée et votre expérience des problèmes qui n’apparaissent qu’en production.
Préparez des exemples de pipelines complexes que vous avez conçus, de problèmes de qualité que vous avez détectés et résolus, et de choix d’architecture que vous avez argumentés face à des contraintes de coût ou de latence. La capacité à quantifier l’impact de vos décisions — en volume traité, en SLA amélioré, en coût réduit — est particulièrement valorisée.
Fourchette de salaire
Estimation France entière, brut annuel. Médian basé sur la séniorité confirmée (3-5 ans).
Questions d'entretien typiques
- 01
Comment garantissez-vous la qualité des données dans un pipeline ETL en production ?
- 02
Concevez un entrepôt analytique pour 500 Go de logs quotidiens avec des SLAs T+1.
- 03
Quelle est la différence entre un data lake, un data warehouse et un lakehouse ?
- 04
Décrivez un pipeline que vous avez conçu, mis en production et maintenu dans le temps.
- 05
Un DAG Airflow échoue silencieusement sans lever d'exception — comment déboguez-vous ?