data-platformDemande élevée · Tendance croissance
Dossier de compétences
Databricks Lakehouse Platform
Databricks est la plateforme Apache Spark managée et unifiée pour les projets data et IA. Elle couvre l'ingestion (DLT), la transformation (notebooks, dbt), le ML (MLflow, Feature Store) et le serving de modèles. En ESN, elle est demandée sur les projets de modernisation de data factory et les projets IA.
Versions
Databricks Runtime 13+
Demande
élevée
Métiers
5 profils
Génération
2 min
DC Databricks par métier
Choisissez le profil de votre consultant pour un DC spécialisé Databricks.
Cas d'usage typiques
- Lakehouse avec Delta Lake pour les projets data à grand volume
- Pipelines ML end-to-end avec MLflow et Feature Store
- Streaming temps-réel avec Structured Streaming
- Migration depuis Hadoop/HDFS vers Databricks
Critères DC spécifiques
- Certifications Databricks (Data Engineer Associate, ML Associate/Professional)
- Delta Lake : expérience avec ACID transactions et time travel
- MLflow en production : tracking, registry, serving de modèles
- Unity Catalog pour la gouvernance des données
Écosystème
Apache Spark / PySparkMLflowDelta LakeUnity Catalogdbt on Databricks
Générez un DC Databricks professionnel en 2 minutes
L'IA de Profilya identifie les compétences Databricks, structure les expériences et produit un DC prêt à envoyer.