data-platformDemande élevée · Tendance croissance

Dossier de compétencesDatabricks Lakehouse Platform

Databricks est la plateforme Apache Spark managée et unifiée pour les projets data et IA. Elle couvre l'ingestion (DLT), la transformation (notebooks, dbt), le ML (MLflow, Feature Store) et le serving de modèles. En ESN, elle est demandée sur les projets de modernisation de data factory et les projets IA.

Versions

Databricks Runtime 13+

Demande

élevée

Métiers

5 profils

Génération

2 min

Cas d'usage typiques

  • Lakehouse avec Delta Lake pour les projets data à grand volume
  • Pipelines ML end-to-end avec MLflow et Feature Store
  • Streaming temps-réel avec Structured Streaming
  • Migration depuis Hadoop/HDFS vers Databricks

Critères DC spécifiques

  • Certifications Databricks (Data Engineer Associate, ML Associate/Professional)
  • Delta Lake : expérience avec ACID transactions et time travel
  • MLflow en production : tracking, registry, serving de modèles
  • Unity Catalog pour la gouvernance des données

Écosystème

Apache Spark / PySparkMLflowDelta LakeUnity Catalogdbt on Databricks

Générez un DC Databricks professionnel en 2 minutes

L'IA de Profilya identifie les compétences Databricks, structure les expériences et produit un DC prêt à envoyer.