Skip to content

Latest commit

 

History

History
10 lines (8 loc) · 433 Bytes

README.md

File metadata and controls

10 lines (8 loc) · 433 Bytes

Projet Spark: Analyse des données des arbres

Description

Ce projet utilise Apache Spark pour effectuer des opérations d'ETL (Extraction, Transformation, Chargement) sur un dataset d'arbres. Le projet est développé en Java et utilise deux approches différentes : RDDs et DataFrames.

Prérequis

  • Java 8 ou supérieur
  • Apache Spark 3.x
  • Maven (pour la gestion des dépendances)
  • Un IDE comme IntelliJ IDEA ou Eclipse