Ce projet utilise Apache Spark pour effectuer des opérations d'ETL (Extraction, Transformation, Chargement) sur un dataset d'arbres. Le projet est développé en Java et utilise deux approches différentes : RDDs et DataFrames.
- Java 8 ou supérieur
- Apache Spark 3.x
- Maven (pour la gestion des dépendances)
- Un IDE comme IntelliJ IDEA ou Eclipse