Installer WSL et Ubuntu via Microsoft Store.
Pour travailler dans de bonnes conditions je recommande VScode avec le plugin Remote Development.
Une fois WSL et Ubuntu d'installés, toutes les prochaines étapes seront à faire dans le terminal Ubuntu.
brew install poetry
Installer poetry en suivant la documentation du site officiel
Attention à ne pas installer poetry avec pip ou pip3.
Mettez à jour votre PATH comme indiqué à la fin de l'installation de poetry
en l'ajoutant à votre ~/.bashrc
.
sudo apt update
sudo apt install python3.10
- Cloner le repo github
- Ouvrir le projet dans VScode
code <dossier créé par git clone>
- Installer les dépendances du projet :
poetry install
brew install apache-spark
- Ouvrez la page de téléchargement de Spark et suivez les instructions.
- Dézippez et déplacez le contenu du dossier dans
/opt/spark
Pour vérifier que c'est bon, lancez :
$ ls /opt/spark
bin data jars LICENSE NOTICE R RELEASE yarn
conf examples kubernetes licenses python README.md sbin
Et vérifiez que votre prompt est le même.
- Créez les variables d'environnements suivantes depuis votre
~/.bashrc
:
export PYSPARK_PYTHON=/usr/bin/python3
export SPARK_HOME=/opt/spark
export PYTHONPATH=$SPARK_HOME/python:$SPARK_HOME/python/lib/py4j-0.10.9-src.zip
- Installer java
sudo apt install openjdk-11-jdk
Pour vérifier que l'installation est bonne, on lance les tests unitaires de l'exercice 0 :
poetry run pytest
Vous devez avoir un test au vert.
-> Suivant