Projet d'étude de santé publique sur le thème de la sous-nutrition dans le monde.
Pour ce projet, les données ont été manipulées en Python sur support Jupyter Notebook. Identification des premières tendances, estimations de la population mondiale qui pourrait être nourrie à partir de la disponibilité alimentaire végétale, animale… Estimation de la population mondiale considérée comme étant en sous-nutrition. Ainsi que d'autres ratios. Transformation des données en un format propice à l’utilisation souhaitée par les utilisateurs finaux, qui utiliserons la base via le langage SQL. Une fois les données correctement formatées, elles seront intégrées dans une base de données.
Téléchargement des données de la FAO, estimation de la population mondiale, calcul de la disponibilité alimentaire pour chaque pays, calcul de différents ratios permettant d'établir des points de comparaison, identification d'aliments riches en protéines animales ou végétales, etc…
- Appliquer l'algèbre relationnelle en R ou Python
- Utiliser une documentation technique
- Utiliser les librairies spécialisées pour la Data Science
- Récupérer des données à partir d'une source identifiée
- Effectuer des requêtes complexes en SQL
Si vous n'avez jamais installé Python, alors autant installer directement la distribution Anaconda. Anaconda est donc une distribution Python, faite pour la Data Science.
De cette manière on peut installer Python et ses librairies de Data Science Pandas, Matplotlib, Seaborn, Scipy, Numpy etc… Mais aussi le notebook Jupyter, qui reste incontournable et vivement recommandé! C'est par ici : Anaconda
Si vous souhaitez lancer le projet, il sera nécessaire d'installer Jupyter Notebook sur votre mahcine. La doc. Jupyter est accessible via : Jupyter Documentation
python -m pip install --upgrade pip
python -m pip install jupyter
Pour tester l'installation, vous pouvez taper dans votre console la commande suivante :
jupyter notebook
Pour installer python ainsi que les librairies de Data Science, il est fortement recommandé d'installer la distribution Anaconda.
pip install pandas
pip install numpy