Segmentez des clients d'un site e-commerce 70 heures Mis à jour le lundi 4 mai 2020 Vous êtes consultant pour Olist, une solution de vente sur les marketplaces en ligne.
Olist souhaite que vous fournissiez à ses équipes d'e-commerce une segmentation des clients qu’elles pourront utiliser au quotidien pour leurs campagnes de communication.
Votre objectif est de comprendre les différents types d’utilisateurs grâce à leur comportement et à leurs données personnelles.
Vous devrez fournir à l’équipe marketing une description actionable de votre segmentation et de sa logique sous-jacente pour une utilisation optimale, ainsi qu’une proposition de contrat de maintenance basée sur une analyse de la stabilité des segments au cours du temps.
Les données Pour cette mission, Olist vous fournit une base de données anonymisée comportant des informations sur l’historique de commandes, les produits achetés, les commentaires de satisfaction, et la localisation des clients depuis janvier 2017. (télécharger à l'adresse : https://www.kaggle.com/olistbr/brazilian-ecommerce)
Votre mission Votre mission est d’aider les équipes d’Olist à comprendre les différents types d'utilisateurs. Vous utiliserez donc des méthodes non supervisées pour regrouper ensemble des clients de profils similaires. Ces catégories pourront être utilisées par l’équipe marketing pour mieux communiquer.
Pour des raisons de confidentialité, Olist ne fournit pas beaucoup de données, à vous de fouiller dans celles dont vous disposez et de créer les meilleures features pour les exploiter.
Enfin, votre client, Olist, a spécifié sa demande ainsi :
La segmentation proposée doit être exploitable et facile d’utilisation pour l’équipe marketing. Vous évaluerez la fréquence à laquelle la segmentation doit être mise à jour, afin de pouvoir effectuer un devis de contrat de maintenance. Le code fourni doit respecter la convention PEP8, pour être utilisable par Olist. Livrables Un notebook de l'analyse exploratoire (non cleané, pour comprendre votre démarche). Un notebook (ou code commenté au choix) d’essais des différentes approches de modélisation (non cleané, pour comprendre votre démarche). Un support de présentation pour la soutenance. Pour faciliter votre passage au jury, déposez sur la plateforme, dans un dossier nommé “POLIST_nom_prenom”, tous les livrables du projet. Chaque livrable doit être nommé avec le numéro du projet et selon l'ordre dans lequel il apparaît, par exemple “POLIST_01_notebookanalyse”, “POLIST_02_notebookessais”, et ainsi de suite.
Soutenance 5 min - Présentation de la problématique, de son interprétation et des pistes de recherche envisagées.
5 min - Présentation du cleaning effectué, du feature engineering et de l'exploration.
10 min - Présentation des différentes pistes de modélisation effectuées.
5 min - Présentation du modèle final sélectionné ainsi que des améliorations effectuées.
5 à 10 minutes de questions-réponses.
Compétences évaluées Transformer les variables pertinentes d'un modèle d'apprentissage non supervisé Adapter les hyperparamètres d'un algorithme non supervisé afin de l'améliorer Évaluer les performances d’un modèle d'apprentissage non supervisé Mettre en place le modèle d'apprentissage non supervisé adapté au problème métier