Previsão de evasão de clientes, com tratamento e análises de dados, e criação e avaliação de modelo de Machine Learning.
🪧 Vitrine.Dev | Minha Vitrine |
---|---|
✨ Nome | Churn Rate |
🏷️ Tecnologias | Python, Data Science, Machine Learning, Storytelling, Análise Churn Rate |
🚀 URL | https://github.com/KaueAbbe/Challenge_ChurnRate/tree/main |
🔥 Desafio | https://www.alura.com.br/challenges/data-science |
Eu atuo como cientista de dados pela operadora de telecomunicações Alura Voz. Na reunião inicial com as pessoas responsáveis pela área de vendas da empresa, foi explicada a importância de se reduzir a Taxa de Evasão de Clientes, conhecido como Churn Rate. Basicamente, o Churn Rate indica o quanto a empresa perdeu de receita ou clientes em um período de tempo.
Eu sugeri, como passo inicial, a identificação de clientes que teriam uma maior chance de deixar a empresa. Para isso, expliquei que é interessante investigar algumas características de clientes ou dos planos de clientes para tentar CLASSIFICAR estas pessoas como potenciais candidatas a deixar a empresa ou não.
Assim, solicitei o conjunto de dados para começar a explorar, tratar e modelar a partir de agora. Em seguida, o foco será na otimização de cada um dos modelos com a finalidade de obter o melhor resultado para a tomada de decisão da Alura Voz.
Realizei tratamento dos dados. Este processo contou as etapas de leitura dos dados, obtenção de informações básicas do dataset, buscando inconsistênicias como valores duplicados e faltantes. Correções foram feitas nas inconsitências encontradas. Como se trata de uma empresa brasileira foi feita a tradução dos dados do inglês para o português. Também alterei tipos de dados e criei o gasto diário do cliente. Salvei os dados tratados para utilizar no processo de análise exploratória.
- Leitura, organização e compreensão dos dados
- Análise de tipo de dados
- Procura e correção das inconsistências
- Tradução de colunas e valores
- Criação de novo arquivo json para uso futuro
Realizei análises estatísticas descritivas e inferenciais que resultaram em análises de features para dois grupos de clientes: evasores e remanescentes. Fazendo essa análise bivariada, destaquei as diferenças dos grupos em cada feature que apresentou diferença significativa pós teste de hipótese. Criei gráficos que expõem as diferenças entre os grupos, passando por features como idade do cliente, tipo de contrato, forma de pagamento, produtos usados, gastos dos clientes. E baseado nas análises sugeri como alternativa realizar um Marketing focado no público mais velho, que incentive a troca de serviços, como trocar a internet de DSL por fibra ótica, obtenção da assinatura de TV ou Streaming. Também incentivar a troca do tipo de contrato de mensal para anual, ou criar o tipo semestral. Esses incentivos podem ser feitos a partir de descontos por um período de tempo maior que 3 meses, já que bastante cliente evade com 2 meses e em sua maioria gastam mais que os remanescentes.
- Análise da variável target, visualização da distribuição
- Análise de dados qualitativos e quantitativos
- Análise bivariada entre grupos evasores e não evasores
- Data visualization
- Testes de hipóteses
- Storytelling
- Pré-Processamento dos Dados
- Sepração dados treino, teste e validação
- Definição de Recall e Métrica de Bussines para avaliação
- Criação de um modelo Dummy e LogisticRegresion como Baseline
- Criação de seis modelos de machine learning
- Otimização por Hiperparâmetros do melhor modelo
- Tratamento: Pandas 🐼|
- Análise Exploratória: Pandas, Numpy, scipy, StatsModels, Plotly |
- Criação do Modelo: Pandas, Numpy, Sklearn, YellowBrick, Pickle, seaborn, matplotlib |