Desafio Oto CRM // Engenharia de Dados - 2023

O QUE DEVE SER FEITO NO TESTE 1

// SOBRE O TESTE

Avaliar a capacidade técnica, crítica e raciocínio lógico do candidato ao construir uma aplicação e interface de usuário para resolução do problema proposto. Receita, frequência e valor A tabela abaixo representa as compras de alguns clientes.

Construa uma consulta (SQL) que calcule as métricas de RFV de cada um dos clientes:

● Recência = Tempo desde a última compra (dias)

● Frequência = Quantidade de compras

● Valor = Valor total em compras

Você deverá implementar o fluxo de tratamento de dado

O QUE DEVE SER FEITO NO TESTE 3

Você deverá implementar o fluxo de tratamento de dados descrito abaixo, utilizando o dataset a seguir como base: https://oto-public.s3.amazonaws.com/natal2021.zip

Sua tarefa:

Com o objetivo de realizar uma campanha especial de final de ano, recebemos o arquivo natal2021.csv do cliente. Você recebeu o desafio de realizar a limpeza deste arquivo CSV para que possamos posteriormente importá-lo em nosso banco de dados. Pensando em um cenário no qual o arquivo CSV seja muito maior e não entre na memória de uma só vez, temos os seguintes problemas para serem resolvidos:

Identificar o encoding do arquivo;
Processar o arquivo de 1000 em 1000 linhas;
Remover os espaços das colunas. Ex. ' Porto Alegre ' -> 'Porto Alegre';
Criar uma coluna CITY_ASCII no arquivo, a qual deve ser construída com base na coluna CITY. Esta coluna não pode conter acentos, minúsculas e caracteres especiais. Apenas letras, números e hífen são permitidos. Ex. 'São Paulo - abç' -> 'SAO PAULO - ABC'
Remover os caracteres não numéricos da coluna PHONE;
Salvar o arquivo .csv com a nova coluna em UTF-8;

RESOLUÇÃO DO TESTE 3 NOTEBOOK V2

Para realizar essas tarefas, vou escrever um código em Python que faz uso das bibliotecas Pandas, Unidecode e Chardet para tratar e ajustar as colunas com acentos e caracteres especiais conforme solicitado.

Segue o passo a passo:

1- Importar as bibliotecas necessárias;

2- Remover os espaços em branco e converter em letras maiúsculas;

3- Usar a biblioteca unidecode para tratar as colunas com acentos e caracteres especiais;

4- Remover os caracteres não numéricos;

5- Ler, tratar e processar os dados do arquivo CSV em chunks;

6- Identificar o encoding correto do arquivo de entrada usando a biblioteca 'chardet';

7- Processar o arquivo de 1000 em 1000 linhas;

8- Concatenar os chunks e salvar o arquivo .csv com a nova coluna em utf-8-sig com BOM5 - Criar a coluna CITY_ASCII;

9- Salvar o arquivo CSV limpo “Natal2021_cleaned.csv”, usando o encoding 'utf-8-sig' em vez de 'utf-8'. Isso adicionará uma marca de ordem de byte (BOM) no início do arquivo, o que ajudará a manter a compatibilidade com diferentes programas e sistemas operacionais ao abrir o arquivo;

10- Ler o arquivo CSV e criar um dataframe;

11- Visualizar o dataframe.

O QUE DEVE SER FEITO NO TESTE 2

Integração e-commerce

Um cliente gostaria de integrar os dados de seu e-commerce com nossa plataforma. Ele utiliza Vtex. Como você desenharia a arquitetura desta integração? Quais sistemas, fluxos e pipelines de dados você criaria?

Considere que serão integrados os seguintes dados:

● Catálogo de produtos

● Pedidos realizados

● Cadastro de clientes

Observe que você deve apenas dissertar sobre a arquitetura, e não codificar.

O QUE SERÁ AVALIADO ?

● Funcionalidade: se atinge o objetivo esperado dentro das limitações impostas.

● Legibilidade do código: será verificado se está fácil de ser lido e entendido, com nomes das funções e variáveis de acordo com a sua funcionalidade.

● Documentação, comentários e reaproveitamento de código.

● Organização na estrutura de arquivos.

● Boas práticas de desenvolvimento.

● Tempo de entrega.

ENTREGAS NECESSÁRIAS

● Você deve salvar o código fonte necessário em um repositório Git da sua escolha.

● Enviar para o e-mail:, renata.rehm@otocrm.com.br, everton.cunha@otocrm.com.br, tobias.jacoby@otocrm.com.br

Name		Name	Last commit message	Last commit date
Latest commit History 46 Commits
Dados		Dados
Dados_tratados		Dados_tratados
Teste_1		Teste_1
Teste_2		Teste_2
Teste_3		Teste_3
README.md		README.md
Rodrigo_campanha_natal_2021.ipynb		Rodrigo_campanha_natal_2021.ipynb
Rodrigo_campanha_natal_2021_V2.ipynb		Rodrigo_campanha_natal_2021_V2.ipynb
teste.csv		teste.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Desafio Oto CRM // Engenharia de Dados - 2023

O QUE DEVE SER FEITO NO TESTE 1

O QUE DEVE SER FEITO NO TESTE 3

RESOLUÇÃO DO TESTE 3 NOTEBOOK V2

O QUE DEVE SER FEITO NO TESTE 2

Integração e-commerce

O QUE SERÁ AVALIADO ?

ENTREGAS NECESSÁRIAS

About

Releases

Packages

Languages

rwurdig/Desafio-Oto-CRM-Engenharia-de-Dados-2023

Folders and files

Latest commit

History

Repository files navigation

Desafio Oto CRM // Engenharia de Dados - 2023

O QUE DEVE SER FEITO NO TESTE 1

O QUE DEVE SER FEITO NO TESTE 3

RESOLUÇÃO DO TESTE 3 NOTEBOOK V2

O QUE DEVE SER FEITO NO TESTE 2

Integração e-commerce

O QUE SERÁ AVALIADO ?

ENTREGAS NECESSÁRIAS

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages