Esse projeto foi feito durante o treino prático do curso de Python para Análise de Dados conduzido por Hashtag Programação e o arquivo está disponível nas linguagens: Português (Analise_Exploratoria_de_Dados_Netflix.ipynb) e Inglês (Exploratory_Data_Analysis_Netflix.ipynb)
O objetivo do projeto foi realizar uma Análise Exploratória de Dados e tentar entender as informações do Dataset e como podemos usá-las, nesse projeto foram usadas a linguagem Python e suas Bibliotecas Pandas, Matplotlib e Seaborn no ambiente do Jupyter Notebook
O Dataset tem as informações dos Filmes e Séries que entraram no TOP 10 da plataforma Netflix, quantos dias permanceram nele e qual sua pontuação. Entender sobre a popularidade dos produtos é essencial para entender em qual tipo de formato e gênero investir mais tempo e recursos.
Durante a análise podemos perceber que a grande maioria dos títulos presentes no Dataset eram exclusivos da Netflix e também que tanto no "Viewership Score", quanto no "Days in Top 10" existe um grande número de Outliers, então decidi tentar entender quais valores seriam esses. Após avaliação pode-se perceber que o título responsável por aqueles Outliers era a animação Cocomelon que foi o título que mais passou tempo no TOP 10 e também o título com a maior pontuação. Por fim, decidi tentar entender como a pontuação "Viewership Score" funcionava, acessando o website de onde o Dataset foi retirado podemos entender que cada dia no TOP 1 rendia 10 pontos, cada dia no TOP 2 rendia 9 pontos e assim por diante. Com uma plotagem de um gráfico histograma podemos analisar que grande parte dos títulos passam pouco tempo no TOP 10 e por isso tem uma pontuação menor.
- Python para Análise de Dados
- Pandas
- Matplotlib
- Seaborn
- Python 3.11.0 ou superior
- Jupyter Notebook
- Pandas
- Matplotlib
- Seaborn
- Power Point
https://www.linkedin.com/in/riquelmo-afonso-avelar-ferreira-df5183/
This project was done during the hands-on training of the Python for Data Analysis course carried out by Hashtag Programação and the file is available in the languages: Portuguese (Analise_Exploratoria_de_Dados_Netflix.ipynb) and English (Exploratory_Data_Analysis_Netflix.ipynb)
The objective of the project is to carry out an Exploratory Data Analysis (EDA) and try to understand the informations in the Dataset and how we can use it, in this project the Python language and its libraries Pandas, Matplotlib and Seaborn were used in the Jupyter Notebook environment.
The Dataset has information on the Movies and Tv Shows that entered the TOP 10 on the Netflix platform, how many days they remained in it and what their score was. Understanding the popularity of products is essential to understand what type of format and genre to invest more time and resources in.
During the analysis we can see that the vast majority of titles present in the Dataset were Netflix Exclusive and also that both in the "Viewership Score" and in the "Days in Top 10" there is a large number of Outliers, so I decided to try to understand which values would be those. After evaluation it can be seen that the title responsible for those Outliers was the animation Cocomelon which was the title that spent the most time in the TOP 10 and also the title with the highest score. Finally, I decided to try to understand how the "Viewership Score" worked, accessing the website where the Dataset was taken from, we can understand that each day in the TOP 1 yielded 10 points, each day in the TOP 2 yielded 9 points and so on. With a histogram plot, we can analyze that most titles spend little time in the TOP 10 and therefore have a lower score.
- Python for Data Analysis
- Pandas
- Matplotlib
- Seaborn
- Python 3.11.0 or superior
- Jupyter Notebook
- Pandas
- Matplotlib
- Seaborn
- Power Point
https://www.linkedin.com/in/riquelmo-afonso-avelar-ferreira-df5183/?locale=en_US