Skip to content

O objetivo do projeto é realizar uma Análise Exploratória de Dados (EDA) e tentar entender as informações do Dataset e como podemos utilizá-lo

License

Notifications You must be signed in to change notification settings

RiquelmoFerreira/Exploratory_Data_Analysis_Netflix_Top_10

Repository files navigation

Português:

Análise Exploratória de Dados - Netflix Top 10

NPM

Sobre o Projeto

Esse projeto foi feito durante o treino prático do curso de Python para Análise de Dados conduzido por Hashtag Programação e o arquivo está disponível nas linguagens: Português (Analise_Exploratoria_de_Dados_Netflix.ipynb) e Inglês (Exploratory_Data_Analysis_Netflix.ipynb)

O objetivo do projeto foi realizar uma Análise Exploratória de Dados e tentar entender as informações do Dataset e como podemos usá-las, nesse projeto foram usadas a linguagem Python e suas Bibliotecas Pandas, Matplotlib e Seaborn no ambiente do Jupyter Notebook

O Dataset tem as informações dos Filmes e Séries que entraram no TOP 10 da plataforma Netflix, quantos dias permanceram nele e qual sua pontuação. Entender sobre a popularidade dos produtos é essencial para entender em qual tipo de formato e gênero investir mais tempo e recursos.

Durante a análise podemos perceber que a grande maioria dos títulos presentes no Dataset eram exclusivos da Netflix e também que tanto no "Viewership Score", quanto no "Days in Top 10" existe um grande número de Outliers, então decidi tentar entender quais valores seriam esses. Após avaliação pode-se perceber que o título responsável por aqueles Outliers era a animação Cocomelon que foi o título que mais passou tempo no TOP 10 e também o título com a maior pontuação. Por fim, decidi tentar entender como a pontuação "Viewership Score" funcionava, acessando o website de onde o Dataset foi retirado podemos entender que cada dia no TOP 1 rendia 10 pontos, cada dia no TOP 2 rendia 9 pontos e assim por diante. Com uma plotagem de um gráfico histograma podemos analisar que grande parte dos títulos passam pouco tempo no TOP 10 e por isso tem uma pontuação menor.

Visão Geral do Projeto

ProjetoGeral

Visão Geral do Gráfico

GraficoGeral

Tecnologias e Bibliotecas

  • Python para Análise de Dados
  • Pandas
  • Matplotlib
  • Seaborn

Rode o Projeto:

Pré-Requisitos:

  • Python 3.11.0 ou superior
  • Jupyter Notebook
  • Pandas
  • Matplotlib
  • Seaborn
  • Power Point

Autor

Riquelmo Afonso Avelar Ferreira

https://www.linkedin.com/in/riquelmo-afonso-avelar-ferreira-df5183/

English:

Exploratory Data Analysis Netflix Top 10

NPM

About the Project

This project was done during the hands-on training of the Python for Data Analysis course carried out by Hashtag Programação and the file is available in the languages: Portuguese (Analise_Exploratoria_de_Dados_Netflix.ipynb) and English (Exploratory_Data_Analysis_Netflix.ipynb)

The objective of the project is to carry out an Exploratory Data Analysis (EDA) and try to understand the informations in the Dataset and how we can use it, in this project the Python language and its libraries Pandas, Matplotlib and Seaborn were used in the Jupyter Notebook environment.

The Dataset has information on the Movies and Tv Shows that entered the TOP 10 on the Netflix platform, how many days they remained in it and what their score was. Understanding the popularity of products is essential to understand what type of format and genre to invest more time and resources in.

During the analysis we can see that the vast majority of titles present in the Dataset were Netflix Exclusive and also that both in the "Viewership Score" and in the "Days in Top 10" there is a large number of Outliers, so I decided to try to understand which values would be those. After evaluation it can be seen that the title responsible for those Outliers was the animation Cocomelon which was the title that spent the most time in the TOP 10 and also the title with the highest score. Finally, I decided to try to understand how the "Viewership Score" worked, accessing the website where the Dataset was taken from, we can understand that each day in the TOP 1 yielded 10 points, each day in the TOP 2 yielded 9 points and so on. With a histogram plot, we can analyze that most titles spend little time in the TOP 10 and therefore have a lower score.

Project Overview

ProjectOverview

Chart Overview

ChartOverview

Technologies and Libraries

  • Python for Data Analysis
  • Pandas
  • Matplotlib
  • Seaborn

Run the Project

Prerequisites:

  • Python 3.11.0 or superior
  • Jupyter Notebook
  • Pandas
  • Matplotlib
  • Seaborn
  • Power Point

Author

Riquelmo Afonso Avelar Ferreira

https://www.linkedin.com/in/riquelmo-afonso-avelar-ferreira-df5183/?locale=en_US

About

O objetivo do projeto é realizar uma Análise Exploratória de Dados (EDA) e tentar entender as informações do Dataset e como podemos utilizá-lo

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published