Skip to content

gafer1997/Anal-tica-de-Datos

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CASO 02

Acerca de nuestro portafolio de Analítica de datos:

1.Limpieza y transformación de datos

La BD utilizada fue la participación en el PIB regional, https://es.wikipedia.org/wiki/Econom%C3%ADa_de_Guatemala: Se menciona que el Producto Interno Bruto (PIB) de Guatemala representa aproximadamente un tercio del PIB regional de América Central. Fundamentos macroeconómicos sólidos: Se hace referencia a la estabilidad económica del país en los últimos años, caracterizada por altos niveles de reservas, un déficit público controlado. Además, se destaca que la deuda pública es relativamente baja, representando el 30% del PIB en 2011.

Preguntas a responder: ¿Cómo se eliminan los espacios en blanco innecesarios de un texto en R? ¿Cómo se renombra y estructura una tabla de datos extraída de una página web en R? ¿Cómo se filtran los datos para eliminar filas con valores NA en una tabla?

2.Análisis de datos: Este conjunto de datos comprende información detallada sobre 2000 listados de perfumes provenientes de eBay.
A través del análisis de los datos se facilita identificar patrones de precios que optimizan las estrategias de venta y fortalecen la competitividad. Al evaluar la disponibilidad de perfumes en diversas regiones, los vendedores pueden ajustar su inventario y campañas de marketing con la finalidad de satisfacer de manera efectiva la demanda del mercado. Preguntas a responder: ¿Cuál es la tendencia de compra a través de las medidas de tendencia central? Identificación de patrones a través de varianza.

3.Visualización de datos: Esta base de datos comprende de salarios globales con 200 datos listados, Para poder tener una visualización de datos se debe obtener una data en esta ocasión se trabajará con una base de datos de la información de salarios a nivel mundial primero necesitamos limpiar y preparar los datos, y luego crear gráficos que nos permitan entender mejor la distribución de los salarios medios por continente y país, utilizando python desarrollaremos toda la visualización de datos. ¿Cuáles son los salarios promedio en diferentes países? ¿Cómo varían los salarios promedio entre los continentes? ¿Qué tendencias existen en los salarios promedio a nivel global y continental? ¿Cuál es la distribución de los salarios promedio dentro de cada continente?

4.Ciencia de datos: La ciencia de datos aplicada a la base de datos de vuelos es una herramienta poderosa que permite a las aerolíneas, los aeropuertos y los analistas de la industria comprender mejor los patrones de vuelo, la demanda del mercado y las tendencias del consumidor. Al examinar variables como la aerolínea, el tiempo de despegue y llegada, y las clases de boletos disponibles, podemos encontrar una gran cantidad de información valiosa sobre cómo estas diferentes variables interactúan y afectan el funcionamiento y la rentabilidad de una ruta aérea específica. ¿Cuáles son los datos simulados de precios y características de vuelos? ¿Cuál es la diferencia de precio promedio entre clases (económica y ejecutiva)? ¿Cómo varía el precio del vuelo según el número de escalas? ¿Cómo difieren los precios si se compra el boleto un día antes vs varios días antes del vuelo?

5.Ingeniería de datos: Este código en R realiza una serie de operaciones para extraer, procesar y analizar datos de una página web específica de Wikipedia https://es.wikipedia.org/wiki/D%C3%ADa_Internacional_del_Orgullo_LGBT, a continuación se desglosan las principales funciones y pasos que realiza el código:

¿Cuál es el contenido del primer párrafo del artículo en Wikipedia sobre el Día Internacional del Orgullo LGBT? ¿Cuál es el contenido de la infobox (tabla de información) del artículo en Wikipedia sobre el Día Internacional del Orgullo LGBT? ¿Cuáles son las estadísticas resumidas de los valores numéricos aleatorios generados a partir de los datos de la infobox?