En este proyecto he trabajado sobre el volumen y precio de productos comercializados en Mercamadrid de enero a septiembre de 2020. Los datos han sido obtenidos del portal de datos abiertos del Ayuntamiento de Madrid.
Mercamadrid es el centro de abastecimiento y distribución de alimentos frescos más importante de España y un referente internacional. Fue fundado en 1982 y actualmente cuenta con 222 hectareas dedicadas a la comercialización de frutas, verduras, carnes y pescados al por mayor.
Los datos vienen en CSV por lo que he hecho ciertos cambios para convertirlos a formato JSON (mercamadrid2020.json) y poder sacar más partido de ellos. En total son 33.644 registros y 8 campos.
fechaVenta
: Momento de recopilación de los datos
año
: El año de la toma de datos es 2020mes
: De enero a septiembre en formato número
codVariedad
: Código de producto vendido. Dividido en codFam y codProd:
codFam
: Clasifica los productos según familias. En base a observaciones:
- CA: Vacuno
- CB: Ovino
- CC: Porcino
- CE: Avicola, conejo, perdiz y codorniz
- CG: Vacuno
- CH: Ovino (incluye producto congelado)
- CI: Porcino (incluye producto congelado)
- CK: Codorniz, conejo, pavo, perdiz y pollo
- F1: Fruta y frutos secos
- F2: Hortalizas, tubérculos y setas
- F3: Patatas
- P4: Pescado fresco
- P5: Marisco fresco
- P6: Pescado y marisco congeladocodProd
: Código del producto dentro de la familia
descVar
: Descripción del producto vendidoorigen
: Código de origen del producto. Del 1 al 54 corresponde al número de provincia de España. Por encíma, hacen referencia a distintos paises.descOrigen
: Descripción del origen del productokg
: Kilos vendidos en la franja de tiempoprecio
: Precios/kg registrados en el periodo separados en:
freq
: Precio más frecuente registrado en el periodomax
: Precio máximo registrado del periodomin
: Precio mínimo registrado del periodo
tags
: Etiquetas clasificadoras de cada registro (elaboración propia)
Importo archivo JSON por linea de comandos e inserto 4 registros de forma manual.
- Comprobar que los registros tienen el campo precio relleno.
- Encontrar los productos de enero 2020 con precio.freq entre 0.01€ y 0.20€ y ordenarlos ascendentemente por precio.freq.
- Encontrar los registro con una etiqueta (tags) para pensar posibles etiquetas a añadir.
- Crear una nueva columna que sea TRUE si el producto es nacional (clave "origen" menor a 54).
- Consultar las claves "descOrigen" y "tags" de cada registro.
- Agrupar la canditad (Kg) de producto vendido en Mercamadrid por lugar de origen y ordenar descendentemente en función de la cantidad.
- Top 10 productos con más kg vendidos de origen valenciano y su cantidad.
- Conocer los 10 lugares de origen que llevan más cantidad de un único producto y mostrar el producto del que se trata.
- Ventas anuales en Mercamadrid por mes y ordenadas descendentemente por facturación.
- Ventas anuales de producto, kg vendidos y ordenadas descendentemente por facturación.
- Conocer cúantos productos diferentes se venden por categoría ("codFam").
- Producto más caro de cada familia de producto.
- Productos internacionales ordenados descendentemente por ventas (kg).
- Kg de mercancía de origen nacional vs origen internacional.
- Top 10 importadores y cantidad importada.
- Obtener todos los peces con la categoría "RIO" en su clave "tags" y ordenar por "precio.freq" descendentemente.