Skip to content

ssanchezromer/supers

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

96 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

portada

Tipología y ciclo de vida de los datos - UOC

Webscraping práctica 1 - Comparación precios supermercados

Este proyecto es una práctica de la asignatura "Tipología y ciclo de vida de los datos" del Máster en Ciencia de Datos de la UOC.

Hemos creado un raspador web que extrae los precios de los productos de los principales supermercados en España y los compara. Finalmente, los resultados se guardan en un archivo CSV y hemos creado una aplicación Flask para visualizar los resultados.

Contexto

En esta actividad se ha llevado a cabo la recopilación de datos con el propósito de comparar los precios de los productos en tres supermercados diferentes: Mercadona, Caprabo y Bonpreu.

Sitios web (enlaces):

Esta iniciativa se ha desarrollado en respuesta a la notable subida de precios de diferentes productos, como puede ser el aceite de oliva, un hecho que ha impactado en la economía de los consumidores, y por consiguiente ha generado un creciente interés de identificar las opciones de compra más económicas.

Grupo de trabajo:

Sergi Sánchez Romero

Lucia Blanc Velázquez

Contenido del repositorio:

  • Readme.md: Expone de forma breve el contenido de la práctica.
  • source/.: Carpeta con el código del programa principal (main.py) y el de la aplicación Flask (run.py). Además incluye:
    • app/.: Carpeta con el código para inicializar la app de Flask.
    • csv/.: Carpeta que incluye el conjunto de datos resultante (products.csv) y también en cada carpeta del supermercado se incluye el csv referente a cada uno de los sitios webs scrapeados.
    • modules/.:: Carpeta con las librerías necesarias
    • requirements.txt: Archivo con las librerías necesarias para el entorno de la práctica.
  • pdf/comparacionPrecioSupers.pdf: Documento pdf con el contenido explicado de la práctica.
  • video/.: Video de presentación de la práctica.

DOI del dataset generado

El Dataset generado contiene el título Comparación de los productos de Mercadona, Caprabo y Bonpreu y se encuentra publicado en Zenodo.

DOI

Pasos a seguir para la creación del entorno y la inicialización del scraping:

Una vez descargado el código de la carpeta source realizaremos los siguientes pasos para poder ejecutar la aplicación:

1. Crear entorno:

python -m venv env_name

2. Activar entorno:

Windows:

env_name\Scripts\activate

MacOS & Linux:

env_name/bin/activate

3. Instalación de librerías:

pip install -r requirements.txt

4. Ejecución del programa

python main.py

final_scraping

flask

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published