Scraper de precios de productos básicos basado en la pagina del SNIIM.
- [Python 3.5+] (https://www.python.org/)
- [Docker] (https://www.docker.com/)
Fuente: Sistema Nacional de Información e Integración de Mercados
Secciones:
- Mercados Agricolas
- Frutas y Hortalizas
- Flores
- Granos basicos
- Azucar
- Aceites comestibles
- Mercados Pecuarios
- Bovinos: Empacadoras y distribuidoras
- Aves: Pollo por partes (Empacadoras y distribuidoras)
Descripción de la estructura final de las colecciones para Mongo
- Sección: Mercados Agricolas
- Mongo collection: agricultura
- Esquema:
{
"fecha": "mm/dd/yyyy", # String
"presentacion": "string",
"origen": "string",
"destino": "string",
"precio_min": "float",
"precio_max": "float",
"precio_frec": "float",
"obs": "string"
}
- Sección: Mercados Pecuarios
- Mongo collection: aves_partes_empacadores
- Esquema:
{
"fecha": "mm/dd/yyyy", # String
"pieza": "string",
"precio_minimo_kg": "float",
"precio_maximo_kg": "float",
"frecuencia_kg": "float",
"empacadora": "string"
}
- Mongo collection: bovino_cortes_empacadoras
- Esquema:
{
"fecha": "mm/dd/yyyy", # String
"origen": "string",
"corte": "string",
"precio_minimo": "float",
"precio_maximo": "float",
"empacadora": "string"
}
Ejecutar este comando dentro de la carpeta principal para instalar correctamente el scraper.
python setup.py install
Para utilizar el scraper en modo de ejecución local se debe correr el siguiente comando.
sniim --no-historial/--historial
Se debera visualizar algo similar a la siguiente imagen:
- --historial: Corre el scraper desde el 2000 hasta la fecha.
- --no-historial: Corre el scraper solo para el dia en que se ejecuta el comando.
Para configurar la conectividad con el servidor Mongo se necesita configurar el scraper con las siguientes variables de entorno:
- MONGO_HOST: DNS o IP del servidor mongo.
- MONGO_PORT: Puerto de conexion del servidor mongo.
- MONGO_USER: Usuario de conexion al servidor mongo.
- MONGO_PASSWORD: Password para el usuario de conexion al servidor mongo.
- MONGO_DATABASE: Nombre de la base de datos en el servidor mongo.
Para ejecutar el scraper en una instancia Docker correr el siguiente comando:
docker run --name sniim -e HISTORIAL=true -e MONGO_HOST=172.17.0.2 -e MONGO_PORT=27017 -e MONGO_DATABASE=central -e MONGO_USER=central -e MONGO_PASSWORD=secret -d mxabierto/scrapper-sniim
Para configurar la conectividad con el servidor Mongo y modo de ejecución se necesita configurar el scraper con las siguientes variables de entorno:
- HISTORIAL: Bandera para ejecutar el scraper en modo historial o solo recopilación diaria. (true/false).
- MONGO_HOST: DNS o IP del servidor mongo.
- MONGO_PORT: Puerto de conexion del servidor mongo.
- MONGO_USER: Usuario de conexion al servidor mongo.
- MONGO_PASSWORD: Password para el usuario de conexion al servidor mongo.
- MONGO_DATABASE: Nombre de la base de datos en el servidor mongo.