Skip to content

Projeto de estruturação de datalake e orquestração de dados de saneamento e hidrografia do município de São Paulo

License

Notifications You must be signed in to change notification settings

sepep-pmsp/hydra

Repository files navigation

Hydra

Bem-vindo ao repositório do Hydra, um projeto de Servidor de Dados Georreferenciados sobre Saneamento e Hidrografia - Município de São Paulo 🌊🗺️

Este projeto utiliza uma combinação de ferramentas, incluindo Dagster, MinIO, Postgres e PostGIS, para coletar, processar e armazenar informações hidrográficas em uma arquitetura Docker Compose. Abaixo estão os detalhes essenciais para começar:

Visão Geral

Este projeto visa criar um ambiente robusto para coleta, conformação, armazenamento e processamento de dados sobre saneamento e hidrografia do município de São Paulo, permitindo análises geoespaciais avançadas.

Ferramentas Utilizadas

  • Dagster: Orquestração de fluxos de dados.
  • MinIO: Armazenamento de dados brutos e conformados em buckets separados.
  • Postgres: Armazenamento de dados estruturados.
  • PostGIS: Processamento de dados georreferenciados.

Estrutura do Diretório

  • requirements.txt: arquivo requirements do pip para o ambiente de desenvolvimento;
  • docker-compose.dev.yml: arquivo compose do ambiente de desenvolvimento;
  • docker-compose.hom.yml: arquivo compose do ambiente de homologação;
  • hydra: módulo principal com os arquivos responsáveis pelos fluxos de dados;
  • hydra_tests: módulo de testes unitários;
  • README.md: Este arquivo.

Configuração do Ambiente

  1. Pré-requisitos: Certifique-se de ter o Docker e o Docker Compose instalados em sua máquina.

  2. Clonar o Repositório: Clone este repositório para o seu ambiente local.

  3. Configurar Variáveis de Ambiente: Renomeie o arquivo .env.example para .env e configure as variáveis de ambiente necessárias, como chaves do MinIO, informações do banco de dados Postgres, etc.

  4. Iniciar os Contêineres: Navegue até o diretório principal do projeto e execute o seguinte comando para iniciar os contêineres:

    docker-compose -f [arquivo do ambiente escolhido] up -d

Configuração Adicional do Ambiente de Desenvolvimento

Para permitir a execução local do dagster e a utilização de um debugger, são necessários alguns passos adicionais.

  1. Instalação das dependências python: Instale as dependências localmente com pip install -r requirements.txt;

  2. Executar o dagster em modo de desenvolvimento: Executar o dagster localmente em modo de desenvolvimento com o comando dagster dev -m hydra.

Acesso aos Serviços

  • Dagster: Acesse a interface do Dagster em http://localhost:3000.
  • MinIO: O MinIO estará disponível em http://localhost:9000, onde você pode acessar os serviços de dados do MinIO.
  • MinIO Console: O MinIO Console estará disponível em http://localhost:9001, onde você pode acessar o console de gerenciamento do MinIO.

Se você tiver dúvidas ou precisar de ajuda, fique à vontade para criar uma Issue neste repositório. 🚀🌊🗺️

About

Projeto de estruturação de datalake e orquestração de dados de saneamento e hidrografia do município de São Paulo

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages