Este repositório contém a configuração e os DAGs (Directed Acyclic Graphs) para o Apache Airflow. O Airflow é uma plataforma para programar, monitorar e gerenciar workflows. Popurlamente conhecido como "orquestrador de tarefas".
A estrutura de pastas deste projeto segue as melhores práticas recomendadas para projetos Airflow.
.
├── dags
│ └── dag_<name>
│ └── function_name.py
├── data
│ └── dag_<name>
│ └── dataset.<extension>
├── functions
│ └── dag_<name>
│ └── function_name.py
│
├── requirements.txt
└── README.md
Após clonar este repositório, certifique-se que seu projeto possua um ambiente virtual criado.
Caso não possua basta, realizar a criação do ambiente virtual utilizando o comando abaixo:
$ python -m venv venv
Após a criação do ambiente, basta estar realizando a instalação das dependências padrões:
$ source venv/bin/activate
$ pip install -r requirements.txt
Com seu terminal aberto, execute o seguinte comando na pasta raíz do projeto:
$ pip freeze > requirements.txt
Certifique-se que está utilizando um ambiente de variavéis virtuais (virtual environments)