Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Cria flow de captura de dados de tracking do Jae (#532)
* remove task de particao nao usada * unifica tasks de particao de data e hora * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * corrige condicional * change capture flow * change generic capture flow * atualiza esquema do flow padrao * change default capture flow structure * change generic capture flow * adjust constant structure * change bilhetagem to new capture flow structure * fix get_storage_blob function * fix get_storage_blob call * organize constants order * fix get_raw_from_sources function call * change transform_raw_to_json to read_raw_data * transform transform_raw_data_to_json to read_raw_data * fix nout task parameter * fix timedelta instantiation * set upstream tasks * declare raw_filepath * update docstrings * adjust get_raw_from_sources return * fix errors * change agent label to dev * refactore source values * update constants * update agent * update schedule params * update interval * fix get_datetime_range interval * remove order by from queries * fix get_raw_data_api * change json read function * update read_raw_data * update save_raw_local_func * log error * change raw api extraction for json * change read json function * print log traceback * skip pre treatment if empty df * skip save staging if dataframe is empty / save raw * remove skip upload if empty dataframe * update docstring and returned values * reorganize task order * fix tuple * change zip logic * remove skip * create gtfs zip constant * add gtfs zip file name * add csv to save raw / change filetype logic * remove comments * fix csv_args default value * change docstring get raw api * change raw data gcs docstring * remove commented task * change quadro primary key to list * update GTFS constants * change upload folder structure * undo silenciamento de falha de notificação * adicionar partition date only na transacao * remove parametros de testes (gtfs) * Update pipelines/rj_smtr/constants.py Co-authored-by: Fernanda Scovino <fscovinom@gmail.com> * corrige encadeamento de erros no flow * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * remove header treatment * mudar agent dev para prd * mudar agent de dev para prd * ajustar retorno das funcoes * Atualiza documentação * adicionar retorno em get_upload_storage_blob * Atualiza documentação * Atualiza string * adiciona recaptura no flow generico * alterar labels para dev * adicionar logica de recaptura * criar conexão com banco de dados * criar conexão com banco de dados * cria função para map de multiplos retornos * remover unmapped dos filepaths * log para debbug * retirar unmapped das partições * adicionar unmapped no parametro recapture * adicionar psycopg2 * comentários dos parametros * adicionar conexão com postgresql * mudar bilhetagem para extrair do db * padronizar nomenclatura dos argumentos * mudar label schedule para dev * corrigir constante db bilhetagem postgresql * alterar nomeação para runs de recaptura * ajuste connector * alterar IP para DNS * Serialize datetime objects / read sql with pandas * mudar logica do nome da run * cria recaptura bilhetagem * mudar host para IP / adiciona interval_minutes * adiciona parametro interval minutes * remove linha comentada * remove arquivo de schedules da bilhetagem * generaliza função query logs * ajuste remove schedule personalizado * unmap interval_minutes * alteração de pasta de gravação para teste * teste retirar timezone * mudar timezone * corrigir logica de recaptura * adicionar possibilidade de recapturar mais dias * ajustar recapture_window_days default * adicionae recapture_window na task query_logs * merge previous_errors * remover log de teste * ajustar log recaptura * adicionar recaptura auxiliar * criar parametros recaptura tabelas auxiliares * comentar materializacao * teste log * muda logica recaptura bilhetagem * unmapped upstream tasks * mudar forma de upstream * remover alterações de teste * mudar agent para prd * corrigir project_name * passar tirar query_logs_func * corrigir project_name * remover comentários * remover query_logs_func * aumentar max_recaptures * adiciona extracao tracking * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * muda agent para dev * corrige constante * formatar constante database * altera nome do flow * alterar queries bilhetagem auxiliar * ajuste na logica de recaptura bilhetagem auxiliar * remover parametro timestamp * remove truncate hour * mudar agent para prd * mudar project name * criar constante interval * criar recaptura gps * corrigir docstring * alterar comentario recaptura * voltar task get_current_timestamp --------- Co-authored-by: fernandascovino <fscovinom@gmail.com> Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> Co-authored-by: mergify[bot] <37929162+mergify[bot]@users.noreply.github.com> Co-authored-by: eng-rodrigocunha <engtransportes.rodrigocunha@gmail.com> Co-authored-by: Carolina Gomes <gsv.lina@gmail.com> Co-authored-by: Rodrigo Cunha <66736583+eng-rodrigocunha@users.noreply.github.com>
- Loading branch information