Este case, foi pensado um cenário de RH com enfoque na função de realizar o processo de ETL para estarem disponíveis de uma forma mais límpida.
Feito por Katia Lorena Cardoso Sena
-
No arquivo CaseRH.ipynb, é possível visualizar o código implementado e documentado
-
A implementação foi realizada pelo Databricks, e para que isso seja possível foi necessário a criação/vinculação de uma conta AWS
-
Para a primeira vez que o código é rodado, é necessário instalar via terminal essas bibliotecas :
- pip install unidecode
- pip install openpyxl
-
O Dataframe final neste estado:
- Número de linhas: 47351
- Número de colunas: 16
- O que é possível concluir que houve a adição de 5 colunas (grupo_cargo, idade,tempo_empresa, ds_idade_cat e ds_tempo_empresa_cat)