Skip to content

Neste case, foi pensado um cenário de RH com enfoque na função de Engenheiro de Dados, com a função de tratar os dados para estarem disponíveis de uma forma mais límpida.

Notifications You must be signed in to change notification settings

katiacardoso/CaseRH

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 

Repository files navigation

CaseRH

Este case, foi pensado um cenário de RH com enfoque na função de realizar o processo de ETL para estarem disponíveis de uma forma mais límpida.

Feito por Katia Lorena Cardoso Sena

  • No arquivo CaseRH.ipynb, é possível visualizar o código implementado e documentado

  • A implementação foi realizada pelo Databricks, e para que isso seja possível foi necessário a criação/vinculação de uma conta AWS

  • Para a primeira vez que o código é rodado, é necessário instalar via terminal essas bibliotecas :

    • pip install unidecode
    • pip install openpyxl
  • O Dataframe final neste estado:

    • Número de linhas: 47351
    • Número de colunas: 16
    • O que é possível concluir que houve a adição de 5 colunas (grupo_cargo, idade,tempo_empresa, ds_idade_cat e ds_tempo_empresa_cat)

About

Neste case, foi pensado um cenário de RH com enfoque na função de Engenheiro de Dados, com a função de tratar os dados para estarem disponíveis de uma forma mais límpida.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published