Crash Course on Python1 - Projeto Final
Optei pelo jupyter notebook pela conveniência das anotações. O programa simplesmente abre um arquivo .pdf
, limpa os dados, calcula a frequência das palavras no texto e imprime uma "word cloud".
1: O curso faz parte da especialização Google IT Automation with Python, disponível no Coursera.
pip install PyPDF2
pip install wordcloud
Muitas ideias para o tratamento do texto foram retiradas do tutorial How to Clean Text for Machine Learning with Python, de Jason Brownlee.
- Interface gráfica para abrir o arquivo.
- Configurar o output da "word cloud".