Данный проект выполнен в рамках курса "Глубокое обучение на практике" от магистратуры ITMO AI Talent Hub.
Загружаем резюме через веб-сервис, получаем описание, информацию об основных навыках и опыте работы. Этот текст отправляем в заранее обученную модель. На выходе модели получаем summary, то есть наименование профессии. Это summary передаем через API на сайты поиска работы (hh.ru или trudvsem.ru) и ищем вакансии по нашему запросу.
За основу был взят датасет вакансий с "hh.ru". Очищенный от лишних столбцов, датасет представляет из себя таблицу:
То есть столбец с названием вакансии и столбец с ее описанием.
Обученная на описанном выше датасете модель загружена в репозиторий Hugging Face и доступна по ссылке. Либо по QR-коду:
Обращение к модели производится путем вызова стандартных методов пакета transformers и предварительного скачивания модели/весов не требует:
import torch
from transformers import T5ForConditionalGeneration, T5Tokenizer
MODEL_NAME = 'basil-77/rut5-base-absum-hh'
model = T5ForConditionalGeneration.from_pretrained(MODEL_NAME)
tokenizer = T5Tokenizer.from_pretrained(MODEL_NAME)
model.eval();
Продукт представляет собой веб-сервис.
Веб-приложение позволяет загрузить своё резюме в формате PDF и получить на выходе подборку вакансий с hh.ru с численным значением "score" - на сколько подходит вакансия под загруженное резюме.
Запись работы приложения:
- Веб-приложение: streamlit
- Модель: rut5-base absum
pip install -r requirements.txt
streamlit run app.py