Skip to content

basil-77/itmo_deep_learning_in_practice_nlp

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Мэтчинг: резюме - вакансия

Данный проект выполнен в рамках курса "Глубокое обучение на практике" от магистратуры ITMO AI Talent Hub.

Основная идея

Загружаем резюме через веб-сервис, получаем описание, информацию об основных навыках и опыте работы. Этот текст отправляем в заранее обученную модель. На выходе модели получаем summary, то есть наименование профессии. Это summary передаем через API на сайты поиска работы (hh.ru или trudvsem.ru) и ищем вакансии по нашему запросу.

Описание используемых данных

За основу был взят датасет вакансий с "hh.ru". Очищенный от лишних столбцов, датасет представляет из себя таблицу:

Main page

То есть столбец с названием вакансии и столбец с ее описанием.

Inference

Обученная на описанном выше датасете модель загружена в репозиторий Hugging Face и доступна по ссылке. Либо по QR-коду:

Main page

Обращение к модели производится путем вызова стандартных методов пакета transformers и предварительного скачивания модели/весов не требует:

import torch  
from transformers import T5ForConditionalGeneration, T5Tokenizer
MODEL_NAME = 'basil-77/rut5-base-absum-hh'
model = T5ForConditionalGeneration.from_pretrained(MODEL_NAME)
tokenizer = T5Tokenizer.from_pretrained(MODEL_NAME)
model.eval();

MVP

Продукт представляет собой веб-сервис.

Веб-приложение позволяет загрузить своё резюме в формате PDF и получить на выходе подборку вакансий с hh.ru с численным значением "score" - на сколько подходит вакансия под загруженное резюме.

Запись работы приложения:

Watch the video

  • Веб-приложение: streamlit
  • Модель: rut5-base absum

Как запустить веб-сервис

Requirements >= 3.10 python version <=3.11

pip install -r requirements.txt

Запуск из папки проекта

streamlit run app.py

About

ITMO. Deep Learning in practice course. Second case (NLP)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published