Skip to content

Эксперименты в MLFlow

netang edited this page Oct 27, 2022 · 2 revisions

MLFlow доступен по адресу: http://node2.bdcl:8811.

Эксперименты проводятся на трех датасетах (в порядке увеличения кол-ва данных): mlm1, MovieLens и MillionSongDataset.

Все названия последних экспериментов соответствуют шаблону %ИМЯ_АЛГОРИТМА%_%ИМЯ_ДАТАСЕТА%. Например, "ALS_MillionSongDataset" — алгоритм ALS и датасет MillionSongDataset. Эксперименты начинающиеся с префикса "replay" и далее название алгоритма это запуски алгоритмов на датасете MovieLens. (!) В них нет информации о метриках, т.к. в то время, когда они писались метрики ещё не логировались.

В экспериментах mlm1_preparation и Dataset_preparation логируется информация по генерации датасетов. В Dataset_preparation происходит подготовка датасетов (прогон через DataPreparator, Indexer и Splitter) MovieLens и MillionSongDataset. И далее сохранение в паркет-файл.

Clone this wiki locally