Chapter 07 exercise template notebook #920
-
My errorIn exercise 1 I got some problems with CUDA device memory in google colab during training a few different models My code%time
# Отследим номер эксперимента
experiment_number = 0
# Пройдем по всем моделям, количеству эпох и даталоадерам из множества
for model_name in model_list:
for dataloader_name, dataloader in train_dataloader_dict.items():
for epochs in epochs_list:
# Обновим информацию
experiment_number += 1
print(f'[INFO] {{{experiment_number}}} Тестируем {model_name} на {epochs} эпох на {dataloader_name} данных...')
# Инициализируем модель
match model_name:
case 'effnetb3':
model = createEffNetB3()
case 'effnetb7':
model = createEffNetB7()
case 'effnetv2l':
model = createEffNetV2_L()
# Настроим loss func & optimizer
loss_fn = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(
model.parameters(),
lr=0.0005
)
# Обучим модель с выбранными параметрами
train(
model,
dataloader,
test_dataloader,
optimizer,
loss_fn,
epochs,
device,
create_writer(
dataloader_name,
model_name,
f'{epochs}_epochs'
)
)
# Сохраним обученную модель
utils.save_model(
model,
'models/',
f'{model_name}_{dataloader_name}_{epochs}_epochs.pth'
)
# Очистим кэш видеоустройства
if device == 'cuda':
torch.cuda.empty_cache()
print('-' * 100, '\n') Output: What I've tried so farI added |
Beta Was this translation helpful? Give feedback.
Replies: 1 comment 17 replies
-
я думаю что у вашей видеокарте не хватает памяти для выполнения операции поэтому указывает на CUDA out of memory. попробуй уменьшить размера пакета (batch size). или как ты и сказал с помощью скажи если помогло 😄 |
Beta Was this translation helpful? Give feedback.
BATCH_SIZE = 16
попробуй