pytorch_training_optimization_using_tensordict_memory_mapping

Optimizing PyTorch training by wrapping torch.utils.data.Dataset with tensordict.TensorDict.MemoryMappedTensor mapped, pinned, and loaded onto an Nvidia GPU and inputting TensorDict(Dataset) into torch.utils.data.DataLoader--to boost model training speed.

To run the demo:

git clone https://github.com/OriYarden/pytorch_training_optimization_using_tensordict_memory_mapping
cd pytorch_training_optimization_using_tensordict_memory_mapping
python run_demo.py

Training 1 Epoch via torch.utils.data.Dataset:

Training 1 Epoch via tensordict.TensorDict.MemoryMappedTensor(torch.utils.data.Dataset):

TensorDict Memory Mapping boosts training speed.

The initial wrapping runtime is approximately equal to 1 epoch of torch.utils.data.Dataset:

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
tensordict_packages		tensordict_packages
README.md		README.md
demo_dataloader.py		demo_dataloader.py
demo_whole_gif.gif		demo_whole_gif.gif
requirements.txt		requirements.txt
run_demo.py		run_demo.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

pytorch_training_optimization_using_tensordict_memory_mapping

About

Releases

Packages

Languages

OriYarden/pytorch_training_optimization_using_tensordict_memory_mapping

Folders and files

Latest commit

History

Repository files navigation

pytorch_training_optimization_using_tensordict_memory_mapping

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages