Unmix

Turn any song into stems. Separate vocals, drums, bass, and instruments with AI.

Extract individual tracks from stereo mixes using Meta's state-of-the-art Demucs model. Go further with drum separation—split your drum track into kick, snare, hi-hats, and toms.

Features

🎵 Stem Separation: Separate any stereo mix into 4 stems using Facebook's Demucs model (bass, drums, other, vocals)
🔧 Drum Component Separation: Further separate drum stems into individual components (kick, snare, toms, hats)
⚡ Hardware Acceleration: Automatic detection and use of mps, cuda or cpu

Future Improvements

Use a fine tuned model for drum separation

Requirements

Python 3.8+
macOS (with Apple Silicon recommended for best performance) or Linux/Windows

Quick Start

Installation

# Clone the repository
git clone https://github.com/stevemurr/unmix.git
cd unmix

# Build environment and install dependencies
make env

# Activate the virtual environment
source .venv/bin/activate

Usage

# Separate a stereo mix into stems
unmix --mode=stems --input-file=your_song.mp3

# Separate a drum stem into components
unmix --mode=drums --input-file=drum_stem.wav

# Full pipeline (separate mix, then drums)
unmix --mode=both --input-file=your_song.mp3

Advanced Options

# Use a different model
unmix --mode=stems --input-file=input.mp3 --model=htdemucs_ft

# Specify custom output directories
unmix --mode=stems --input-file=input.mp3 --output-stems=my_stems/
unmix --mode=drums --input-file=drums.wav --output-drums=my_drums/

Available models:

htdemucs (default) - Hybrid Transformer Demucs
htdemucs_ft - Fine-tuned version
hdemucs_mmi - Alternative model

For all options:

unmix --help

Development

Available Make Commands

make help          # Show all available commands
make env-build     # Create virtual environment and install dependencies
make install       # Install/reinstall production dependencies
make install-dev   # Install development dependencies
make clean         # Remove virtual environment and cache files
make format        # Format code with black
make lint          # Lint code with ruff
make test          # Run pytest unit tests
make test-audio    # Run test separation on sample audio

Running Tests

# Install dev dependencies
make install-dev

# Run unit tests
make test

# Run audio separation test (requires sample audio file)
make test-audio

Project Structure

unmix/
├── src/
│   └── unmix/
│       ├── __init__.py      # Package initialization
│       ├── cli.py           # Command-line interface
│       ├── audio_io.py      # Audio I/O utilities
│       ├── separator.py     # Stem separation logic
│       └── filters.py       # Drum filtering logic
├── tests/
│   ├── test_audio_io.py     # Audio I/O tests
│   └── test_filters.py      # Filter tests
├── pyproject.toml           # Project configuration
├── Makefile                 # Build automation
└── README.md

Output Structure

After running stem separation:

output_stems/
├── song_drums.wav
├── song_vocals.wav
├── song_bass.wav
└── song_other.wav

After running drum separation:

output_drums/
├── drums_kick.wav
├── drums_snare.wav
├── drums_hihat.wav
└── drums_toms.wav

Technical Details

Stem Separation

Uses Meta's Demucs model, a state-of-the-art source separation system based on hybrid spectrogram and waveform processing.

Drum Separation

Employs frequency-based filtering to isolate drum components:

Kick: 20-200 Hz
Snare: 150-4000 Hz
Hi-hats/Cymbals: 5 kHz+
Toms: 80-500 Hz

Note: The drum separation uses frequency-based filtering as a baseline approach. For production-quality results, consider using specialized drum separation models like ADTof.

Performance Notes

Apple Silicon (M1/M2/M3): Uses Metal Performance Shaders for GPU acceleration
NVIDIA GPUs: Uses CUDA for acceleration
CPU: Fallback mode (slower but functional)

Processing time depends on:

Audio file length
Hardware capabilities
Selected model

Typical processing: 3-5 minutes for a 3-minute song on Apple Silicon.

Dependencies

demucs - AI-powered source separation
librosa - Audio analysis
soundfile - Audio I/O
scipy - Signal processing
numpy - Numerical computing
pydub - Audio manipulation

License

See LICENSE file for details.

Acknowledgments

Demucs by Meta Research
Librosa audio processing library

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
src/unmix		src/unmix
tests		tests
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Unmix

Features

Future Improvements

Requirements

Quick Start

Installation

Usage

Advanced Options

Development

Available Make Commands

Running Tests

Project Structure

Output Structure

Technical Details

Stem Separation

Drum Separation

Performance Notes

Dependencies

License

Acknowledgments

About

Uh oh!

Releases

Packages

Languages

stevemurr/unmix

Folders and files

Latest commit

History

Repository files navigation

Unmix

Features

Future Improvements

Requirements

Quick Start

Installation

Usage

Advanced Options

Development

Available Make Commands

Running Tests

Project Structure

Output Structure

Technical Details

Stem Separation

Drum Separation

Performance Notes

Dependencies

License

Acknowledgments

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages