11 Jan 08:06

v5.0.0

485458f

RL Toolkit v5.0.0 Latest

Latest

update setup

Assets 2

0 Join discussion

02 Sep 14:31

markub3327

v4.1.1

862c317

RL Toolkit v4.1.1

Release v4.1.1

Changelog

update default config.yaml

Assets 2

09 Feb 03:40

markub3327

v4.1.0

883bb8b

RL Toolkit v4.1.0

Release v4.1.0

Changelog

Features 🔊

.fit()
AgentCallback

Assets 2

05 Feb 17:40

markub3327

v4.0.0

668f128

RL Toolkit v4.0.0

Release v4.0.0

Changelog

Features 🔊

Render environments to WanDB
Grouping of runs in WanDB
SampleToInsertRatio rate limiter
Global Gradient Clipping to avoid exploding gradients
Softplus for numerical stability
YAML configuration file
LogCosh instead of Huber loss
Critic network with Add layer applied on state & action branches
Custom uniform initializer
XLA (Accelerated Linear Algebra) compiler
Optimized Replay Buffer (google-deepmind/reverb#90)
split into Agent, Learner, Tester and Server

Bug fixes 🛠️

Fixed creating of saving path for models
Fixed model's summary()

Assets 2

03 Aug 03:55

markub3327

v3.2.5

a5795cc

RL Toolkit v3.2.5

Release v3.2.5

Changelog

Fix out of memory

Assets 2

07 Jul 21:06

markub3327

v3.2.4

11f4c7d

RL Toolkit v3.2.4

Release v3.2.4

Changelog

Reverb
setup.py (package is available on PyPI)
Split into agent, learner and tester roles
Use custom model and layer for defining Actor-Critic
MultiCritic - concatenating multiple critic networks into one network
Truncated Quantile Critics

Assets 2

0 Join discussion

23 May 20:49

markub3327

v2.0.2

d1bd3f4

RL Toolkit v2.0.2

Release v2.0.2

Changelog

+ update Dockerfile
+ update README.md
+ formatted code by Black & Flake8

Assets 2

27 Apr 08:58

markub3327

v2.0.1

032d16c

RL-Toolkit v2.0.1

Release v2.0.1

Changelog

fix Critic model

Assets 2

0 Join discussion

22 Apr 19:58

markub3327

v2.0

5bbbed6

RL-Toolkit v2.0 Pre-release

Pre-release

Release v2.0

Changelog

+ Huber loss,
+ Rendering to the video file (test mode),
+ Normalized observation by Min-max method,
+ removed TD3 support,
± instead of Concatenate layer is used Add layer (Critic network)

Assets 2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Release v4.1.1

Changelog

Release v4.1.0

Changelog

Features 🔊

Release v4.0.0

Changelog

Features 🔊

Bug fixes 🛠️

Release v3.2.5

Changelog

Release v3.2.4

Changelog

Release v2.0.2

Changelog

Release v2.0.1

Changelog

Release v2.0

Changelog

Releases: markub3327/rl-toolkit

RL Toolkit v5.0.0

RL Toolkit v4.1.1

Release v4.1.1

Changelog

RL Toolkit v4.1.0

Release v4.1.0

Changelog

Features 🔊

RL Toolkit v4.0.0

Release v4.0.0

Changelog

Features 🔊

Bug fixes 🛠️

RL Toolkit v3.2.5

Release v3.2.5

Changelog

RL Toolkit v3.2.4

Release v3.2.4

Changelog

RL Toolkit v2.0.2

Release v2.0.2

Changelog

RL-Toolkit v2.0.1

Release v2.0.1

Changelog

RL-Toolkit v2.0

Release v2.0

Changelog