TheHPXProject · arpittkhandelwal · Mar 24, 2026 · Apr 16, 2026 · Apr 17, 2026 · Apr 18, 2026
@@ -121,9 +121,9 @@ namespace hpx::detail {
 
         bool try_lock_shared()
         {
+            auto s = state.load(std::memory_order_acquire);
             while (true)
             {
-                auto s = state.load(std::memory_order_acquire);
                 if (s.data.exclusive || s.data.exclusive_waiting_blocked)
                 {
                     return false;
@@ -136,15 +136,37 @@ namespace hpx::detail {
                 {
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
             return true;
         }
 
-        void unlock_shared()
+        bool try_unlock_shared_fast()
         {
             while (true)
             {
                 auto s = state.load(std::memory_order_acquire);
+                if (s.data.exclusive || s.data.exclusive_waiting_blocked ||
+                    s.data.upgrade || s.data.shared_count <= 1)
+                {
+                    return false;
+                }
+
+                auto s1 = s;
+                --s.data.shared_count;
+                if (set_state(s1, s))
+                {
+                    return true;
+                }
+                s = s1;
+            }
+        }
+
+        void unlock_shared()
+        {
+            auto s = state.load(std::memory_order_acquire);
+            while (true)
+            {
                 auto s1 = s;
 
                 if (--s.data.shared_count == 0)
@@ -184,14 +206,15 @@ namespace hpx::detail {
                 {
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
         }
 
         void lock()
         {
+            auto s = state.load(std::memory_order_acquire);
             while (true)
             {
-                auto s = state.load(std::memory_order_acquire);
                 while (s.data.shared_count != 0 || s.data.exclusive)
                 {
                     auto s1 = s;
@@ -214,14 +237,15 @@ namespace hpx::detail {
                 {
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
         }
 
         bool try_lock()
         {
+            auto s = state.load(std::memory_order_acquire);
             while (true)
             {
-                auto s = state.load(std::memory_order_acquire);
                 if (s.data.shared_count || s.data.exclusive)
                 {
                     return false;
@@ -234,15 +258,16 @@ namespace hpx::detail {
                 {
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
             return true;
         }
 
         void unlock()
         {
+            auto s = state.load(std::memory_order_acquire);
             while (true)
             {
-                auto s = state.load(std::memory_order_acquire);
                 auto s1 = s;
 
                 s.data.exclusive = false;
@@ -255,6 +280,7 @@ namespace hpx::detail {
                     release_waiters(lk);
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
         }
 
@@ -287,9 +313,9 @@ namespace hpx::detail {
 
         bool try_lock_upgrade()
         {
+            auto s = state.load(std::memory_order_acquire);
             while (true)
             {
-                auto s = state.load(std::memory_order_acquire);
                 if (s.data.exclusive || s.data.exclusive_waiting_blocked ||
                     s.data.upgrade)
                 {
@@ -304,15 +330,16 @@ namespace hpx::detail {
                 {
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
             return true;
         }
 
         void unlock_upgrade()
         {
+            auto s = state.load(std::memory_order_acquire);
             while (true)
             {
-                auto s = state.load(std::memory_order_acquire);
                 auto s1 = s;
 
                 bool release = false;
@@ -337,6 +364,7 @@ namespace hpx::detail {
                 {
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
         }
 
@@ -384,9 +412,9 @@ namespace hpx::detail {
 
         void unlock_and_lock_upgrade()
         {
+            auto s = state.load(std::memory_order_acquire);
             while (true)
             {
-                auto s = state.load(std::memory_order_acquire);
                 auto s1 = s;
 
                 s.data.exclusive = false;
@@ -401,14 +429,15 @@ namespace hpx::detail {
                     release_waiters(lk);
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
         }
 
         void unlock_and_lock_shared()
         {
+            auto s = state.load(std::memory_order_acquire);
             while (true)
             {
-                auto s = state.load(std::memory_order_acquire);
                 auto s1 = s;
 
                 s.data.exclusive = false;
@@ -422,14 +451,15 @@ namespace hpx::detail {
                     release_waiters(lk);
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
         }
 
         bool try_unlock_shared_and_lock()
         {
+            auto s = state.load(std::memory_order_acquire);
             while (true)
             {
-                auto s = state.load(std::memory_order_acquire);
                 if (s.data.exclusive || s.data.exclusive_waiting_blocked ||
                     s.data.upgrade || s.data.shared_count != 1)
                 {
@@ -444,15 +474,16 @@ namespace hpx::detail {
                 {
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
             return true;
         }
 
         void unlock_upgrade_and_lock_shared()
         {
+            auto s = state.load(std::memory_order_acquire);
             while (true)
             {
-                auto s = state.load(std::memory_order_acquire);
                 auto s1 = s;
 
                 s.data.exclusive_waiting_blocked = false;
@@ -465,6 +496,7 @@ namespace hpx::detail {
                     release_waiters(lk);
                     break;
                 }
+                s = state.load(std::memory_order_acquire);
             }
         }
 
@@ -510,6 +542,8 @@ namespace hpx::detail {
         void lock_shared()
         {
             auto data = data_;
+            if (data->try_lock_shared())
+                return;
             data->lock_shared();
         }
 
@@ -522,6 +556,8 @@ namespace hpx::detail {
         void unlock_shared()
         {
             auto data = data_;
+            if (data->try_unlock_shared_fast())
+                return;
-            if (data->try_unlock_shared_fast())
-                return;
-            if (data->try_unlock_shared_fast())
-                return;
             data->unlock_shared();
         }
 

@@ -25,6 +25,7 @@ set(benchmarks
     skynet
     wait_all_timings
     benchmark_stealing
+    shared_mutex_overhead
 )
 
 set(timed_task_spawn_SOURCES activate_counters.cpp)
@@ -144,6 +145,7 @@ set(print_heterogeneous_payloads_PARAMETERS NO_HPX_MAIN)
 set(skynet_PARAMETERS NO_HPX_MAIN)
 set(timed_task_spawn_PARAMETERS NO_HPX_MAIN)
 set(benchmark_stealing_PARAMETERS NO_HPX_MAIN)
+set(shared_mutex_overhead_PARAMETERS NO_HPX_MAIN)
 set(hpx_tls_overhead_PARAMETERS NO_HPX_MAIN)
 set(native_tls_overhead_PARAMETERS NO_HPX_MAIN)
 set(coroutines_call_overhead_PARAMETERS NO_HPX_MAIN)

@@ -0,0 +1,75 @@
+//  (C) Copyright 2026 Arpit Khandelwal
+//
+//  SPDX-License-Identifier: BSL-1.0
+//  Distributed under the Boost Software License, Version 1.0. (See accompanying
+//  file LICENSE_1_0.txt or copy at http://www.boost.org/LICENSE_1_0.txt)
+
+#include <hpx/config.hpp>
+#include <hpx/hpx.hpp>
+#include <hpx/hpx_init.hpp>
+#include <hpx/include/util.hpp>
+#include <hpx/modules/testing.hpp>
+#include <hpx/synchronization/shared_mutex.hpp>
+
+#include <cstdint>
+#include <iostream>
-#include <iostream>
+#include <iostream>
+#include <shared_mutex>
-#include <iostream>
+#include <iostream>
+#include <shared_mutex>
+#include <vector>
+
+std::uint64_t num_iterations = 100000;
+std::uint64_t reader_threads = 4;
+
+hpx::shared_mutex mtx;
+
+void reader()
+{
+    for (std::uint64_t i = 0; i < num_iterations; ++i)
+    {
+        std::shared_lock<hpx::shared_mutex> l(mtx);
+    }
+}
+
+int hpx_main(hpx::program_options::variables_map& vm)
+{
+    num_iterations = vm["iterations"].as<std::uint64_t>();
+    reader_threads = hpx::get_num_worker_threads();
+
+    std::cout << "Starting benchmark with " << reader_threads << " threads..."
+              << std::endl;
+
+    std::vector<hpx::future<void>> futures;
+    futures.reserve(reader_threads);
+
+    hpx::chrono::high_resolution_timer walltime;
+
+    for (std::uint64_t i = 0; i < reader_threads; ++i)
+    {
+        futures.push_back(hpx::async(&reader));
+    }
+
+    hpx::wait_all(futures);
+
+    double const duration = walltime.elapsed();
+
+    std::cout << "Total time: " << duration << " seconds" << std::endl;
+    std::cout << "Average time per reader thread: " << duration / reader_threads
+              << " seconds" << std::endl;
+
+    hpx::util::print_cdash_timing("SharedMutexOverhead", duration);
+
+    return hpx::local::finalize();
+}
+
+int main(int argc, char* argv[])
+{
+    hpx::program_options::options_description cmdline(
+        "usage: " HPX_APPLICATION_STRING " [options]");
+
+    cmdline.add_options()("iterations",
+        hpx::program_options::value<std::uint64_t>()->default_value(100000),
+        "number of iterations per thread");
+
+    hpx::local::init_params init_args;
+    init_args.desc_cmdline = cmdline;
+
+    return hpx::local::init(hpx_main, argc, argv, init_args);
+}