Caffe2 - C++ API: caffe2/core/net_async_gpu_thread_pool

 #include "caffe2/core/net_async_gpu_thread_pool.h"
 
 #include "caffe2/core/context_gpu.h"
 
 CAFFE2_DEFINE_int(caffe2_threads_per_gpu, 1, "Number of CPU threads per GPU");
 
 namespace caffe2 {
 
 namespace {
 std::shared_ptr<TaskThreadPool> AsyncNetGPUThreadPoolCreator(
     const DeviceOption& device_option) {
   CAFFE_ENFORCE_EQ(
       device_option.device_type(),
       CUDA,
       "Unexpected device type for CUDA thread pool");
   return GetAsyncNetGPUThreadPool(device_option.cuda_gpu_id());
 }
 } // namespace
 
 CAFFE_REGISTER_CREATOR(ThreadPoolRegistry, CUDA, AsyncNetGPUThreadPoolCreator);
 
 std::shared_ptr<TaskThreadPool> GetAsyncNetGPUThreadPool(int gpu_id) {
   static std::unordered_map<int, std::weak_ptr<TaskThreadPool>> pools;
   static std::mutex pool_mutex;
   std::lock_guard<std::mutex> lock(pool_mutex);
 
   std::shared_ptr<TaskThreadPool> shared_pool = nullptr;
   if (pools.count(gpu_id)) {
     shared_pool = pools.at(gpu_id).lock();
   }
   if (!shared_pool) {
     shared_pool =
         std::make_shared<TaskThreadPool>(FLAGS_caffe2_threads_per_gpu);
     pools[gpu_id] = shared_pool;
   }
   return shared_pool;
 }
 
 } // namespace caffe2
Facebook Open Source