d7/d1f/cudaCompat_8h_source.html

 #ifndef HeterogeneousCore_CUDAUtilities_interface_cudaCompat_h
 #define HeterogeneousCore_CUDAUtilities_interface_cudaCompat_h

 /*
  * Everything you need to run cuda code in plain sequential c++ code
  */

 #ifndef __CUDACC__

 #include <algorithm>
 #include <cstdint>
 #include <cstring>

 // include the CUDA runtime header to define some of the attributes, types and sybols also on the CPU
 #include <cuda_runtime.h>

 // make sure function are inlined to avoid multiple definition
 #undef __global__
 #define __global__ inline __attribute__((always_inline))

 #undef __forceinline__
 #define __forceinline__ inline __attribute__((always_inline))

 namespace cms {
   namespace cudacompat {

     // run serially with a single thread
     // 1-dimensional block
     const dim3 threadIdx = {0, 0, 0};
     const dim3 blockDim = {1, 1, 1};
     // 1-dimensional grid
     const dim3 blockIdx = {0, 0, 0};
     const dim3 gridDim = {1, 1, 1};

     template <typename T1, typename T2>
     T1 atomicCAS(T1* address, T1 compare, T2 val) {
       T1 old = *address;
       *address = old == compare ? val : old;
       return old;
     }

     template <typename T1, typename T2>
     T1 atomicCAS_block(T1* address, T1 compare, T2 val) {
       return atomicCAS(address, compare, val);
     }

     template <typename T1, typename T2>
     T1 atomicInc(T1* a, T2 b) {
       auto ret = *a;
       if ((*a) < T1(b))
         (*a)++;
       return ret;
     }

     template <typename T1, typename T2>
     T1 atomicInc_block(T1* a, T2 b) {
       return atomicInc(a, b);
     }

     template <typename T1, typename T2>
     T1 atomicAdd(T1* a, T2 b) {
       auto ret = *a;
       (*a) += b;
       return ret;
     }

     template <typename T1, typename T2>
     T1 atomicAdd_block(T1* a, T2 b) {
       return atomicAdd(a, b);
     }

     template <typename T1, typename T2>
     T1 atomicSub(T1* a, T2 b) {
       auto ret = *a;
       (*a) -= b;
       return ret;
     }

     template <typename T1, typename T2>
     T1 atomicSub_block(T1* a, T2 b) {
       return atomicSub(a, b);
     }

     template <typename T1, typename T2>
     T1 atomicMin(T1* a, T2 b) {
       auto ret = *a;
       *a = std::min(*a, T1(b));
       return ret;
     }

     template <typename T1, typename T2>
     T1 atomicMin_block(T1* a, T2 b) {
       return atomicMin(a, b);
     }

     template <typename T1, typename T2>
     T1 atomicMax(T1* a, T2 b) {
       auto ret = *a;
       *a = std::max(*a, T1(b));
       return ret;
     }

     template <typename T1, typename T2>
     T1 atomicMax_block(T1* a, T2 b) {
       return atomicMax(a, b);
     }

     template <typename T1, typename T2>
     T1 atomicAnd(T1* a, T2 b) {
       auto ret = *a;
       (*a) &= b;
       return ret;
     }

     template <typename T1, typename T2>
     T1 atomicAnd_block(T1* a, T2 b) {
       return atomicAnd(a, b);
     }

     template <typename T1, typename T2>
     T1 atomicOr(T1* a, T2 b) {
       auto ret = *a;
       (*a) |= b;
       return ret;
     }

     template <typename T1, typename T2>
     T1 atomicOr_block(T1* a, T2 b) {
       return atomicOr(a, b);
     }

     inline void __syncthreads() {}
     inline void __threadfence() {}
     inline bool __syncthreads_or(bool x) { return x; }
     inline bool __syncthreads_and(bool x) { return x; }
     template <typename T>
     inline T __ldg(T const* x) {
       return *x;
     }

   }  // namespace cudacompat
 }  // namespace cms

 // make the cudacompat implementation available in the global namespace
 using namespace cms::cudacompat;

 #endif  // __CUDACC__

 #endif  // HeterogeneousCore_CUDAUtilities_interface_cudaCompat_h
cms::cudacompat::threadIdx
const dim3 threadIdx
Definition: cudaCompat.h:29

cms::cudacompat::atomicMax
T1 atomicMax(T1 *a, T2 b)
Definition: cudaCompat.h:97

cms::cudacompat::__syncthreads_or
bool __syncthreads_or(bool x)
Definition: cudaCompat.h:134

cms::cudacompat
Definition: HeterogeneousSoA.h:54

cms::cudacompat::gridDim
const dim3 gridDim
Definition: cudaCompat.h:33

cms::cudacompat::atomicCAS
T1 atomicCAS(T1 *address, T1 compare, T2 val)
Definition: cudaCompat.h:36

cms::cudacompat::atomicSub
T1 atomicSub(T1 *a, T2 b)
Definition: cudaCompat.h:73

runTheMatrix.ret
ret
prodAgent to be discontinued
Definition: runTheMatrix.py:761

cms::cudacompat::blockDim
const dim3 blockDim
Definition: cudaCompat.h:30

cms::cudacompat::atomicSub_block
T1 atomicSub_block(T1 *a, T2 b)
Definition: cudaCompat.h:80

compare
Definition: compare.py:1

cms::cudacompat::atomicOr_block
T1 atomicOr_block(T1 *a, T2 b)
Definition: cudaCompat.h:128

cms::cudacompat::atomicAnd_block
T1 atomicAnd_block(T1 *a, T2 b)
Definition: cudaCompat.h:116

cms::cudacompat::atomicAnd
T1 atomicAnd(T1 *a, T2 b)
Definition: cudaCompat.h:109

cms::cudacompat::atomicInc
T1 atomicInc(T1 *a, T2 b)
Definition: cudaCompat.h:48

cms::cudacompat::atomicCAS_block
T1 atomicCAS_block(T1 *address, T1 compare, T2 val)
Definition: cudaCompat.h:43

SiStripPI::min
Definition: SiStripPayloadInspectorHelper.h:178

SiStripPI::max
Definition: SiStripPayloadInspectorHelper.h:178

cms::cudacompat::blockIdx
const dim3 blockIdx
Definition: cudaCompat.h:32

cms
Namespace of DDCMS conversion namespace.
Definition: ProducerAnalyzer.cc:41

cms::cudacompat::atomicMin_block
T1 atomicMin_block(T1 *a, T2 b)
Definition: cudaCompat.h:92

cms::cudacompat::__ldg
T __ldg(T const *x)
Definition: cudaCompat.h:137

cms::cudacompat::atomicInc_block
T1 atomicInc_block(T1 *a, T2 b)
Definition: cudaCompat.h:56

b
double b
Definition: hdecay.h:120

cms::cudacompat::atomicAdd_block
T1 atomicAdd_block(T1 *a, T2 b)
Definition: cudaCompat.h:68

cms::cudacompat::__syncthreads
void __syncthreads()
Definition: cudaCompat.h:132

cms::cudacompat::atomicOr
T1 atomicOr(T1 *a, T2 b)
Definition: cudaCompat.h:121

a
double a
Definition: hdecay.h:121

x
float x
Definition: beamSpotDipStandalone.cc:55

cms::cudacompat::__syncthreads_and
bool __syncthreads_and(bool x)
Definition: cudaCompat.h:135

cms::cudacompat::atomicMin
T1 atomicMin(T1 *a, T2 b)
Definition: cudaCompat.h:85

T
long double T
Definition: Basic3DVectorLD.h:48

heppy_batch.val
val
Definition: heppy_batch.py:351

cms::cudacompat::atomicAdd
T1 atomicAdd(T1 *a, T2 b)
Definition: cudaCompat.h:61

cms::cudacompat::__threadfence
void __threadfence()
Definition: cudaCompat.h:133

cms::cudacompat::atomicMax_block
T1 atomicMax_block(T1 *a, T2 b)
Definition: cudaCompat.h:104