da/d14/gpuClusterChargeCut_8h_source.html

 #ifndef RecoLocalTracker_SiPixelClusterizer_plugins_gpuClusterChargeCut_h

 #define RecoLocalTracker_SiPixelClusterizer_plugins_gpuClusterChargeCut_h


 #include <cstdint>

 #include <cstdio>


 #include "CUDADataFormats/SiPixelCluster/interface/gpuClusteringConstants.h"

 #include "Geometry/TrackerGeometryBuilder/interface/phase1PixelTopology.h"

 #include "HeterogeneousCore/CUDAUtilities/interface/cuda_assert.h"

 #include "HeterogeneousCore/CUDAUtilities/interface/prefixScan.h"


 // local include(s)

 #include "SiPixelClusterThresholds.h"


 namespace gpuClustering {


   __global__ void clusterChargeCut(

       SiPixelClusterThresholds

           clusterThresholds,             // charge cut on cluster in electrons (for layer 1 and for other layers)

       uint16_t* __restrict__ id,         // module id of each pixel (modified if bad cluster)

       uint16_t const* __restrict__ adc,  //  charge of each pixel

       uint32_t const* __restrict__ moduleStart,  // index of the first pixel of each module

       uint32_t* __restrict__ nClustersInModule,  // modified: number of clusters found in each module

       uint32_t const* __restrict__ moduleId,     // module id of each module

       int32_t* __restrict__ clusterId,           // modified: cluster id of each pixel

       uint32_t numElements) {

     __shared__ int32_t charge[maxNumClustersPerModules];

     __shared__ uint8_t ok[maxNumClustersPerModules];

     __shared__ uint16_t newclusId[maxNumClustersPerModules];


     auto firstModule = blockIdx.x;

     auto endModule = moduleStart[0];

     for (auto module = firstModule; module < endModule; module += gridDim.x) {

       auto firstPixel = moduleStart[1 + module];

       auto thisModuleId = id[firstPixel];

       assert(thisModuleId < maxNumModules);

       assert(thisModuleId == moduleId[module]);


       auto nclus = nClustersInModule[thisModuleId];

       if (nclus == 0)

         continue;


       if (threadIdx.x == 0 && nclus > maxNumClustersPerModules)

         printf("Warning too many clusters in module %d in block %d: %d > %d\n",

                thisModuleId,

                blockIdx.x,

                nclus,

                maxNumClustersPerModules);


       auto first = firstPixel + threadIdx.x;


       if (nclus > maxNumClustersPerModules) {

         // remove excess  FIXME find a way to cut charge first....

         for (auto i = first; i < numElements; i += blockDim.x) {

           if (id[i] == invalidModuleId)

             continue;  // not valid

           if (id[i] != thisModuleId)

             break;  // end of module

           if (clusterId[i] >= maxNumClustersPerModules) {

             id[i] = invalidModuleId;

             clusterId[i] = invalidModuleId;

           }

         }

         nclus = maxNumClustersPerModules;

       }


 #ifdef GPU_DEBUG

       if (thisModuleId % 100 == 1)

         if (threadIdx.x == 0)

           printf("start cluster charge cut for module %d in block %d\n", thisModuleId, blockIdx.x);

 #endif


       assert(nclus <= maxNumClustersPerModules);

       for (auto i = threadIdx.x; i < nclus; i += blockDim.x) {

         charge[i] = 0;

       }

       __syncthreads();


       for (auto i = first; i < numElements; i += blockDim.x) {

         if (id[i] == invalidModuleId)

           continue;  // not valid

         if (id[i] != thisModuleId)

           break;  // end of module

         atomicAdd(&charge[clusterId[i]], adc[i]);

       }

       __syncthreads();


       auto chargeCut =

           clusterThresholds.getThresholdForLayerOnCondition(thisModuleId < phase1PixelTopology::layerStart[1]);


       bool good = true;

       for (auto i = threadIdx.x; i < nclus; i += blockDim.x) {

         newclusId[i] = ok[i] = charge[i] >= chargeCut ? 1 : 0;

         if (0 == ok[i])

           good = false;

       }


       // if all clusters above threshold do nothing

       if (__syncthreads_and(good))

         continue;


       // renumber

       __shared__ uint16_t ws[32];

       cms::cuda::blockPrefixScan(newclusId, nclus, ws);


       assert(nclus > newclusId[nclus - 1]);


       nClustersInModule[thisModuleId] = newclusId[nclus - 1];


       // reassign id

       for (auto i = first; i < numElements; i += blockDim.x) {

         if (id[i] == invalidModuleId)

           continue;  // not valid

         if (id[i] != thisModuleId)

           break;  // end of module

         if (0 == ok[clusterId[i]])

           clusterId[i] = id[i] = invalidModuleId;

         else

           clusterId[i] = newclusId[clusterId[i]] - 1;

       }


       //done

       __syncthreads();

     }  // loop on modules

   }


 }  // namespace gpuClustering


 #endif  // RecoLocalTracker_SiPixelClusterizer_plugins_gpuClusterChargeCut_h

cms::cudacompat::threadIdx
const dim3 threadIdx
Definition: cudaCompat.h:29

first
auto first
Definition: CAHitNtupletGeneratorKernelsImpl.h:125

gpuClustering::ok
__shared__ uint8_t ok[maxNumClustersPerModules]
Definition: gpuClusterChargeCut.h:28

gpuClustering::firstModule
auto firstModule
Definition: gpuClusterChargeCut.h:31

mps_fire.i
i
Definition: mps_fire.py:428

gpuClusteringConstants.h

cms::cudacompat::gridDim
const dim3 gridDim
Definition: cudaCompat.h:33

gpuClustering::clusterId
uint16_t *__restrict__ uint16_t const *__restrict__ uint32_t const *__restrict__ uint32_t *__restrict__ uint32_t const *__restrict__ int32_t *__restrict__ clusterId
Definition: gpuClusterChargeCut.h:20

__global__
#define __global__
Definition: cudaCompat.h:19

cms::cudacompat::blockDim
const dim3 blockDim
Definition: cudaCompat.h:30

clusterChargeCut
float clusterChargeCut(const edm::ParameterSet &conf, const char *name="clusterChargeCut")
Definition: ClusterChargeCut.h:7

cms::cuda::assert
assert(be >=bs)

phase1PixelTopology.h

SiPixelClusterThresholds::getThresholdForLayerOnCondition
constexpr int32_t getThresholdForLayerOnCondition(bool isLayer1) const noexcept
Definition: SiPixelClusterThresholds.h:5

gpuClustering::nClustersInModule
uint16_t *__restrict__ uint16_t const *__restrict__ uint32_t const *__restrict__ uint32_t *__restrict__ nClustersInModule
Definition: gpuClusterChargeCut.h:20

gpuVertexFinder::ws
auto &__restrict__ ws
Definition: gpuClusterTracksDBSCAN.h:32

gpuVertexFinder::printf
printf("params %d %f %f %f\n", minT, eps, errmax, chi2max)

prefixScan.h

gpuClustering::moduleStart
uint16_t *__restrict__ uint16_t const *__restrict__ uint32_t const *__restrict__ moduleStart
Definition: gpuClusterChargeCut.h:20

gpuClustering::maxNumClustersPerModules
constexpr int32_t maxNumClustersPerModules
Definition: gpuClusteringConstants.h:19

gpuClustering::maxNumModules
constexpr uint16_t maxNumModules
Definition: gpuClusteringConstants.h:18

gpuClustering::numElements
uint16_t *__restrict__ uint16_t const *__restrict__ uint32_t const *__restrict__ uint32_t *__restrict__ uint32_t const *__restrict__ int32_t *__restrict__ uint32_t numElements
Definition: gpuClusterChargeCut.h:26

cms::cudacompat::blockIdx
const dim3 blockIdx
Definition: cudaCompat.h:32

gpuClustering::invalidModuleId
constexpr uint16_t invalidModuleId
Definition: gpuClusteringConstants.h:20

gpuClustering::moduleId
uint16_t *__restrict__ uint16_t const *__restrict__ uint32_t const *__restrict__ uint32_t *__restrict__ uint32_t const *__restrict__ moduleId
Definition: gpuClusterChargeCut.h:20

SiPixelClusterThresholds
Definition: SiPixelClusterThresholds.h:4

good
auto const good
min quality of good
Definition: CAHitNtupletGeneratorKernelsImpl.h:765

gpuClustering::newclusId
__shared__ uint16_t newclusId[maxNumClustersPerModules]
Definition: gpuClusterChargeCut.h:29

cms::cudacompat::__syncthreads
void __syncthreads()
Definition: cudaCompat.h:108

phase1PixelTopology::layerStart
constexpr uint32_t layerStart[numberOfLayers+1]
Definition: phase1PixelTopology.h:33

gpuClustering::endModule
auto endModule
Definition: gpuClusterChargeCut.h:32

SiPixelClusterThresholds.h

cms::cudacompat::__syncthreads_and
bool __syncthreads_and(bool x)
Definition: cudaCompat.h:111

RecoTauCleanerPlugins.charge
tuple charge
Definition: RecoTauCleanerPlugins.py:37

cms::cudacompat::atomicAdd
T1 atomicAdd(T1 *a, T2 b)
Definition: cudaCompat.h:61

cuda_assert.h

callgraph.module
tuple module
Definition: callgraph.py:69

gpuClustering::adc
uint16_t *__restrict__ uint16_t const *__restrict__ adc
Definition: gpuClusterChargeCut.h:20