d6/de5/AlpakaInterface_2interface_2OneToManyAssoc_8h_source.html

 #ifndef HeterogeneousCore_AlpakaInterface_interface_OneToManyAssoc_h
 #define HeterogeneousCore_AlpakaInterface_interface_OneToManyAssoc_h

 #include <algorithm>
 #include <cstddef>
 #include <cstdint>
 #include <type_traits>

 #include <alpaka/alpaka.hpp>

 #include "HeterogeneousCore/AlpakaInterface/interface/AtomicPairCounter.h"
 #include "HeterogeneousCore/AlpakaInterface/interface/FlexiStorage.h"
 #include "HeterogeneousCore/AlpakaInterface/interface/prefixScan.h"
 #include "HeterogeneousCore/AlpakaInterface/interface/workdivision.h"

 namespace cms::alpakatools {

   template <typename I,    // type stored in the container (usually an index in a vector of the input values)
             int32_t ONES,  // number of "Ones"  +1. If -1 is initialized at runtime using external storage
             int32_t SIZE   // max number of element. If -1 is initialized at runtime using external storage
             >
   class OneToManyAssocBase {
   public:
     using Counter = uint32_t;

     using CountersOnly = OneToManyAssocBase<I, ONES, 0>;

     using index_type = I;

     struct View {
       OneToManyAssocBase *assoc = nullptr;
       Counter *offStorage = nullptr;
       index_type *contentStorage = nullptr;
       int32_t offSize = -1;
       int32_t contentSize = -1;
     };

     static constexpr int32_t ctNOnes() { return ONES; }
     constexpr auto totOnes() const { return off.capacity(); }
     constexpr auto nOnes() const { return totOnes() - 1; }
     static constexpr int32_t ctCapacity() { return SIZE; }
     constexpr auto capacity() const { return content.capacity(); }

     ALPAKA_FN_HOST_ACC void initStorage(View view) {
       ALPAKA_ASSERT_ACC(view.assoc == this);
       if constexpr (ctCapacity() < 0) {
         ALPAKA_ASSERT_ACC(view.contentStorage);
         ALPAKA_ASSERT_ACC(view.contentSize > 0);
         content.init(view.contentStorage, view.contentSize);
       }
       if constexpr (ctNOnes() < 0) {
         ALPAKA_ASSERT_ACC(view.offStorage);
         ALPAKA_ASSERT_ACC(view.offSize > 0);
         off.init(view.offStorage, view.offSize);
       }
     }

     ALPAKA_FN_HOST_ACC void zero() {
       for (int32_t i = 0; i < totOnes(); ++i) {
         off[i] = 0;
       }
     }

     template <typename TAcc>
     ALPAKA_FN_ACC ALPAKA_FN_INLINE void add(const TAcc &acc, CountersOnly const &co) {
       for (uint32_t i = 0; static_cast<int>(i) < totOnes(); ++i) {
         alpaka::atomicAdd(acc, off.data() + i, co.off[i], alpaka::hierarchy::Blocks{});
       }
     }

     template <typename TAcc>
     ALPAKA_FN_ACC ALPAKA_FN_INLINE static uint32_t atomicIncrement(const TAcc &acc, Counter &x) {
       return alpaka::atomicAdd(acc, &x, 1u, alpaka::hierarchy::Blocks{});
     }

     template <typename TAcc>
     ALPAKA_FN_ACC ALPAKA_FN_INLINE static uint32_t atomicDecrement(const TAcc &acc, Counter &x) {
       return alpaka::atomicSub(acc, &x, 1u, alpaka::hierarchy::Blocks{});
     }

     template <typename TAcc>
     ALPAKA_FN_ACC ALPAKA_FN_INLINE void count(const TAcc &acc, I b) {
       ALPAKA_ASSERT_ACC(b < static_cast<uint32_t>(nOnes()));
       atomicIncrement(acc, off[b]);
     }

     template <typename TAcc>
     ALPAKA_FN_ACC ALPAKA_FN_INLINE void fill(const TAcc &acc, I b, index_type j) {
       ALPAKA_ASSERT_ACC(b < static_cast<uint32_t>(nOnes()));
       auto w = atomicDecrement(acc, off[b]);
       ALPAKA_ASSERT_ACC(w > 0);
       content[w - 1] = j;
     }

     // this MUST BE DONE in a single block (or in two kernels!)
     struct zeroAndInit {
       template <typename TAcc>
       ALPAKA_FN_ACC void operator()(const TAcc &acc, View view) const {
         ALPAKA_ASSERT_ACC((1 == alpaka::getWorkDiv<alpaka::Grid, alpaka::Blocks>(acc)[0]));
         ALPAKA_ASSERT_ACC((0 == alpaka::getIdx<alpaka::Grid, alpaka::Blocks>(acc)[0]));
         auto h = view.assoc;
         if (cms::alpakatools::once_per_block(acc)) {
           h->psws = 0;
           h->initStorage(view);
         }
         alpaka::syncBlockThreads(acc);
         for (int i : cms::alpakatools::independent_group_elements(acc, h->totOnes())) {
           h->off[i] = 0;
         }
       }
     };

     template <typename TAcc, typename TQueue>
     ALPAKA_FN_INLINE static void launchZero(OneToManyAssocBase *h, TQueue &queue) {
       View view = {h, nullptr, nullptr, -1, -1};
       launchZero<TAcc>(view, queue);
     }

     template <typename TAcc, typename TQueue>
     ALPAKA_FN_INLINE static void launchZero(View view, TQueue &queue) {
       if constexpr (ctCapacity() < 0) {
         ALPAKA_ASSERT_ACC(view.contentStorage);
         ALPAKA_ASSERT_ACC(view.contentSize > 0);
       }
       if constexpr (ctNOnes() < 0) {
         ALPAKA_ASSERT_ACC(view.offStorage);
         ALPAKA_ASSERT_ACC(view.offSize > 0);
       }
       if constexpr (!requires_single_thread_per_block_v<TAcc>) {
         auto nthreads = 1024;
         auto nblocks = 1;  // MUST BE ONE as memory is initialize in thread 0 (alternative is two kernels);
         auto workDiv = cms::alpakatools::make_workdiv<TAcc>(nblocks, nthreads);
         alpaka::exec<TAcc>(queue, workDiv, zeroAndInit{}, view);
       } else {
         auto h = view.assoc;
         ALPAKA_ASSERT_ACC(h);
         h->initStorage(view);
         h->zero();
         h->psws = 0;
       }
     }

     constexpr auto size() const { return uint32_t(off[totOnes() - 1]); }
     constexpr auto size(uint32_t b) const { return off[b + 1] - off[b]; }

     constexpr index_type const *begin() const { return content.data(); }
     constexpr index_type const *end() const { return begin() + size(); }

     constexpr index_type const *begin(uint32_t b) const { return content.data() + off[b]; }
     constexpr index_type const *end(uint32_t b) const { return content.data() + off[b + 1]; }

     FlexiStorage<Counter, ONES> off;
     FlexiStorage<index_type, SIZE> content;
     int32_t psws;  // prefix-scan working space
   };

   template <typename I,    // type stored in the container (usually an index in a vector of the input values)
             int32_t ONES,  // number of "Ones"  +1. If -1 is initialized at runtime using external storage
             int32_t SIZE   // max number of element. If -1 is initialized at runtime using external storage
             >
   class OneToManyAssocSequential : public OneToManyAssocBase<I, ONES, SIZE> {
   public:
     using index_type = typename OneToManyAssocBase<I, ONES, SIZE>::index_type;

     template <typename TAcc>
     ALPAKA_FN_HOST_ACC ALPAKA_FN_INLINE int32_t
     bulkFill(const TAcc &acc, AtomicPairCounter &apc, index_type const *v, uint32_t n) {
       auto c = apc.inc_add(acc, n);
       if (int(c.first) >= this->nOnes())
         return -int32_t(c.first);
       this->off[c.first] = c.second;
       for (uint32_t j = 0; j < n; ++j)
         this->content[c.second + j] = v[j];
       return c.first;
     }

     ALPAKA_FN_HOST_ACC ALPAKA_FN_INLINE void bulkFinalize(AtomicPairCounter const &apc) {
       this->off[apc.get().first] = apc.get().second;
     }

     template <typename TAcc>
     ALPAKA_FN_HOST_ACC ALPAKA_FN_INLINE void bulkFinalizeFill(TAcc &acc, AtomicPairCounter const &apc) {
       int f = apc.get().first;
       auto s = apc.get().second;
       if (f >= this->nOnes()) {  // overflow!
         this->off[this->nOnes()] = uint32_t(this->off[this->nOnes() - 1]);
         return;
       }
       auto first = f + alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[0];
       for (int i = first; i < this->totOnes(); i += alpaka::getWorkDiv<alpaka::Grid, alpaka::Threads>(acc)[0]) {
         this->off[i] = s;
       }
     }

     struct finalizeBulk {
       template <typename TAcc>
       ALPAKA_FN_ACC void operator()(const TAcc &acc,
                                     AtomicPairCounter const *apc,
                                     OneToManyAssocSequential *__restrict__ assoc) const {
         assoc->bulkFinalizeFill(acc, *apc);
       }
     };
   };

   template <typename I,    // type stored in the container (usually an index in a vector of the input values)
             int32_t ONES,  // number of "Ones"  +1. If -1 is initialized at runtime using external storage
             int32_t SIZE   // max number of element. If -1 is initialized at runtime using external storage
             >
   class OneToManyAssocRandomAccess : public OneToManyAssocBase<I, ONES, SIZE> {
   public:
     using Counter = typename OneToManyAssocBase<I, ONES, SIZE>::Counter;
     using View = typename OneToManyAssocBase<I, ONES, SIZE>::View;

     template <typename TAcc>
     ALPAKA_FN_HOST_ACC ALPAKA_FN_INLINE void finalize(TAcc &acc, Counter *ws = nullptr) {
       ALPAKA_ASSERT_ACC(this->off[this->totOnes() - 1] == 0);
       blockPrefixScan(acc, this->off.data(), this->totOnes(), ws);
       ALPAKA_ASSERT_ACC(this->off[this->totOnes() - 1] == this->off[this->totOnes() - 2]);
     }

     ALPAKA_FN_HOST_ACC ALPAKA_FN_INLINE void finalize() {
       // Single thread finalize.
       for (uint32_t i = 1; static_cast<int>(i) < this->totOnes(); ++i)
         this->off[i] += this->off[i - 1];
     }

     template <typename TAcc, typename TQueue>
     ALPAKA_FN_INLINE static void launchFinalize(OneToManyAssocRandomAccess *h, TQueue &queue) {
       View view = {h, nullptr, nullptr, -1, -1};
       launchFinalize<TAcc>(view, queue);
     }

     template <typename TAcc, typename TQueue>
     ALPAKA_FN_INLINE static void launchFinalize(View view, TQueue &queue) {
       // View stores a base pointer, we need to upcast back...
       auto h = static_cast<OneToManyAssocRandomAccess *>(view.assoc);
       ALPAKA_ASSERT_ACC(h);
       if constexpr (!requires_single_thread_per_block_v<TAcc>) {
         Counter *poff = (Counter *)((char *)(h) + offsetof(OneToManyAssocRandomAccess, off));
         auto nOnes = OneToManyAssocRandomAccess::ctNOnes();
         if constexpr (OneToManyAssocRandomAccess::ctNOnes() < 0) {
           ALPAKA_ASSERT_ACC(view.offStorage);
           ALPAKA_ASSERT_ACC(view.offSize > 0);
           nOnes = view.offSize;
           poff = view.offStorage;
         }
         ALPAKA_ASSERT_ACC(nOnes > 0);
         int32_t *ppsws = (int32_t *)((char *)(h) + offsetof(OneToManyAssocRandomAccess, psws));
         auto nthreads = 1024;
         auto nblocks = (nOnes + nthreads - 1) / nthreads;
         auto workDiv = cms::alpakatools::make_workdiv<TAcc>(nblocks, nthreads);
         alpaka::exec<TAcc>(queue,
                            workDiv,
                            multiBlockPrefixScan<Counter>(),
                            poff,
                            poff,
                            nOnes,
                            nblocks,
                            ppsws,
                            alpaka::getWarpSizes(alpaka::getDev(queue))[0]);
       } else {
         h->finalize();
       }
     }
   };

 }  // namespace cms::alpakatools

 #endif  // HeterogeneousCore_CUDAUtilities_interface_HistoContainer_h
cms::alpakatools::OneToManyAssocSequential::bulkFill
ALPAKA_FN_HOST_ACC ALPAKA_FN_INLINE int32_t bulkFill(const TAcc &acc, AtomicPairCounter &apc, index_type const *v, uint32_t n)
Definition: OneToManyAssoc.h:167

cms::cuda::ONES
cudaStream_t int32_t ONES
Definition: OneToManyAssoc.h:57

cms::alpakatools::OneToManyAssocBase::View::assoc
OneToManyAssocBase * assoc
Definition: OneToManyAssoc.h:31

cms::alpakatools::OneToManyAssocBase::begin
constexpr index_type const  * begin() const
Definition: OneToManyAssoc.h:146

cms::alpakatools::once_per_block
ALPAKA_FN_ACC constexpr bool once_per_block(TAcc const &acc)
Definition: workdivision.h:1332

mps_fire.i
i
Definition: mps_fire.py:429

ntupleEnum.SIZE
SIZE
Definition: ntupleEnum.py:86

cms::alpakatools::AtomicPairCounter::Counters::first
uint32_t first
Definition: AtomicPairCounter.h:24

cms::alpakatools::OneToManyAssocBase::View::offSize
int32_t offSize
Definition: OneToManyAssoc.h:34

cms::alpakatools::OneToManyAssocBase::launchZero
static ALPAKA_FN_INLINE void launchZero(View view, TQueue &queue)
Definition: OneToManyAssoc.h:120

cms::alpakatools::OneToManyAssocBase::size
constexpr auto size(uint32_t b) const
Definition: OneToManyAssoc.h:144

dqmiolumiharvest.j
j
Definition: dqmiolumiharvest.py:66

cms::alpakatools::multiBlockPrefixScan
Definition: prefixScan.h:138

cms::alpakatools::OneToManyAssocSequential
Definition: OneToManyAssoc.h:161

w
T w() const
Definition: extBasic3DVector.h:225

cms::cudacompat::atomicSub
T1 atomicSub(T1 *a, T2 b)
Definition: cudaCompat.h:73

cms::alpakatools::FlexiStorage::data
constexpr I * data()
Definition: FlexiStorage.h:17

cms::alpakatools::OneToManyAssocBase::View::contentSize
int32_t contentSize
Definition: OneToManyAssoc.h:35

alignCSCRings.s
s
Definition: alignCSCRings.py:92

cms::alpakatools::OneToManyAssocBase::off
FlexiStorage< Counter, ONES > off
Definition: OneToManyAssoc.h:152

cms::alpakatools::OneToManyAssocBase::launchZero
static ALPAKA_FN_INLINE void launchZero(OneToManyAssocBase *h, TQueue &queue)
Definition: OneToManyAssoc.h:114

cms::alpakatools::independent_group_elements
ALPAKA_FN_ACC auto independent_group_elements(TAcc const &acc, TArgs... args)
Definition: workdivision.h:1281

pv::view
view
Definition: PreparePVTrends.h:58

cms::alpakatools::OneToManyAssocBase::index_type
I index_type
Definition: OneToManyAssoc.h:28

cms::alpakatools::OneToManyAssocBase::totOnes
constexpr auto totOnes() const
Definition: OneToManyAssoc.h:39

workdivision.h

findQualityFiles.v
v
Definition: findQualityFiles.py:179

cms::alpakatools::OneToManyAssocBase::View
Definition: OneToManyAssoc.h:30

ALPAKA_ACCELERATOR_NAMESPACE::brokenline::constexpr
if constexpr(n > 3)
Definition: BrokenLine.h:164

cms::cuda::co
__host__ __device__ VT * co
Definition: prefixScan.h:47

createBeamHaloJobs.queue
queue
Definition: createBeamHaloJobs.py:343

HltBtagPostValidation_cff.c
c
Definition: HltBtagPostValidation_cff.py:35

cms::alpakatools::OneToManyAssocBase::initStorage
ALPAKA_FN_HOST_ACC void initStorage(View view)
Definition: OneToManyAssoc.h:44

cms::alpakatools
Definition: PortableCollection.h:48

dqmiodumpmetadata.n
n
Definition: dqmiodumpmetadata.py:28

trackingPlots.assoc
assoc
Definition: trackingPlots.py:183

cms::alpakatools::OneToManyAssocRandomAccess::finalize
ALPAKA_FN_HOST_ACC ALPAKA_FN_INLINE void finalize(TAcc &acc, Counter *ws=nullptr)
Definition: OneToManyAssoc.h:215

cms::alpakatools::OneToManyAssocBase
Definition: OneToManyAssoc.h:22

cms::alpakatools::AtomicPairCounter
Definition: AtomicPairCounter.h:10

cms::alpakatools::OneToManyAssocBase::ctNOnes
static constexpr int32_t ctNOnes()
Definition: OneToManyAssoc.h:38

cms::alpakatools::OneToManyAssocBase::end
constexpr index_type const  * end() const
Definition: OneToManyAssoc.h:147

FlexiStorage.h

cms::alpakatools::OneToManyAssocRandomAccess::finalize
ALPAKA_FN_HOST_ACC ALPAKA_FN_INLINE void finalize()
Definition: OneToManyAssoc.h:221

cms::alpakatools::OneToManyAssocBase::count
ALPAKA_FN_ACC ALPAKA_FN_INLINE void count(const TAcc &acc, I b)
Definition: OneToManyAssoc.h:82

cms::alpakatools::OneToManyAssocBase::zeroAndInit::operator()
ALPAKA_FN_ACC void operator()(const TAcc &acc, View view) const
Definition: OneToManyAssoc.h:98

cms::cuda::AtomicPairCounter::get
__device__ __host__ Counters get() const
Definition: AtomicPairCounter.h:35

cms::alpakatools::OneToManyAssocRandomAccess
Definition: OneToManyAssoc.h:209

l1t::Blocks
std::vector< Block > Blocks
Definition: Block.h:99

cms::alpakatools::OneToManyAssocSequential::bulkFinalizeFill
ALPAKA_FN_HOST_ACC ALPAKA_FN_INLINE void bulkFinalizeFill(TAcc &acc, AtomicPairCounter const &apc)
Definition: OneToManyAssoc.h:182

Exhume::I
const std::complex< double > I
Definition: I.h:8

f
double f[11][100]
Definition: MuScleFitUtils.cc:78

ALPAKA_ACCELERATOR_NAMESPACE::vertexFinder::ws
auto &__restrict__ ws
Definition: clusterTracksByDensity.h:48

cms::cuda::nthreads
uint32_t T const  *__restrict__ uint32_t const  *__restrict__ int32_t int nthreads
Definition: HistoContainer.h:43

cms::alpakatools::AtomicPairCounter::get
ALPAKA_FN_ACC constexpr Counters get() const
Definition: AtomicPairCounter.h:28

cms::alpakatools::OneToManyAssocBase::psws
int32_t psws
Definition: OneToManyAssoc.h:154

cms::alpakatools::OneToManyAssocBase::size
constexpr auto size() const
Definition: OneToManyAssoc.h:143

cms::alpakatools::OneToManyAssocBase::Counter
uint32_t Counter
Definition: OneToManyAssoc.h:24

prefixScan.h

cms::alpakatools::OneToManyAssocSequential::bulkFinalize
ALPAKA_FN_HOST_ACC ALPAKA_FN_INLINE void bulkFinalize(AtomicPairCounter const &apc)
Definition: OneToManyAssoc.h:177

cms::alpakatools::OneToManyAssocBase::ctCapacity
static constexpr int32_t ctCapacity()
Definition: OneToManyAssoc.h:41

cms::alpakatools::OneToManyAssocBase::nOnes
constexpr auto nOnes() const
Definition: OneToManyAssoc.h:40

cms::alpakatools::OneToManyAssocSequential::finalizeBulk::operator()
ALPAKA_FN_ACC void operator()(const TAcc &acc, AtomicPairCounter const *apc, OneToManyAssocSequential *__restrict__ assoc) const
Definition: OneToManyAssoc.h:197

cms::alpakatools::OneToManyAssocBase::zeroAndInit
Definition: OneToManyAssoc.h:96

AtomicPairCounter.h

cms::alpakatools::OneToManyAssocBase::end
constexpr index_type const  * end(uint32_t b) const
Definition: OneToManyAssoc.h:150

cms::alpakatools::OneToManyAssocRandomAccess< I, NHISTS *NBINS+1, SIZE >::View
typename OneToManyAssocBase< I, ONES, SIZE >::View View
Definition: OneToManyAssoc.h:212

cms::alpakatools::OneToManyAssocBase::begin
constexpr index_type const  * begin(uint32_t b) const
Definition: OneToManyAssoc.h:149

b
double b
Definition: hdecay.h:120

cms::alpakatools::OneToManyAssocBase::fill
ALPAKA_FN_ACC ALPAKA_FN_INLINE void fill(const TAcc &acc, I b, index_type j)
Definition: OneToManyAssoc.h:88

cms::alpakatools::OneToManyAssocBase::zero
ALPAKA_FN_HOST_ACC void zero()
Definition: OneToManyAssoc.h:58

cms::alpakatools::OneToManyAssocRandomAccess::launchFinalize
static ALPAKA_FN_INLINE void launchFinalize(View view, TQueue &queue)
Definition: OneToManyAssoc.h:234

dqmdumpme.first
first
Definition: dqmdumpme.py:55

cms::alpakatools::FlexiStorage::capacity
constexpr int capacity() const
Definition: FlexiStorage.h:12

cms::alpakatools::blockPrefixScan
ALPAKA_FN_ACC ALPAKA_FN_INLINE void blockPrefixScan(const TAcc &acc, T const *ci, T *co, int32_t size, T *ws=nullptr)
Definition: prefixScan.h:47

cms::alpakatools::OneToManyAssocBase::add
ALPAKA_FN_ACC ALPAKA_FN_INLINE void add(const TAcc &acc, CountersOnly const &co)
Definition: OneToManyAssoc.h:65

cms::alpakatools::OneToManyAssocBase::content
FlexiStorage< index_type, SIZE > content
Definition: OneToManyAssoc.h:153

cms::alpakatools::OneToManyAssocBase::capacity
constexpr auto capacity() const
Definition: OneToManyAssoc.h:42

caHitNtupletGeneratorKernels::apc
TupleMultiplicity< TrackerTraits > const HitToTuple< TrackerTraits > const cms::cuda::AtomicPairCounter * apc
Definition: CAHitNtupletGeneratorKernelsImpl.h:70

x
float x
Definition: beamSpotDipStandalone.cc:55

cms::alpakatools::OneToManyAssocBase::View::contentStorage
index_type * contentStorage
Definition: OneToManyAssoc.h:33

cms::alpakatools::OneToManyAssocSequential::finalizeBulk
Definition: OneToManyAssoc.h:195

cms::alpakatools::OneToManyAssocBase::atomicIncrement
ALPAKA_FN_ACC static ALPAKA_FN_INLINE uint32_t atomicIncrement(const TAcc &acc, Counter &x)
Definition: OneToManyAssoc.h:72

cms::alpakatools::OneToManyAssocRandomAccess::launchFinalize
static ALPAKA_FN_INLINE void launchFinalize(OneToManyAssocRandomAccess *h, TQueue &queue)
Definition: OneToManyAssoc.h:228

h
The Signals That Services Can Subscribe To This is based on ActivityRegistry h
Helper function to determine trigger accepts.
Definition: Activities.doc:4

ALPAKA_ACCELERATOR_NAMESPACE::caPixelDoublets::ALPAKA_ASSERT_ACC
ALPAKA_ASSERT_ACC(offsets)

cms::cudacompat::atomicAdd
T1 atomicAdd(T1 *a, T2 b)
Definition: cudaCompat.h:61

cms::alpakatools::FlexiStorage< Counter, ONES >

cms::alpakatools::OneToManyAssocBase::View::offStorage
Counter * offStorage
Definition: OneToManyAssoc.h:32

cms::alpakatools::OneToManyAssocBase::atomicDecrement
ALPAKA_FN_ACC static ALPAKA_FN_INLINE uint32_t atomicDecrement(const TAcc &acc, Counter &x)
Definition: OneToManyAssoc.h:77