d6/dfb/TrackingRecHit2DHeterogeneous_8h_source.html

 #ifndef CUDADataFormats_TrackingRecHit_interface_TrackingRecHit2DHeterogeneous_h

 #define CUDADataFormats_TrackingRecHit_interface_TrackingRecHit2DHeterogeneous_h


 #include "CUDADataFormats/TrackingRecHit/interface/TrackingRecHit2DSOAView.h"

 #include "CUDADataFormats/Common/interface/HeterogeneousSoA.h"

 #include "RecoLocalTracker/SiPixelRecHits/interface/pixelCPEforGPU.h"


 template <typename Traits>

 class TrackingRecHit2DHeterogeneous {

 public:

   template <typename T>

   using unique_ptr = typename Traits::template unique_ptr<T>;


   using PhiBinner = TrackingRecHit2DSOAView::PhiBinner;


   TrackingRecHit2DHeterogeneous() = default;


   explicit TrackingRecHit2DHeterogeneous(

       uint32_t nHits,

       bool isPhase2,

       int32_t offsetBPIX2,

       pixelCPEforGPU::ParamsOnGPU const* cpeParams,

       uint32_t const* hitsModuleStart,

       cudaStream_t stream,

       TrackingRecHit2DHeterogeneous<cms::cudacompat::GPUTraits> const* input = nullptr);


   ~TrackingRecHit2DHeterogeneous() = default;


   TrackingRecHit2DHeterogeneous(const TrackingRecHit2DHeterogeneous&) = delete;

   TrackingRecHit2DHeterogeneous& operator=(const TrackingRecHit2DHeterogeneous&) = delete;

   TrackingRecHit2DHeterogeneous(TrackingRecHit2DHeterogeneous&&) = default;

   TrackingRecHit2DHeterogeneous& operator=(TrackingRecHit2DHeterogeneous&&) = default;


   TrackingRecHit2DSOAView* view() { return m_view.get(); }

   TrackingRecHit2DSOAView const* view() const { return m_view.get(); }


   auto nHits() const { return m_nHits; }

   auto nMaxModules() const { return m_nMaxModules; }

   auto offsetBPIX2() const { return m_offsetBPIX2; }


   auto hitsModuleStart() const { return m_hitsModuleStart; }

   auto hitsLayerStart() { return m_hitsLayerStart; }

   auto phiBinner() { return m_phiBinner; }

   auto phiBinnerStorage() { return m_phiBinnerStorage; }

   auto iphi() { return m_iphi; }


   // only the local coord and detector index

   cms::cuda::host::unique_ptr<float[]> localCoordToHostAsync(cudaStream_t stream) const;

   cms::cuda::host::unique_ptr<uint32_t[]> hitsModuleStartToHostAsync(cudaStream_t stream) const;


   // needs specialization for Host

   void copyFromGPU(TrackingRecHit2DHeterogeneous<cms::cudacompat::GPUTraits> const* input, cudaStream_t stream);


 private:

   static constexpr uint32_t n16 = 4;                 // number of elements in m_store16

   static constexpr uint32_t n32 = 10;                // number of elements in m_store32

   static_assert(sizeof(uint32_t) == sizeof(float));  // just stating the obvious


   unique_ptr<uint16_t[]> m_store16;

   unique_ptr<float[]> m_store32;


   unique_ptr<TrackingRecHit2DSOAView::PhiBinner> m_PhiBinnerStore;

   unique_ptr<TrackingRecHit2DSOAView::AverageGeometry> m_AverageGeometryStore;


   unique_ptr<TrackingRecHit2DSOAView> m_view;


   uint32_t m_nHits;

   int32_t m_offsetBPIX2;


   uint32_t const* m_hitsModuleStart;  // needed for legacy, this is on GPU!


   uint32_t m_nMaxModules;

   // needed as kernel params...

   PhiBinner* m_phiBinner;

   PhiBinner::index_type* m_phiBinnerStorage;

   uint32_t* m_hitsLayerStart;

   int16_t* m_iphi;

 };


 using TrackingRecHit2DGPU = TrackingRecHit2DHeterogeneous<cms::cudacompat::GPUTraits>;

 using TrackingRecHit2DCPU = TrackingRecHit2DHeterogeneous<cms::cudacompat::CPUTraits>;

 using TrackingRecHit2DHost = TrackingRecHit2DHeterogeneous<cms::cudacompat::HostTraits>;


 #include "HeterogeneousCore/CUDAUtilities/interface/copyAsync.h"

 #include "HeterogeneousCore/CUDAUtilities/interface/cudaCheck.h"


 template <typename Traits>

 TrackingRecHit2DHeterogeneous<Traits>::TrackingRecHit2DHeterogeneous(

     uint32_t nHits,

     bool isPhase2,

     int32_t offsetBPIX2,

     pixelCPEforGPU::ParamsOnGPU const* cpeParams,

     uint32_t const* hitsModuleStart,

     cudaStream_t stream,

     TrackingRecHit2DHeterogeneous<cms::cudacompat::GPUTraits> const* input)

     : m_nHits(nHits), m_offsetBPIX2(offsetBPIX2), m_hitsModuleStart(hitsModuleStart) {

   auto view = Traits::template make_host_unique<TrackingRecHit2DSOAView>(stream);


   m_nMaxModules = isPhase2 ? phase2PixelTopology::numberOfModules : phase1PixelTopology::numberOfModules;


   view->m_nHits = nHits;

   view->m_nMaxModules = m_nMaxModules;

   m_view = Traits::template make_unique<TrackingRecHit2DSOAView>(stream);  // leave it on host and pass it by value?

   m_AverageGeometryStore = Traits::template make_unique<TrackingRecHit2DSOAView::AverageGeometry>(stream);

   view->m_averageGeometry = m_AverageGeometryStore.get();

   view->m_cpeParams = cpeParams;

   view->m_hitsModuleStart = hitsModuleStart;


   // if empy do not bother

   if (0 == nHits) {

     if constexpr (std::is_same<Traits, cms::cudacompat::GPUTraits>::value) {

       cms::cuda::copyAsync(m_view, view, stream);

     } else {

       m_view.reset(view.release());  // NOLINT: std::move() breaks CUDA version

     }

     return;

   }


   // the single arrays are not 128 bit alligned...

   // the hits are actually accessed in order only in building

   // if ordering is relevant they may have to be stored phi-ordered by layer or so

   // this will break 1to1 correspondence with cluster and module locality

   // so unless proven VERY inefficient we keep it ordered as generated


   // host copy is "reduced"  (to be reviewed at some point)

   if constexpr (std::is_same<Traits, cms::cudacompat::HostTraits>::value) {

     // it has to compile for ALL cases

     copyFromGPU(input, stream);

   } else {

     assert(input == nullptr);


     auto nL = isPhase2 ? phase2PixelTopology::numberOfLayers : phase1PixelTopology::numberOfLayers;


     m_store16 = Traits::template make_unique<uint16_t[]>(nHits * n16, stream);

     m_store32 = Traits::template make_unique<float[]>(nHits * n32 + nL + 1, stream);

     m_PhiBinnerStore = Traits::template make_unique<TrackingRecHit2DSOAView::PhiBinner>(stream);

   }


   static_assert(sizeof(TrackingRecHit2DSOAView::hindex_type) == sizeof(float));

   static_assert(sizeof(TrackingRecHit2DSOAView::hindex_type) == sizeof(TrackingRecHit2DSOAView::PhiBinner::index_type));


   auto get32 = [&](int i) { return m_store32.get() + i * nHits; };


   // copy all the pointers

   m_phiBinner = view->m_phiBinner = m_PhiBinnerStore.get();

   m_phiBinnerStorage = view->m_phiBinnerStorage =

       reinterpret_cast<TrackingRecHit2DSOAView::PhiBinner::index_type*>(get32(9));


   view->m_xl = get32(0);

   view->m_yl = get32(1);

   view->m_xerr = get32(2);

   view->m_yerr = get32(3);

   view->m_chargeAndStatus = reinterpret_cast<uint32_t*>(get32(4));


   if constexpr (!std::is_same<Traits, cms::cudacompat::HostTraits>::value) {

     assert(input == nullptr);

     view->m_xg = get32(5);

     view->m_yg = get32(6);

     view->m_zg = get32(7);

     view->m_rg = get32(8);


     auto get16 = [&](int i) { return m_store16.get() + i * nHits; };

     m_iphi = view->m_iphi = reinterpret_cast<int16_t*>(get16(1));


     view->m_xsize = reinterpret_cast<int16_t*>(get16(2));

     view->m_ysize = reinterpret_cast<int16_t*>(get16(3));

     view->m_detInd = get16(0);


     m_phiBinner = view->m_phiBinner = m_PhiBinnerStore.get();

     m_hitsLayerStart = view->m_hitsLayerStart = reinterpret_cast<uint32_t*>(get32(n32));

   }


   // transfer view

   if constexpr (std::is_same<Traits, cms::cudacompat::GPUTraits>::value) {

     cms::cuda::copyAsync(m_view, view, stream);

   } else {

     m_view.reset(view.release());  // NOLINT: std::move() breaks CUDA version

   }

 }


 #endif  // CUDADataFormats_TrackingRecHit_interface_TrackingRecHit2DHeterogeneous_h

TrackingRecHit2DHeterogeneous::localCoordToHostAsync
cms::cuda::host::unique_ptr< float[]> localCoordToHostAsync(cudaStream_t stream) const
Definition: TrackingRecHit2DHeterogeneous.cc:8

TrackingRecHit2DHeterogeneous::m_store32
unique_ptr< float[]> m_store32
Definition: TrackingRecHit2DHeterogeneous.h:60

mps_fire.i
i
Definition: mps_fire.py:428

TrackingRecHit2DHeterogeneous::m_phiBinnerStorage
PhiBinner::index_type * m_phiBinnerStorage
Definition: TrackingRecHit2DHeterogeneous.h:75

TrackingRecHit2DSOAView::m_detInd
uint16_t * m_detInd
Definition: TrackingRecHit2DSOAView.h:105

TrackingRecHit2DHeterogeneous::m_hitsLayerStart
uint32_t * m_hitsLayerStart
Definition: TrackingRecHit2DHeterogeneous.h:76

TrackingRecHit2DHeterogeneous::hitsLayerStart
auto hitsLayerStart()
Definition: TrackingRecHit2DHeterogeneous.h:42

TrackingRecHit2DHeterogeneous::m_nHits
uint32_t m_nHits
Definition: TrackingRecHit2DHeterogeneous.h:67

TrackingRecHit2DSOAView::m_xsize
int16_t * m_xsize
Definition: TrackingRecHit2DSOAView.h:103

phase1PixelTopology::numberOfLayers
constexpr uint32_t numberOfLayers
Definition: SimplePixelTopology.h:71

relativeConstraints.value
tuple value
Definition: relativeConstraints.py:55

TrackingRecHit2DSOAView::m_yg
float * m_yg
Definition: TrackingRecHit2DSOAView.h:97

TrackingRecHit2DHeterogeneous::nMaxModules
auto nMaxModules() const
Definition: TrackingRecHit2DHeterogeneous.h:38

TrackingRecHit2DHeterogeneous::hitsModuleStart
auto hitsModuleStart() const
Definition: TrackingRecHit2DHeterogeneous.h:41

TrackingRecHit2DSOAView::m_rg
float * m_rg
Definition: TrackingRecHit2DSOAView.h:97

TrackingRecHit2DHeterogeneous::copyFromGPU
void copyFromGPU(TrackingRecHit2DHeterogeneous< cms::cudacompat::GPUTraits > const *input, cudaStream_t stream)

TrackingRecHit2DHeterogeneous::m_view
unique_ptr< TrackingRecHit2DSOAView > m_view
Definition: TrackingRecHit2DHeterogeneous.h:65

TrackingRecHit2DHeterogeneous::n32
static constexpr uint32_t n32
Definition: TrackingRecHit2DHeterogeneous.h:56

TrackingRecHit2DHeterogeneous::~TrackingRecHit2DHeterogeneous
~TrackingRecHit2DHeterogeneous()=default

phase1PixelTopology::numberOfModules
constexpr uint32_t numberOfModules
Definition: SimplePixelTopology.h:70

cms::cuda::stream
uint32_t T const *__restrict__ uint32_t const *__restrict__ int32_t int Histo::index_type cudaStream_t stream
Definition: HistoContainer.h:51

TrackingRecHit2DHeterogeneous
Definition: TrackingRecHit2DHeterogeneous.h:9

cms::cuda::assert
assert(be >=bs)

TrackingRecHit2DSOAView::m_hitsLayerStart
uint32_t * m_hitsLayerStart
Definition: TrackingRecHit2DSOAView.h:113

TrackingRecHit2DHeterogeneous::m_hitsModuleStart
uint32_t const * m_hitsModuleStart
Definition: TrackingRecHit2DHeterogeneous.h:70

cms::cuda::HistoContainer
Definition: HistoContainer.h:101

TrackingRecHit2DSOAView
Definition: TrackingRecHit2DSOAView.h:16

TrackingRecHit2DHeterogeneous::hitsModuleStartToHostAsync
cms::cuda::host::unique_ptr< uint32_t[]> hitsModuleStartToHostAsync(cudaStream_t stream) const
Definition: TrackingRecHit2DHeterogeneous.cc:15

TrackingRecHit2DSOAView::hindex_type
uint32_t hindex_type
Definition: TrackingRecHit2DSOAView.h:21

TrackingRecHit2DHeterogeneous::iphi
auto iphi()
Definition: TrackingRecHit2DHeterogeneous.h:45

input
static std::string const input
Definition: EdmProvDump.cc:47

TrackingRecHit2DHeterogeneous::unique_ptr
typename Traits::template unique_ptr< T > unique_ptr
Definition: TrackingRecHit2DHeterogeneous.h:12

TrackingRecHit2DHeterogeneous::phiBinner
auto phiBinner()
Definition: TrackingRecHit2DHeterogeneous.h:43

TrackingRecHit2DHeterogeneous::m_store16
unique_ptr< uint16_t[]> m_store16
Definition: TrackingRecHit2DHeterogeneous.h:57

TrackingRecHit2DSOAView::m_nHits
uint32_t m_nHits
Definition: TrackingRecHit2DSOAView.h:118

TrackingRecHit2DSOAView::m_yerr
float * m_yerr
Definition: TrackingRecHit2DSOAView.h:94

TrackingRecHit2DHeterogeneous::n16
static constexpr uint32_t n16
Definition: TrackingRecHit2DHeterogeneous.h:55

TrackingRecHit2DSOAView::m_nMaxModules
uint32_t m_nMaxModules
Definition: TrackingRecHit2DSOAView.h:119

TrackingRecHit2DSOAView::m_xl
float * m_xl
Definition: TrackingRecHit2DSOAView.h:93

cms::cuda::HistoContainer::index_type
typename Base::index_type index_type
Definition: HistoContainer.h:106

HLT_FULL_cff.isPhase2
tuple isPhase2
Definition: HLT_FULL_cff.py:5456

TrackingRecHit2DSOAView::PhiBinner
cms::cuda::HistoContainer< int16_t, 256,-1, 8 *sizeof(int16_t), hindex_type, pixelTopology::maxLayers > PhiBinner
Definition: TrackingRecHit2DSOAView.h:24

TrackingRecHit2DHeterogeneous::phiBinnerStorage
auto phiBinnerStorage()
Definition: TrackingRecHit2DHeterogeneous.h:44

TrackingRecHit2DSOAView.h

TrackingRecHit2DHeterogeneous::m_AverageGeometryStore
unique_ptr< TrackingRecHit2DSOAView::AverageGeometry > m_AverageGeometryStore
Definition: TrackingRecHit2DHeterogeneous.h:63

TrackingRecHit2DHeterogeneous::m_nMaxModules
uint32_t m_nMaxModules
Definition: TrackingRecHit2DHeterogeneous.h:72

cms::cuda::copyAsync
void copyAsync(device::unique_ptr< T > &dst, const host::unique_ptr< T > &src, cudaStream_t stream)
Definition: copyAsync.h:20

TrackingRecHit2DSOAView::m_phiBinnerStorage
PhiBinner::index_type * m_phiBinnerStorage
Definition: TrackingRecHit2DSOAView.h:116

pixelCPEforGPU::ParamsOnGPU
Definition: pixelCPEforGPU.h:82

TrackingRecHit2DHeterogeneous::operator=
TrackingRecHit2DHeterogeneous & operator=(const TrackingRecHit2DHeterogeneous &)=delete

TrackingRecHit2DHeterogeneous::view
TrackingRecHit2DSOAView const * view() const
Definition: TrackingRecHit2DHeterogeneous.h:35

TrackingRecHit2DSOAView::m_chargeAndStatus
m_chargeAndStatus[i]
Definition: TrackingRecHit2DSOAView.h:61

TrackingRecHit2DSOAView::m_yl
float * m_yl
Definition: TrackingRecHit2DSOAView.h:93

phase2PixelTopology::numberOfModules
constexpr uint32_t numberOfModules
Definition: SimplePixelTopology.h:211

TrackingRecHit2DSOAView::m_ysize
int16_t * m_ysize
Definition: TrackingRecHit2DSOAView.h:104

TrackingRecHit2DHeterogeneous::nHits
auto nHits() const
Definition: TrackingRecHit2DHeterogeneous.h:37

TrackingRecHit2DHeterogeneous::TrackingRecHit2DHeterogeneous
TrackingRecHit2DHeterogeneous()=default

cudaCheck.h

TrackingRecHit2DSOAView::m_averageGeometry
AverageGeometry * m_averageGeometry
Definition: TrackingRecHit2DSOAView.h:109

copyAsync.h

TrackingRecHit2DSOAView::m_xg
float * m_xg
Definition: TrackingRecHit2DSOAView.h:97

nHits
caConstants::TupleMultiplicity const CAHitNtupletGeneratorKernelsGPU::HitToTuple const cms::cuda::AtomicPairCounter GPUCACell const *__restrict__ uint32_t const *__restrict__ gpuPixelDoublets::CellNeighborsVector const gpuPixelDoublets::CellTracksVector const GPUCACell::OuterHitOfCell const int32_t nHits
Definition: CAHitNtupletGeneratorKernelsImpl.h:43

TrackingRecHit2DSOAView::m_zg
float * m_zg
Definition: TrackingRecHit2DSOAView.h:97

TrackingRecHit2DHeterogeneous::m_phiBinner
PhiBinner * m_phiBinner
Definition: TrackingRecHit2DHeterogeneous.h:74

TrackingRecHit2DSOAView::m_iphi
int16_t * m_iphi
Definition: TrackingRecHit2DSOAView.h:98

phase2PixelTopology::numberOfLayers
constexpr uint8_t numberOfLayers
Definition: SimplePixelTopology.h:212

TrackingRecHit2DHeterogeneous::offsetBPIX2
auto offsetBPIX2() const
Definition: TrackingRecHit2DHeterogeneous.h:39

pixelCPEforGPU.h

TrackingRecHit2DSOAView::m_hitsModuleStart
uint32_t const * m_hitsModuleStart
Definition: TrackingRecHit2DSOAView.h:111

cms::cuda::host::unique_ptr
std::unique_ptr< T, impl::HostDeleter > unique_ptr
Definition: host_unique_ptr.h:21

TrackingRecHit2DSOAView::m_phiBinner
PhiBinner * m_phiBinner
Definition: TrackingRecHit2DSOAView.h:115

TrackingRecHit2DSOAView::m_cpeParams
pixelCPEforGPU::ParamsOnGPU const * m_cpeParams
Definition: TrackingRecHit2DSOAView.h:110

TrackingRecHit2DHeterogeneous::view
TrackingRecHit2DSOAView * view()
Definition: TrackingRecHit2DHeterogeneous.h:34

TrackingRecHit2DHeterogeneous::m_iphi
int16_t * m_iphi
Definition: TrackingRecHit2DHeterogeneous.h:77

TrackingRecHit2DHeterogeneous::m_offsetBPIX2
int32_t m_offsetBPIX2
Definition: TrackingRecHit2DHeterogeneous.h:68

TrackingRecHit2DSOAView::m_xerr
float * m_xerr
Definition: TrackingRecHit2DSOAView.h:94

svgfig.template
def template
Definition: svgfig.py:521

HeterogeneousSoA.h

TrackingRecHit2DHeterogeneous::m_PhiBinnerStore
unique_ptr< TrackingRecHit2DSOAView::PhiBinner > m_PhiBinnerStore
Definition: TrackingRecHit2DHeterogeneous.h:62