#include <HelixFitOnGPU.h>

Public Types
using	HitsView = TrackingRecHit2DSOAView

using	OutputSoA = pixelTrack::TrackSoA

using	TupleMultiplicity = caConstants::TupleMultiplicity

using	Tuples = pixelTrack::HitContainer

Public Member Functions
void	allocateOnGPU (Tuples const tuples, TupleMultiplicity const tupleMultiplicity, OutputSoA *outputSoA)

void	deallocateOnGPU ()

	HelixFitOnGPU (float bf, bool fitNas4)

void	launchBrokenLineKernels (HitsView const *hv, uint32_t nhits, uint32_t maxNumberOfTuples, cudaStream_t cudaStream)

void	launchBrokenLineKernelsOnCPU (HitsView const *hv, uint32_t nhits, uint32_t maxNumberOfTuples)

void	launchRiemannKernels (HitsView const *hv, uint32_t nhits, uint32_t maxNumberOfTuples, cudaStream_t cudaStream)

void	launchRiemannKernelsOnCPU (HitsView const *hv, uint32_t nhits, uint32_t maxNumberOfTuples)

void	setBField (double bField)

	~HelixFitOnGPU ()

Private Attributes
float	bField_

const bool	fitNas4_

OutputSoA *	outputSoa_

TupleMultiplicity const *	tupleMultiplicity_ = nullptr

Tuples const *	tuples_ = nullptr

Static Private Attributes
static constexpr uint32_t	maxNumberOfConcurrentFits_ = riemannFit::maxNumberOfConcurrentFits

Detailed Description

Definition at line 34 of file HelixFitOnGPU.h.

Member Typedef Documentation

using HelixFitOnGPU::HitsView = TrackingRecHit2DSOAView

Definition at line 36 of file HelixFitOnGPU.h.

using HelixFitOnGPU::OutputSoA = pixelTrack::TrackSoA

Definition at line 39 of file HelixFitOnGPU.h.

using HelixFitOnGPU::TupleMultiplicity = caConstants::TupleMultiplicity

Definition at line 41 of file HelixFitOnGPU.h.

using HelixFitOnGPU::Tuples = pixelTrack::HitContainer

Definition at line 38 of file HelixFitOnGPU.h.

Constructor & Destructor Documentation

HelixFitOnGPU::HelixFitOnGPU	(	float	bf,
		bool	fitNas4
	)

inlineexplicit

Definition at line 43 of file HelixFitOnGPU.h.

43 : bField_(bf), fitNas4_(fitNas4) {}

HelixFitOnGPU::fitNas4_

const bool fitNas4_

Definition: HelixFitOnGPU.h:65

HLT_FULL_cff.fitNas4

tuple fitNas4

Definition: HLT_FULL_cff.py:9444

HelixFitOnGPU::bField_

float bField_

Definition: HelixFitOnGPU.h:63

HelixFitOnGPU::~HelixFitOnGPU ( )

inline

Definition at line 44 of file HelixFitOnGPU.h.

References deallocateOnGPU().

44 { deallocateOnGPU(); }

HelixFitOnGPU::deallocateOnGPU

void deallocateOnGPU()

Definition: HelixFitOnGPU.cc:16

Member Function Documentation

void HelixFitOnGPU::allocateOnGPU	(	Tuples const *	tuples,
		TupleMultiplicity const *	tupleMultiplicity,
		OutputSoA *	outputSoA
	)

Definition at line 4 of file HelixFitOnGPU.cc.

References cms::cuda::assert(), outputSoa_, tupleMultiplicity, tupleMultiplicity_, tuples, and tuples_.

Referenced by CAHitNtupletGeneratorOnGPU::makeTuples(), and CAHitNtupletGeneratorOnGPU::makeTuplesAsync().

                                                                 {
   tuples_ = tuples;
   tupleMultiplicity_ = tupleMultiplicity;
   outputSoa_ = helix_fit_results;
 
   assert(tuples_);
   assert(tupleMultiplicity_);
   assert(outputSoa_);
 }

void HelixFitOnGPU::deallocateOnGPU ( )

Definition at line 16 of file HelixFitOnGPU.cc.

Referenced by ~HelixFitOnGPU().

16 {}

void HelixFitOnGPU::launchBrokenLineKernels	(	HitsView const *	hv,
		uint32_t	nhits,
		uint32_t	maxNumberOfTuples,
		cudaStream_t	cudaStream
	)

Referenced by CAHitNtupletGeneratorOnGPU::makeTuplesAsync().

void HelixFitOnGPU::launchBrokenLineKernelsOnCPU	(	HitsView const *	hv,
		uint32_t	nhits,
		uint32_t	maxNumberOfTuples
	)

Definition at line 3 of file BrokenLineFitOnGPU.cc.

References cms::cuda::assert(), bField_, fitNas4_, maxNumberOfConcurrentFits_, caConstants::maxNumberOfTuples, hltrates_dqm_sourceclient-live_cfg::offset, outputSoa_, submitPVResolutionJobs::stdout, tupleMultiplicity_, and tuples_.

Referenced by CAHitNtupletGeneratorOnGPU::makeTuples().

                                                                                                                    {
   assert(tuples_);
 
 #ifdef BROKENLINE_DEBUG
   setlinebuf(stdout);
 #endif
 
   //  Fit internals
   auto tkidGPU = std::make_unique<caConstants::tindex_type[]>(maxNumberOfConcurrentFits_);
   auto hitsGPU =
       std::make_unique<double[]>(maxNumberOfConcurrentFits_ * sizeof(riemannFit::Matrix3xNd<6>) / sizeof(double));
   auto hits_geGPU =
       std::make_unique<float[]>(maxNumberOfConcurrentFits_ * sizeof(riemannFit::Matrix6xNf<6>) / sizeof(float));
   auto fast_fit_resultsGPU =
       std::make_unique<double[]>(maxNumberOfConcurrentFits_ * sizeof(riemannFit::Vector4d) / sizeof(double));
 
   for (uint32_t offset = 0; offset < maxNumberOfTuples; offset += maxNumberOfConcurrentFits_) {
     // fit triplets
     kernel_BLFastFit<3>(tuples_,
                         tupleMultiplicity_,
                         hv,
                         tkidGPU.get(),
                         hitsGPU.get(),
                         hits_geGPU.get(),
                         fast_fit_resultsGPU.get(),
                         3,
                         3,
                         offset);
 
     kernel_BLFit<3>(tupleMultiplicity_,
                     bField_,
                     outputSoa_,
                     tkidGPU.get(),
                     hitsGPU.get(),
                     hits_geGPU.get(),
                     fast_fit_resultsGPU.get());
 
     if (fitNas4_) {
       // fit all as 4
       kernel_BLFastFit<4>(tuples_,
                           tupleMultiplicity_,
                           hv,
                           tkidGPU.get(),
                           hitsGPU.get(),
                           hits_geGPU.get(),
                           fast_fit_resultsGPU.get(),
                           4,
                           8,
                           offset);
 
       kernel_BLFit<4>(tupleMultiplicity_,
                       bField_,
                       outputSoa_,
                       tkidGPU.get(),
                       hitsGPU.get(),
                       hits_geGPU.get(),
                       fast_fit_resultsGPU.get());
     } else {
       // fit quads
       kernel_BLFastFit<4>(tuples_,
                           tupleMultiplicity_,
                           hv,
                           tkidGPU.get(),
                           hitsGPU.get(),
                           hits_geGPU.get(),
                           fast_fit_resultsGPU.get(),
                           4,
                           4,
                           offset);
 
       kernel_BLFit<4>(tupleMultiplicity_,
                       bField_,
                       outputSoa_,
                       tkidGPU.get(),
                       hitsGPU.get(),
                       hits_geGPU.get(),
                       fast_fit_resultsGPU.get());
       // fit penta (all 5)
       kernel_BLFastFit<5>(tuples_,
                           tupleMultiplicity_,
                           hv,
                           tkidGPU.get(),
                           hitsGPU.get(),
                           hits_geGPU.get(),
                           fast_fit_resultsGPU.get(),
                           5,
                           5,
                           offset);
 
       kernel_BLFit<5>(tupleMultiplicity_,
                       bField_,
                       outputSoa_,
                       tkidGPU.get(),
                       hitsGPU.get(),
                       hits_geGPU.get(),
                       fast_fit_resultsGPU.get());
       // fit sexta and above (as 6)
       kernel_BLFastFit<6>(tuples_,
                           tupleMultiplicity_,
                           hv,
                           tkidGPU.get(),
                           hitsGPU.get(),
                           hits_geGPU.get(),
                           fast_fit_resultsGPU.get(),
                           6,
                           8,
                           offset);
 
       kernel_BLFit<6>(tupleMultiplicity_,
                       bField_,
                       outputSoa_,
                       tkidGPU.get(),
                       hitsGPU.get(),
                       hits_geGPU.get(),
                       fast_fit_resultsGPU.get());
     }
 
   }  // loop on concurrent fits
 }

void HelixFitOnGPU::launchRiemannKernels	(	HitsView const *	hv,
		uint32_t	nhits,
		uint32_t	maxNumberOfTuples,
		cudaStream_t	cudaStream
	)

Referenced by CAHitNtupletGeneratorOnGPU::makeTuplesAsync().

void HelixFitOnGPU::launchRiemannKernelsOnCPU	(	HitsView const *	hv,
		uint32_t	nhits,
		uint32_t	maxNumberOfTuples
	)

Definition at line 3 of file RiemannFitOnGPU.cc.

References cms::cuda::assert(), bField_, fitNas4_, maxNumberOfConcurrentFits_, caConstants::maxNumberOfTuples, hltrates_dqm_sourceclient-live_cfg::offset, outputSoa_, tupleMultiplicity_, and tuples_.

Referenced by CAHitNtupletGeneratorOnGPU::makeTuples().

                                                                                                             {
   assert(tuples_);
 
   //  Fit internals
   auto hitsGPU =
       std::make_unique<double[]>(maxNumberOfConcurrentFits_ * sizeof(riemannFit::Matrix3xNd<4>) / sizeof(double));
   auto hits_geGPU =
       std::make_unique<float[]>(maxNumberOfConcurrentFits_ * sizeof(riemannFit::Matrix6x4f) / sizeof(float));
   auto fast_fit_resultsGPU =
       std::make_unique<double[]>(maxNumberOfConcurrentFits_ * sizeof(riemannFit::Vector4d) / sizeof(double));
   auto circle_fit_resultsGPU_holder =
       std::make_unique<char[]>(maxNumberOfConcurrentFits_ * sizeof(riemannFit::CircleFit));
   riemannFit::CircleFit *circle_fit_resultsGPU = (riemannFit::CircleFit *)(circle_fit_resultsGPU_holder.get());
 
   for (uint32_t offset = 0; offset < maxNumberOfTuples; offset += maxNumberOfConcurrentFits_) {
     // triplets
     kernel_FastFit<3>(
         tuples_, tupleMultiplicity_, 3, hv, hitsGPU.get(), hits_geGPU.get(), fast_fit_resultsGPU.get(), offset);
 
     kernel_CircleFit<3>(tupleMultiplicity_,
                         3,
                         bField_,
                         hitsGPU.get(),
                         hits_geGPU.get(),
                         fast_fit_resultsGPU.get(),
                         circle_fit_resultsGPU,
                         offset);
 
     kernel_LineFit<3>(tupleMultiplicity_,
                       3,
                       bField_,
                       outputSoa_,
                       hitsGPU.get(),
                       hits_geGPU.get(),
                       fast_fit_resultsGPU.get(),
                       circle_fit_resultsGPU,
                       offset);
 
     // quads
     kernel_FastFit<4>(
         tuples_, tupleMultiplicity_, 4, hv, hitsGPU.get(), hits_geGPU.get(), fast_fit_resultsGPU.get(), offset);
 
     kernel_CircleFit<4>(tupleMultiplicity_,
                         4,
                         bField_,
                         hitsGPU.get(),
                         hits_geGPU.get(),
                         fast_fit_resultsGPU.get(),
                         circle_fit_resultsGPU,
                         offset);
 
     kernel_LineFit<4>(tupleMultiplicity_,
                       4,
                       bField_,
                       outputSoa_,
                       hitsGPU.get(),
                       hits_geGPU.get(),
                       fast_fit_resultsGPU.get(),
                       circle_fit_resultsGPU,
                       offset);
 
     if (fitNas4_) {
       // penta
       kernel_FastFit<4>(
           tuples_, tupleMultiplicity_, 5, hv, hitsGPU.get(), hits_geGPU.get(), fast_fit_resultsGPU.get(), offset);
 
       kernel_CircleFit<4>(tupleMultiplicity_,
                           5,
                           bField_,
                           hitsGPU.get(),
                           hits_geGPU.get(),
                           fast_fit_resultsGPU.get(),
                           circle_fit_resultsGPU,
                           offset);
 
       kernel_LineFit<4>(tupleMultiplicity_,
                         5,
                         bField_,
                         outputSoa_,
                         hitsGPU.get(),
                         hits_geGPU.get(),
                         fast_fit_resultsGPU.get(),
                         circle_fit_resultsGPU,
                         offset);
 
     } else {
       // penta all 5
       kernel_FastFit<5>(
           tuples_, tupleMultiplicity_, 5, hv, hitsGPU.get(), hits_geGPU.get(), fast_fit_resultsGPU.get(), offset);
 
       kernel_CircleFit<5>(tupleMultiplicity_,
                           5,
                           bField_,
                           hitsGPU.get(),
                           hits_geGPU.get(),
                           fast_fit_resultsGPU.get(),
                           circle_fit_resultsGPU,
                           offset);
 
       kernel_LineFit<5>(tupleMultiplicity_,
                         5,
                         bField_,
                         outputSoa_,
                         hitsGPU.get(),
                         hits_geGPU.get(),
                         fast_fit_resultsGPU.get(),
                         circle_fit_resultsGPU,
                         offset);
     }
   }
 }