d1/d6d/CAHitNtupletGeneratorKernelsImpl_8h_source.html

//

// Original Author: Felice Pantaleo, CERN

//


// #define NTUPLE_DEBUG


#include <cmath>

#include <cstdint>


#include <cuda_runtime.h>


#include "HeterogeneousCore/CUDAUtilities/interface/cudaCheck.h"

#include "HeterogeneousCore/CUDAUtilities/interface/cuda_assert.h"

#include "RecoLocalTracker/SiPixelRecHits/interface/pixelCPEforGPU.h"


#include "CAConstants.h"

#include "CAHitNtupletGeneratorKernels.h"

#include "GPUCACell.h"

#include "gpuFishbone.h"

#include "gpuPixelDoublets.h"


using HitsOnGPU = TrackingRecHit2DSOAView;

using HitsOnCPU = TrackingRecHit2DCUDA;


using HitToTuple = caConstants::HitToTuple;

using TupleMultiplicity = caConstants::TupleMultiplicity;


using Quality = pixelTrack::Quality;

using TkSoA = pixelTrack::TrackSoA;

using HitContainer = pixelTrack::HitContainer;


__global__ void kernel_checkOverflows(HitContainer const *foundNtuplets,

                                      caConstants::TupleMultiplicity const *tupleMultiplicity,

                                      CAHitNtupletGeneratorKernelsGPU::HitToTuple const *hitToTuple,

                                      cms::cuda::AtomicPairCounter *apc,

                                      GPUCACell const *__restrict__ cells,

                                      uint32_t const *__restrict__ nCells,

                                      gpuPixelDoublets::CellNeighborsVector const *cellNeighbors,

                                      gpuPixelDoublets::CellTracksVector const *cellTracks,

                                      GPUCACell::OuterHitOfCell const *__restrict__ isOuterHitOfCell,

                                      uint32_t nHits,

                                      uint32_t maxNumberOfDoublets,

                                      CAHitNtupletGeneratorKernelsGPU::Counters *counters) {

  auto first = threadIdx.x + blockIdx.x * blockDim.x;


  auto &c = *counters;

  // counters once per event

  if (0 == first) {

    atomicAdd(&c.nEvents, 1);

    atomicAdd(&c.nHits, nHits);

    atomicAdd(&c.nCells, *nCells);

    atomicAdd(&c.nTuples, apc->get().m);

    atomicAdd(&c.nFitTracks, tupleMultiplicity->size());

  }


#ifdef NTUPLE_DEBUG

  if (0 == first) {

    printf("number of found cells %d, found tuples %d with total hits %d out of %d\n",

           *nCells,

           apc->get().m,

           apc->get().n,

           nHits);

    if (apc->get().m < caConstants::maxNumberOfQuadruplets()) {

      assert(foundNtuplets->size(apc->get().m) == 0);

      assert(foundNtuplets->size() == apc->get().n);

    }

  }


  for (int idx = first, nt = foundNtuplets->nbins(); idx < nt; idx += gridDim.x * blockDim.x) {

    if (foundNtuplets->size(idx) > 5)

      printf("ERROR %d, %d\n", idx, foundNtuplets->size(idx));

    assert(foundNtuplets->size(idx) < 6);

    for (auto ih = foundNtuplets->begin(idx); ih != foundNtuplets->end(idx); ++ih)

      assert(*ih < nHits);

  }

#endif


  if (0 == first) {

    if (apc->get().m >= caConstants::maxNumberOfQuadruplets)

      printf("Tuples overflow\n");

    if (*nCells >= maxNumberOfDoublets)

      printf("Cells overflow\n");

    if (cellNeighbors && cellNeighbors->full())

      printf("cellNeighbors overflow\n");

    if (cellTracks && cellTracks->full())

      printf("cellTracks overflow\n");

  }


  for (int idx = first, nt = (*nCells); idx < nt; idx += gridDim.x * blockDim.x) {

    auto const &thisCell = cells[idx];

    if (thisCell.outerNeighbors().full())  //++tooManyNeighbors[thisCell.theLayerPairId];

      printf("OuterNeighbors overflow %d in %d\n", idx, thisCell.layerPairId());

    if (thisCell.tracks().full())  //++tooManyTracks[thisCell.theLayerPairId];

      printf("Tracks overflow %d in %d\n", idx, thisCell.layerPairId());

    if (thisCell.isKilled())

      atomicAdd(&c.nKilledCells, 1);

    if (thisCell.unused())

      atomicAdd(&c.nEmptyCells, 1);

    if (0 == hitToTuple->size(thisCell.inner_hit_id()) && 0 == hitToTuple->size(thisCell.outer_hit_id()))

      atomicAdd(&c.nZeroTrackCells, 1);

  }


  for (int idx = first, nt = nHits; idx < nt; idx += gridDim.x * blockDim.x) {

    if (isOuterHitOfCell[idx].full())  // ++tooManyOuterHitOfCell;

      printf("OuterHitOfCell overflow %d\n", idx);

  }

}


__global__ void kernel_fishboneCleaner(GPUCACell const *cells, uint32_t const *__restrict__ nCells, Quality *quality) {

  constexpr auto bad = pixelTrack::Quality::bad;


  auto first = threadIdx.x + blockIdx.x * blockDim.x;

  for (int idx = first, nt = (*nCells); idx < nt; idx += gridDim.x * blockDim.x) {

    auto const &thisCell = cells[idx];

    if (!thisCell.isKilled())

      continue;


    for (auto it : thisCell.tracks())

      quality[it] = bad;

  }

}


__global__ void kernel_earlyDuplicateRemover(GPUCACell const *cells,

                                             uint32_t const *__restrict__ nCells,

                                             HitContainer *foundNtuplets,

                                             Quality *quality) {

  // constexpr auto bad = trackQuality::bad;

  constexpr auto dup = pixelTrack::Quality::dup;

  // constexpr auto loose = trackQuality::loose;


  assert(nCells);

  auto first = threadIdx.x + blockIdx.x * blockDim.x;

  for (int idx = first, nt = (*nCells); idx < nt; idx += gridDim.x * blockDim.x) {

    auto const &thisCell = cells[idx];


    if (thisCell.tracks().size() < 2)

      continue;

    //if (0==thisCell.theUsed) continue;

    // if (thisCell.theDoubletId < 0) continue;


    uint32_t maxNh = 0;


    // find maxNh

    for (auto it : thisCell.tracks()) {

      auto nh = foundNtuplets->size(it);

      maxNh = std::max(nh, maxNh);

    }


    for (auto it : thisCell.tracks()) {

      if (foundNtuplets->size(it) != maxNh)

        quality[it] = dup;  //no race:  simple assignment of the same constant

    }

  }

}


__global__ void kernel_fastDuplicateRemover(GPUCACell const *__restrict__ cells,

                                            uint32_t const *__restrict__ nCells,

                                            HitContainer const *__restrict__ foundNtuplets,

                                            TkSoA *__restrict__ tracks) {

  constexpr auto bad = pixelTrack::Quality::bad;

  constexpr auto dup = pixelTrack::Quality::dup;

  constexpr auto loose = pixelTrack::Quality::loose;


  assert(nCells);


  auto first = threadIdx.x + blockIdx.x * blockDim.x;

  for (int idx = first, nt = (*nCells); idx < nt; idx += gridDim.x * blockDim.x) {

    auto const &thisCell = cells[idx];

    if (thisCell.tracks().size() < 2)

      continue;

    // if (thisCell.theDoubletId < 0) continue;


    float mc = 10000.f;

    uint16_t im = 60000;


    auto score = [&](auto it) {

      return std::abs(tracks->tip(it));  // tip

      // return tracks->chi2(it);  //chi2

    };


    // find min score

    for (auto it : thisCell.tracks()) {

      if (tracks->quality(it) == loose && score(it) < mc) {

        mc = score(it);

        im = it;

      }

    }

    // mark all other duplicates

    for (auto it : thisCell.tracks()) {

      if (tracks->quality(it) != bad && it != im)

        tracks->quality(it) = dup;  //no race:  simple assignment of the same constant

    }

  }

}


__global__ void kernel_connect(cms::cuda::AtomicPairCounter *apc1,

                               cms::cuda::AtomicPairCounter *apc2,  // just to zero them,

                               GPUCACell::Hits const *__restrict__ hhp,

                               GPUCACell *cells,

                               uint32_t const *__restrict__ nCells,

                               gpuPixelDoublets::CellNeighborsVector *cellNeighbors,

                               GPUCACell::OuterHitOfCell const *__restrict__ isOuterHitOfCell,

                               float hardCurvCut,

                               float ptmin,

                               float CAThetaCutBarrel,

                               float CAThetaCutForward,

                               float dcaCutInnerTriplet,

                               float dcaCutOuterTriplet) {

  auto const &hh = *hhp;


  auto firstCellIndex = threadIdx.y + blockIdx.y * blockDim.y;

  auto first = threadIdx.x;

  auto stride = blockDim.x;


  if (0 == (firstCellIndex + first)) {

    (*apc1) = 0;

    (*apc2) = 0;

  }  // ready for next kernel


  for (int idx = firstCellIndex, nt = (*nCells); idx < nt; idx += gridDim.y * blockDim.y) {

    auto cellIndex = idx;

    auto &thisCell = cells[idx];

    auto innerHitId = thisCell.inner_hit_id();

    int numberOfPossibleNeighbors = isOuterHitOfCell[innerHitId].size();

    auto vi = isOuterHitOfCell[innerHitId].data();


    auto ri = thisCell.inner_r(hh);

    auto zi = thisCell.inner_z(hh);


    auto ro = thisCell.outer_r(hh);

    auto zo = thisCell.outer_z(hh);

    auto isBarrel = thisCell.inner_detIndex(hh) < caConstants::last_barrel_detIndex;


    for (int j = first; j < numberOfPossibleNeighbors; j += stride) {

      auto otherCell = __ldg(vi + j);

      auto &oc = cells[otherCell];

      auto r1 = oc.inner_r(hh);

      auto z1 = oc.inner_z(hh);

      bool aligned = GPUCACell::areAlignedRZ(

          r1,

          z1,

          ri,

          zi,

          ro,

          zo,

          ptmin,

          isBarrel ? CAThetaCutBarrel : CAThetaCutForward);  // 2.f*thetaCut); // FIXME tune cuts

      if (aligned && thisCell.dcaCut(hh,

                                     oc,

                                     oc.inner_detIndex(hh) < caConstants::last_bpix1_detIndex ? dcaCutInnerTriplet

                                                                                              : dcaCutOuterTriplet,

                                     hardCurvCut)) {  // FIXME tune cuts

        oc.addOuterNeighbor(cellIndex, *cellNeighbors);

        thisCell.setUsedBit(1);

        oc.setUsedBit(1);

      }

    }  // loop on inner cells

  }    // loop on outer cells

}


__global__ void kernel_find_ntuplets(GPUCACell::Hits const *__restrict__ hhp,

                                     GPUCACell *__restrict__ cells,

                                     uint32_t const *nCells,

                                     gpuPixelDoublets::CellTracksVector *cellTracks,

                                     HitContainer *foundNtuplets,

                                     cms::cuda::AtomicPairCounter *apc,

                                     Quality *__restrict__ quality,

                                     unsigned int minHitsPerNtuplet) {

  // recursive: not obvious to widen

  auto const &hh = *hhp;


  auto first = threadIdx.x + blockIdx.x * blockDim.x;

  for (int idx = first, nt = (*nCells); idx < nt; idx += gridDim.x * blockDim.x) {

    auto const &thisCell = cells[idx];

    if (thisCell.isKilled())

      continue;  // cut by earlyFishbone


    auto pid = thisCell.layerPairId();

    auto doit = minHitsPerNtuplet > 3 ? pid < 3 : pid < 8 || pid > 12;

    if (doit) {

      GPUCACell::TmpTuple stack;

      stack.reset();

      thisCell.find_ntuplets(hh, cells, *cellTracks, *foundNtuplets, *apc, quality, stack, minHitsPerNtuplet, pid < 3);

      assert(stack.empty());

      // printf("in %d found quadruplets: %d\n", cellIndex, apc->get());

    }

  }

}


__global__ void kernel_mark_used(GPUCACell::Hits const *__restrict__ hhp,

                                 GPUCACell *__restrict__ cells,

                                 uint32_t const *nCells) {

  auto first = threadIdx.x + blockIdx.x * blockDim.x;

  for (int idx = first, nt = (*nCells); idx < nt; idx += gridDim.x * blockDim.x) {

    auto &thisCell = cells[idx];

    if (!thisCell.tracks().empty())

      thisCell.setUsedBit(2);

  }

}


__global__ void kernel_countMultiplicity(HitContainer const *__restrict__ foundNtuplets,

                                         Quality const *__restrict__ quality,

                                         caConstants::TupleMultiplicity *tupleMultiplicity) {

  auto first = blockIdx.x * blockDim.x + threadIdx.x;

  for (int it = first, nt = foundNtuplets->nbins(); it < nt; it += gridDim.x * blockDim.x) {

    auto nhits = foundNtuplets->size(it);

    if (nhits < 3)

      continue;

    if (quality[it] == pixelTrack::Quality::dup)

      continue;

    assert(quality[it] == pixelTrack::Quality::bad);

    if (nhits > 5)

      printf("wrong mult %d %d\n", it, nhits);

    assert(nhits < 8);

    tupleMultiplicity->countDirect(nhits);

  }

}


__global__ void kernel_fillMultiplicity(HitContainer const *__restrict__ foundNtuplets,

                                        Quality const *__restrict__ quality,

                                        caConstants::TupleMultiplicity *tupleMultiplicity) {

  auto first = blockIdx.x * blockDim.x + threadIdx.x;

  for (int it = first, nt = foundNtuplets->nbins(); it < nt; it += gridDim.x * blockDim.x) {

    auto nhits = foundNtuplets->size(it);

    if (nhits < 3)

      continue;

    if (quality[it] == pixelTrack::Quality::dup)

      continue;

    assert(quality[it] == pixelTrack::Quality::bad);

    if (nhits > 5)

      printf("wrong mult %d %d\n", it, nhits);

    assert(nhits < 8);

    tupleMultiplicity->fillDirect(nhits, it);

  }

}


__global__ void kernel_classifyTracks(HitContainer const *__restrict__ tuples,

                                      TkSoA const *__restrict__ tracks,

                                      CAHitNtupletGeneratorKernelsGPU::QualityCuts cuts,

                                      Quality *__restrict__ quality) {

  int first = blockDim.x * blockIdx.x + threadIdx.x;

  for (int it = first, nt = tuples->nbins(); it < nt; it += gridDim.x * blockDim.x) {

    auto nhits = tuples->size(it);

    if (nhits == 0)

      break;  // guard


    // if duplicate: not even fit

    if (quality[it] == pixelTrack::Quality::dup)

      continue;


    assert(quality[it] == pixelTrack::Quality::bad);


    // mark doublets as bad

    if (nhits < 3)

      continue;


    // if the fit has any invalid parameters, mark it as bad

    bool isNaN = false;

    for (int i = 0; i < 5; ++i) {

      isNaN |= std::isnan(tracks->stateAtBS.state(it)(i));

    }

    if (isNaN) {

#ifdef NTUPLE_DEBUG

      printf("NaN in fit %d size %d chi2 %f\n", it, tuples->size(it), tracks->chi2(it));

#endif

      continue;

    }


    // compute a pT-dependent chi2 cut

    // default parameters:

    //   - chi2MaxPt = 10 GeV

    //   - chi2Coeff = { 0.68177776, 0.74609577, -0.08035491, 0.00315399 }

    //   - chi2Scale = 30 for broken line fit, 45 for Riemann fit

    // (see CAHitNtupletGeneratorGPU.cc)

    float pt = std::min<float>(tracks->pt(it), cuts.chi2MaxPt);

    float chi2Cut = cuts.chi2Scale *

                    (cuts.chi2Coeff[0] + pt * (cuts.chi2Coeff[1] + pt * (cuts.chi2Coeff[2] + pt * cuts.chi2Coeff[3])));

    // above number were for Quads not normalized so for the time being just multiple by ndof for Quads  (triplets to be understood)

    if (3.f * tracks->chi2(it) >= chi2Cut) {

#ifdef NTUPLE_DEBUG

      printf("Bad fit %d size %d pt %f eta %f chi2 %f\n",

             it,

             tuples->size(it),

             tracks->pt(it),

             tracks->eta(it),

             3.f * tracks->chi2(it));

#endif

      continue;

    }


    // impose "region cuts" based on the fit results (phi, Tip, pt, cotan(theta)), Zip)

    // default cuts:

    //   - for triplets:    |Tip| < 0.3 cm, pT > 0.5 GeV, |Zip| < 12.0 cm

    //   - for quadruplets: |Tip| < 0.5 cm, pT > 0.3 GeV, |Zip| < 12.0 cm

    // (see CAHitNtupletGeneratorGPU.cc)

    auto const &region = (nhits > 3) ? cuts.quadruplet : cuts.triplet;

    bool isOk = (std::abs(tracks->tip(it)) < region.maxTip) and (tracks->pt(it) > region.minPt) and

                (std::abs(tracks->zip(it)) < region.maxZip);


    if (isOk)

      quality[it] = pixelTrack::Quality::loose;

  }

}


__global__ void kernel_doStatsForTracks(HitContainer const *__restrict__ tuples,

                                        Quality const *__restrict__ quality,

                                        CAHitNtupletGeneratorKernelsGPU::Counters *counters) {

  int first = blockDim.x * blockIdx.x + threadIdx.x;

  for (int idx = first, ntot = tuples->nbins(); idx < ntot; idx += gridDim.x * blockDim.x) {

    if (tuples->size(idx) == 0)

      break;  //guard

    if (quality[idx] != pixelTrack::Quality::loose)

      continue;

    atomicAdd(&(counters->nGoodTracks), 1);

  }

}


__global__ void kernel_countHitInTracks(HitContainer const *__restrict__ tuples,

                                        Quality const *__restrict__ quality,

                                        CAHitNtupletGeneratorKernelsGPU::HitToTuple *hitToTuple) {

  int first = blockDim.x * blockIdx.x + threadIdx.x;

  for (int idx = first, ntot = tuples->nbins(); idx < ntot; idx += gridDim.x * blockDim.x) {

    if (tuples->size(idx) == 0)

      break;  // guard

    if (quality[idx] != pixelTrack::Quality::loose)

      continue;

    for (auto h = tuples->begin(idx); h != tuples->end(idx); ++h)

      hitToTuple->countDirect(*h);

  }

}


__global__ void kernel_fillHitInTracks(HitContainer const *__restrict__ tuples,

                                       Quality const *__restrict__ quality,

                                       CAHitNtupletGeneratorKernelsGPU::HitToTuple *hitToTuple) {

  int first = blockDim.x * blockIdx.x + threadIdx.x;

  for (int idx = first, ntot = tuples->nbins(); idx < ntot; idx += gridDim.x * blockDim.x) {

    if (tuples->size(idx) == 0)

      break;  // guard

    if (quality[idx] != pixelTrack::Quality::loose)

      continue;

    for (auto h = tuples->begin(idx); h != tuples->end(idx); ++h)

      hitToTuple->fillDirect(*h, idx);

  }

}


__global__ void kernel_fillHitDetIndices(HitContainer const *__restrict__ tuples,

                                         TrackingRecHit2DSOAView const *__restrict__ hhp,

                                         HitContainer *__restrict__ hitDetIndices) {

  int first = blockDim.x * blockIdx.x + threadIdx.x;

  // copy offsets

  for (int idx = first, ntot = tuples->totbins(); idx < ntot; idx += gridDim.x * blockDim.x) {

    hitDetIndices->off[idx] = tuples->off[idx];

  }

  // fill hit indices

  auto const &hh = *hhp;

  auto nhits = hh.nHits();

  for (int idx = first, ntot = tuples->size(); idx < ntot; idx += gridDim.x * blockDim.x) {

    assert(tuples->bins[idx] < nhits);

    hitDetIndices->bins[idx] = hh.detectorIndex(tuples->bins[idx]);

  }

}


__global__ void kernel_doStatsForHitInTracks(CAHitNtupletGeneratorKernelsGPU::HitToTuple const *__restrict__ hitToTuple,

                                             CAHitNtupletGeneratorKernelsGPU::Counters *counters) {

  auto &c = *counters;

  int first = blockDim.x * blockIdx.x + threadIdx.x;

  for (int idx = first, ntot = hitToTuple->nbins(); idx < ntot; idx += gridDim.x * blockDim.x) {

    if (hitToTuple->size(idx) == 0)

      continue;  // SHALL NOT BE break

    atomicAdd(&c.nUsedHits, 1);

    if (hitToTuple->size(idx) > 1)

      atomicAdd(&c.nDupHits, 1);

  }

}


__global__ void kernel_sharedHitCleaner(TrackingRecHit2DSOAView const *__restrict__ hhp,

                                        HitContainer const *__restrict__ ptuples,

                                        TkSoA const *__restrict__ ptracks,

                                        Quality *__restrict__ quality,

                                        uint16_t nmin,

                                        CAHitNtupletGeneratorKernelsGPU::HitToTuple const *__restrict__ phitToTuple) {

  constexpr auto bad = pixelTrack::Quality::bad;

  constexpr auto dup = pixelTrack::Quality::dup;

  // constexpr auto loose = trackQuality::loose;


  auto &hitToTuple = *phitToTuple;

  auto const &foundNtuplets = *ptuples;

  auto const &tracks = *ptracks;


  auto const &hh = *hhp;

  int l1end = hh.hitsLayerStart()[1];


  int first = blockDim.x * blockIdx.x + threadIdx.x;

  for (int idx = first, ntot = hitToTuple.nbins(); idx < ntot; idx += gridDim.x * blockDim.x) {

    if (hitToTuple.size(idx) < 2)

      continue;


    float mc = 10000.f;

    uint16_t im = 60000;

    uint32_t maxNh = 0;


    // find maxNh

    for (auto it = hitToTuple.begin(idx); it != hitToTuple.end(idx); ++it) {

      uint32_t nh = foundNtuplets.size(*it);

      maxNh = std::max(nh, maxNh);

    }

    // kill all tracks shorter than maxHn (only triplets???)

    for (auto it = hitToTuple.begin(idx); it != hitToTuple.end(idx); ++it) {

      uint32_t nh = foundNtuplets.size(*it);


      //checking if shared hit is on bpix1 and if the tuple is short enough

      if (idx < l1end and nh > nmin)

        continue;


      if (maxNh != nh)

        quality[*it] = dup;

    }


    if (maxNh > 3)

      continue;

    // for triplets choose best tip!

    for (auto ip = hitToTuple.begin(idx); ip != hitToTuple.end(idx); ++ip) {

      auto const it = *ip;

      if (quality[it] != bad && std::abs(tracks.tip(it)) < mc) {

        mc = std::abs(tracks.tip(it));

        im = it;

      }

    }

    // mark duplicates

    for (auto ip = hitToTuple.begin(idx); ip != hitToTuple.end(idx); ++ip) {

      auto const it = *ip;

      if (quality[it] != bad && it != im)

        quality[it] = dup;  //no race:  simple assignment of the same constant

    }

  }  // loop over hits

}


__global__ void kernel_print_found_ntuplets(TrackingRecHit2DSOAView const *__restrict__ hhp,

                                            HitContainer const *__restrict__ ptuples,

                                            TkSoA const *__restrict__ ptracks,

                                            Quality const *__restrict__ quality,

                                            CAHitNtupletGeneratorKernelsGPU::HitToTuple const *__restrict__ phitToTuple,

                                            uint32_t maxPrint,

                                            int iev) {

  auto const &foundNtuplets = *ptuples;

  auto const &tracks = *ptracks;

  int first = blockDim.x * blockIdx.x + threadIdx.x;

  for (int i = first, np = std::min(maxPrint, foundNtuplets.nbins()); i < np; i += blockDim.x * gridDim.x) {

    auto nh = foundNtuplets.size(i);

    if (nh < 3)

      continue;

    printf("TK: %d %d %d %f %f %f %f %f %f %f %d %d %d %d %d\n",

           10000 * iev + i,

           int(quality[i]),

           nh,

           tracks.charge(i),

           tracks.pt(i),

           tracks.eta(i),

           tracks.phi(i),

           tracks.tip(i),

           tracks.zip(i),

           //           asinhf(fit_results[i].par(3)),

           tracks.chi2(i),

           *foundNtuplets.begin(i),

           *(foundNtuplets.begin(i) + 1),

           *(foundNtuplets.begin(i) + 2),

           nh > 3 ? int(*(foundNtuplets.begin(i) + 3)) : -1,

           nh > 4 ? int(*(foundNtuplets.begin(i) + 4)) : -1);

  }

}


__global__ void kernel_printCounters(cAHitNtupletGenerator::Counters const *counters) {

  auto const &c = *counters;

  printf(

      "||Counters | nEvents | nHits | nCells | nTuples | nFitTacks  |  nGoodTracks | nUsedHits | nDupHits | "

      "nKilledCells | "

      "nEmptyCells | nZeroTrackCells ||\n");

  printf("Counters Raw %lld %lld %lld %lld %lld %lld %lld %lld %lld %lld %lld\n",

         c.nEvents,

         c.nHits,

         c.nCells,

         c.nTuples,

         c.nGoodTracks,

         c.nFitTracks,

         c.nUsedHits,

         c.nDupHits,

         c.nKilledCells,

         c.nEmptyCells,

         c.nZeroTrackCells);

  printf("Counters Norm %lld ||  %.1f|  %.1f|  %.1f|  %.1f|  %.1f|  %.1f|  %.1f|  %.1f|  %.3f|  %.3f||\n",

         c.nEvents,

         c.nHits / double(c.nEvents),

         c.nCells / double(c.nEvents),

         c.nTuples / double(c.nEvents),

         c.nFitTracks / double(c.nEvents),

         c.nGoodTracks / double(c.nEvents),

         c.nUsedHits / double(c.nEvents),

         c.nDupHits / double(c.nEvents),

         c.nKilledCells / double(c.nEvents),

         c.nEmptyCells / double(c.nCells),

         c.nZeroTrackCells / double(c.nCells));

}