d0/d00/CUDATestWrapperAdditionModule_8cc_source.html

 #include <cstddef>
 #include <cstdint>
 #include <iostream>
 #include <random>
 #include <vector>

 #include <cuda_runtime.h>

 #include "FWCore/Framework/interface/Event.h"
 #include "FWCore/Framework/interface/Frameworkfwd.h"
 #include "FWCore/Framework/interface/global/EDAnalyzer.h"
 #include "FWCore/ParameterSet/interface/ConfigurationDescriptions.h"
 #include "FWCore/ParameterSet/interface/ParameterSet.h"
 #include "FWCore/ParameterSet/interface/ParameterSetDescription.h"
 #include "FWCore/ServiceRegistry/interface/Service.h"
 #include "HeterogeneousCore/CUDAServices/interface/CUDAInterface.h"
 #include "HeterogeneousTest/CUDAWrapper/interface/DeviceAdditionWrapper.h"
 #include "HeterogeneousCore/CUDAUtilities/interface/cudaCheck.h"

 class CUDATestWrapperAdditionModule : public edm::global::EDAnalyzer<> {
 public:
   explicit CUDATestWrapperAdditionModule(edm::ParameterSet const& config);
   ~CUDATestWrapperAdditionModule() override = default;

   static void fillDescriptions(edm::ConfigurationDescriptions& descriptions);

   void analyze(edm::StreamID, edm::Event const& event, edm::EventSetup const& setup) const override;

 private:
   const uint32_t size_;
 };

 CUDATestWrapperAdditionModule::CUDATestWrapperAdditionModule(edm::ParameterSet const& config)
     : size_(config.getParameter<uint32_t>("size")) {}

 void CUDATestWrapperAdditionModule::fillDescriptions(edm::ConfigurationDescriptions& descriptions) {
   edm::ParameterSetDescription desc;
   desc.add<uint32_t>("size", 1024 * 1024);
   descriptions.addWithDefaultLabel(desc);
 }

 void CUDATestWrapperAdditionModule::analyze(edm::StreamID,
                                             edm::Event const& event,
                                             edm::EventSetup const& setup) const {
   // require CUDA for running
   edm::Service<CUDAInterface> cuda;
   if (not cuda or not cuda->enabled()) {
     std::cout << "The CUDAService is not available or disabled, the test will be skipped.\n";
     return;
   }

   // random number generator with a gaussian distribution
   std::random_device rd{};
   std::default_random_engine rand{rd()};
   std::normal_distribution<float> dist{0., 1.};

   // tolerance
   constexpr float epsilon = 0.000001;

   // allocate input and output host buffers
   std::vector<float> in1_h(size_);
   std::vector<float> in2_h(size_);
   std::vector<float> out_h(size_);

   // fill the input buffers with random data, and the output buffer with zeros
   for (size_t i = 0; i < size_; ++i) {
     in1_h[i] = dist(rand);
     in2_h[i] = dist(rand);
     out_h[i] = 0.;
   }

   // allocate input and output buffers on the device
   float* in1_d;
   float* in2_d;
   float* out_d;
   cudaCheck(cudaMalloc(&in1_d, size_ * sizeof(float)));
   cudaCheck(cudaMalloc(&in2_d, size_ * sizeof(float)));
   cudaCheck(cudaMalloc(&out_d, size_ * sizeof(float)));

   // copy the input data to the device
   cudaCheck(cudaMemcpy(in1_d, in1_h.data(), size_ * sizeof(float), cudaMemcpyHostToDevice));
   cudaCheck(cudaMemcpy(in2_d, in2_h.data(), size_ * sizeof(float), cudaMemcpyHostToDevice));

   // fill the output buffer with zeros
   cudaCheck(cudaMemset(out_d, 0, size_ * sizeof(float)));

   // launch the 1-dimensional kernel for vector addition
   cms::cudatest::wrapper_add_vectors_f(in1_d, in2_d, out_d, size_);

   // copy the results from the device to the host
   cudaCheck(cudaMemcpy(out_h.data(), out_d, size_ * sizeof(float), cudaMemcpyDeviceToHost));

   // wait for all the operations to complete
   cudaCheck(cudaDeviceSynchronize());

   // check the results
   for (size_t i = 0; i < size_; ++i) {
     float sum = in1_h[i] + in2_h[i];
     assert(out_h[i] < sum + epsilon);
     assert(out_h[i] > sum - epsilon);
   }

   std::cout << "All tests passed.\n";
 }

 #include "FWCore/Framework/interface/MakerMacros.h"
 DEFINE_FWK_MODULE(CUDATestWrapperAdditionModule);
CUDAInterface.h

edm::ConfigurationDescriptions::addWithDefaultLabel
void addWithDefaultLabel(ParameterSetDescription const &psetDescription)
Definition: ConfigurationDescriptions.cc:87

mps_fire.i
i
Definition: mps_fire.py:429

edm::Service
Definition: Service.h:30

CUDATestWrapperAdditionModule::~CUDATestWrapperAdditionModule
~CUDATestWrapperAdditionModule() override=default

cms::cudatest::wrapper_add_vectors_f
void wrapper_add_vectors_f(const float *__restrict__ in1, const float *__restrict__ in2, float *__restrict__ out, size_t size)
Definition: ROCmTestDeviceAdditionAlgo.hip.cc:19

edm::global::EDAnalyzer
Definition: EDAnalyzer.h:32

edm::StreamID
Definition: StreamID.h:30

Event.h

config
Definition: config.py:1

ALPAKA_ACCELERATOR_NAMESPACE::brokenline::constexpr
if constexpr(n > 3)
Definition: BrokenLine.h:164

cms::cuda::assert
assert(be >=bs)

Frameworkfwd.h

edm::ParameterSetDescription
Definition: ParameterSetDescription.h:52

EDAnalyzer.h

geometryDiff.epsilon
int epsilon
Definition: geometryDiff.py:26

ParameterSet.h

ParameterSetDescription.h

nano_mu_digi_cff.float
float
Definition: nano_mu_digi_cff.py:14

CUDATestWrapperAdditionModule::fillDescriptions
static void fillDescriptions(edm::ConfigurationDescriptions &descriptions)
Definition: CUDATestWrapperAdditionModule.cc:36

or
The Signals That Services Can Subscribe To This is based on ActivityRegistry and is current per Services can connect to the signals distributed by the ActivityRegistry in order to monitor the activity of the application Each possible callback has some defined which we here list in angle e< void, edm::EventID const  &, edm::Timestamp const  & > We also list in braces which AR_WATCH_USING_METHOD_ is used for those or
Definition: Activities.doc:12

submitPVResolutionJobs.desc
string desc
Definition: submitPVResolutionJobs.py:254

CUDATestWrapperAdditionModule::size_
const uint32_t size_
Definition: CUDATestWrapperAdditionModule.cc:30

Service.h

DEFINE_FWK_MODULE
#define DEFINE_FWK_MODULE(type)
Definition: MakerMacros.h:16

edm::EventSetup
Definition: EventSetup.h:56

singleTopDQM_cfi.setup
setup
 SETUP
Definition: singleTopDQM_cfi.py:37

DeviceAdditionWrapper.h

cudaCheck.h

CUDATestWrapperAdditionModule::analyze
void analyze(edm::StreamID, edm::Event const &event, edm::EventSetup const &setup) const override
Definition: CUDATestWrapperAdditionModule.cc:42

ecalDigis_cff.cuda
cuda
Definition: ecalDigis_cff.py:33

edm::ParameterSet
Definition: ParameterSet.h:48

ConfigurationDescriptions.h

gather_cfg.cout
cout
Definition: gather_cfg.py:144

cudaCheck
#define cudaCheck(ARG,...)
Definition: cudaCheck.h:69

CUDATestWrapperAdditionModule
Definition: CUDATestWrapperAdditionModule.cc:20

edm::Event
Definition: Event.h:73

MakerMacros.h

edm::ConfigurationDescriptions
Definition: ConfigurationDescriptions.h:28

CUDATestWrapperAdditionModule::CUDATestWrapperAdditionModule
CUDATestWrapperAdditionModule(edm::ParameterSet const &config)
Definition: CUDATestWrapperAdditionModule.cc:33

event
Definition: event.py:1