dd/df9/TestCUDAProducerGPUEWTask_8cc_source.html

 #include "FWCore/Concurrency/interface/FunctorTask.h"
 #include "FWCore/Concurrency/interface/WaitingTask.h"
 #include "FWCore/Concurrency/interface/WaitingTaskHolder.h"
 #include "FWCore/Framework/interface/Event.h"
 #include "FWCore/Framework/interface/Frameworkfwd.h"
 #include "FWCore/Framework/interface/MakerMacros.h"
 #include "FWCore/Framework/interface/stream/EDProducer.h"
 #include "FWCore/ParameterSet/interface/ParameterSet.h"
 #include "FWCore/ParameterSet/interface/ParameterSetDescription.h"
 #include "FWCore/ServiceRegistry/interface/Service.h"

 #include "CUDADataFormats/Common/interface/Product.h"
 #include "HeterogeneousCore/CUDAUtilities/interface/cudaCheck.h"
 #include "HeterogeneousCore/CUDACore/interface/ScopedContext.h"
 #include "HeterogeneousCore/CUDACore/interface/ContextState.h"
 #include "HeterogeneousCore/CUDAServices/interface/CUDAService.h"
 #include "HeterogeneousCore/CUDATest/interface/Thing.h"
 #include "HeterogeneousCore/CUDAUtilities/interface/host_noncached_unique_ptr.h"

 #include "TestCUDAProducerGPUKernel.h"

 #include <thread>

 class TestCUDAProducerGPUEWTask : public edm::stream::EDProducer<edm::ExternalWork> {
 public:
   explicit TestCUDAProducerGPUEWTask(edm::ParameterSet const& iConfig);
   ~TestCUDAProducerGPUEWTask() override = default;

   static void fillDescriptions(edm::ConfigurationDescriptions& descriptions);

   void acquire(edm::Event const& iEvent,
                edm::EventSetup const& iSetup,
                edm::WaitingTaskWithArenaHolder waitingTaskHolder) override;
   void produce(edm::Event& iEvent, const edm::EventSetup& iSetup) override;

 private:
   void addSimpleWork(edm::EventNumber_t eventID, edm::StreamID streamID, cms::cuda::ScopedContextTask& ctx);

   std::string const label_;
   edm::EDGetTokenT<cms::cuda::Product<cms::cudatest::Thing>> const srcToken_;
   edm::EDPutTokenT<cms::cuda::Product<cms::cudatest::Thing>> const dstToken_;
   TestCUDAProducerGPUKernel gpuAlgo_;
   cms::cuda::ContextState ctxState_;
   cms::cuda::device::unique_ptr<float[]> devicePtr_;
   cms::cuda::host::noncached::unique_ptr<float> hostData_;
 };

 TestCUDAProducerGPUEWTask::TestCUDAProducerGPUEWTask(edm::ParameterSet const& iConfig)
     : label_{iConfig.getParameter<std::string>("@module_label")},
       srcToken_{consumes<cms::cuda::Product<cms::cudatest::Thing>>(iConfig.getParameter<edm::InputTag>("src"))},
       dstToken_{produces<cms::cuda::Product<cms::cudatest::Thing>>()} {
   edm::Service<CUDAService> cs;
   if (cs->enabled()) {
     hostData_ = cms::cuda::make_host_noncached_unique<float>();
   }
 }

 void TestCUDAProducerGPUEWTask::fillDescriptions(edm::ConfigurationDescriptions& descriptions) {
   edm::ParameterSetDescription desc;
   desc.add<edm::InputTag>("src", edm::InputTag());
   descriptions.addWithDefaultLabel(desc);
   descriptions.setComment(
       "This EDProducer is part of the TestCUDAProducer* family. It models a GPU algorithm this is not the first "
       "algorithm in the chain of the GPU EDProducers, and that transfers some data from GPU to CPU multiple times "
       "alternating the transfers and kernel executions (e.g. to decide which kernel to run next based on a value from "
       "GPU). A synchronization between GPU and CPU is needed after each transfer. The synchronizations are implemented "
       "with the ExternalWork extension and explicit TBB tasks within the module. Produces "
       "cms::cuda::Product<cms::cudatest::Thing>.");
 }

 void TestCUDAProducerGPUEWTask::acquire(edm::Event const& iEvent,
                                         edm::EventSetup const& iSetup,
                                         edm::WaitingTaskWithArenaHolder waitingTaskHolder) {
   edm::LogVerbatim("TestCUDAProducerGPUEWTask") << label_ << " TestCUDAProducerGPUEWTask::acquire begin event "
                                                 << iEvent.id().event() << " stream " << iEvent.streamID();

   auto const& in = iEvent.get(srcToken_);
   cms::cuda::ScopedContextAcquire ctx{in, waitingTaskHolder, ctxState_};

   cms::cudatest::Thing const& input = ctx.get(in);

   devicePtr_ = gpuAlgo_.runAlgo(label_, input.get(), ctx.stream());
   // Mimick the need to transfer some of the GPU data back to CPU to
   // be used for something within this module, or to be put in the
   // event.
   cudaCheck(
       cudaMemcpyAsync(hostData_.get(), devicePtr_.get() + 10, sizeof(float), cudaMemcpyDeviceToHost, ctx.stream()));
   // Push a task to run addSimpleWork() after the asynchronous work
   // (and acquire()) has finished instead of produce()
   ctx.pushNextTask([iev = iEvent.id().event(), istr = iEvent.streamID(), this](cms::cuda::ScopedContextTask ctx) {
     addSimpleWork(iev, istr, ctx);
   });

   edm::LogVerbatim("TestCUDAProducerGPUEWTask") << label_ << " TestCUDAProducerGPUEWTask::acquire end event "
                                                 << iEvent.id().event() << " stream " << iEvent.streamID();
 }

 void TestCUDAProducerGPUEWTask::addSimpleWork(edm::EventNumber_t eventID,
                                               edm::StreamID streamID,
                                               cms::cuda::ScopedContextTask& ctx) {
   if (*hostData_ < 13) {
     edm::LogVerbatim("TestCUDAProducerGPUEWTask")
         << label_ << " TestCUDAProducerGPUEWTask::addSimpleWork begin event " << eventID << " stream " << streamID
         << " 10th element " << *hostData_ << " not satisfied, queueing more work";
     cudaCheck(
         cudaMemcpyAsync(hostData_.get(), devicePtr_.get() + 10, sizeof(float), cudaMemcpyDeviceToHost, ctx.stream()));

     ctx.pushNextTask(
         [eventID, streamID, this](cms::cuda::ScopedContextTask ctx) { addSimpleWork(eventID, streamID, ctx); });
     gpuAlgo_.runSimpleAlgo(devicePtr_.get(), ctx.stream());
     edm::LogVerbatim("TestCUDAProducerGPUEWTask")
         << label_ << " TestCUDAProducerGPUEWTask::addSimpleWork end event " << eventID << " stream " << streamID;
   } else {
     edm::LogVerbatim("TestCUDAProducerGPUEWTask")
         << label_ << " TestCUDAProducerGPUEWTask::addSimpleWork event " << eventID << " stream " << streamID
         << " 10th element " << *hostData_ << " not queueing more work";
   }
 }

 void TestCUDAProducerGPUEWTask::produce(edm::Event& iEvent, edm::EventSetup const& iSetup) {
   edm::LogVerbatim("TestCUDAProducerGPUEWTask")
       << label_ << " TestCUDAProducerGPUEWTask::produce begin event " << iEvent.id().event() << " stream "
       << iEvent.streamID() << " 10th element " << *hostData_;
   if (*hostData_ != 13) {
     throw cms::Exception("Assert") << "Expecting 10th element to be 13, got " << *hostData_;
   }

   cms::cuda::ScopedContextProduce ctx{ctxState_};

   ctx.emplace(iEvent, dstToken_, std::move(devicePtr_));

   edm::LogVerbatim("TestCUDAProducerGPUEWTask") << label_ << " TestCUDAProducerGPUEWTask::produce end event "
                                                 << iEvent.id().event() << " stream " << iEvent.streamID();
 }

 DEFINE_FWK_MODULE(TestCUDAProducerGPUEWTask);
Thing.h

edm::LogVerbatim
Log< level::Info, true > LogVerbatim
Definition: MessageLogger.h:128

TestCUDAProducerGPUEWTask
Definition: TestCUDAProducerGPUEWTask.cc:24

edm::ConfigurationDescriptions::addWithDefaultLabel
void addWithDefaultLabel(ParameterSetDescription const &psetDescription)
Definition: ConfigurationDescriptions.cc:87

edm::ParameterSet::getParameter
T getParameter(std::string const &) const
Definition: ParameterSet.h:303

cms::cuda::ScopedContextTask::pushNextTask
void pushNextTask(F &&f)
Definition: ScopedContext.h:203

edm::Service
Definition: Service.h:30

Exception
Definition: hltDiff.cc:245

EDProducer.h

TestCUDAProducerGPUEWTask::label_
std::string const label_
Definition: TestCUDAProducerGPUEWTask.cc:39

cms::cuda::ScopedContextTask
Definition: ScopedContext.h:192

TestCUDAProducerGPUKernel::runSimpleAlgo
void runSimpleAlgo(float *d_data, cudaStream_t stream) const

edm::StreamID
Definition: StreamID.h:30

Event.h

edm::EventNumber_t
unsigned long long EventNumber_t
Definition: RunLumiEventNumber.h:12

TestCUDAProducerGPUEWTask::~TestCUDAProducerGPUEWTask
~TestCUDAProducerGPUEWTask() override=default

HLT_2022v15_cff.InputTag
InputTag
Definition: HLT_2022v15_cff.py:60417

TestCUDAProducerGPUEWTask::gpuAlgo_
TestCUDAProducerGPUKernel gpuAlgo_
Definition: TestCUDAProducerGPUEWTask.cc:42

FunctorTask.h

cms::cuda::host::noncached::unique_ptr
std::unique_ptr< T, impl::HostDeleter > unique_ptr
Definition: host_noncached_unique_ptr.h:23

recoMuon::in
Definition: RecoMuonEnumerators.h:6

cms::cuda::device::unique_ptr
std::unique_ptr< T, impl::DeviceDeleter > unique_ptr
Definition: device_unique_ptr.h:33

edm::EDGetTokenT
Definition: EDGetToken.h:37

Frameworkfwd.h

edm::EDPutTokenT
Definition: EDPutToken.h:33

AlCaHLTBitMon_QueryRunRegistry.string
string string
Definition: AlCaHLTBitMon_QueryRunRegistry.py:256

edm::ParameterSetDescription
Definition: ParameterSetDescription.h:52

TestCUDAProducerGPUKernel.h

ScopedContext.h

input
static std::string const input
Definition: EdmProvDump.cc:50

edm::WaitingTaskWithArenaHolder
Definition: WaitingTaskWithArenaHolder.h:34

ParameterSet.h

WaitingTask.h

callgraph.cs
cs
Definition: callgraph.py:102

iEvent
int iEvent
Definition: GenABIO.cc:224

cms::cuda::ScopedContextAcquire
Definition: ScopedContext.h:101

ParameterSetDescription.h

TestCUDAProducerGPUEWTask::hostData_
cms::cuda::host::noncached::unique_ptr< float > hostData_
Definition: TestCUDAProducerGPUEWTask.cc:45

TestCUDAProducerGPUKernel
Definition: TestCUDAProducerGPUKernel.h:19

submitPVResolutionJobs.desc
string desc
Definition: submitPVResolutionJobs.py:251

cms::cudatest::Thing
Definition: Thing.h:8

ContextState.h

TestCUDAProducerGPUEWTask::devicePtr_
cms::cuda::device::unique_ptr< float[]> devicePtr_
Definition: TestCUDAProducerGPUEWTask.cc:44

Service.h

TestCUDAProducerGPUEWTask::TestCUDAProducerGPUEWTask
TestCUDAProducerGPUEWTask(edm::ParameterSet const &iConfig)
Definition: TestCUDAProducerGPUEWTask.cc:48

DEFINE_FWK_MODULE
#define DEFINE_FWK_MODULE(type)
Definition: MakerMacros.h:16

edm::EventSetup
Definition: EventSetup.h:59

TestCUDAProducerGPUEWTask::fillDescriptions
static void fillDescriptions(edm::ConfigurationDescriptions &descriptions)
Definition: TestCUDAProducerGPUEWTask.cc:58

TestCUDAProducerGPUEWTask::acquire
void acquire(edm::Event const &iEvent, edm::EventSetup const &iSetup, edm::WaitingTaskWithArenaHolder waitingTaskHolder) override
Definition: TestCUDAProducerGPUEWTask.cc:71

Product.h

cms::cuda::ContextState
Definition: ContextState.h:15

TestCUDAProducerGPUEWTask::dstToken_
edm::EDPutTokenT< cms::cuda::Product< cms::cudatest::Thing > > const dstToken_
Definition: TestCUDAProducerGPUEWTask.cc:41

edm::ConfigurationDescriptions::setComment
void setComment(std::string const &value)
Definition: ConfigurationDescriptions.cc:48

edm::stream::EDProducer
Definition: EDProducer.h:36

TestCUDAProducerGPUEWTask::ctxState_
cms::cuda::ContextState ctxState_
Definition: TestCUDAProducerGPUEWTask.cc:43

cudaCheck.h

iev
HitContainer const  *__restrict__ TkSoA const  *__restrict__ Quality const  *__restrict__ CAHitNtupletGeneratorKernelsGPU::HitToTuple const  *__restrict__ int32_t int32_t int iev
Definition: CAHitNtupletGeneratorKernelsImpl.h:866

CUDAService.h

TestCUDAProducerGPUEWTask::srcToken_
edm::EDGetTokenT< cms::cuda::Product< cms::cudatest::Thing > > const srcToken_
Definition: TestCUDAProducerGPUEWTask.cc:40

edm::InputTag
Definition: InputTag.h:15

dqmMemoryStats.float
float
Definition: dqmMemoryStats.py:127

edm::ParameterSet
Definition: ParameterSet.h:47

TestCUDAProducerGPUKernel::runAlgo
cms::cuda::device::unique_ptr< float[]> runAlgo(const std::string &label, cudaStream_t stream) const
Definition: TestCUDAProducerGPUKernel.h:27

host_noncached_unique_ptr.h

cudaCheck
#define cudaCheck(ARG,...)
Definition: cudaCheck.h:69

cms::cuda::impl::ScopedContextBase::stream
cudaStream_t stream() const
Definition: ScopedContext.h:34

edm::Event
Definition: Event.h:73

cms::cuda::ScopedContextProduce
Definition: ScopedContext.h:149

MakerMacros.h

WaitingTaskHolder.h

eostools.move
def move(src, dest)
Definition: eostools.py:511

edm::ConfigurationDescriptions
Definition: ConfigurationDescriptions.h:28

TestCUDAProducerGPUEWTask::addSimpleWork
void addSimpleWork(edm::EventNumber_t eventID, edm::StreamID streamID, cms::cuda::ScopedContextTask &ctx)
Definition: TestCUDAProducerGPUEWTask.cc:98

TestCUDAProducerGPUEWTask::produce
void produce(edm::Event &iEvent, const edm::EventSetup &iSetup) override
Definition: TestCUDAProducerGPUEWTask.cc:120