dd/df9/TestCUDAProducerGPUEWTask_8cc_source.html

 #include "FWCore/Concurrency/interface/FunctorTask.h"

 #include "FWCore/Concurrency/interface/WaitingTask.h"

 #include "FWCore/Concurrency/interface/WaitingTaskHolder.h"

 #include "FWCore/Framework/interface/Event.h"

 #include "FWCore/Framework/interface/Frameworkfwd.h"

 #include "FWCore/Framework/interface/MakerMacros.h"

 #include "FWCore/Framework/interface/stream/EDProducer.h"

 #include "FWCore/ParameterSet/interface/ParameterSet.h"

 #include "FWCore/ParameterSet/interface/ParameterSetDescription.h"

 #include "FWCore/ServiceRegistry/interface/Service.h"


 #include "CUDADataFormats/Common/interface/Product.h"

 #include "HeterogeneousCore/CUDAUtilities/interface/cudaCheck.h"

 #include "HeterogeneousCore/CUDACore/interface/ScopedContext.h"

 #include "HeterogeneousCore/CUDACore/interface/ContextState.h"

 #include "HeterogeneousCore/CUDAServices/interface/CUDAService.h"

 #include "HeterogeneousCore/CUDATest/interface/Thing.h"

 #include "HeterogeneousCore/CUDAUtilities/interface/host_noncached_unique_ptr.h"


 #include "TestCUDAProducerGPUKernel.h"


 #include <thread>


 class TestCUDAProducerGPUEWTask : public edm::stream::EDProducer<edm::ExternalWork> {

 public:

   explicit TestCUDAProducerGPUEWTask(edm::ParameterSet const& iConfig);

   ~TestCUDAProducerGPUEWTask() override = default;


   static void fillDescriptions(edm::ConfigurationDescriptions& descriptions);


   void acquire(edm::Event const& iEvent,

                edm::EventSetup const& iSetup,

                edm::WaitingTaskWithArenaHolder waitingTaskHolder) override;

   void produce(edm::Event& iEvent, const edm::EventSetup& iSetup) override;


 private:

   void addSimpleWork(edm::EventNumber_t eventID, edm::StreamID streamID, cms::cuda::ScopedContextTask& ctx);


   std::string const label_;

   edm::EDGetTokenT<cms::cuda::Product<cms::cudatest::Thing>> const srcToken_;

   edm::EDPutTokenT<cms::cuda::Product<cms::cudatest::Thing>> const dstToken_;

   TestCUDAProducerGPUKernel gpuAlgo_;

   cms::cuda::ContextState ctxState_;

   cms::cuda::device::unique_ptr<float[]> devicePtr_;

   cms::cuda::host::noncached::unique_ptr<float> hostData_;

 };


 TestCUDAProducerGPUEWTask::TestCUDAProducerGPUEWTask(edm::ParameterSet const& iConfig)

     : label_{iConfig.getParameter<std::string>("@module_label")},

       srcToken_{consumes<cms::cuda::Product<cms::cudatest::Thing>>(iConfig.getParameter<edm::InputTag>("src"))},

       dstToken_{produces<cms::cuda::Product<cms::cudatest::Thing>>()} {

   edm::Service<CUDAService> cs;

   if (cs->enabled()) {

     hostData_ = cms::cuda::make_host_noncached_unique<float>();

   }

 }


 void TestCUDAProducerGPUEWTask::fillDescriptions(edm::ConfigurationDescriptions& descriptions) {

   edm::ParameterSetDescription desc;

   desc.add<edm::InputTag>("src", edm::InputTag());

   descriptions.addWithDefaultLabel(desc);

   descriptions.setComment(

       "This EDProducer is part of the TestCUDAProducer* family. It models a GPU algorithm this is not the first "

       "algorithm in the chain of the GPU EDProducers, and that transfers some data from GPU to CPU multiple times "

       "alternating the transfers and kernel executions (e.g. to decide which kernel to run next based on a value from "

       "GPU). A synchronization between GPU and CPU is needed after each transfer. The synchronizations are implemented "

       "with the ExternalWork extension and explicit TBB tasks within the module. Produces "

       "cms::cuda::Product<cms::cudatest::Thing>.");

 }


 void TestCUDAProducerGPUEWTask::acquire(edm::Event const& iEvent,

                                         edm::EventSetup const& iSetup,

                                         edm::WaitingTaskWithArenaHolder waitingTaskHolder) {

   edm::LogVerbatim("TestCUDAProducerGPUEWTask") << label_ << " TestCUDAProducerGPUEWTask::acquire begin event "

                                                 << iEvent.id().event() << " stream " << iEvent.streamID();


   auto const& in = iEvent.get(srcToken_);

   cms::cuda::ScopedContextAcquire ctx{in, waitingTaskHolder, ctxState_};


   cms::cudatest::Thing const& input = ctx.get(in);


   devicePtr_ = gpuAlgo_.runAlgo(label_, input.get(), ctx.stream());

   // Mimick the need to transfer some of the GPU data back to CPU to

   // be used for something within this module, or to be put in the

   // event.

   cudaCheck(

       cudaMemcpyAsync(hostData_.get(), devicePtr_.get() + 10, sizeof(float), cudaMemcpyDeviceToHost, ctx.stream()));

   // Push a task to run addSimpleWork() after the asynchronous work

   // (and acquire()) has finished instead of produce()

   ctx.pushNextTask([iev = iEvent.id().event(), istr = iEvent.streamID(), this](cms::cuda::ScopedContextTask ctx) {

     addSimpleWork(iev, istr, ctx);

   });


   edm::LogVerbatim("TestCUDAProducerGPUEWTask") << label_ << " TestCUDAProducerGPUEWTask::acquire end event "

                                                 << iEvent.id().event() << " stream " << iEvent.streamID();

 }


 void TestCUDAProducerGPUEWTask::addSimpleWork(edm::EventNumber_t eventID,

                                               edm::StreamID streamID,

                                               cms::cuda::ScopedContextTask& ctx) {

   if (*hostData_ < 13) {

     edm::LogVerbatim("TestCUDAProducerGPUEWTask")

         << label_ << " TestCUDAProducerGPUEWTask::addSimpleWork begin event " << eventID << " stream " << streamID

         << " 10th element " << *hostData_ << " not satisfied, queueing more work";

     cudaCheck(

         cudaMemcpyAsync(hostData_.get(), devicePtr_.get() + 10, sizeof(float), cudaMemcpyDeviceToHost, ctx.stream()));


     ctx.pushNextTask(

         [eventID, streamID, this](cms::cuda::ScopedContextTask ctx) { addSimpleWork(eventID, streamID, ctx); });

     gpuAlgo_.runSimpleAlgo(devicePtr_.get(), ctx.stream());

     edm::LogVerbatim("TestCUDAProducerGPUEWTask")

         << label_ << " TestCUDAProducerGPUEWTask::addSimpleWork end event " << eventID << " stream " << streamID;

   } else {

     edm::LogVerbatim("TestCUDAProducerGPUEWTask")

         << label_ << " TestCUDAProducerGPUEWTask::addSimpleWork event " << eventID << " stream " << streamID

         << " 10th element " << *hostData_ << " not queueing more work";

   }

 }


 void TestCUDAProducerGPUEWTask::produce(edm::Event& iEvent, edm::EventSetup const& iSetup) {

   edm::LogVerbatim("TestCUDAProducerGPUEWTask")

       << label_ << " TestCUDAProducerGPUEWTask::produce begin event " << iEvent.id().event() << " stream "

       << iEvent.streamID() << " 10th element " << *hostData_;

   if (*hostData_ != 13) {

     throw cms::Exception("Assert") << "Expecting 10th element to be 13, got " << *hostData_;

   }


   cms::cuda::ScopedContextProduce ctx{ctxState_};


   ctx.emplace(iEvent, dstToken_, std::move(devicePtr_));


   edm::LogVerbatim("TestCUDAProducerGPUEWTask") << label_ << " TestCUDAProducerGPUEWTask::produce end event "

                                                 << iEvent.id().event() << " stream " << iEvent.streamID();

 }


 DEFINE_FWK_MODULE(TestCUDAProducerGPUEWTask);

Thing.h

edm::LogVerbatim
Log< level::Info, true > LogVerbatim
Definition: MessageLogger.h:128

edm::EventID::event
EventNumber_t event() const
Definition: EventID.h:40

TestCUDAProducerGPUKernel::runSimpleAlgo
void runSimpleAlgo(float *d_data, cudaStream_t stream) const

TestCUDAProducerGPUEWTask
Definition: TestCUDAProducerGPUEWTask.cc:24

edm::ConfigurationDescriptions::addWithDefaultLabel
void addWithDefaultLabel(ParameterSetDescription const &psetDescription)
Definition: ConfigurationDescriptions.cc:87

cms::cudatest::Thing::get
const float * get() const
Definition: Thing.h:13

cms::cuda::ScopedContextTask::pushNextTask
void pushNextTask(F &&f)
Definition: ScopedContext.h:203

edm::Service
Definition: Service.h:30

Exception
Definition: hltDiff.cc:245

TestCUDAProducerGPUEWTask::label_
std::string const label_
Definition: TestCUDAProducerGPUEWTask.cc:39

cms::cuda::ScopedContextTask
Definition: ScopedContext.h:192

DEFINE_FWK_MODULE
#define DEFINE_FWK_MODULE(type)
Definition: MakerMacros.h:16

fwrapper::cs
unique_ptr< ClusterSequence > cs
Definition: fastjetfortran_madfks.cc:47

edm::StreamID
Definition: StreamID.h:30

Event.h

MakerMacros.h

ContextState.h

edm::EventNumber_t
unsigned long long EventNumber_t
Definition: RunLumiEventNumber.h:12

TestCUDAProducerGPUEWTask::~TestCUDAProducerGPUEWTask
~TestCUDAProducerGPUEWTask() override=default

TestCUDAProducerGPUEWTask::gpuAlgo_
TestCUDAProducerGPUKernel gpuAlgo_
Definition: TestCUDAProducerGPUEWTask.cc:42

FunctorTask.h

cms::cuda::host::noncached::unique_ptr
std::unique_ptr< T, impl::HostDeleter > unique_ptr
Definition: host_noncached_unique_ptr.h:23

recoMuon::in
Definition: RecoMuonEnumerators.h:6

cms::cuda::device::unique_ptr
std::unique_ptr< T, impl::DeviceDeleter > unique_ptr
Definition: device_unique_ptr.h:33

ScopedContext.h

edm::EDGetTokenT
Definition: EDGetToken.h:33

Frameworkfwd.h

edm::EDPutTokenT
Definition: EDPutToken.h:33

AlCaHLTBitMon_QueryRunRegistry.string
string string
Definition: AlCaHLTBitMon_QueryRunRegistry.py:256

edm::ParameterSetDescription
Definition: ParameterSetDescription.h:52

TestCUDAProducerGPUKernel.h

input
static std::string const input
Definition: EdmProvDump.cc:47

edm::WaitingTaskWithArenaHolder
Definition: WaitingTaskWithArenaHolder.h:34

ParameterSet.h

WaitingTask.h

EDProducer.h

TestCUDAProducerGPUKernel::runAlgo
cms::cuda::device::unique_ptr< float[]> runAlgo(const std::string &label, cudaStream_t stream) const
Definition: TestCUDAProducerGPUKernel.h:27

iEvent
int iEvent
Definition: GenABIO.cc:224

cms::cuda::ScopedContextAcquire
Definition: ScopedContext.h:101

ParameterSetDescription.h

TestCUDAProducerGPUEWTask::hostData_
cms::cuda::host::noncached::unique_ptr< float > hostData_
Definition: TestCUDAProducerGPUEWTask.cc:45

TestCUDAProducerGPUKernel
Definition: TestCUDAProducerGPUKernel.h:19

CUDAService::enabled
bool enabled() const
Definition: CUDAService.h:22

submitPVResolutionJobs.desc
string desc
Definition: submitPVResolutionJobs.py:251

eostools.move
def move
Definition: eostools.py:511

cms::cudatest::Thing
Definition: Thing.h:8

edm::Event::get
bool get(ProductID const &oid, Handle< PROD > &result) const
Definition: Event.h:346

TestCUDAProducerGPUEWTask::devicePtr_
cms::cuda::device::unique_ptr< float[]> devicePtr_
Definition: TestCUDAProducerGPUEWTask.cc:44

Service.h

TestCUDAProducerGPUEWTask::TestCUDAProducerGPUEWTask
TestCUDAProducerGPUEWTask(edm::ParameterSet const &iConfig)
Definition: TestCUDAProducerGPUEWTask.cc:48

edm::EventSetup
Definition: EventSetup.h:59

edm::ParameterSetDescription::add
ParameterDescriptionBase * add(U const &iLabel, T const &value)
Definition: ParameterSetDescription.h:95

TestCUDAProducerGPUEWTask::fillDescriptions
static void fillDescriptions(edm::ConfigurationDescriptions &descriptions)
Definition: TestCUDAProducerGPUEWTask.cc:58

TestCUDAProducerGPUEWTask::acquire
void acquire(edm::Event const &iEvent, edm::EventSetup const &iSetup, edm::WaitingTaskWithArenaHolder waitingTaskHolder) override
Definition: TestCUDAProducerGPUEWTask.cc:71

Product.h

cms::cuda::ContextState
Definition: ContextState.h:15

TestCUDAProducerGPUEWTask::dstToken_
edm::EDPutTokenT< cms::cuda::Product< cms::cudatest::Thing > > const dstToken_
Definition: TestCUDAProducerGPUEWTask.cc:41

edm::ConfigurationDescriptions::setComment
void setComment(std::string const &value)
Definition: ConfigurationDescriptions.cc:48

edm::stream::EDProducer
Definition: EDProducer.h:36

TestCUDAProducerGPUEWTask::ctxState_
cms::cuda::ContextState ctxState_
Definition: TestCUDAProducerGPUEWTask.cc:43

cudaCheck.h

edm::ParameterSet::getParameter
T getParameter(std::string const &) const
Definition: ParameterSet.h:303

iev
HitContainer const *__restrict__ TkSoA const *__restrict__ Quality const *__restrict__ CAHitNtupletGeneratorKernelsGPU::HitToTuple const *__restrict__ int32_t int32_t int iev
Definition: CAHitNtupletGeneratorKernelsImpl.h:869

HLT_FULL_cff.InputTag
tuple InputTag
Definition: HLT_FULL_cff.py:72505

CUDAService.h

cms::cuda::impl::ScopedContextBase::stream
cudaStream_t stream() const
Definition: ScopedContext.h:34

edm::EventBase::id
edm::EventID id() const
Definition: EventBase.h:59

TestCUDAProducerGPUEWTask::srcToken_
edm::EDGetTokenT< cms::cuda::Product< cms::cudatest::Thing > > const srcToken_
Definition: TestCUDAProducerGPUEWTask.cc:40

edm::InputTag
Definition: InputTag.h:15

edm::Event::streamID
StreamID streamID() const
Definition: Event.h:98

edm::ParameterSet
Definition: ParameterSet.h:47

host_noncached_unique_ptr.h

cudaCheck
#define cudaCheck(ARG,...)
Definition: cudaCheck.h:69

edm::Event
Definition: Event.h:73

cms::cuda::ScopedContextProduce
Definition: ScopedContext.h:149

iConfig
iConfig
Definition: TSGFromPropagation.cc:56

WaitingTaskHolder.h

edm::ConfigurationDescriptions
Definition: ConfigurationDescriptions.h:28

TestCUDAProducerGPUEWTask::addSimpleWork
void addSimpleWork(edm::EventNumber_t eventID, edm::StreamID streamID, cms::cuda::ScopedContextTask &ctx)
Definition: TestCUDAProducerGPUEWTask.cc:98

TestCUDAProducerGPUEWTask::produce
void produce(edm::Event &iEvent, const edm::EventSetup &iSetup) override
Definition: TestCUDAProducerGPUEWTask.cc:120