db/dde/CUDAMonitoringService_8cc_source.html

 #include <iostream>

 #include <cuda.h>

 #include "DataFormats/Provenance/interface/ModuleDescription.h"
 #include "FWCore/MessageLogger/interface/MessageLogger.h"
 #include "FWCore/ParameterSet/interface/ConfigurationDescriptions.h"
 #include "FWCore/ParameterSet/interface/ParameterSet.h"
 #include "FWCore/ParameterSet/interface/ParameterSetDescription.h"
 #include "FWCore/ServiceRegistry/interface/ActivityRegistry.h"
 #include "FWCore/ServiceRegistry/interface/ModuleCallingContext.h"
 #include "FWCore/ServiceRegistry/interface/Service.h"
 #include "FWCore/ServiceRegistry/interface/ServiceMaker.h"
 #include "HeterogeneousCore/CUDAServices/interface/CUDAService.h"
 #include "HeterogeneousCore/CUDAUtilities/interface/cudaCheck.h"
 #include "HeterogeneousCore/CUDAUtilities/interface/deviceAllocatorStatus.h"

 namespace edm {
   class StreamContext;
 }

 class CUDAMonitoringService {
 public:
   CUDAMonitoringService(edm::ParameterSet const& iConfig, edm::ActivityRegistry& iRegistry);
   ~CUDAMonitoringService() = default;

   static void fillDescriptions(edm::ConfigurationDescriptions& descriptions);

   void postModuleConstruction(edm::ModuleDescription const& desc);
   void postModuleBeginStream(edm::StreamContext const&, edm::ModuleCallingContext const& mcc);
   void postModuleEvent(edm::StreamContext const& sc, edm::ModuleCallingContext const& mcc);
   void postEvent(edm::StreamContext const& sc);

 private:
   int numberOfDevices_ = 0;
 };

 CUDAMonitoringService::CUDAMonitoringService(edm::ParameterSet const& config, edm::ActivityRegistry& registry) {
   // make sure that CUDA is initialised, and that the CUDAService destructor is called after this service's destructor
   edm::Service<CUDAService> cudaService;
   if (!cudaService->enabled())
     return;
   numberOfDevices_ = cudaService->numberOfDevices();

   if (config.getUntrackedParameter<bool>("memoryConstruction")) {
     registry.watchPostModuleConstruction(this, &CUDAMonitoringService::postModuleConstruction);
   }
   if (config.getUntrackedParameter<bool>("memoryBeginStream")) {
     registry.watchPostModuleBeginStream(this, &CUDAMonitoringService::postModuleBeginStream);
   }
   if (config.getUntrackedParameter<bool>("memoryPerModule")) {
     registry.watchPostModuleEvent(this, &CUDAMonitoringService::postModuleEvent);
   }
   if (config.getUntrackedParameter<bool>("memoryPerEvent")) {
     registry.watchPostEvent(this, &CUDAMonitoringService::postEvent);
   }
 }

 void CUDAMonitoringService::fillDescriptions(edm::ConfigurationDescriptions& descriptions) {
   edm::ParameterSetDescription desc;

   desc.addUntracked<bool>("memoryConstruction", false)
       ->setComment("Print memory information for each device after the construction of each module");
   desc.addUntracked<bool>("memoryBeginStream", true)
       ->setComment("Print memory information for each device after the beginStream() of each module");
   desc.addUntracked<bool>("memoryPerModule", true)
       ->setComment("Print memory information for each device after the event of each module");
   desc.addUntracked<bool>("memoryPerEvent", true)
       ->setComment("Print memory information for each device after each event");

   descriptions.add("CUDAMonitoringService", desc);
   descriptions.setComment(
       "The memory information is the global state of the device. This gets confusing if there are multiple processes "
       "running on the same device. Probably the information retrieval should be re-thought?");
 }

 // activity handlers
 namespace {
   template <typename T>
   void dumpUsedMemory(T& log, int num) {
     auto const cachingDeviceAllocatorStatus = cms::cuda::deviceAllocatorStatus();
     int old = 0;
     cudaCheck(cudaGetDevice(&old));
     constexpr auto mbytes = 1 << 20;
     for (int i = 0; i < num; ++i) {
       size_t freeMemory, totalMemory;
       cudaCheck(cudaSetDevice(i));
       cudaCheck(cudaMemGetInfo(&freeMemory, &totalMemory));
       log << "\n"
           << i << ": " << (totalMemory - freeMemory) / mbytes << " MB used / " << totalMemory / mbytes << " MB total";
       auto found = cachingDeviceAllocatorStatus.find(i);
       if (found != cachingDeviceAllocatorStatus.end()) {
         auto const& cached = found->second;
         log << "; CachingDeviceAllocator " << cached.live / mbytes << " MB live "
             << "(" << cached.liveRequested / mbytes << " MB requested) " << cached.free / mbytes << " MB free "
             << (cached.live + cached.free) / mbytes << " MB total cached";
       }
     }
     cudaCheck(cudaSetDevice(old));
   }
 }  // namespace

 void CUDAMonitoringService::postModuleConstruction(edm::ModuleDescription const& desc) {
   auto log = edm::LogPrint("CUDAMonitoringService");
   log << "CUDA device memory after construction of " << desc.moduleLabel() << " (" << desc.moduleName() << ")";
   dumpUsedMemory(log, numberOfDevices_);
 }

 void CUDAMonitoringService::postModuleBeginStream(edm::StreamContext const&, edm::ModuleCallingContext const& mcc) {
   auto log = edm::LogPrint("CUDAMonitoringService");
   log << "CUDA device memory after beginStream() of " << mcc.moduleDescription()->moduleLabel() << " ("
       << mcc.moduleDescription()->moduleName() << ")";
   dumpUsedMemory(log, numberOfDevices_);
 }

 void CUDAMonitoringService::postModuleEvent(edm::StreamContext const&, edm::ModuleCallingContext const& mcc) {
   auto log = edm::LogPrint("CUDAMonitoringService");
   log << "CUDA device memory after processing an event by " << mcc.moduleDescription()->moduleLabel() << " ("
       << mcc.moduleDescription()->moduleName() << ")";
   dumpUsedMemory(log, numberOfDevices_);
 }

 void CUDAMonitoringService::postEvent(edm::StreamContext const& sc) {
   auto log = edm::LogPrint("CUDAMonitoringService");
   log << "CUDA device memory after event";
   dumpUsedMemory(log, numberOfDevices_);
 }

 DEFINE_FWK_SERVICE(CUDAMonitoringService);
edm::ActivityRegistry::watchPostModuleConstruction
void watchPostModuleConstruction(PostModuleConstruction::slot_type const &iSlot)
Definition: ActivityRegistry.h:602

CUDAMonitoringService::CUDAMonitoringService
CUDAMonitoringService(edm::ParameterSet const &iConfig, edm::ActivityRegistry &iRegistry)
Definition: CUDAMonitoringService.cc:38

edm::ModuleCallingContext::moduleDescription
ModuleDescription const  * moduleDescription() const
Definition: ModuleCallingContext.h:53

mps_fire.i
i
Definition: mps_fire.py:428

edm::Service
Definition: Service.h:30

MessageLogger.h

CUDAMonitoringService
Definition: CUDAMonitoringService.cc:22

edm::ModuleCallingContext
Definition: ModuleCallingContext.h:32

edm::ActivityRegistry::watchPostEvent
void watchPostEvent(PostEvent::slot_type const &iSlot)
Definition: ActivityRegistry.h:480

CUDAMonitoringService::fillDescriptions
static void fillDescriptions(edm::ConfigurationDescriptions &descriptions)
Definition: CUDAMonitoringService.cc:59

edm::ActivityRegistry::watchPostModuleEvent
void watchPostModuleEvent(PostModuleEvent::slot_type const &iSlot)
Definition: ActivityRegistry.h:679

edm::ModuleDescription::moduleName
std::string const  & moduleName() const
Definition: ModuleDescription.h:42

config
Definition: config.py:1

ModuleDescription.h

edm::ParameterSetDescription
Definition: ParameterSetDescription.h:52

CUDAService::numberOfDevices
int numberOfDevices() const
Definition: CUDAService.h:24

CUDAMonitoringService::postEvent
void postEvent(edm::StreamContext const &sc)
Definition: CUDAMonitoringService.cc:123

ParameterSet.h

ServiceMaker.h

ParameterSetDescription.h

cms::cuda::deviceAllocatorStatus
allocator::GpuCachedBytes deviceAllocatorStatus()
Definition: deviceAllocatorStatus.cc:6

submitPVResolutionJobs.desc
string desc
Definition: submitPVResolutionJobs.py:251

Service.h

edm::LogPrint
Log< level::Warning, true > LogPrint
Definition: MessageLogger.h:130

DEFINE_FWK_SERVICE
#define DEFINE_FWK_SERVICE(type)
Definition: ServiceMaker.h:97

edm::ConfigurationDescriptions::setComment
void setComment(std::string const &value)
Definition: ConfigurationDescriptions.cc:48

EgammaValidation_cff.num
num
Definition: EgammaValidation_cff.py:33

edm::ActivityRegistry::watchPostModuleBeginStream
void watchPostModuleBeginStream(PostModuleBeginStream::slot_type const &iSlot)
Definition: ActivityRegistry.h:269

cudaCheck.h

edm::ConfigurationDescriptions::add
void add(std::string const &label, ParameterSetDescription const &psetDescription)
Definition: ConfigurationDescriptions.cc:57

ActivityRegistry.h

CUDAService::enabled
bool enabled() const
Definition: CUDAService.h:22

CUDAService.h

CUDAMonitoringService::numberOfDevices_
int numberOfDevices_
Definition: CUDAMonitoringService.cc:35

edm
HLT enums.
Definition: AlignableModifier.h:19

CUDAMonitoringService::postModuleConstruction
void postModuleConstruction(edm::ModuleDescription const &desc)
Definition: CUDAMonitoringService.cc:103

edm::ParameterSet
Definition: ParameterSet.h:47

CUDAMonitoringService::postModuleBeginStream
void postModuleBeginStream(edm::StreamContext const &, edm::ModuleCallingContext const &mcc)
Definition: CUDAMonitoringService.cc:109

ConfigurationDescriptions.h

cudaCheck
#define cudaCheck(ARG,...)
Definition: cudaCheck.h:69

CUDAMonitoringService::~CUDAMonitoringService
~CUDAMonitoringService()=default

dqm-mbProfile.log
log
Definition: dqm-mbProfile.py:17

edm::ModuleDescription
Definition: ModuleDescription.h:21

T
long double T
Definition: Basic3DVectorLD.h:48

newFWLiteAna.found
found
Definition: newFWLiteAna.py:118

edm::ModuleDescription::moduleLabel
std::string const  & moduleLabel() const
Definition: ModuleDescription.h:43

edm::StreamContext
Definition: StreamContext.h:31

ModuleCallingContext.h

edm::ActivityRegistry
Definition: ActivityRegistry.h:135

edm::ConfigurationDescriptions
Definition: ConfigurationDescriptions.h:28

CUDAMonitoringService::postModuleEvent
void postModuleEvent(edm::StreamContext const &sc, edm::ModuleCallingContext const &mcc)
Definition: CUDAMonitoringService.cc:116

deviceAllocatorStatus.h