d2/dc1/TritonClient_8h_source.html

 #ifndef HeterogeneousCore_SonicTriton_TritonClient
 #define HeterogeneousCore_SonicTriton_TritonClient

 #include "FWCore/ParameterSet/interface/ParameterSet.h"
 #include "FWCore/ParameterSet/interface/ParameterSetDescription.h"
 #include "HeterogeneousCore/SonicCore/interface/SonicClient.h"
 #include "HeterogeneousCore/SonicTriton/interface/TritonData.h"
 #include "HeterogeneousCore/SonicTriton/interface/TritonService.h"

 #include <map>
 #include <vector>
 #include <string>
 #include <exception>
 #include <unordered_map>

 #include "grpc_client.h"
 #include "grpc_service.pb.h"

 enum class TritonBatchMode { Rectangular = 1, Ragged = 2 };

 class TritonClient : public SonicClient<TritonInputMap, TritonOutputMap> {
 public:
   struct ServerSideStats {
     uint64_t inference_count_;
     uint64_t execution_count_;
     uint64_t success_count_;
     uint64_t cumm_time_ns_;
     uint64_t queue_time_ns_;
     uint64_t compute_input_time_ns_;
     uint64_t compute_infer_time_ns_;
     uint64_t compute_output_time_ns_;
   };

   //constructor
   TritonClient(const edm::ParameterSet& params, const std::string& debugName);

   //destructor
   ~TritonClient() override;

   //accessors
   unsigned batchSize() const;
   TritonBatchMode batchMode() const { return batchMode_; }
   bool verbose() const { return verbose_; }
   bool useSharedMemory() const { return useSharedMemory_; }
   void setUseSharedMemory(bool useShm) { useSharedMemory_ = useShm; }
   bool setBatchSize(unsigned bsize);
   void setBatchMode(TritonBatchMode batchMode);
   void resetBatchMode();
   void reset() override;
   TritonServerType serverType() const { return serverType_; }
   bool isLocal() const { return isLocal_; }

   //for fillDescriptions
   static void fillPSetDescription(edm::ParameterSetDescription& iDesc);

 protected:
   //helpers
   bool noOuterDim() const { return noOuterDim_; }
   unsigned outerDim() const { return outerDim_; }
   unsigned nEntries() const;
   void getResults(const std::vector<std::shared_ptr<triton::client::InferResult>>& results);
   void evaluate() override;
   template <typename F>
   bool handle_exception(F&& call);

   void reportServerSideStats(const ServerSideStats& stats) const;
   ServerSideStats summarizeServerStats(const inference::ModelStatistics& start_status,
                                        const inference::ModelStatistics& end_status) const;

   inference::ModelStatistics getServerSideStatus() const;

   //members
   unsigned maxOuterDim_;
   unsigned outerDim_;
   bool noOuterDim_;
   unsigned nEntries_;
   TritonBatchMode batchMode_;
   bool manualBatchMode_;
   bool verbose_;
   bool useSharedMemory_;
   TritonServerType serverType_;
   bool isLocal_;
   grpc_compression_algorithm compressionAlgo_;
   triton::client::Headers headers_;

   std::unique_ptr<triton::client::InferenceServerGrpcClient> client_;
   //stores timeout, model name and version
   std::vector<triton::client::InferOptions> options_;

 private:
   friend TritonInputData;
   friend TritonOutputData;

   //private accessors only used by data
   auto client() { return client_.get(); }
   void addEntry(unsigned entry);
   void resizeEntries(unsigned entry);
 };

 #endif
TritonClient::ServerSideStats::execution_count_
uint64_t execution_count_
Definition: TritonClient.h:25

TritonClient::verbose
bool verbose() const
Definition: TritonClient.h:43

TritonClient::noOuterDim
bool noOuterDim() const
Definition: TritonClient.h:58

TritonClient::ServerSideStats::cumm_time_ns_
uint64_t cumm_time_ns_
Definition: TritonClient.h:27

TritonClient::getResults
void getResults(const std::vector< std::shared_ptr< triton::client::InferResult >> &results)
Definition: TritonClient.cc:341

SonicClientBase::debugName
const std::string & debugName() const
Definition: SonicClientBase.h:26

TritonClient::maxOuterDim_
unsigned maxOuterDim_
Definition: TritonClient.h:73

TritonClient::setBatchSize
bool setBatchSize(unsigned bsize)
Definition: TritonClient.cc:264

TritonBatchMode::Ragged

TritonClient::noOuterDim_
bool noOuterDim_
Definition: TritonClient.h:75

TritonClient::~TritonClient
~TritonClient() override
Definition: TritonClient.cc:237

TritonClient::ServerSideStats
Definition: TritonClient.h:23

TritonClient::addEntry
void addEntry(unsigned entry)
Definition: TritonClient.cc:297

TritonService.h

TritonClient::ServerSideStats::success_count_
uint64_t success_count_
Definition: TritonClient.h:26

TritonClient::manualBatchMode_
bool manualBatchMode_
Definition: TritonClient.h:78

TritonClient::useSharedMemory_
bool useSharedMemory_
Definition: TritonClient.h:80

TritonClient::TritonOutputData
friend TritonOutputData
Definition: TritonClient.h:92

TritonClient::batchMode
TritonBatchMode batchMode() const
Definition: TritonClient.h:42

TritonClient::client_
std::unique_ptr< triton::client::InferenceServerGrpcClient > client_
Definition: TritonClient.h:86

TritonClient::TritonClient
TritonClient(const edm::ParameterSet &params, const std::string &debugName)
Definition: TritonClient.cc:56

TritonClient::TritonInputData
friend TritonInputData
Definition: TritonClient.h:91

TritonClient::ServerSideStats::compute_infer_time_ns_
uint64_t compute_infer_time_ns_
Definition: TritonClient.h:30

SonicClient
Definition: SonicClient.h:9

TritonClient::ServerSideStats::inference_count_
uint64_t inference_count_
Definition: TritonClient.h:24

TritonClient::summarizeServerStats
ServerSideStats summarizeServerStats(const inference::ModelStatistics &start_status, const inference::ModelStatistics &end_status) const
Definition: TritonClient.cc:536

AlCaHLTBitMon_QueryRunRegistry.string
string string
Definition: AlCaHLTBitMon_QueryRunRegistry.py:256

TritonClient::isLocal_
bool isLocal_
Definition: TritonClient.h:82

TritonBatchMode
TritonBatchMode
Definition: TritonClient.h:19

edm::ParameterSetDescription
Definition: ParameterSetDescription.h:52

ParameterSet.h

TritonClient::verbose_
bool verbose_
Definition: TritonClient.h:79

TritonClient::resetBatchMode
void resetBatchMode()
Definition: TritonClient.cc:255

TritonClient::serverType_
TritonServerType serverType_
Definition: TritonClient.h:81

mps_splice.entry
entry
Definition: mps_splice.py:68

ParameterSetDescription.h

TritonClient::handle_exception
bool handle_exception(F &&call)
Definition: TritonClient.cc:322

TritonData.h

SonicClient.h

TritonClient::nEntries_
unsigned nEntries_
Definition: TritonClient.h:76

TritonClient::compressionAlgo_
grpc_compression_algorithm compressionAlgo_
Definition: TritonClient.h:83

TritonClient::serverType
TritonServerType serverType() const
Definition: TritonClient.h:50

TritonClient::client
auto client()
Definition: TritonClient.h:95

submitPVValidationJobs.params
def params
Definition: submitPVValidationJobs.py:483

TritonClient::resizeEntries
void resizeEntries(unsigned entry)
Definition: TritonClient.cc:283

TritonClient::getServerSideStatus
inference::ModelStatistics getServerSideStatus() const
Definition: TritonClient.cc:557

TritonClient::headers_
triton::client::Headers headers_
Definition: TritonClient.h:84

TritonClient::nEntries
unsigned nEntries() const
Definition: TritonClient.cc:260

TritonClient::isLocal
bool isLocal() const
Definition: TritonClient.h:51

cond::uint64_t
unsigned long long uint64_t
Definition: Time.h:13

TritonClient
Definition: TritonClient.h:21

TritonClient::setUseSharedMemory
void setUseSharedMemory(bool useShm)
Definition: TritonClient.h:45

TritonClient::outerDim_
unsigned outerDim_
Definition: TritonClient.h:74

TritonClient::batchSize
unsigned batchSize() const
Definition: TritonClient.cc:262

TritonClient::outerDim
unsigned outerDim() const
Definition: TritonClient.h:59

TritonClient::evaluate
void evaluate() override
Definition: TritonClient.cc:364

TritonClient::setBatchMode
void setBatchMode(TritonBatchMode batchMode)
Definition: TritonClient.cc:246

trackerHitRTTI::vector
Definition: trackerHitRTTI.h:21

TritonClient::reportServerSideStats
void reportServerSideStats(const ServerSideStats &stats) const
Definition: TritonClient.cc:499

TritonClient::reset
void reset() override
Definition: TritonClient.cc:310

TritonServerType
TritonServerType
Definition: TritonService.h:29

TritonClient::useSharedMemory
bool useSharedMemory() const
Definition: TritonClient.h:44

mysort.results
results
Definition: mysort.py:8

TritonClient::ServerSideStats::queue_time_ns_
uint64_t queue_time_ns_
Definition: TritonClient.h:28

edm::ParameterSet
Definition: ParameterSet.h:48

TritonClient::ServerSideStats::compute_output_time_ns_
uint64_t compute_output_time_ns_
Definition: TritonClient.h:31

TritonClient::fillPSetDescription
static void fillPSetDescription(edm::ParameterSetDescription &iDesc)
Definition: TritonClient.cc:569

F
static uInt32 F(BLOWFISH_CTX *ctx, uInt32 x)
Definition: blowfish.cc:163

TritonClient::batchMode_
TritonBatchMode batchMode_
Definition: TritonClient.h:77

TritonBatchMode::Rectangular

TritonClient::options_
std::vector< triton::client::InferOptions > options_
Definition: TritonClient.h:88

TritonClient::ServerSideStats::compute_input_time_ns_
uint64_t compute_input_time_ns_
Definition: TritonClient.h:29

dqmMemoryStats.stats
stats
Definition: dqmMemoryStats.py:134