d8/d3c/TritonData_8h_source.html

 #ifndef HeterogeneousCore_SonicTriton_TritonData

 #define HeterogeneousCore_SonicTriton_TritonData


 #include "FWCore/Utilities/interface/Exception.h"

 #include "FWCore/Utilities/interface/Span.h"


 #include <vector>

 #include <string>

 #include <unordered_map>

 #include <numeric>

 #include <algorithm>

 #include <memory>

 #include <atomic>


 #include "grpc_client.h"

 #include "grpc_service.pb.h"


 //forward declaration

 class TritonClient;

 template <typename IO>

 class TritonMemResource;

 template <typename IO>

 class TritonHeapResource;

 template <typename IO>

 class TritonCpuShmResource;

 #ifdef TRITON_ENABLE_GPU

 template <typename IO>

 class TritonGpuShmResource;

 #endif


 //aliases for local input and output types

 template <typename DT>

 using TritonInput = std::vector<std::vector<DT>>;

 template <typename DT>

 using TritonOutput = std::vector<edm::Span<const DT*>>;


 //other useful typdefs

 template <typename DT>

 using TritonInputContainer = std::shared_ptr<TritonInput<DT>>;


 //store all the info needed for triton input and output

 //NOTE: this class is not const-thread-safe, and should only be used with stream or one modules

 //(generally recommended for SONIC, but especially necessary here)

 template <typename IO>

 class TritonData {

 public:

   using Result = triton::client::InferResult;

   using TensorMetadata = inference::ModelMetadataResponse_TensorMetadata;

   using ShapeType = std::vector<int64_t>;

   using ShapeView = edm::Span<ShapeType::const_iterator>;


   //constructor

   TritonData(const std::string& name, const TensorMetadata& model_info, TritonClient* client, const std::string& pid);


   //some members can be modified

   void setShape(const ShapeType& newShape);

   void setShape(unsigned loc, int64_t val);


   //io accessors

   template <typename DT>

   TritonInputContainer<DT> allocate(bool reserve = true);

   template <typename DT>

   void toServer(TritonInputContainer<DT> ptr);

   void prepare();

   template <typename DT>

   TritonOutput<DT> fromServer() const;


   //const accessors

   const ShapeView& shape() const { return shape_; }

   int64_t byteSize() const { return byteSize_; }

   const std::string& dname() const { return dname_; }

   unsigned batchSize() const { return batchSize_; }


   //utilities

   bool variableDims() const { return variableDims_; }

   int64_t sizeDims() const { return productDims_; }

   //default to dims if shape isn't filled

   int64_t sizeShape() const { return variableDims_ ? dimProduct(shape_) : sizeDims(); }


 private:

   friend class TritonClient;

   friend class TritonMemResource<IO>;

   friend class TritonHeapResource<IO>;

   friend class TritonCpuShmResource<IO>;

 #ifdef TRITON_ENABLE_GPU

   friend class TritonGpuShmResource<IO>;

 #endif


   //private accessors only used internally or by client

   unsigned fullLoc(unsigned loc) const { return loc + (noBatch_ ? 0 : 1); }

   void setBatchSize(unsigned bsize);

   void reset();

   void setResult(std::shared_ptr<Result> result) { result_ = result; }

   IO* data() { return data_.get(); }

   void updateMem(size_t size);

   void computeSizes();

   void resetSizes();

   triton::client::InferenceServerGrpcClient* client();


   //helpers

   bool anyNeg(const ShapeView& vec) const {

     return std::any_of(vec.begin(), vec.end(), [](int64_t i) { return i < 0; });

   }

   int64_t dimProduct(const ShapeView& vec) const {

     return std::accumulate(vec.begin(), vec.end(), 1, std::multiplies<int64_t>());

   }

   void createObject(IO** ioptr);

   //generates a unique id number for each instance of the class

   unsigned uid() const {

     static std::atomic<unsigned> uid{0};

     return ++uid;

   }

   std::string xput() const;


   //members

   std::string name_;

   std::shared_ptr<IO> data_;

   TritonClient* client_;

   bool useShm_;

   std::string shmName_;

   const ShapeType dims_;

   bool noBatch_;

   unsigned batchSize_;

   ShapeType fullShape_;

   ShapeView shape_;

   bool variableDims_;

   int64_t productDims_;

   std::string dname_;

   inference::DataType dtype_;

   int64_t byteSize_;

   size_t sizeShape_;

   size_t byteSizePerBatch_;

   size_t totalByteSize_;

   //can be modified in otherwise-const fromServer() method in TritonMemResource::copyOutput():

   //TritonMemResource holds a non-const pointer to an instance of this class

   //so that TritonOutputGpuShmResource can store data here

   std::shared_ptr<void> holder_;

   std::shared_ptr<TritonMemResource<IO>> memResource_;

   std::shared_ptr<Result> result_;

   //can be modified in otherwise-const fromServer() method to prevent multiple calls

   CMS_SA_ALLOW mutable bool done_{};

 };


 using TritonInputData = TritonData<triton::client::InferInput>;

 using TritonInputMap = std::unordered_map<std::string, TritonInputData>;

 using TritonOutputData = TritonData<triton::client::InferRequestedOutput>;

 using TritonOutputMap = std::unordered_map<std::string, TritonOutputData>;


 //avoid "explicit specialization after instantiation" error

 template <>

 std::string TritonInputData::xput() const;

 template <>

 std::string TritonOutputData::xput() const;

 template <>

 template <typename DT>

 TritonInputContainer<DT> TritonInputData::allocate(bool reserve);

 template <>

 template <typename DT>

 void TritonInputData::toServer(std::shared_ptr<TritonInput<DT>> ptr);

 template <>

 void TritonOutputData::prepare();

 template <>

 template <typename DT>

 TritonOutput<DT> TritonOutputData::fromServer() const;

 template <>

 void TritonInputData::reset();

 template <>

 void TritonOutputData::reset();

 template <>

 void TritonInputData::createObject(triton::client::InferInput** ioptr);

 template <>

 void TritonOutputData::createObject(triton::client::InferRequestedOutput** ioptr);


 //explicit template instantiation declarations

 extern template class TritonData<triton::client::InferInput>;

 extern template class TritonData<triton::client::InferRequestedOutput>;


 #endif

TritonData::data_
std::shared_ptr< IO > data_
Definition: TritonData.h:117

TritonData::setBatchSize
void setBatchSize(unsigned bsize)
Definition: TritonData.cc:99

edm::Span::begin
T begin() const
Definition: Span.h:20

CMS_SA_ALLOW
#define CMS_SA_ALLOW

mps_fire.i
i
Definition: mps_fire.py:428

TritonInputContainer
std::shared_ptr< TritonInput< DT >> TritonInputContainer
Definition: TritonData.h:39

TritonData::dimProduct
int64_t dimProduct(const ShapeView &vec) const
Definition: TritonData.h:104

TritonData::holder_
std::shared_ptr< void > holder_
Definition: TritonData.h:137

TritonData::done_
bool done_
Definition: TritonData.h:141

TritonData::totalByteSize_
size_t totalByteSize_
Definition: TritonData.h:133

TritonHeapResource
Definition: TritonData.h:23

TritonData::allocate
TritonInputContainer< DT > allocate(bool reserve=true)
Definition: TritonData.cc:150

Span.h

edm::Span::end
T end() const
Definition: Span.h:21

hgcalPerformanceValidation.val
tuple val
Definition: hgcalPerformanceValidation.py:364

TritonData::byteSizePerBatch_
size_t byteSizePerBatch_
Definition: TritonData.h:132

TritonData::fullLoc
unsigned fullLoc(unsigned loc) const
Definition: TritonData.h:90

TritonData::computeSizes
void computeSizes()
Definition: TritonData.cc:106

TritonData::dims_
const ShapeType dims_
Definition: TritonData.h:121

TritonData::setResult
void setResult(std::shared_ptr< Result > result)
Definition: TritonData.h:93

TritonData::xput
std::string xput() const
Definition: TritonData.cc:58

TritonData::useShm_
bool useShm_
Definition: TritonData.h:119

mergeVDriftHistosByStation.name
string name
Definition: mergeVDriftHistosByStation.py:78

TritonData::shape_
ShapeView shape_
Definition: TritonData.h:125

TritonData::sizeShape
int64_t sizeShape() const
Definition: TritonData.h:78

TritonData::updateMem
void updateMem(size_t size)
Definition: TritonData.cc:121

AlCaHLTBitMon_QueryRunRegistry.string
string string
Definition: AlCaHLTBitMon_QueryRunRegistry.py:256

TritonData::variableDims
bool variableDims() const
Definition: TritonData.h:75

mps_fire.result
tuple result
Definition: mps_fire.py:311

TritonCpuShmResource
Definition: TritonData.h:25

TritonData::productDims_
int64_t productDims_
Definition: TritonData.h:127

TritonData::anyNeg
bool anyNeg(const ShapeView &vec) const
Definition: TritonData.h:101

TritonData::byteSize_
int64_t byteSize_
Definition: TritonData.h:130

TritonData::sizeShape_
size_t sizeShape_
Definition: TritonData.h:131

TritonData::shape
const ShapeView & shape() const
Definition: TritonData.h:69

TritonData::result_
std::shared_ptr< Result > result_
Definition: TritonData.h:139

TritonData::batchSize
unsigned batchSize() const
Definition: TritonData.h:72

TritonData::reset
void reset()
Definition: TritonData.cc:235

TritonData::data
IO * data()
Definition: TritonData.h:94

TritonData::Result
triton::client::InferResult Result
Definition: TritonData.h:47

TritonData::client_
TritonClient * client_
Definition: TritonData.h:118

TritonData::prepare
void prepare()
Definition: TritonData.cc:198

TritonData::TritonData
TritonData(const std::string &name, const TensorMetadata &model_info, TritonClient *client, const std::string &pid)
Definition: TritonData.cc:19

Exception.h

TritonInputMap
std::unordered_map< std::string, TritonInputData > TritonInputMap
Definition: TritonData.h:145

TritonData::setShape
void setShape(const ShapeType &newShape)

TritonInput
std::vector< std::vector< DT >> TritonInput
Definition: TritonData.h:33

TritonData::TensorMetadata
inference::ModelMetadataResponse_TensorMetadata TensorMetadata
Definition: TritonData.h:48

TritonData::createObject
void createObject(IO **ioptr)

TritonData::fromServer
TritonOutput< DT > fromServer() const
Definition: TritonData.cc:206

TritonData::client
triton::client::InferenceServerGrpcClient * client()
Definition: TritonData.cc:68

TritonClient
Definition: TritonClient.h:19

TritonData::uid
unsigned uid() const
Definition: TritonData.h:109

TritonData::resetSizes
void resetSizes()
Definition: TritonData.cc:112

TritonData::dtype_
inference::DataType dtype_
Definition: TritonData.h:129

TritonData::noBatch_
bool noBatch_
Definition: TritonData.h:122

TritonOutput
std::vector< edm::Span< const DT * >> TritonOutput
Definition: TritonData.h:35

TritonData::memResource_
std::shared_ptr< TritonMemResource< IO > > memResource_
Definition: TritonData.h:138

TritonData::dname_
std::string dname_
Definition: TritonData.h:128

TritonMemResource
Definition: TritonData.h:21

edm::Span< ShapeType::const_iterator >

TritonData::fullShape_
ShapeType fullShape_
Definition: TritonData.h:124

TritonData::name_
std::string name_
Definition: TritonData.h:116

TritonData::ShapeType
std::vector< int64_t > ShapeType
Definition: TritonData.h:49

TritonData::batchSize_
unsigned batchSize_
Definition: TritonData.h:123

TritonData::shmName_
std::string shmName_
Definition: TritonData.h:120

TritonData::dname
const std::string & dname() const
Definition: TritonData.h:71

TritonData::variableDims_
bool variableDims_
Definition: TritonData.h:126

TritonData::toServer
void toServer(TritonInputContainer< DT > ptr)
Definition: TritonData.cc:164

TritonOutputMap
std::unordered_map< std::string, TritonOutputData > TritonOutputMap
Definition: TritonData.h:147

TritonData
Definition: TritonData.h:45

TritonData::sizeDims
int64_t sizeDims() const
Definition: TritonData.h:76

TritonData::byteSize
int64_t byteSize() const
Definition: TritonData.h:70

findQualityFiles.size
tuple size
Write out results.
Definition: findQualityFiles.py:443