d6/dc5/BaseMVAValueMapProducer_8h_source.html

 #ifndef PhysicsTools_PatAlgos_BaseMVAValueMapProducer
 #define PhysicsTools_PatAlgos_BaseMVAValueMapProducer

 // -*- C++ -*-
 //
 // Package:    PhysicsTools/PatAlgos
 // Class:      BaseMVAValueMapProducer
 //
 //
 // Original Author:  Andre Rizzi
 //         Created:  Mon, 07 Sep 2017 09:18:03 GMT
 //
 //

 // system include files
 #include <memory>

 // user include files
 #include "FWCore/Framework/interface/Frameworkfwd.h"
 #include "FWCore/Framework/interface/stream/EDProducer.h"

 #include "FWCore/Framework/interface/Event.h"
 #include "FWCore/Framework/interface/MakerMacros.h"

 #include "FWCore/ParameterSet/interface/ParameterSet.h"
 #include "FWCore/Utilities/interface/StreamID.h"

 #include "TMVA/Factory.h"
 #include "TMVA/Reader.h"

 #include "CommonTools/Utils/interface/StringObjectFunction.h"
 #include "DataFormats/Common/interface/ValueMap.h"
 #include "CommonTools/MVAUtils/interface/TMVAZipReader.h"
 #include "DataFormats/PatCandidates/interface/Jet.h"
 #include "DataFormats/PatCandidates/interface/Muon.h"
 #include "DataFormats/PatCandidates/interface/Electron.h"

 #include "DataFormats/PatCandidates/interface/Jet.h"
 #include "DataFormats/PatCandidates/interface/Muon.h"
 #include "DataFormats/PatCandidates/interface/Electron.h"
 #include "PhysicsTools/TensorFlow/interface/TensorFlow.h"
 #include "PhysicsTools/ONNXRuntime/interface/ONNXRuntime.h"

 #include <string>
 //
 // class declaration
 //

 template <typename T>
 class BaseMVAValueMapProducer : public edm::stream::EDProducer<> {
 public:
   explicit BaseMVAValueMapProducer(const edm::ParameterSet& iConfig)
       : src_(consumes<edm::View<T>>(iConfig.getParameter<edm::InputTag>("src"))),
         variablesOrder_(iConfig.getParameter<std::vector<std::string>>("variablesOrder")),
         name_(iConfig.getParameter<std::string>("name")),
         backend_(iConfig.getParameter<std::string>("backend")),
         weightfilename_(iConfig.getParameter<edm::FileInPath>("weightFile").fullPath()),
         isClassifier_(iConfig.getParameter<bool>("isClassifier")),
         tmva_(backend_ == "TMVA"),
         tf_(backend_ == "TF"),
         onnx_(backend_ == "ONNX"),
         batch_eval_(iConfig.getParameter<bool>("batch_eval")) {
     if (tmva_)
       reader_ = new TMVA::Reader();
     edm::ParameterSet const& varsPSet = iConfig.getParameter<edm::ParameterSet>("variables");
     for (const std::string& vname : varsPSet.getParameterNamesForType<std::string>()) {
       funcs_.emplace_back(
           std::pair<std::string, StringObjectFunction<T, true>>(vname, varsPSet.getParameter<std::string>(vname)));
     }

     values_.resize(variablesOrder_.size());
     size_t i = 0;
     for (const auto& v : variablesOrder_) {
       positions_[v] = i;
       if (tmva_)
         reader_->AddVariable(v, (&values_.front()) + i);
       i++;
     }
     //      reader_.BookMVA(name_,iConfig.getParameter<edm::FileInPath>("weightFile").fullPath() );
     if (tmva_) {
       reco::details::loadTMVAWeights(reader_, name_, weightfilename_);
     } else if (tf_) {
       tensorflow::setLogging("3");
       graph_ = tensorflow::loadGraphDef(weightfilename_);
       size_t nThreads = iConfig.getParameter<unsigned int>("nThreads");
       session_ = tensorflow::createSession(graph_, nThreads);
     } else if (onnx_) {
       ort_ = std::make_unique<cms::Ort::ONNXRuntime>(weightfilename_);
     } else {
       throw cms::Exception("ConfigError") << "Only 'TF', 'ONNX' and 'TMVA' backends are supported\n";
     }
     if (tf_ || onnx_) {
       inputTensorName_ = iConfig.getParameter<std::string>("inputTensorName");
       outputTensorName_ = iConfig.getParameter<std::string>("outputTensorName");
       output_names_ = iConfig.getParameter<std::vector<std::string>>("outputNames");
       for (const auto& s : iConfig.getParameter<std::vector<std::string>>("outputFormulas")) {
         output_formulas_.push_back(StringObjectFunction<std::vector<float>>(s));
       }
     }
     if (tmva_)
       produces<edm::ValueMap<float>>();
     else {
       for (const auto& n : output_names_) {
         produces<edm::ValueMap<float>>(n);
       }
     }
   }
   ~BaseMVAValueMapProducer() override {}

   void setValue(const std::string var, float val) {
     if (positions_.find(var) != positions_.end())
       values_[positions_[var]] = val;
   }

   static edm::ParameterSetDescription getDescription();
   static void fillDescriptions(edm::ConfigurationDescriptions& descriptions);

 private:
   void beginStream(edm::StreamID) override{};
   void produce(edm::Event&, const edm::EventSetup&) override;
   void endStream() override{};

   virtual void readAdditionalCollections(edm::Event&, const edm::EventSetup&) {}
   virtual void fillAdditionalVariables(const T&) {}

   edm::EDGetTokenT<edm::View<T>> src_;
   std::map<std::string, size_t> positions_;
   std::vector<std::pair<std::string, StringObjectFunction<T, true>>> funcs_;
   std::vector<std::string> variablesOrder_;
   std::vector<float> values_;
   TMVA::Reader* reader_;
   tensorflow::GraphDef* graph_;
   tensorflow::Session* session_;
   std::string singleThreadPool_;
   std::unique_ptr<cms::Ort::ONNXRuntime> ort_;

   std::string name_;
   std::string backend_;
   std::string weightfilename_;
   bool isClassifier_;
   bool tmva_;
   bool tf_;
   bool onnx_;
   bool batch_eval_;
   std::string inputTensorName_;
   std::string outputTensorName_;
   std::vector<std::string> output_names_;
   std::vector<StringObjectFunction<std::vector<float>>> output_formulas_;
 };

 template <typename T>
 void BaseMVAValueMapProducer<T>::produce(edm::Event& iEvent, const edm::EventSetup& iSetup) {
   edm::Handle<edm::View<T>> src;
   iEvent.getByToken(src_, src);
   readAdditionalCollections(iEvent, iSetup);
   std::vector<std::vector<float>> mvaOut((tmva_) ? 1 : output_names_.size());
   for (auto& v : mvaOut)
     v.reserve(src->size());

   if (batch_eval_) {
     if (!src->empty()) {
       std::vector<float> data;
       data.reserve(src->size() * positions_.size());
       for (auto const& o : *src) {
         for (auto const& p : funcs_) {
           setValue(p.first, p.second(o));
         }
         fillAdditionalVariables(o);
         data.insert(data.end(), values_.begin(), values_.end());
       }

       std::vector<float> outputs;
       if (tf_) {
         //currently support only one input sensor to reuse the TMVA like config
         tensorflow::TensorShape input_size{(long long int)src->size(), (long long int)positions_.size()};
         tensorflow::NamedTensorList input_tensors;
         input_tensors.resize(1);
         input_tensors[0] =
             tensorflow::NamedTensor(inputTensorName_, tensorflow::Tensor(tensorflow::DT_FLOAT, input_size));

         for (unsigned i = 0; i < data.size(); ++i) {
           input_tensors[0].second.flat<float>()(i) = data[i];
         }
         std::vector<tensorflow::Tensor> output_tensors;
         tensorflow::run(session_, input_tensors, {outputTensorName_}, &output_tensors);
         for (unsigned i = 0; i < output_tensors.at(0).NumElements(); ++i) {
           outputs.push_back(output_tensors.at(0).flat<float>()(i));
         }
       } else if (onnx_) {
         cms::Ort::FloatArrays inputs{data};
         outputs = ort_->run({inputTensorName_}, inputs, {}, {outputTensorName_}, src->size())[0];
       }

       const unsigned outdim = outputs.size() / src->size();
       for (unsigned i = 0; i < src->size(); ++i) {
         std::vector<float> tmpOut(outputs.begin() + i * outdim, outputs.begin() + (i + 1) * outdim);
         for (size_t k = 0; k < output_names_.size(); k++) {
           mvaOut[k].push_back(output_formulas_[k](tmpOut));
         }
       }
     }
   } else {
     for (auto const& o : *src) {
       for (auto const& p : funcs_) {
         setValue(p.first, p.second(o));
       }
       fillAdditionalVariables(o);
       if (tmva_) {
         mvaOut[0].push_back(isClassifier_ ? reader_->EvaluateMVA(name_) : reader_->EvaluateRegression(name_)[0]);
       } else {
         std::vector<float> tmpOut;
         if (tf_) {
           //currently support only one input sensor to reuse the TMVA like config
           tensorflow::TensorShape input_size{1, (long long int)positions_.size()};
           tensorflow::NamedTensorList input_tensors;
           input_tensors.resize(1);
           input_tensors[0] =
               tensorflow::NamedTensor(inputTensorName_, tensorflow::Tensor(tensorflow::DT_FLOAT, input_size));
           for (size_t j = 0; j < values_.size(); j++) {
             input_tensors[0].second.matrix<float>()(0, j) = values_[j];
           }
           std::vector<tensorflow::Tensor> outputs;
           tensorflow::run(session_, input_tensors, {outputTensorName_}, &outputs);
           for (int k = 0; k < outputs.at(0).matrix<float>().dimension(1); k++)
             tmpOut.push_back(outputs.at(0).matrix<float>()(0, k));
         } else if (onnx_) {
           cms::Ort::FloatArrays inputs{values_};
           tmpOut = ort_->run({inputTensorName_}, inputs, {}, {outputTensorName_})[0];
         }

         for (size_t k = 0; k < output_names_.size(); k++)
           mvaOut[k].push_back(output_formulas_[k](tmpOut));
       }
     }
   }

   size_t k = 0;
   for (auto& m : mvaOut) {
     std::unique_ptr<edm::ValueMap<float>> mvaV(new edm::ValueMap<float>());
     edm::ValueMap<float>::Filler filler(*mvaV);
     filler.insert(src, m.begin(), m.end());
     filler.fill();
     iEvent.put(std::move(mvaV), (tmva_) ? "" : output_names_[k]);
     k++;
   }
 }

 template <typename T>
 edm::ParameterSetDescription BaseMVAValueMapProducer<T>::getDescription() {
   edm::ParameterSetDescription desc;
   desc.add<edm::InputTag>("src")->setComment("input physics object collection");
   desc.add<std::vector<std::string>>("variablesOrder")->setComment("ordered list of MVA input variable names");
   desc.add<std::string>("name")->setComment("output score variable name");
   desc.add<bool>("isClassifier")->setComment("is a classifier discriminator");
   edm::ParameterSetDescription variables;
   variables.setAllowAnything();
   desc.add<edm::ParameterSetDescription>("variables", variables)->setComment("list of input variable definitions");
   desc.add<edm::FileInPath>("weightFile")->setComment("xml weight file");
   desc.add<std::string>("backend", "TMVA")->setComment("TMVA, TF or ONNX");
   desc.add<std::string>("inputTensorName", "")->setComment("Name of tensorflow input tensor in the model");
   desc.add<std::string>("outputTensorName", "")->setComment("Name of tensorflow output tensor in the model");
   desc.add<std::vector<std::string>>("outputNames", std::vector<std::string>())
       ->setComment("Names of the output values to be used in the output valuemap");
   desc.add<std::vector<std::string>>("outputFormulas", std::vector<std::string>())
       ->setComment("Formulas to be used to post process the output");
   desc.add<unsigned int>("nThreads", 1)->setComment("number of threads");
   desc.add<std::string>("singleThreadPool", "no_threads");
   desc.add<bool>("batch_eval", false)->setComment("Run inference in batch instead of per-object");
   desc.add<bool>("disableONNXGraphOpt", false)->setComment("Disable ONNX runtime graph optimization");

   return desc;
 }

 template <typename T>
 void BaseMVAValueMapProducer<T>::fillDescriptions(edm::ConfigurationDescriptions& descriptions) {
   edm::ParameterSetDescription desc = getDescription();
   std::string modname;
   if (typeid(T) == typeid(pat::Jet))
     modname += "Jet";
   else if (typeid(T) == typeid(pat::Muon))
     modname += "Muon";
   else if (typeid(T) == typeid(pat::Electron))
     modname += "Ele";
   modname += "BaseMVAValueMapProducer";
   descriptions.add(modname, desc);
 }

 #endif
BaseMVAValueMapProducer::values_
std::vector< float > values_
Definition: BaseMVAValueMapProducer.h:138

tensorflow::createSession
Session * createSession(SessionOptions &sessionOptions)
Definition: TensorFlow.cc:87

BaseMVAValueMapProducer::getDescription
static edm::ParameterSetDescription getDescription()
Definition: BaseMVAValueMapProducer.h:257

BaseMVAValueMapProducer::tf_
bool tf_
Definition: BaseMVAValueMapProducer.h:150

BaseMVAValueMapProducer::endStream
void endStream() override
Definition: BaseMVAValueMapProducer.h:128

edm::ParameterSet::getParameter
T getParameter(std::string const &) const

JetChargeProducer_cfi.var
var
Definition: JetChargeProducer_cfi.py:4

edm::ParameterDescriptionNode::setComment
void setComment(std::string const &value)
Definition: ParameterDescriptionNode.cc:101

edm::helper::Filler::fill
void fill()
Definition: ValueMap.h:63

BaseMVAValueMapProducer::fillAdditionalVariables
virtual void fillAdditionalVariables(const T &)
Definition: BaseMVAValueMapProducer.h:132

tensorflow::NamedTensorList
std::vector< NamedTensor > NamedTensorList
Definition: TensorFlow.h:26

BaseMVAValueMapProducer::reader_
TMVA::Reader * reader_
Definition: BaseMVAValueMapProducer.h:139

BaseMVAValueMapProducer::batch_eval_
bool batch_eval_
Definition: BaseMVAValueMapProducer.h:152

haddnano.inputs
inputs
Definition: haddnano.py:50

edm::Event::put
OrphanHandle< PROD > put(std::unique_ptr< PROD > product)
Put a new product.
Definition: Event.h:125

BaseMVAValueMapProducer::output_formulas_
std::vector< StringObjectFunction< std::vector< float > > > output_formulas_
Definition: BaseMVAValueMapProducer.h:156

mps_fire.i
i
Definition: mps_fire.py:338

StringObjectFunction< T, true >

AlCaHLTBitMon_ParallelJobs.p
p
Definition: AlCaHLTBitMon_ParallelJobs.py:153

Exception
Definition: hltDiff.cc:292

BaseMVAValueMapProducer::inputTensorName_
std::string inputTensorName_
Definition: BaseMVAValueMapProducer.h:153

edm::Event::getByToken
bool getByToken(EDGetToken token, Handle< PROD > &result) const
Definition: Event.h:517

edm::ParameterSetDescription::setAllowAnything
void setAllowAnything()
allow any parameter label/value pairs
Definition: ParameterSetDescription.cc:37

PatBasicFWLiteJetAnalyzer_Selector_cfg.outputs
outputs
Definition: PatBasicFWLiteJetAnalyzer_Selector_cfg.py:48

AlCaHLTBitMon_QueryRunRegistry.string
string
Definition: AlCaHLTBitMon_QueryRunRegistry.py:256

tensorflow::loadGraphDef
GraphDef * loadGraphDef(const std::string &pbFile)
Definition: TensorFlow.cc:68

edm::StreamID
Definition: StreamID.h:30

Event.h

alignCSCRings.s
s
Definition: alignCSCRings.py:92

MakerMacros.h

BaseMVAValueMapProducer::tmva_
bool tmva_
Definition: BaseMVAValueMapProducer.h:149

edm::Handle
Definition: AssociativeIterator.h:47

edm::helper::Filler::insert
void insert(const H &h, I begin, I end)
Definition: ValueMap.h:53

BaseMVAValueMapProducer::produce
void produce(edm::Event &, const edm::EventSetup &) override
Definition: BaseMVAValueMapProducer.h:160

BaseMVAValueMapProducer::outputTensorName_
std::string outputTensorName_
Definition: BaseMVAValueMapProducer.h:154

BaseMVAValueMapProducer::weightfilename_
std::string weightfilename_
Definition: BaseMVAValueMapProducer.h:147

std
Definition: JetResolutionObject.h:80

findQualityFiles.v
v
Definition: findQualityFiles.py:179

cms::Ort::FloatArrays
std::vector< std::vector< float > > FloatArrays
Definition: ONNXRuntime.h:23

ValueMap.h

edm::EDGetTokenT
Definition: EDGetToken.h:33

Frameworkfwd.h

BaseMVAValueMapProducer::setValue
void setValue(const std::string var, float val)
Definition: BaseMVAValueMapProducer.h:117

BaseMVAValueMapProducer::graph_
tensorflow::GraphDef * graph_
Definition: BaseMVAValueMapProducer.h:140

StringObjectFunction.h

edm::ParameterSetDescription
Definition: ParameterSetDescription.h:52

BaseMVAValueMapProducer::ort_
std::unique_ptr< cms::Ort::ONNXRuntime > ort_
Definition: BaseMVAValueMapProducer.h:143

BaseMVAValueMapProducer::onnx_
bool onnx_
Definition: BaseMVAValueMapProducer.h:151

BaseMVAValueMapProducer::BaseMVAValueMapProducer
BaseMVAValueMapProducer(const edm::ParameterSet &iConfig)
Definition: BaseMVAValueMapProducer.h:59

ONNXRuntime.h

ParameterSet.h

edm::ParameterSet::getParameterNamesForType
std::vector< std::string > getParameterNamesForType(bool trackiness=true) const
Definition: ParameterSet.h:169

tensorflow::NamedTensor
std::pair< std::string, Tensor > NamedTensor
Definition: TensorFlow.h:25

EDProducer.h

BaseMVAValueMapProducer::singleThreadPool_
std::string singleThreadPool_
Definition: BaseMVAValueMapProducer.h:142

iEvent
int iEvent
Definition: GenABIO.cc:224

createfilelist.int
int
Definition: createfilelist.py:10

BaseMVAValueMapProducer::funcs_
std::vector< std::pair< std::string, StringObjectFunction< T, true > > > funcs_
Definition: BaseMVAValueMapProducer.h:136

BaseMVAValueMapProducer::variablesOrder_
std::vector< std::string > variablesOrder_
Definition: BaseMVAValueMapProducer.h:137

objects.autophobj.variables
variables
Definition: autophobj.py:8

TensorFlow.h

TMVAZipReader.h

StreamID.h

edm::EventSetup
Definition: EventSetup.h:57

objects.autophobj.filler
filler
Definition: autophobj.py:25

edm::ParameterSetDescription::add
ParameterDescriptionBase * add(U const &iLabel, T const &value)
Definition: ParameterSetDescription.h:95

Electron.h

edm::helper::Filler
Definition: ValueMap.h:22

gen::k
int k[5][pyjets_maxn]
Definition: Cascade2Hadronizer.cc:79

electrons_cff.bool
bool
Definition: electrons_cff.py:359

edm::FileInPath
Definition: FileInPath.h:64

TrackRefitter_38T_cff.src
src
Definition: TrackRefitter_38T_cff.py:24

edm::ValueMap< float >

connectstrParser.o
o
Definition: connectstrParser.py:72

BaseMVAValueMapProducer::src_
edm::EDGetTokenT< edm::View< T > > src_
Definition: BaseMVAValueMapProducer.h:134

tensorflow::setLogging
void setLogging(const std::string &level="3")
Definition: TensorFlow.cc:14

jets_cff.nThreads
nThreads
Definition: jets_cff.py:334

edm::stream::EDProducer
Definition: EDProducer.h:38

BaseMVAValueMapProducer::fillDescriptions
static void fillDescriptions(edm::ConfigurationDescriptions &descriptions)
Definition: BaseMVAValueMapProducer.h:283

BaseMVAValueMapProducer::session_
tensorflow::Session * session_
Definition: BaseMVAValueMapProducer.h:141

pat::Electron
Analysis-level electron class.
Definition: Electron.h:52

BaseMVAValueMapProducer::positions_
std::map< std::string, size_t > positions_
Definition: BaseMVAValueMapProducer.h:135

pat::Jet
Analysis-level calorimeter jet class.
Definition: Jet.h:80

funct::m
m
Definition: Factorize.h:56

edm::ConfigurationDescriptions::add
void add(std::string const &label, ParameterSetDescription const &psetDescription)
Definition: ConfigurationDescriptions.cc:57

gen::n
int n
Definition: Cascade2Hadronizer.cc:79

reco::details::loadTMVAWeights
TMVA::IMethod * loadTMVAWeights(TMVA::Reader *reader, const std::string &method, const std::string &weightFile, bool verbose=false)
Definition: TMVAZipReader.cc:52

Muon.h

edm
HLT enums.
Definition: AlignableModifier.h:17

data
char data[epos_bytes_allocation]
Definition: EPOS_Wrapper.h:82

edm::InputTag
Definition: InputTag.h:15

BaseMVAValueMapProducer::isClassifier_
bool isClassifier_
Definition: BaseMVAValueMapProducer.h:148

Jet.h

tensorflow::run
void run(Session *session, const NamedTensorList &inputs, const std::vector< std::string > &outputNames, const std::vector< std::string > &targetNodes, std::vector< Tensor > *outputs)
Definition: TensorFlow.cc:210

BaseMVAValueMapProducer::~BaseMVAValueMapProducer
~BaseMVAValueMapProducer() override
Definition: BaseMVAValueMapProducer.h:115

edm::ParameterSet
Definition: ParameterSet.h:36

BaseMVAValueMapProducer::beginStream
void beginStream(edm::StreamID) override
Definition: BaseMVAValueMapProducer.h:126

BaseMVAValueMapProducer::name_
std::string name_
Definition: BaseMVAValueMapProducer.h:145

BaseMVAValueMapProducer::backend_
std::string backend_
Definition: BaseMVAValueMapProducer.h:146

edm::Event
Definition: Event.h:71

T
long double T
Definition: Basic3DVectorLD.h:66

pat::helper::ParametrizationHelper::dimension
uint32_t dimension(pat::CandKinResolution::Parametrization parametrization)
Returns the number of free parameters in a parametrization (3 or 4)
Definition: ParametrizationHelper.h:11

heppy_batch.val
val
Definition: heppy_batch.py:351

pat::Muon
Analysis-level muon class.
Definition: Muon.h:51

sistrip::View
View
Definition: ConstantsForView.h:26

eostools.move
def move(src, dest)
Definition: eostools.py:511

BaseMVAValueMapProducer::output_names_
std::vector< std::string > output_names_
Definition: BaseMVAValueMapProducer.h:155

edm::ConfigurationDescriptions
Definition: ConfigurationDescriptions.h:28

BaseMVAValueMapProducer::readAdditionalCollections
virtual void readAdditionalCollections(edm::Event &, const edm::EventSetup &)
to be implemented in derived classes, filling values for additional variables
Definition: BaseMVAValueMapProducer.h:131

BaseMVAValueMapProducer
Definition: BaseMVAValueMapProducer.h:57