d3/de7/EgammaDNNHelper_8cc_source.html

 #include "RecoEgamma/EgammaTools/interface/EgammaDNNHelper.h"

 #include "FWCore/MessageLogger/interface/MessageLogger.h"

 #include "FWCore/Utilities/interface/FileInPath.h"

 #include <iostream>

 #include <fstream>

 using namespace egammaTools;


 EgammaDNNHelper::EgammaDNNHelper(const DNNConfiguration& cfg,

                                  const ModelSelector& modelSelector,

                                  const std::vector<std::string>& availableVars)

     : cfg_(cfg), modelSelector_(modelSelector), nModels_(cfg_.modelsFiles.size()), graphDefs_(cfg_.modelsFiles.size()) {

   initTensorFlowGraphs();

   initScalerFiles(availableVars);

 }


 void EgammaDNNHelper::initTensorFlowGraphs() {

   // load the graph definition

   LogDebug("EgammaDNNHelper") << "Loading " << nModels_ << " graphs";

   size_t i = 0;

   for (const auto& model_file : cfg_.modelsFiles) {

     graphDefs_[i] =

         std::unique_ptr<tensorflow::GraphDef>(tensorflow::loadGraphDef(edm::FileInPath(model_file).fullPath()));

     i++;

   }

 }


 std::vector<tensorflow::Session*> EgammaDNNHelper::getSessions() const {

   std::vector<tensorflow::Session*> sessions;

   LogDebug("EgammaDNNHelper") << "Starting " << nModels_ << " TF sessions";

   for (const auto& graphDef : graphDefs_) {

     sessions.push_back(tensorflow::createSession(graphDef.get()));

   }

   LogDebug("EgammaDNNHelper") << "TF sessions started";

   return sessions;

 }


 void EgammaDNNHelper::initScalerFiles(const std::vector<std::string>& availableVars) {

   for (const auto& scaler_file : cfg_.scalersFiles) {

     // Parse scaler configuration

     std::vector<ScalerConfiguration> features;

     std::ifstream inputfile_scaler{edm::FileInPath(scaler_file).fullPath()};

     int ninputs = 0;

     if (inputfile_scaler.fail()) {

       throw cms::Exception("MissingFile") << "Scaler file for Electron PFid DNN not found";

     } else {

       // Now read mean, scale factors for each variable

       float par1, par2;

       std::string varName, type_str;

       uint type;

       while (inputfile_scaler >> varName >> type_str >> par1 >> par2) {

         if (type_str == "stdscale")

           type = 1;

         else if (type_str == "minmax")

           type = 2;

         else if (type_str == "custom1")  // 2*((X_train - minValues)/(MaxMinusMin)) -1.0

           type = 3;

         else

           type = 0;

         features.push_back(ScalerConfiguration{.varName = varName, .type = type, .par1 = par1, .par2 = par2});

         // Protection for mismatch between requested variables and the available ones

         auto match = std::find(availableVars.begin(), availableVars.end(), varName);

         if (match == std::end(availableVars)) {

           throw cms::Exception("MissingVariable")

               << "Requested variable (" << varName << ") not available between DNN inputs";

         }

         ninputs += 1;

       }

     }

     inputfile_scaler.close();

     featuresMap_.push_back(features);

     nInputs_.push_back(ninputs);

   }

 }


 std::pair<uint, std::vector<float>> EgammaDNNHelper::getScaledInputs(

     const std::map<std::string, float>& variables) const {

   // Call the modelSelector function passing the variables map to return

   // the modelIndex to be used for the current candidate

   const auto modelIndex = modelSelector_(variables);

   std::vector<float> inputs;

   // Loop on the list of requested variables and scaling values for the specific modelIndex

   // Different type of scaling are available: 0=no scaling, 1=standard scaler, 2=minmax

   for (auto& [varName, type, par1, par2] : featuresMap_[modelIndex]) {

     if (type == 1)  // Standard scaling

       inputs.push_back((variables.at(varName) - par1) / par2);

     else if (type == 2)  // MinMax

       inputs.push_back((variables.at(varName) - par1) / (par2 - par1));

     else if (type == 3)  //2*((X_train - minValues)/(MaxMinusMin)) -1.0

       inputs.push_back(2 * (variables.at(varName) - par1) / (par2 - par1) - 1.);

     else {

       inputs.push_back(variables.at(varName));  // Do nothing on the variable

     }

     //Protection for mismatch between requested variables and the available ones

     // have been added when the scaler config are loaded --> here we know that the variables are available

   }

   return std::make_pair(modelIndex, inputs);

 }


 std::vector<std::vector<float>> EgammaDNNHelper::evaluate(const std::vector<std::map<std::string, float>>& candidates,

                                                           const std::vector<tensorflow::Session*>& sessions) const {

   /*

     Evaluate the PFID DNN for all the electrons/photons.

     nModels_ are defined depending on modelIndex  --> we need to build N input tensors to evaluate

     the DNNs with batching.


     1) Get all the variable for each candidate  vector<map<string:float>>

     2) Scale the input and select the variables for each model

     2) Prepare the input tensors for the  models

     3) Run the models and get the output for each candidate

     4) Sort the output by candidate index

     5) Return the DNN outputs


     */

   size_t nCandidates = candidates.size();

   std::vector<std::vector<int>> indexMap(nModels_);  // for each model; the list of candidate index is saved

   std::vector<std::vector<float>> inputsVectors(nCandidates);

   std::vector<uint> counts(nModels_);


   LogDebug("EgammaDNNHelper") << "Working on " << nCandidates << " candidates";


   int icand = 0;

   for (auto& candidate : candidates) {

     LogDebug("EgammaDNNHelper") << "Working on candidate: " << icand;

     const auto& [model_index, inputs] = getScaledInputs(candidate);

     counts[model_index] += 1;

     indexMap[model_index].push_back(icand);

     inputsVectors[icand] = inputs;

     icand++;

   }


   // Prepare one input tensors for each model

   std::vector<tensorflow::Tensor> input_tensors(nModels_);

   // Pointers for filling efficiently the input tensors

   std::vector<float*> input_tensors_pointer(nModels_);

   for (size_t i = 0; i < nModels_; i++) {

     LogDebug("EgammaDNNHelper") << "Initializing TF input " << i << " with rows:" << counts[i]

                                 << " and cols:" << nInputs_[i];

     input_tensors[i] = tensorflow::Tensor{tensorflow::DT_FLOAT, {counts[i], nInputs_[i]}};

     input_tensors_pointer[i] = input_tensors[i].flat<float>().data();

   }


   // Filling the input tensors

   for (size_t m = 0; m < nModels_; m++) {

     LogDebug("EgammaDNNHelper") << "Loading TF input tensor for model: " << m;

     float* T = input_tensors_pointer[m];

     for (size_t cand_index : indexMap[m]) {

       for (size_t k = 0; k < nInputs_[m]; k++, T++) {  //Note the input tensor pointer incremented

         *T = inputsVectors[cand_index][k];

       }

     }

   }


   // Define the output and run

   // Define the output and run

   std::vector<std::pair<int, std::vector<float>>> outputs;

   // Run all the models

   for (size_t m = 0; m < nModels_; m++) {

     if (counts[m] == 0)

       continue;  //Skip model witout inputs

     std::vector<tensorflow::Tensor> output;

     LogDebug("EgammaDNNHelper") << "Run model: " << m << " with " << counts[m] << " electrons";

     tensorflow::run(sessions[m], {{cfg_.inputTensorName, input_tensors[m]}}, {cfg_.outputTensorName}, &output);

     // Get the output and save the ElectronDNNEstimator::outputDim numbers along with the ele index

     const auto& r = output[0].tensor<float, 2>();

     // Iterate on the list of elements in the batch --> many electrons

     for (uint b = 0; b < counts[m]; b++) {

       std::vector<float> result(cfg_.outputDim);

       for (size_t k = 0; k < cfg_.outputDim; k++)

         result[k] = r(b, k);

       // Get the original index of the electorn in the original order

       const auto cand_index = indexMap[m][b];

       outputs.push_back(std::make_pair(cand_index, result));

     }

   }

   // Now we have just to re-order the outputs

   std::sort(outputs.begin(), outputs.end());

   std::vector<std::vector<float>> final_outputs(outputs.size());

   std::transform(outputs.begin(), outputs.end(), final_outputs.begin(), [](auto a) { return a.second; });


   return final_outputs;

 }

egammaTools::EgammaDNNHelper::graphDefs_
std::vector< std::unique_ptr< const tensorflow::GraphDef > > graphDefs_
Definition: EgammaDNNHelper.h:66

tensorflow::createSession
Session * createSession(SessionOptions &sessionOptions)
Definition: TensorFlow.cc:85

egammaTools::EgammaDNNHelper::evaluate
std::vector< std::vector< float > > evaluate(const std::vector< std::map< std::string, float >> &candidates, const std::vector< tensorflow::Session * > &sessions) const
Definition: EgammaDNNHelper.cc:100

L1TEGammaDiff_cfi.variables
dictionary variables
Definition: L1TEGammaDiff_cfi.py:4

EgammaDNNHelper.h

looper.cfg
tuple cfg
Definition: looper.py:296

mps_fire.i
i
Definition: mps_fire.py:428

Exception
Definition: hltDiff.cc:245

MessageLogger.h

isotrackApplyRegressor.k
int k
Definition: isotrackApplyRegressor.py:91

tensorflow::loadGraphDef
GraphDef * loadGraphDef(const std::string &pbFile)
Definition: TensorFlow.cc:68

contentValuesFiles.fullPath
fullPath
Definition: contentValuesFiles.py:64

PixelMapPlotter.inputs
tuple inputs
Definition: PixelMapPlotter.py:490

egammaTools::EgammaDNNHelper::EgammaDNNHelper
EgammaDNNHelper(const DNNConfiguration &, const ModelSelector &sel, const std::vector< std::string > &availableVars)
Definition: EgammaDNNHelper.cc:9

egammaTools::DNNConfiguration::modelsFiles
std::vector< std::string > modelsFiles
Definition: EgammaDNNHelper.h:20

egammaTools::EgammaDNNHelper::nInputs_
std::vector< uint > nInputs_
Definition: EgammaDNNHelper.h:64

spr::find
void find(edm::Handle< EcalRecHitCollection > &hits, DetId thisDet, std::vector< EcalRecHitCollection::const_iterator > &hit, bool debug=false)
Definition: FindCaloHit.cc:19

type
type
Definition: SiPixelVCal_PayloadInspector.cc:39

egammaTools::DNNConfiguration::inputTensorName
std::string inputTensorName
Definition: EgammaDNNHelper.h:18

AlCaHLTBitMon_QueryRunRegistry.string
string string
Definition: AlCaHLTBitMon_QueryRunRegistry.py:256

mps_fire.result
tuple result
Definition: mps_fire.py:311

egammaTools::EgammaDNNHelper::getScaledInputs
std::pair< uint, std::vector< float > > getScaledInputs(const std::map< std::string, float > &variables) const
Definition: EgammaDNNHelper.cc:76

visualization-live-secondInstance_cfg.m
tuple m
Definition: visualization-live-secondInstance_cfg.py:79

egammaTools::DNNConfiguration
Definition: EgammaDNNHelper.h:17

gainCalibHelper::gainCalibPI::type
type
Definition: SiPixelGainCalibHelper.h:40

egammaTools::EgammaDNNHelper::nModels_
uint nModels_
Definition: EgammaDNNHelper.h:62

lowptgsfeleseed::features
std::vector< float > features(const reco::PreId &ecal, const reco::PreId &hcal, double rho, const reco::BeamSpot &spot, noZS::EcalClusterLazyTools &ecalTools)
Definition: LowPtGsfElectronFeatures.cc:17

egammaTools::EgammaDNNHelper::featuresMap_
std::vector< std::vector< ScalerConfiguration > > featuresMap_
Definition: EgammaDNNHelper.h:69

dqmiodumpmetadata.counts
tuple counts
Definition: dqmiodumpmetadata.py:25

tensorflow::run
void run(Session *session, const NamedTensorList &inputs, const std::vector< std::string > &outputNames, std::vector< Tensor > *outputs, const thread::ThreadPoolOptions &threadPoolOptions)
Definition: TensorFlow.cc:213

egammaTools::ScalerConfiguration::varName
std::string varName
Definition: EgammaDNNHelper.h:31

egammaTools::EgammaDNNHelper::getSessions
std::vector< tensorflow::Session * > getSessions() const
Definition: EgammaDNNHelper.cc:28

HLT_FULL_cff.candidates
tuple candidates
Definition: HLT_FULL_cff.py:55315

parallelization.uint
def uint
Definition: parallelization.py:50

FileInPath.h

edm::FileInPath
Definition: FileInPath.h:61

egammaTools::ScalerConfiguration
Definition: EgammaDNNHelper.h:25

convertSQLitetoXML_cfg.output
tuple output
Definition: convertSQLitetoXML_cfg.py:72

egammaTools::EgammaDNNHelper::initScalerFiles
void initScalerFiles(const std::vector< std::string > &availableVars)
Definition: EgammaDNNHelper.cc:38

b
double b
Definition: hdecay.h:118

egammaTools::DNNConfiguration::outputTensorName
std::string outputTensorName
Definition: EgammaDNNHelper.h:19

data
char data[epos_bytes_allocation]
Definition: EPOS_Wrapper.h:79

a
double a
Definition: hdecay.h:119

trackerHitRTTI::vector
Definition: trackerHitRTTI.h:21

egammaTools::DNNConfiguration::outputDim
uint outputDim
Definition: EgammaDNNHelper.h:22

dataset.end
string end
Definition: dataset.py:937

alignCSCRings.r
list r
Definition: alignCSCRings.py:93

edm::FileInPath::fullPath
std::string fullPath() const
Definition: FileInPath.cc:161

egammaTools::DNNConfiguration::scalersFiles
std::vector< std::string > scalersFiles
Definition: EgammaDNNHelper.h:21

match
std::pair< typename Association::data_type::first_type, double > match(Reference key, Association association, bool bestMatchByMaxValue)
Generic matching function.
Definition: Utils.h:10

egammaTools::ModelSelector
std::function< uint(const std::map< std::string, float > &)> ModelSelector
Definition: EgammaDNNHelper.h:39

egammaTools::EgammaDNNHelper::initTensorFlowGraphs
void initTensorFlowGraphs()
Definition: EgammaDNNHelper.cc:17

egammaTools::EgammaDNNHelper::modelSelector_
const ModelSelector modelSelector_
Definition: EgammaDNNHelper.h:60

T
long double T
Definition: Basic3DVectorLD.h:48

egammaTools::EgammaDNNHelper::cfg_
const DNNConfiguration cfg_
Definition: EgammaDNNHelper.h:59

modelfilter_cfi.modelSelector
tuple modelSelector
Definition: modelfilter_cfi.py:3

findQualityFiles.size
tuple size
Write out results.
Definition: findQualityFiles.py:443

LogDebug
#define LogDebug(id)
Definition: MessageLogger.h:233

HcalDetIdTransform::transform
unsigned transform(const HcalDetId &id, unsigned transformCode)
Definition: HcalDetIdTransform.cc:7