d4/d9f/genericValidation_8py_source.html

 import os

 import globalDictionaries

 import configTemplates

 from dataset import Dataset

 from helperFunctions import replaceByMap

 from TkAlExceptions import AllInOneError


 class GenericValidation:

     defaultReferenceName = "DEFAULT"

     def __init__(self, valName, alignment, config):

         import random

         self.name = valName

         self.alignmentToValidate = alignment

         self.general = config.getGeneral()

         self.randomWorkdirPart = "%0i"%random.randint(1,10e9)

         self.configFiles = []

         self.filesToCompare = {}

         self.jobmode = self.general["jobmode"]

         self.config = config


     def getRepMap(self, alignment = None):

         if alignment == None:

             alignment = self.alignmentToValidate

         result = alignment.getRepMap()

         result.update( self.general )

         result.update({

                 "workdir": os.path.join(self.general["workdir"],

                                         self.randomWorkdirPart),

                 "datadir": self.general["datadir"],

                 "logdir": self.general["logdir"],

                 "CommandLineTemplate": ("#run configfile and post-proccess it\n"

                                         "cmsRun %(cfgFile)s\n"

                                         "%(postProcess)s "),

                 "CMSSW_BASE": os.environ['CMSSW_BASE'],

                 "SCRAM_ARCH": os.environ['SCRAM_ARCH'],

                 "alignmentName": alignment.name,

                 "condLoad": alignment.getConditions()

                 })

         return result


     def getCompareStrings( self, requestId = None ):

         result = {}

         repMap = self.alignmentToValidate.getRepMap()

         for validationId in self.filesToCompare:

             repMap["file"] = self.filesToCompare[ validationId ]

             if repMap["file"].startswith( "/castor/" ):

                 repMap["file"] = "rfio:%(file)s"%repMap

             elif repMap["file"].startswith( "/store/" ):

                 repMap["file"] = "root://eoscms.cern.ch//eos/cms%(file)s"%repMap

             result[validationId]= "%(file)s=%(name)s|%(color)s|%(style)s"%repMap

         if requestId == None:

             return result

         else:

             if not "." in requestId:

                 requestId += ".%s"%GenericValidation.defaultReferenceName

             if not requestId.split(".")[-1] in result:

                 msg = ("could not find %s in reference Objects!"

                        %requestId.split(".")[-1])

                 raise AllInOneError(msg)

             return result[ requestId.split(".")[-1] ]


     def createFiles( self, fileContents, path ):

         result = []

         for fileName in fileContents:

             filePath = os.path.join( path, fileName)

             theFile = open( filePath, "w" )

             theFile.write( fileContents[ fileName ] )

             theFile.close()

             result.append( filePath )

         return result


     def createConfiguration(self, fileContents, path, schedule= None):

         self.configFiles = GenericValidation.createFiles(self, fileContents,

                                                          path)

         if not schedule == None:

             schedule = [os.path.join( path, cfgName) for cfgName in schedule]

             for cfgName in schedule:

                 if not cfgName in self.configFiles:

                     msg = ("scheduled %s missing in generated configfiles: %s"

                            %(cfgName, self.configFiles))

                     raise AllInOneError(msg)

             for cfgName in self.configFiles:

                 if not cfgName in schedule:

                     msg = ("generated configuration %s not scheduled: %s"

                            %(cfgName, schedule))

                     raise AllInOneError(msg)

             self.configFiles = schedule

         return self.configFiles


     def createScript(self, fileContents, path, downloadFiles=[] ):

         self.scriptFiles = GenericValidation.createFiles(self, fileContents,

                                                          path)

         for script in self.scriptFiles:

             os.chmod(script,0755)

         return self.scriptFiles


     def createCrabCfg(self, fileContents, path ):

         self.crabConfigFiles = GenericValidation.createFiles(self, fileContents,

                                                              path)

         return self.crabConfigFiles


 class GenericValidationData(GenericValidation):

     """

     Subclass of `GenericValidation` which is the base for validations using

     datasets.

     """


     def __init__(self, valName, alignment, config, valType,

                  addDefaults = {}, addMandatories=[]):

         """

         This method adds additional items to the `self.general` dictionary

         which are only needed for validations using datasets.


         Arguments:

         - `valName`: String which identifies individual validation instances

         - `alignment`: `Alignment` instance to validate

         - `config`: `BetterConfigParser` instance which includes the

                     configuration of the validations

         - `valType`: String which specifies the type of validation

         - `addDefaults`: Dictionary which contains default values for individual

                          validations in addition to the general default values

         - `addMandatories`: List which contains mandatory parameters for

                             individual validations in addition to the general

                             mandatory parameters

                             (currently there are no general mandatories)

         """


         GenericValidation.__init__(self, valName, alignment, config)

         defaults = {"jobmode": self.jobmode,

                     "runRange": "",

                     "firstRun": "",

                     "lastRun": "",

                     "begin": "",

                     "end": "",

                     "JSON": ""

                     }

         defaults.update(addDefaults)

         mandatories = []

         mandatories += addMandatories

         theUpdate = config.getResultingSection(valType+":"+self.name,

                                                defaultDict = defaults,

                                                demandPars = mandatories)

         self.general.update(theUpdate)

         self.jobmode = self.general["jobmode"]


         knownOpts = defaults.keys()+mandatories

         ignoreOpts = []

         if self.jobmode.split(",")[0] == "crab" \

                 or self.__class__.__name__=="OfflineValidationParallel":

             knownOpts.append("parallelJobs")

         else:

             ignoreOpts.append("parallelJobs")

         config.checkInput(valType+":"+self.name,

                           knownSimpleOptions = knownOpts,

                           ignoreOptions = ignoreOpts)


         if self.general["dataset"] not in globalDictionaries.usedDatasets:

             globalDictionaries.usedDatasets[self.general["dataset"]] = Dataset(

                 self.general["dataset"] )

         self.dataset = globalDictionaries.usedDatasets[self.general["dataset"]]


         if not self.jobmode.split( ',' )[0] == "crab":

             try:

                 self.general["datasetDefinition"] = self.dataset.datasetSnippet(

                     jsonPath = self.general["JSON"],

                     nEvents = self.general["maxevents"],

                     firstRun = self.general["firstRun"],

                     lastRun = self.general["lastRun"],

                     begin = self.general["begin"],

                     end = self.general["end"] )

             except AllInOneError, e:

                 msg = "In section [%s:%s]: "%(valType, self.name)

                 msg += str(e)

                 raise AllInOneError(msg)

         else:

             if self.dataset.predefined():

                 msg = ("For jobmode 'crab' you cannot use predefined datasets "

                        "(in your case: '%s')."%( self.dataset.name() ))

                 raise AllInOneError( msg )

             try:

                 theUpdate = config.getResultingSection(valType+":"+self.name,

                                                        demandPars = ["parallelJobs"])

             except AllInOneError, e:

                 msg = str(e)[:-1]+" when using 'jobmode: crab'."

                 raise AllInOneError(msg)

             self.general.update(theUpdate)

             if self.general["begin"] or self.general["end"]:

                 ( self.general["begin"],

                   self.general["end"],

                   self.general["firstRun"],

                   self.general["lastRun"] ) = self.dataset.convertTimeToRun(

                     firstRun = self.general["firstRun"],

                     lastRun = self.general["lastRun"],

                     begin = self.general["begin"],

                     end = self.general["end"],

                     shortTuple = False)

                 if self.general["begin"] == None:

                     self.general["begin"] = ""

                 if self.general["end"] == None:

                     self.general["end"] = ""

                 self.general["firstRun"] = str( self.general["firstRun"] )

                 self.general["lastRun"] = str( self.general["lastRun"] )

             if ( not self.general["firstRun"] ) and \

                    ( self.general["end"] or self.general["lastRun"] ):

                 self.general["firstRun"] = str(

                     self.dataset.runList()[0]["run_number"])

             if ( not self.general["lastRun"] ) and \

                    ( self.general["begin"] or self.general["firstRun"] ):

                 self.general["lastRun"] = str(

                     self.dataset.runList()[-1]["run_number"])

             if self.general["firstRun"] and self.general["lastRun"]:

                 if int(self.general["firstRun"]) > int(self.general["lastRun"]):

                     msg = ( "The lower time/runrange limit ('begin'/'firstRun') "

                             "chosen is greater than the upper time/runrange limit "

                             "('end'/'lastRun').")

                     raise AllInOneError( msg )

                 self.general["runRange"] = (self.general["firstRun"]

                                             + '-' + self.general["lastRun"])

             try:

                 self.general["datasetDefinition"] = self.dataset.datasetSnippet(

                     jsonPath = self.general["JSON"],

                     nEvents = self.general["maxevents"],

                     firstRun = self.general["firstRun"],

                     lastRun = self.general["lastRun"],

                     begin = self.general["begin"],

                     end = self.general["end"],

                     crab = True )

             except AllInOneError, e:

                 msg = "In section [%s:%s]: "%(valType, self.name)

                 msg += str( e )

                 raise AllInOneError( msg )


     def createCrabCfg(self, path, crabCfgBaseName):

         """

         Method which creates a `crab.cfg` for a validation on datasets.


         Arguments:

         - `path`: Path at which the file will be stored.

         - `crabCfgBaseName`: String which depends on the actual type of

                              validation calling this method.

         """

         crabCfgName = "crab.%s.%s.%s.cfg"%( crabCfgBaseName, self.name,

                                             self.alignmentToValidate.name )

         repMap = self.getRepMap()

         repMap["script"] = "dummy_script.sh"

         # repMap["crabOutputDir"] = os.path.basename( path )

         repMap["crabWorkingDir"] = crabCfgName.split( '.cfg' )[0]

         self.crabWorkingDir = repMap["crabWorkingDir"]

         repMap["numberOfJobs"] = self.general["parallelJobs"]

         repMap["cfgFile"] = self.configFiles[0]

         repMap["queue"] = self.jobmode.split( ',' )[1].split( '-q' )[1]

         if self.dataset.dataType() == "mc":

             repMap["McOrData"] = "events = .oO[nEvents]Oo."

         elif self.dataset.dataType() == "data":

             repMap["McOrData"] = "lumis = -1"

             if self.jobmode.split( ',' )[0] == "crab":

                 print ("For jobmode 'crab' the parameter 'maxevents' will be "

                        "ignored and all events will be processed.")

         crabCfg = {crabCfgName: replaceByMap( configTemplates.crabCfgTemplate,

                                               repMap ) }

         return GenericValidation.createCrabCfg( self, crabCfg, path )

genericValidation.GenericValidation.__init__
def __init__
Definition: genericValidation.py:11

genericValidation.GenericValidation.randomWorkdirPart
randomWorkdirPart
Definition: genericValidation.py:16

genericValidation.GenericValidation.scriptFiles
scriptFiles
Definition: genericValidation.py:92

genericValidation.GenericValidationData.dataset
dataset
Definition: genericValidation.py:162

genericValidation.GenericValidation.createScript
def createScript
Definition: genericValidation.py:91

genericValidation.GenericValidation.getRepMap
def getRepMap
Definition: genericValidation.py:22

genericValidation.GenericValidation.name
name
Definition: genericValidation.py:13

genericValidation.GenericValidation.createCrabCfg
def createCrabCfg
Definition: genericValidation.py:98

genericValidation.GenericValidationData.createCrabCfg
def createCrabCfg
Definition: genericValidation.py:235

genericValidation.GenericValidation
Definition: genericValidation.py:9

genericValidation.GenericValidation.config
config
Definition: genericValidation.py:20

dataset.Dataset
Definition: dataset.py:13

TkAlExceptions.AllInOneError
Definition: TkAlExceptions.py:1

genericValidation.GenericValidation.jobmode
jobmode
Definition: genericValidation.py:19

genericValidation.GenericValidation.crabConfigFiles
crabConfigFiles
Definition: genericValidation.py:99

genericValidation.GenericValidation.filesToCompare
filesToCompare
Definition: genericValidation.py:18

genericValidation.GenericValidation.createConfiguration
def createConfiguration
Definition: genericValidation.py:73

genericValidation.GenericValidationData.__init__
def __init__
Definition: genericValidation.py:111

helperFunctions.replaceByMap
def replaceByMap
— Helpers —############################
Definition: helperFunctions.py:5

genericValidation.GenericValidation.getCompareStrings
def getCompareStrings
Definition: genericValidation.py:42

genericValidation.GenericValidationData
Definition: genericValidation.py:104

genericValidation.GenericValidation.configFiles
configFiles
Definition: genericValidation.py:17

genericValidation.GenericValidation.createFiles
def createFiles
Definition: genericValidation.py:63

genericValidation.GenericValidation.alignmentToValidate
alignmentToValidate
Definition: genericValidation.py:14

genericValidation.GenericValidation.general
general
Definition: genericValidation.py:15

genericValidation.GenericValidationData.crabWorkingDir
crabWorkingDir
Definition: genericValidation.py:250

split
double split
Definition: MVATrainer.cc:139