dd/dc2/personalPlayback_8py_source.html

 #!/usr/bin/env python


 import os

 import sys

 import argparse

 import asyncore

 import pickle

 import logging

 import subprocess

 import shutil

 import re

 import collections

 import json

 import tempfile

 import signal

 import time

 import glob


 # Utilities

 log_format = '%(asctime)s: %(name)-20s - %(levelname)-8s - %(message)s'

 logging.basicConfig(format=log_format, level=logging.INFO)

 root_log = logging.getLogger()


 class Applet(object):

     def __init__(self, name, opts, **kwargs):

         self.name = name

         self.opts = opts

         self.kwargs = kwargs


         self.do_init()


     def write(self, fp):

         self.control_fp = fp


         with open(fp, "wb") as f:

             pickle.dump(self, f)


         self.log.info("Written control file: %s", fp)


     @staticmethod

     def read(fp):

         with open(fp, "rb") as f:

             return pickle.load(f)


     @property

     def log(self):

         return logging.getLogger(self.name)


     def do_init(self):

         pass


     def do_exec(self):

         pass


 def preexec_kill_on_pdeath():

     import ctypes

     libc = ctypes.CDLL("libc.so.6")

     PR_SET_PDEATHSIG = 1

     libc.prctl(PR_SET_PDEATHSIG, signal.SIGKILL)


 # Actual implementation of the workers


 class Playback(Applet):

     re_pattern = re.compile(r'run([0-9]+)_ls([0-9]+)_stream([A-Za-z0-9]+)_([A-Za-z0-9_-]+)\.jsn')


     def discover_files(self):

         self.lumi_found = {}


         files_found = set()

         streams_found = set()

         run_found = None

         for f in os.listdir(self.input):

             r = self.re_pattern.match(f)

             if r:

                 run, lumi, stream, stream_source = r.groups()

                 run, lumi = int(run), int(lumi)


                 if run_found is None:

                     run_found = run

                 elif run_found != run:

                     raise Exception("Files from multiple runs are not (yet) supported for as playback input.")


                 lumi_dct = self.lumi_found.setdefault(lumi, { 'streams': {} })

                 lumi_dct["streams"][stream] = (f, stream_source)

                 files_found.add(f)

                 streams_found.add(stream)


         if run_found is None:

             raise Exception("Playback files not found.")


         if self.run < 0:

             self.run = run_found


         self.log.info("Found run %s, will map output to run %s", run_found, self.run)

         self.log.info("Found %d lumisections with %d files", len(self.lumi_found), len(files_found))

         self.log.info("Found %d streams: %s", len(streams_found), list(streams_found))


         self.lumi_order = list(self.lumi_found.keys())

         self.lumi_order.sort()

         self.log.info("Lumi order: %s", str(self.lumi_order))


     def do_init(self):

         # check if our input directory is okay

         self.input = self.opts.playback

         self.ramdisk = self.opts.work_ramdisk

         self.run = self.opts.run

         self.log.info("Using input directory: %s", self.input)


         self.discover_files()


         self.output = os.path.join(self.ramdisk, "run%06d" % self.run)

         if not os.path.isdir(self.output):

             os.makedirs(self.output)

         self.log.info("Using output directory: %s", self.output)


         self.global_file = os.path.join(self.ramdisk, ".run%06d.global" % self.run)

         self.log.info("Writing: %s", self.global_file)

         with open(self.global_file, "w") as f:

             f.write("run_key = pp_run")


         self.lumi_backlog = collections.deque()

         self.lumi_backlog_size = 10

         self.next_lumi_index = 1


     def do_create_lumi(self):

         orig_lumi = self.lumi_order[(self.next_lumi_index - 1) % len(self.lumi_order)]

         play_lumi = self.next_lumi_index;

         self.next_lumi_index += 1


         self.log.info("Start copying lumi (original) %06d -> %06d (playback)", orig_lumi, play_lumi)


         lumi_dct = self.lumi_found[orig_lumi]

         streams = lumi_dct["streams"]


         def ijoin(f):

             return os.path.join(self.input, f)


         def ojoin(f):

             return os.path.join(self.output, f)


         written_files = set()

         for stream, v  in streams.items():

             jsn_orig_fn, stream_source = v

             jsn_play_fn = "run%06d_ls%04d_stream%s_%s.jsn" % (self.run, play_lumi, stream, stream_source)


             # define dat filename

             ext = "dat"

             if stream.startswith("streamDQMHistograms"):

                 ext = "pb"

             dat_play_fn = "run%06d_ls%04d_stream%s_%s.%s" % (self.run, play_lumi, stream, stream_source, ext)


             # read the original file name, for copying

             with open(ijoin(jsn_orig_fn), 'r') as f:

                 jsn_data = json.load(f)

                 dat_orig_fn = jsn_data["data"][3]


             # copy the data file

             if os.path.exists(ijoin(dat_orig_fn)):

                 self.log.info("C: %s -> %s", dat_orig_fn, dat_play_fn)

                 shutil.copyfile(ijoin(dat_orig_fn), ojoin(dat_play_fn))


                 written_files.add(dat_play_fn)

             else:

                 log.warning("Dat file is missing: %s", dat_orig_fn)


             # write a new json file point to a different data file

             # this has to be atomic!

             jsn_data["data"][3] = dat_play_fn


             f = tempfile.NamedTemporaryFile(prefix=jsn_play_fn+ ".", suffix=".tmp", dir = self.output, delete=False)

             tmp_fp = f.name

             json.dump(jsn_data, f)

             f.close()


             os.rename(tmp_fp, ojoin(jsn_play_fn))

             written_files.add(jsn_play_fn)


         self.log.info("Copied %d files for lumi %06d", len(written_files), play_lumi)


         self.lumi_backlog.append((play_lumi, written_files))

         while len(self.lumi_backlog) > self.lumi_backlog_size:

             old_lumi, files_to_delete = self.lumi_backlog.popleft()


             self.log.info("Deleting %d files for old lumi %06d", len(files_to_delete), old_lumi)

             for f in files_to_delete:

                 os.unlink(ojoin(f))


     def do_exec(self):

         last_write = 0

         lumi_produced = 0


         while True:

             time.sleep(1)


             now = time.time()

             if (now - last_write) > self.opts.playback_time_lumi:

                 last_write = now


                 if self.opts.playback_nlumi > -1 and lumi_produced >= self.opts.playback_nlumi:

                     break


                 self.do_create_lumi()

                 lumi_produced += 1


         # write eor

         eor_fn = "run%06d_ls0000_EoR.jsn" % (self.run, )

         eor_fp = os.path.join(self.output, eor_fn)

         with open(eor_fp, "w"):

             pass


         self.log.info("Wrote EoR: %s", eor_fp)


 start_dqm_job = """

 #!/bin/env /bin/bash

 set -x #echo on

 TODAY=$(date)

 logname="/var/log/hltd/pid/hlt_run$4_pid$$.log"

 lognamez="/var/log/hltd/pid/hlt_run$4_pid$$_gzip.log.gz"

 #override the noclobber option by using >| operator for redirection - then keep appending to log

 echo startDqmRun invoked $TODAY with arguments $1 $2 $3 $4 $5 $6 $7 $8 >| $logname

 export http_proxy="http://cmsproxy.cms:3128"

 export https_proxy="https://cmsproxy.cms:3128/"

 export NO_PROXY=".cms"

 export SCRAM_ARCH=$2

 cd $1

 cd base

 source cmsset_default.sh >> $logname

 cd $1

 cd current

 pwd >> $logname 2>&1

 eval `scram runtime -sh`;

 cd $3;

 pwd >> $logname 2>&1

 #exec esMonitoring.py -z $lognamez cmsRun `readlink $6` runInputDir=$5 runNumber=$4 $7 $8 >> $logname 2>&1

 exec esMonitoring.py cmsRun `readlink $6` runInputDir=$5 runNumber=$4 $7 $8

 """


 start_dqm_job = start_dqm_job.replace("/var/log/hltd/pid/", '{log_path}/')

 start_dqm_job = start_dqm_job.replace(" cmsRun ", ' {cmsRun} ')


 RunDesc = collections.namedtuple('Run', ['run', 'run_fp', 'global_fp', 'global_param'])

 RunState = collections.namedtuple('RunState', ['desc', 'proc'])


 class FrameworkJob(Applet):

     def _set_name(self):

         x = os.path.basename(self.cfg_file)

         x = re.sub(r'(.*)\.py', r'\1', x)

         x = re.sub(r'(.*)_cfg', r'\1', x)

         x = re.sub(r'(.*)-live', r'\1', x)

         x = re.sub(r'(.*)_sourceclient', r'\1', x)

         x = re.sub(r'(.*)_dqm', r'\1', x)


         x = "".join([c for c in x if c.isalnum()])

         self.tag = x

         self.name = "cmssw_%s" % x


     def _find_release(self):

         fp = os.path.realpath(self.cfg_file)

         while len(fp) > 3:

             bn = os.path.basename(fp)

             fp = os.path.dirname(fp)


             if bn == "src":

                 break


         if len(fp) <= 3:

             raise Exception("Could not find the cmssw release area.")


         self.cmsenv_path = fp

         self.log.info("cmsenv path: %s", self.cmsenv_path)


     def _prepare_files(self):

         self.home_path = os.path.join(self.opts.work_home, "%s_%s" % (self.name, hex(id(self))))

         self.home_path = os.path.realpath(self.home_path)

         os.makedirs(self.home_path)


         self.log_path = self.opts.work_logs

         self.log.info("logs path: %s", self.log_path)


         self.exec_file = os.path.join(self.home_path, "startDqmRun.sh")

         self.log.info("Creating: %s", self.exec_file)

         f = open(self.exec_file, "w")

         template = start_dqm_job

         body = template.format(log_path=self.log_path, cmsRun=self.opts.cmsRun)

         f.write(body)

         f.close()

         os.chmod(self.exec_file, 0o755)


         cmsset_globs = ["/afs/cern.ch/cms/cmsset_default.sh", "/home/dqm*local/base/cmsset_default.sh"]

         cmsset_target = None

         for t in cmsset_globs:

             files =  glob.glob(t)

             for f in files:

                 cmsset_target = f

                 break


         if cmsset_target is not None:

             base = os.path.join(self.home_path, "base")

             os.makedirs(base)


             cmsset_link = os.path.join(base, "cmsset_default.sh")

             self.log.info("Linking : %s -> %s", cmsset_link, cmsset_target)

             os.symlink(cmsset_target, cmsset_link)

         else:

             self.log.warning("Couldn't find cmsset_default.sh, source it yourself!")


         current_link = os.path.join(self.home_path, "current")

         target = os.path.relpath(self.cmsenv_path, self.home_path)

         self.log.info("Linking : %s -> %s", current_link, target)

         os.symlink(target, current_link)


         # check if current is outside the release directory

         # otherwise scram gets stuck forever

         cp = os.path.commonprefix([self.home_path, self.cmsenv_path])

         if self.cmsenv_path == cp:

             self.log.error("Working directory (incl. control directory), have to be outside the cmssw release. Otherwise scram fails due to recursive links.")

             raise Exception("Invalid home_path: %s" % self.home_path)


         output_link = os.path.join(self.home_path, "output")

         output_target = os.path.realpath(self.opts.work_output)

         target = os.path.relpath(output_target, self.home_path)

         self.log.info("Linking : %s -> %s", output_link, target)

         os.symlink(target, output_link)

         self.output_path = output_link


         cfg_link = os.path.join(self.home_path, os.path.basename(self.cfg_file))

         target = self.cfg_fp

         self.log.info("Linking : %s -> %s", cfg_link, target)

         os.symlink(target, cfg_link)

         self.cfg_link = cfg_link


     def do_init(self):

         # check if our input directory is okay

         self.ramdisk = self.opts.work_ramdisk

         self.run = self.opts.run

         self.cfg_file = self.kwargs["cfg_file"]


         if not os.path.isfile(self.cfg_file):

             raise Exception("Configuration file not found: %s" % self.cfg_file)


         self.cfg_fp = os.path.realpath(self.cfg_file)

         self.ramdisk_fp = os.path.realpath(self.ramdisk)


         self._set_name()

         self._find_release()

         self._prepare_files()


     def make_args(self, run):

         args = []

         args.append("bash")                 # arg 0

         args.append(self.exec_file)         # arg 0

         args.append(self.home_path)         # home path

         args.append("slc6_amd64_gcc491")    # release

         args.append(self.output_path)       # cwd/output path

         args.append(str(run))               # run

         args.append(self.ramdisk_fp)        # ramdisk

         args.append(self.cfg_link)          # cmsRun arg 1

         args.append("runkey=pp_run")        # cmsRun arg 2


         return args


     def discover_latest(self):

         re_run = re.compile(r'run([0-9]+)')

         re_global = re.compile(r'\.run([0-9]+)\.global')


         # find runs

         runs = {}

         globals = {}

         for x in os.listdir(self.ramdisk):

             m = re_run.match(x)

             if m:

                 runs[int(m.group(1))] = x


             m = re_global.match(x)

             if m:

                 globals[int(m.group(1))] = x


         # find max global for which there is a run directory

         run_set = set(runs.keys())

         run_set = run_set.intersection(globals.keys())


         if self.opts.run < 0:

             largest = max(run_set)

         else:

             largest = self.opts.run


         #self.log.info("Largest: %s", largest)

         global_fp = os.path.join(self.ramdisk, globals[largest])

         with open(global_fp, "r") as f:

             global_param = f.read()


         return RunDesc(

             run = largest,

             run_fp = os.path.join(self.ramdisk, runs[largest]),

             global_fp = global_fp,

             global_param = global_param,

         )


     def start_run(self, current):

         old_state = self.current_state


         # kill the old run

         # nope, since it involves eof and i am lazy

         if old_state:

             return


         args = self.make_args(current.run)

         self.log.info("Executing: %s", " ".join(args))

         proc = subprocess.Popen(args, preexec_fn=preexec_kill_on_pdeath)

         self.current_state = RunState(desc=current, proc=proc)


     def do_exec(self):

         time.sleep(1)


         self.current_state = None


         while True:

             latest = self.discover_latest()

             if self.current_state is None or latest != self.current_state.desc:

                 self.log.info("Found latest run: %s", latest)


                 self.start_run(latest)


             if not self.current_state:

                 self.log.info("Run not found, waiting 1 sec.")

             else:

                 r = self.current_state.proc.poll()

                 if r is not None:

                     self.log.info("Process exitted: %s", r)


                     return 0


             time.sleep(1)


 import getpass

 if __name__ == "__main__":

     if len(sys.argv) == 2 and sys.argv[-1].endswith(".pkl"):

         f = sys.argv[-1]

         obj = Applet.read(f)


         ret = obj.do_exec()

         sys.exit(ret if ret else 0)


     # control -> interal files and home directory for the run

     subdirectories = ["ramdisk", "output", "control", "home", "logs", "dqm_monitoring"]

     username = getpass.getuser()


     parser = argparse.ArgumentParser(description="Emulate DQM@P5 environment and launch cmssw jobs.")

     #parser.add_argument('-q', action='store_true', help="Don't write to stdout, just the log file.")

     #parser.add_argument("log", type=str, help="Filename to write.", metavar="<logfile.gz>")


     parser.add_argument("--work", "-w", type=str, help="Working directory (used for inputs,outputs,monitoring and logs).", default="/tmp/pplay." + username)

     parser.add_argument("--clean", "-c", action="store_true", help="Clean work directories (if they are not set).", default=False)

     parser.add_argument("--dry", "-n", action="store_true", help="Do not execute, just init.", default=False)


     work_group = parser.add_argument_group('Paths', 'Path options for cmssw jobs, auto generated if not specified.')

     for subdirectory in subdirectories:

         work_group.add_argument("--work_%s" % subdirectory, type=str, help="Path for %s directory." % subdirectory, default=None)


     playback_group = parser.add_argument_group('Playback', 'Playback configuration/parameters.')

     playback_group.add_argument("--playback", "-p", type=str, metavar="PLAYBACK_INPUT_DIR", help="Enable playback (emulate file delivery, otherwise set work_input).", default=None)

     playback_group.add_argument("--playback_nlumi", type=int, help="Number of lumis to deliver, -1 for forever.", default=-1)

     playback_group.add_argument("--playback_time_lumi", type=float, help="Number of seconds between lumisections.", default=23.3)


     run_group = parser.add_argument_group('Run', 'Run configuration/parameters.')

     run_group.add_argument("--run", type=int, help="Run number, -1 for autodiscovery.", default=-1)

     run_group.add_argument("--cmsRun", type=str, help="cmsRun command to run, for igprof and so on.", default="cmsRun")


     parser.add_argument('cmssw_configs', metavar='cmssw_cfg.py', type=str, nargs='*', help='List of cmssw jobs (clients).')


     args = parser.parse_args()


     if len(args.cmssw_configs) and args.cmssw_configs[0] == "--":

         # compat with 2.6

         args.cmssw_configs = args.cmssw_configs[1:]


     for subdirectory in subdirectories:

         if getattr(args, "work_" + subdirectory) is None:

             setattr(args, "work_" + subdirectory, os.path.join(args.work, subdirectory))


             path = getattr(args, "work_" + subdirectory)

             if args.clean and os.path.isdir(path):

                 root_log.info("Removing directory: %s", path)

                 shutil.rmtree(path)


         path = getattr(args, "work_" + subdirectory)

         if not os.path.isdir(path):

             os.makedirs(path)


         root_log.info("Using directory: %s", path)


     print "*"*80

     print args

     print "*"*80


     applets = []


     if args.playback:

         # launch playback service

         playback = Playback("playback_emu", opts=args)

         applets.append(playback)


     for cfg in args.cmssw_configs:

         cfg_a = FrameworkJob("framework_job", opts=args, cfg_file=cfg)

         applets.append(cfg_a)


     if len(applets) == 0:

         sys.stderr.write("At least one process should be specified, use --playback and/or cmssw_configs options.\n")


     # serialize them into control directory

     for a in applets:

         fn = "%s_%s.pkl" % (a.name, hex(id(a)))

         a.write(os.path.join(args.work_control, fn))


     if args.dry:

         sys.exit(0)


     # launch each in a separate subprocess

     for a in applets:

         fp = a.control_fp


         args = [os.path.realpath(__file__), fp]

         a.control_proc = subprocess.Popen(args, preexec_fn=preexec_kill_on_pdeath)


     for a in applets:

         # wait till everything finishes

         a.control_proc.wait()


personalPlayback.Playback.output
output
Definition: personalPlayback.py:111

personalPlayback.Playback.do_init
def do_init
Definition: personalPlayback.py:102

personalPlayback.Playback.next_lumi_index
next_lumi_index
Definition: personalPlayback.py:123

argparse.ArgumentParser
Definition: argparse.py:1503

personalPlayback.FrameworkJob.tag
tag
Definition: personalPlayback.py:255

personalPlayback.Applet.do_exec
def do_exec
Definition: personalPlayback.py:52

personalPlayback.Playback.lumi_found
lumi_found
Definition: personalPlayback.py:67

personalPlayback.Playback.global_file
global_file
Definition: personalPlayback.py:116

personalPlayback.FrameworkJob.exec_file
exec_file
Definition: personalPlayback.py:281

personalPlayback.Playback.lumi_backlog_size
lumi_backlog_size
Definition: personalPlayback.py:122

personalPlayback.FrameworkJob.discover_latest
def discover_latest
Definition: personalPlayback.py:364

personalPlayback.Applet.write
def write
Definition: personalPlayback.py:32

personalPlayback.FrameworkJob.make_args
def make_args
Definition: personalPlayback.py:350

personalPlayback.Playback.discover_files
def discover_files
Definition: personalPlayback.py:66

personalPlayback.FrameworkJob.cmsenv_path
cmsenv_path
Definition: personalPlayback.py:270

personalPlayback.Playback.input
input
Definition: personalPlayback.py:104

personalPlayback.RunState
tuple RunState
Definition: personalPlayback.py:243

personalPlayback.preexec_kill_on_pdeath
def preexec_kill_on_pdeath
Definition: personalPlayback.py:55

personalPlayback.Applet.opts
opts
Definition: personalPlayback.py:27

personalPlayback.FrameworkJob._prepare_files
def _prepare_files
Definition: personalPlayback.py:273

personalPlayback.FrameworkJob.cfg_file
cfg_file
Definition: personalPlayback.py:338

personalPlayback.FrameworkJob.ramdisk_fp
ramdisk_fp
Definition: personalPlayback.py:344

personalPlayback.Playback.do_exec
def do_exec
Definition: personalPlayback.py:188

personalPlayback.FrameworkJob.ramdisk
ramdisk
Definition: personalPlayback.py:336

personalPlayback.Applet.name
name
Definition: personalPlayback.py:26

personalPlayback.Playback.run
run
Definition: personalPlayback.py:92

personalPlayback.FrameworkJob.cfg_fp
cfg_fp
Definition: personalPlayback.py:343

personalPlayback.Playback.lumi_backlog
lumi_backlog
Definition: personalPlayback.py:121

personalPlayback.FrameworkJob.do_init
def do_init
Definition: personalPlayback.py:334

personalPlayback.FrameworkJob.log_path
log_path
Definition: personalPlayback.py:278

personalPlayback.FrameworkJob
Definition: personalPlayback.py:245

personalPlayback.FrameworkJob.do_exec
def do_exec
Definition: personalPlayback.py:414

personalPlayback.FrameworkJob.run
run
Definition: personalPlayback.py:337

join
static std::string join(char **cmd)
Definition: RemoteFile.cc:18

personalPlayback.FrameworkJob.output_path
output_path
Definition: personalPlayback.py:325

personalPlayback.Applet.__init__
def __init__
Definition: personalPlayback.py:25

personalPlayback.FrameworkJob.cfg_link
cfg_link
Definition: personalPlayback.py:331

Exception

personalPlayback.FrameworkJob.start_run
def start_run
Definition: personalPlayback.py:401

personalPlayback.Applet.kwargs
kwargs
Definition: personalPlayback.py:28

dbtoconf.object
list object
Definition: dbtoconf.py:77

personalPlayback.Playback
Definition: personalPlayback.py:63

bookConverter.max
max
Definition: bookConverter.py:166

personalPlayback.Applet.log
def log
Definition: personalPlayback.py:46

personalPlayback.Applet.read
def read
Definition: personalPlayback.py:41

personalPlayback.FrameworkJob.current_state
current_state
Definition: personalPlayback.py:412

personalPlayback.Playback.do_create_lumi
def do_create_lumi
Definition: personalPlayback.py:125

personalPlayback.FrameworkJob._set_name
def _set_name
Definition: personalPlayback.py:246

personalPlayback.Applet.control_fp
control_fp
Definition: personalPlayback.py:33

personalPlayback.FrameworkJob._find_release
def _find_release
Definition: personalPlayback.py:258

personalPlayback.Playback.lumi_order
lumi_order
Definition: personalPlayback.py:98

personalPlayback.FrameworkJob.home_path
home_path
Definition: personalPlayback.py:274

personalPlayback.Applet
Definition: personalPlayback.py:24

personalPlayback.Applet.do_init
def do_init
Definition: personalPlayback.py:49

personalPlayback.Playback.ramdisk
ramdisk
Definition: personalPlayback.py:105

list
How EventSelector::AcceptEvent() decides whether to accept an event for output otherwise it is excluding the probing of A single or multiple positive and the trigger will pass if any such matching triggers are PASS or EXCEPTION[A criterion thatmatches no triggers at all is detected and causes a throw.] A single negative with an expectation of appropriate bit checking in the decision and the trigger will pass if any such matching triggers are FAIL or EXCEPTION A wildcarded negative criterion that matches more than one trigger in the trigger list("!*","!HLTx*"if it matches 2 triggers or more) will accept the event if all the matching triggers are FAIL.It will reject the event if any of the triggers are PASS or EXCEPTION(this matches the behavior of"!*"before the partial wildcard feature was incorporated).Triggers which are in the READY state are completely ignored.(READY should never be returned since the trigger paths have been run

personalPlayback.RunDesc
tuple RunDesc
Definition: personalPlayback.py:242