#include <libminifloat.h>

Public Member Functions
float	operator() (float f) const

	ReduceMantissaToNbitsRounding (int bits)

Private Attributes
const uint32_t	mask

const uint32_t	maxn

const int	shift

const uint32_t	test

Detailed Description

Definition at line 52 of file libminifloat.h.

Constructor & Destructor Documentation

◆ ReduceMantissaToNbitsRounding()

MiniFloatConverter::ReduceMantissaToNbitsRounding::ReduceMantissaToNbitsRounding ( int bits )

inline

Definition at line 54 of file libminifloat.h.

References cms::cuda::assert().

         : shift(23 - bits), mask((0xFFFFFFFF >> (shift)) << (shift)), test(1 << (shift - 1)), maxn((1 << bits) - 2) {
       assert(bits <= 23);  // "max mantissa size is 23 bits"
     }

Member Function Documentation

◆ operator()()

float MiniFloatConverter::ReduceMantissaToNbitsRounding::operator() ( float f ) const

inline

Definition at line 58 of file libminifloat.h.

References edm::bit_cast(), f, mask, maxn, and shift.

                                     {
       constexpr uint32_t low23 = (0x007FFFFF);  // mask to keep lowest 23 bits = mantissa
       constexpr uint32_t hi9 = (0xFF800000);    // mask to keep highest 9 bits = the rest
       uint32_t i32 = edm::bit_cast<uint32_t>(f);
       if (i32 & test) {  // need to round
         uint32_t mantissa = (i32 & low23) >> shift;
         if (mantissa < maxn)
           mantissa++;
         i32 = (i32 & hi9) | (mantissa << shift);
       } else {
         i32 &= mask;
       }
       return edm::bit_cast<float>(i32);
     }

Member Data Documentation

◆ mask

const uint32_t MiniFloatConverter::ReduceMantissaToNbitsRounding::mask

private

Definition at line 75 of file libminifloat.h.

Referenced by operator()().

◆ maxn

const uint32_t MiniFloatConverter::ReduceMantissaToNbitsRounding::maxn

private

Definition at line 75 of file libminifloat.h.

Referenced by operator()().

◆ shift

const int MiniFloatConverter::ReduceMantissaToNbitsRounding::shift

private

Definition at line 74 of file libminifloat.h.

Referenced by operator()().

◆ test

const uint32_t MiniFloatConverter::ReduceMantissaToNbitsRounding::test

private

Definition at line 75 of file libminifloat.h.

Referenced by edmIntegrityCheck.IntegrityCheck::report(), and edmIntegrityCheck.IntegrityCheck::structured().

Public Member Functions

Private Attributes

Detailed Description

Constructor & Destructor Documentation

◆ ReduceMantissaToNbitsRounding()

Member Function Documentation

◆ operator()()

Member Data Documentation

◆ mask

◆ maxn

◆ shift

◆ test