Move denormal state to metadata

davidjwoo · igcbot · commit 15b443f56a2c · 2025-05-14T20:51:27.000+02:00
Move denormal mode state to llvm metadata.
diff --git a/IGC/AdaptorOCL/dllInterfaceCompute.cpp b/IGC/AdaptorOCL/dllInterfaceCompute.cpp
@@ -1420,15 +1420,16 @@ bool TranslateBuildSPMD(
 
     // Set default denorm.
     // Note that those values have been set to FLOAT_DENORM_FLUSH_TO_ZERO
+    CompOptions* compOpt = &oclContext.getModuleMetaData()->compOpt;
     if (IGFX_GEN8_CORE <= oclContext.platform.GetPlatformFamily())
     {
-        oclContext.m_floatDenormMode16 = FLOAT_DENORM_RETAIN;
-        oclContext.m_floatDenormMode32 = FLOAT_DENORM_RETAIN;
-        oclContext.m_floatDenormMode64 = FLOAT_DENORM_RETAIN;
+        compOpt->FloatDenormMode16 = FLOAT_DENORM_RETAIN;
+        compOpt->FloatDenormMode32 = FLOAT_DENORM_RETAIN;
+        compOpt->FloatDenormMode64 = FLOAT_DENORM_RETAIN;
     }
     if (oclContext.platform.hasBFTFDenormMode())
     {
-        oclContext.m_floatDenormModeBFTF = FLOAT_DENORM_RETAIN;
+        compOpt->FloatDenormModeBFTF = FLOAT_DENORM_RETAIN;
     }
 
     unsigned PtrSzInBits = pKernelModule->getDataLayout().getPointerSizeInBits();
@@ -1504,12 +1505,12 @@ bool TranslateBuildSPMD(
                 ModuleMetaData* modMD = oclContext.getModuleMetaData();
                 if (modMD->compOpt.DenormsAreZero)
                 {
-                    oclContext.m_floatDenormMode16 = FLOAT_DENORM_FLUSH_TO_ZERO;
-                    oclContext.m_floatDenormMode32 = FLOAT_DENORM_FLUSH_TO_ZERO;
+                    modMD->compOpt.FloatDenormMode16 = FLOAT_DENORM_FLUSH_TO_ZERO;
+                    modMD->compOpt.FloatDenormMode32 = FLOAT_DENORM_FLUSH_TO_ZERO;
                 }
                 if (modMD->compOpt.BFTFDenormsAreZero)
                 {
-                    oclContext.m_floatDenormModeBFTF = FLOAT_DENORM_FLUSH_TO_ZERO;
+                    modMD->compOpt.FloatDenormModeBFTF = FLOAT_DENORM_FLUSH_TO_ZERO;
                 }
                 if (IGC_GET_FLAG_VALUE(ForceFastestSIMD))
                 {
@@ -1565,6 +1566,20 @@ bool TranslateBuildSPMD(
                 // Remove annotations for kernels that do not require recompilation
                 RebuildGlobalAnnotations(oclContext, pKernelModule);
 
+                // Set default denorm since metadata was cleared.
+                // Note that those values have been set to FLOAT_DENORM_FLUSH_TO_ZERO
+                compOpt = &oclContext.getModuleMetaData()->compOpt;
+                if (IGFX_GEN8_CORE <= oclContext.platform.GetPlatformFamily())
+                {
+                    compOpt->FloatDenormMode16 = FLOAT_DENORM_RETAIN;
+                    compOpt->FloatDenormMode32 = FLOAT_DENORM_RETAIN;
+                    compOpt->FloatDenormMode64 = FLOAT_DENORM_RETAIN;
+                }
+                if (oclContext.platform.hasBFTFDenormMode())
+                {
+                    compOpt->FloatDenormModeBFTF = FLOAT_DENORM_RETAIN;
+                }
+
                 for (auto it = pKernelModule->getFunctionList().begin(), ie = pKernelModule->getFunctionList().end(); it != ie;)
                 {
                     Function* pFunc = &*(it++);
diff --git a/IGC/Compiler/Builtins/BIFFlagCtrl/BIFFlagCtrlResolution.cpp b/IGC/Compiler/Builtins/BIFFlagCtrl/BIFFlagCtrlResolution.cpp
@@ -42,7 +42,7 @@ void BIFFlagCtrlResolution::FillFlagCtrl() {
   BIF_FLAG_CTRL_SET(RenderFamily, PtrCGC->platform.getPlatformInfo().eRenderCoreFamily);
   BIF_FLAG_CTRL_SET(
       FlushDenormals,
-      ((PtrCGC->m_floatDenormMode32 == FLOAT_DENORM_FLUSH_TO_ZERO) ||
+      ((PtrCGC->getModuleMetaData()->compOpt.FloatDenormMode32 == FLOAT_DENORM_FLUSH_TO_ZERO) ||
        PtrCGC->getModuleMetaData()->compOpt.DenormsAreZero));
   BIF_FLAG_CTRL_SET(FastRelaxedMath,
                     PtrCGC->getModuleMetaData()->compOpt.RelaxedBuiltins);
diff --git a/IGC/Compiler/CISACodeGen/CISABuilder.cpp b/IGC/Compiler/CISACodeGen/CISABuilder.cpp
@@ -2909,13 +2909,13 @@ namespace IGC
         uint imm_data = 0;
 
         CodeGenContext* pCtx = m_program->GetContext();
-        if (pCtx->m_floatDenormMode16 == FLOAT_DENORM_RETAIN)
+        if (pCtx->getModuleMetaData()->compOpt.FloatDenormMode16 == FLOAT_DENORM_RETAIN)
             imm_data |= 0x400;
-        if (pCtx->m_floatDenormMode32 == FLOAT_DENORM_RETAIN)
+        if (pCtx->getModuleMetaData()->compOpt.FloatDenormMode32 == FLOAT_DENORM_RETAIN)
             imm_data |= 0x80;
-        if (pCtx->m_floatDenormMode64 == FLOAT_DENORM_RETAIN)
+        if (pCtx->getModuleMetaData()->compOpt.FloatDenormMode64 == FLOAT_DENORM_RETAIN)
             imm_data |= 0x40;
-        if (pCtx->m_floatDenormModeBFTF == FLOAT_DENORM_RETAIN)
+        if (pCtx->getModuleMetaData()->compOpt.FloatDenormModeBFTF == FLOAT_DENORM_RETAIN)
             imm_data |= (0x1 << 30);
 
         uint RM_bits = 0;
@@ -4352,10 +4352,10 @@ namespace IGC
 
         CodeGenContext* pCtx = m_program->GetContext();
         bool needsDenormRetainForMathInstructions =
-             (pCtx->m_floatDenormMode16 == FLOAT_DENORM_FLUSH_TO_ZERO) ||
-             (pCtx->m_floatDenormMode32 == FLOAT_DENORM_FLUSH_TO_ZERO) ||
-             (pCtx->m_floatDenormMode64 == FLOAT_DENORM_FLUSH_TO_ZERO) ||
-             (m_program->m_Platform->hasBFTFDenormMode() && pCtx->m_floatDenormModeBFTF == FLOAT_DENORM_FLUSH_TO_ZERO);
+             (context->getModuleMetaData()->compOpt.FloatDenormMode16 == FLOAT_DENORM_FLUSH_TO_ZERO) ||
+             (context->getModuleMetaData()->compOpt.FloatDenormMode32 == FLOAT_DENORM_FLUSH_TO_ZERO) ||
+             (context->getModuleMetaData()->compOpt.FloatDenormMode64 == FLOAT_DENORM_FLUSH_TO_ZERO) ||
+             (m_program->m_Platform->hasBFTFDenormMode() && context->getModuleMetaData()->compOpt.FloatDenormModeBFTF == FLOAT_DENORM_FLUSH_TO_ZERO);
 
         if (m_program->m_Platform->hasCorrectlyRoundedMacros() && needsDenormRetainForMathInstructions)
         {
diff --git a/IGC/Compiler/CISACodeGen/EmitVISAPass.cpp b/IGC/Compiler/CISACodeGen/EmitVISAPass.cpp
@@ -21690,10 +21690,10 @@ void IGC::EmitPass::emitCanonicalize(llvm::Instruction* inst, const DstModifier&
     // A normalized fp value isn't changed.
     // The operation is done only if particular flags are set.
     // If the instruction should be emitted anyway, flushing a subnormal to zero has to implemented in other way.
-    CodeGenContext* pCodeGenContext = getAnalysis<CodeGenContextWrapper>().getCodeGenContext();
-    bool flushVal = pCodeGenContext->m_floatDenormMode16 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isHalfTy();
-    flushVal = flushVal || (pCodeGenContext->m_floatDenormMode32 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isFloatTy());
-    flushVal = flushVal || (pCodeGenContext->m_floatDenormMode64 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isDoubleTy());
+    CompOptions& compOpt = getAnalysis<CodeGenContextWrapper>().getCodeGenContext()->getModuleMetaData()->compOpt;
+    bool flushVal = compOpt.FloatDenormMode16 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isHalfTy();
+    flushVal = flushVal || (compOpt.FloatDenormMode32 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isFloatTy());
+    flushVal = flushVal || (compOpt.FloatDenormMode64 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isDoubleTy());
     if (flushVal || modifier.sat)
     {
         CVariable* inputVal = GetSymbol(inst->getOperand(0));
diff --git a/IGC/Compiler/CISACodeGen/PatternMatchPass.cpp b/IGC/Compiler/CISACodeGen/PatternMatchPass.cpp
@@ -221,9 +221,9 @@ namespace IGC
     bool CodeGenPatternMatch::FlushesDenormsOnOutput(Instruction& I)
     {
         bool flushesDenorms = false;
-        if ((m_ctx->m_floatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isHalfTy()) ||
-            (m_ctx->m_floatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isFloatTy()) ||
-            (m_ctx->m_floatDenormMode64 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isDoubleTy()))
+        if ((m_ctx->getModuleMetaData()->compOpt.FloatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isHalfTy()) ||
+            (m_ctx->getModuleMetaData()->compOpt.FloatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isFloatTy()) ||
+            (m_ctx->getModuleMetaData()->compOpt.FloatDenormMode64 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isDoubleTy()))
         {
             switch (GetOpCode(&I))
             {
@@ -294,9 +294,9 @@ namespace IGC
     bool CodeGenPatternMatch::FlushesDenormsOnInput(Instruction& I)
     {
         bool flushesDenorms = false;
-        if ((m_ctx->m_floatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isHalfTy()) ||
-            (m_ctx->m_floatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isFloatTy()) ||
-            (m_ctx->m_floatDenormMode64 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isDoubleTy()))
+        if ((m_ctx->getModuleMetaData()->compOpt.FloatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isHalfTy()) ||
+            (m_ctx->getModuleMetaData()->compOpt.FloatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isFloatTy()) ||
+            (m_ctx->getModuleMetaData()->compOpt.FloatDenormMode64 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isDoubleTy()))
         {
             switch (GetOpCode(&I))
             {
@@ -3593,8 +3593,8 @@ namespace IGC
         IGC_ASSERT(isa<Instruction>(I.getOperand(0)) || isa<Argument>(I.getOperand(0)));
         // Current implementation assumes that mix mode is disabled if
         // half float or 32-bit float denorms must be flushed.
-        if (m_ctx->m_floatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO ||
-            m_ctx->m_floatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO)
+        if (m_ctx->getModuleMetaData()->compOpt.FloatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO ||
+            m_ctx->getModuleMetaData()->compOpt.FloatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO)
         {
             IGC_ASSERT(!m_Platform.supportMixMode() || m_ctx->getModuleMetaData()->disableMixMode);
         }
diff --git a/IGC/Compiler/CodeGenContext.cpp b/IGC/Compiler/CodeGenContext.cpp
@@ -440,10 +440,6 @@ namespace IGC
         PRINT_CTX_MEMBER(m_enableSampleMultiversioning);
         PRINT_CTX_MEMBER(m_enableSimdVariantCompilation);
         PRINT_CTX_MEMBER(m_enableSubroutine);
-        PRINT_CTX_MEMBER(m_floatDenormMode16);
-        PRINT_CTX_MEMBER(m_floatDenormMode32);
-        PRINT_CTX_MEMBER(m_floatDenormMode64);
-        PRINT_CTX_MEMBER(m_floatDenormModeBFTF);
         PRINT_CTX_MEMBER(m_ForceEarlyZMathCheck);
         PRINT_CTX_MEMBER(m_hasDPDivSqrtEmu);
         PRINT_CTX_MEMBER(m_hasDPEmu);
diff --git a/IGC/Compiler/CodeGenPublic.h b/IGC/Compiler/CodeGenPublic.h
@@ -916,11 +916,6 @@ namespace IGC
         /// output: list of buffer IDs which are promoted to direct AS
         // Map of promoted buffer ids with their respective buffer offsets if needed. Buffer offset will be -1 if no need of buffer offset
         std::map<unsigned, int> m_buffersPromotedToDirectAS;
-        // float 16, float32 and float64 denorm mode
-        Float_DenormMode    m_floatDenormMode16 = FLOAT_DENORM_FLUSH_TO_ZERO;
-        Float_DenormMode    m_floatDenormMode32 = FLOAT_DENORM_FLUSH_TO_ZERO;
-        Float_DenormMode    m_floatDenormMode64 = FLOAT_DENORM_FLUSH_TO_ZERO;
-        Float_DenormMode    m_floatDenormModeBFTF = FLOAT_DENORM_FLUSH_TO_ZERO;
 
         PushConstantMode m_pushConstantMode = PushConstantMode::DEFAULT;
 
diff --git a/IGC/Compiler/CustomSafeOptPass.cpp b/IGC/Compiler/CustomSafeOptPass.cpp
@@ -4259,10 +4259,10 @@ Constant* IGCConstProp::ConstantFoldCallInstruction(CallInst* inst)
             // Please, be aware of the fact that clients can understand the term canonical FP value in other way.
             if (C0)
             {
-                CodeGenContext* pCodeGenContext = getAnalysis<CodeGenContextWrapper>().getCodeGenContext();
-                bool flushVal = pCodeGenContext->m_floatDenormMode16 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isHalfTy();
-                flushVal = flushVal || (pCodeGenContext->m_floatDenormMode32 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isFloatTy());
-                flushVal = flushVal || (pCodeGenContext->m_floatDenormMode64 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isDoubleTy());
+                CompOptions& compOpt = getAnalysis<CodeGenContextWrapper>().getCodeGenContext()->getModuleMetaData()->compOpt;
+                bool flushVal = compOpt.FloatDenormMode16 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isHalfTy();
+                flushVal = flushVal || (compOpt.FloatDenormMode32 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isFloatTy());
+                flushVal = flushVal || (compOpt.FloatDenormMode64 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isDoubleTy());
                 C = constantFolder.CreateCanonicalize(C0, flushVal);
             }
         }
diff --git a/IGC/Compiler/CustomUnsafeOptPass.cpp b/IGC/Compiler/CustomUnsafeOptPass.cpp
@@ -136,7 +136,7 @@ bool CustomUnsafeOptPass::runOnFunction(Function& F)
     {
         m_disableReorderingOpt = true;
     }
-    if (m_ctx->type == ShaderType::COMPUTE_SHADER && m_ctx->m_floatDenormMode64 == FLOAT_DENORM_RETAIN)
+    if (m_ctx->type == ShaderType::COMPUTE_SHADER && m_ctx->getModuleMetaData()->compOpt.FloatDenormMode64 == FLOAT_DENORM_RETAIN)
     {
         m_disableReorderingOpt = true;
     }
diff --git a/IGC/Compiler/Optimizer/PreCompiledFuncImport.cpp b/IGC/Compiler/Optimizer/PreCompiledFuncImport.cpp
@@ -2225,7 +2225,7 @@ void PreCompiledFuncImport::visitCallInst(llvm::CallInst& I)
         args[1] = I.getOperand(1);
 
         auto pMD = getAnalysis<MetaDataUtilsWrapper>().getModuleMetaData();
-        int ftz = (m_pCtx->m_floatDenormMode32 == FLOAT_DENORM_FLUSH_TO_ZERO) ? 1 : 0;
+        int ftz = (pMD->compOpt.FloatDenormMode32 == FLOAT_DENORM_FLUSH_TO_ZERO) ? 1 : 0;
         int daz = (pMD->compOpt.DenormsAreZero) ? 1 : 0;
         args[2] = ConstantInt::get(Type::getInt32Ty(I.getContext()), ftz);
         args[3] = ConstantInt::get(Type::getInt32Ty(I.getContext()), daz);
diff --git a/IGC/Compiler/WorkaroundAnalysisPass.cpp b/IGC/Compiler/WorkaroundAnalysisPass.cpp
@@ -588,9 +588,9 @@ void WAFMinFMax::visitCallInst(CallInst& I)
                         EnableFMaxFMinPlusZero);
                 bool hasNaNs = !modMD->compOpt.FiniteMathOnly;
                 if (hasNaNs && minmaxModeSetByDenormBit &&
-                    ((Ty->isFloatTy() && (m_ctx->m_floatDenormMode32 == FLOAT_DENORM_RETAIN)) ||
-                    (Ty->isDoubleTy() && (m_ctx->m_floatDenormMode64 == FLOAT_DENORM_RETAIN)) ||
-                        (Ty->isHalfTy() && (m_ctx->m_floatDenormMode16 == FLOAT_DENORM_RETAIN))))
+                    ((Ty->isFloatTy() && (modMD->compOpt.FloatDenormMode32 == FLOAT_DENORM_RETAIN)) ||
+                    (Ty->isDoubleTy() && (modMD->compOpt.FloatDenormMode64 == FLOAT_DENORM_RETAIN)) ||
+                        (Ty->isHalfTy() && (modMD->compOpt.FloatDenormMode16 == FLOAT_DENORM_RETAIN))))
                 {
                     m_builder->SetInsertPoint(&I);
 
diff --git a/IGC/common/MDFrameWork.h b/IGC/common/MDFrameWork.h
@@ -114,6 +114,16 @@ enum class ShaderTypeMD
         unsigned int MipCount = 0;
     };
 
+// The real declaration is in CodeGenPublicEnums.h.
+// This declaration exists to fool the autogeneration script into generating the relevant parsing code.
+#if 0
+    enum Float_DenormMode
+    {
+        FLOAT_DENORM_FLUSH_TO_ZERO = 0,
+        FLOAT_DENORM_RETAIN,
+    };
+#endif
+
     struct ArgDependencyInfoMD
     {
         int argDependency = 0;
@@ -381,6 +391,11 @@ enum class ShaderTypeMD
         bool MadEnable                                  = false;
         bool NoSignedZeros                              = false;
         bool NoNaNs                                     = false;
+        // float 16, float32 and float64 denorm mode
+        Float_DenormMode FloatDenormMode16              = FLOAT_DENORM_FLUSH_TO_ZERO;
+        Float_DenormMode FloatDenormMode32              = FLOAT_DENORM_FLUSH_TO_ZERO;
+        Float_DenormMode FloatDenormMode64              = FLOAT_DENORM_FLUSH_TO_ZERO;
+        Float_DenormMode FloatDenormModeBFTF            = FLOAT_DENORM_FLUSH_TO_ZERO;
 
         // default rounding modes
         unsigned FloatRoundingMode                      = IGC::ROUND_TO_NEAREST_EVEN;

Original file line number	Diff line number	Diff line change
`@@ -1420,15 +1420,16 @@ bool TranslateBuildSPMD(`
`1420`	`1420`
`1421`	`1421`	`// Set default denorm.`
`1422`	`1422`	`// Note that those values have been set to FLOAT_DENORM_FLUSH_TO_ZERO`
	`1423`	`+ CompOptions* compOpt = &oclContext.getModuleMetaData()->compOpt;`
`1423`	`1424`	`if (IGFX_GEN8_CORE <= oclContext.platform.GetPlatformFamily())`
`1424`	`1425`	`{`
`1425`		`- oclContext.m_floatDenormMode16 = FLOAT_DENORM_RETAIN;`
`1426`		`- oclContext.m_floatDenormMode32 = FLOAT_DENORM_RETAIN;`
`1427`		`- oclContext.m_floatDenormMode64 = FLOAT_DENORM_RETAIN;`
	`1426`	`+ compOpt->FloatDenormMode16 = FLOAT_DENORM_RETAIN;`
	`1427`	`+ compOpt->FloatDenormMode32 = FLOAT_DENORM_RETAIN;`
	`1428`	`+ compOpt->FloatDenormMode64 = FLOAT_DENORM_RETAIN;`
`1428`	`1429`	`}`
`1429`	`1430`	`if (oclContext.platform.hasBFTFDenormMode())`
`1430`	`1431`	`{`
`1431`		`- oclContext.m_floatDenormModeBFTF = FLOAT_DENORM_RETAIN;`
	`1432`	`+ compOpt->FloatDenormModeBFTF = FLOAT_DENORM_RETAIN;`
`1432`	`1433`	`}`
`1433`	`1434`
`1434`	`1435`	`unsigned PtrSzInBits = pKernelModule->getDataLayout().getPointerSizeInBits();`
`@@ -1504,12 +1505,12 @@ bool TranslateBuildSPMD(`
`1504`	`1505`	`ModuleMetaData* modMD = oclContext.getModuleMetaData();`
`1505`	`1506`	`if (modMD->compOpt.DenormsAreZero)`
`1506`	`1507`	`{`
`1507`		`- oclContext.m_floatDenormMode16 = FLOAT_DENORM_FLUSH_TO_ZERO;`
`1508`		`- oclContext.m_floatDenormMode32 = FLOAT_DENORM_FLUSH_TO_ZERO;`
	`1508`	`+ modMD->compOpt.FloatDenormMode16 = FLOAT_DENORM_FLUSH_TO_ZERO;`
	`1509`	`+ modMD->compOpt.FloatDenormMode32 = FLOAT_DENORM_FLUSH_TO_ZERO;`
`1509`	`1510`	`}`
`1510`	`1511`	`if (modMD->compOpt.BFTFDenormsAreZero)`
`1511`	`1512`	`{`
`1512`		`- oclContext.m_floatDenormModeBFTF = FLOAT_DENORM_FLUSH_TO_ZERO;`
	`1513`	`+ modMD->compOpt.FloatDenormModeBFTF = FLOAT_DENORM_FLUSH_TO_ZERO;`
`1513`	`1514`	`}`
`1514`	`1515`	`if (IGC_GET_FLAG_VALUE(ForceFastestSIMD))`
`1515`	`1516`	`{`
`@@ -1565,6 +1566,20 @@ bool TranslateBuildSPMD(`
`1565`	`1566`	`// Remove annotations for kernels that do not require recompilation`
`1566`	`1567`	`RebuildGlobalAnnotations(oclContext, pKernelModule);`
`1567`	`1568`
	`1569`	`+ // Set default denorm since metadata was cleared.`
	`1570`	`+ // Note that those values have been set to FLOAT_DENORM_FLUSH_TO_ZERO`
	`1571`	`+ compOpt = &oclContext.getModuleMetaData()->compOpt;`
	`1572`	`+ if (IGFX_GEN8_CORE <= oclContext.platform.GetPlatformFamily())`
	`1573`	`+ {`
	`1574`	`+ compOpt->FloatDenormMode16 = FLOAT_DENORM_RETAIN;`
	`1575`	`+ compOpt->FloatDenormMode32 = FLOAT_DENORM_RETAIN;`
	`1576`	`+ compOpt->FloatDenormMode64 = FLOAT_DENORM_RETAIN;`
	`1577`	`+ }`
	`1578`	`+ if (oclContext.platform.hasBFTFDenormMode())`
	`1579`	`+ {`
	`1580`	`+ compOpt->FloatDenormModeBFTF = FLOAT_DENORM_RETAIN;`
	`1581`	`+ }`
	`1582`	`+`
`1568`	`1583`	`for (auto it = pKernelModule->getFunctionList().begin(), ie = pKernelModule->getFunctionList().end(); it != ie;)`
`1569`	`1584`	`{`
`1570`	`1585`	`Function* pFunc = &*(it++);`
Original file line number	Diff line number	Diff line change
`@@ -221,9 +221,9 @@ namespace IGC`
`221`	`221`	`bool CodeGenPatternMatch::FlushesDenormsOnOutput(Instruction& I)`
`222`	`222`	`{`
`223`	`223`	`bool flushesDenorms = false;`
`224`		`- if ((m_ctx->m_floatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isHalfTy()) \|\|`
`225`		`- (m_ctx->m_floatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isFloatTy()) \|\|`
`226`		`- (m_ctx->m_floatDenormMode64 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isDoubleTy()))`
	`224`	`+ if ((m_ctx->getModuleMetaData()->compOpt.FloatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isHalfTy()) \|\|`
	`225`	`+ (m_ctx->getModuleMetaData()->compOpt.FloatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isFloatTy()) \|\|`
	`226`	`+ (m_ctx->getModuleMetaData()->compOpt.FloatDenormMode64 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isDoubleTy()))`
`227`	`227`	`{`
`228`	`228`	`switch (GetOpCode(&I))`
`229`	`229`	`{`
`@@ -294,9 +294,9 @@ namespace IGC`
`294`	`294`	`bool CodeGenPatternMatch::FlushesDenormsOnInput(Instruction& I)`
`295`	`295`	`{`
`296`	`296`	`bool flushesDenorms = false;`
`297`		`- if ((m_ctx->m_floatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isHalfTy()) \|\|`
`298`		`- (m_ctx->m_floatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isFloatTy()) \|\|`
`299`		`- (m_ctx->m_floatDenormMode64 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isDoubleTy()))`
	`297`	`+ if ((m_ctx->getModuleMetaData()->compOpt.FloatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isHalfTy()) \|\|`
	`298`	`+ (m_ctx->getModuleMetaData()->compOpt.FloatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isFloatTy()) \|\|`
	`299`	`+ (m_ctx->getModuleMetaData()->compOpt.FloatDenormMode64 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO && I.getType()->isDoubleTy()))`
`300`	`300`	`{`
`301`	`301`	`switch (GetOpCode(&I))`
`302`	`302`	`{`
`@@ -3593,8 +3593,8 @@ namespace IGC`
`3593`	`3593`	`IGC_ASSERT(isa<Instruction>(I.getOperand(0)) \|\| isa<Argument>(I.getOperand(0)));`
`3594`	`3594`	`// Current implementation assumes that mix mode is disabled if`
`3595`	`3595`	`// half float or 32-bit float denorms must be flushed.`
`3596`		`- if (m_ctx->m_floatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO \|\|`
`3597`		`- m_ctx->m_floatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO)`
	`3596`	`+ if (m_ctx->getModuleMetaData()->compOpt.FloatDenormMode16 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO \|\|`
	`3597`	`+ m_ctx->getModuleMetaData()->compOpt.FloatDenormMode32 == IGC::FLOAT_DENORM_FLUSH_TO_ZERO)`
`3598`	`3598`	`{`
`3599`	`3599`	`IGC_ASSERT(!m_Platform.supportMixMode() \|\| m_ctx->getModuleMetaData()->disableMixMode);`
`3600`	`3600`	`}`
Original file line number	Diff line number	Diff line change
`@@ -4259,10 +4259,10 @@ Constant* IGCConstProp::ConstantFoldCallInstruction(CallInst* inst)`
`4259`	`4259`	`// Please, be aware of the fact that clients can understand the term canonical FP value in other way.`
`4260`	`4260`	`if (C0)`
`4261`	`4261`	`{`
`4262`		`- CodeGenContext* pCodeGenContext = getAnalysis<CodeGenContextWrapper>().getCodeGenContext();`
`4263`		`- bool flushVal = pCodeGenContext->m_floatDenormMode16 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isHalfTy();`
`4264`		`- flushVal = flushVal \|\| (pCodeGenContext->m_floatDenormMode32 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isFloatTy());`
`4265`		`- flushVal = flushVal \|\| (pCodeGenContext->m_floatDenormMode64 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isDoubleTy());`
	`4262`	`+ CompOptions& compOpt = getAnalysis<CodeGenContextWrapper>().getCodeGenContext()->getModuleMetaData()->compOpt;`
	`4263`	`+ bool flushVal = compOpt.FloatDenormMode16 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isHalfTy();`
	`4264`	`+ flushVal = flushVal \|\| (compOpt.FloatDenormMode32 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isFloatTy());`
	`4265`	`+ flushVal = flushVal \|\| (compOpt.FloatDenormMode64 == ::IGC::FLOAT_DENORM_FLUSH_TO_ZERO && inst->getType()->isDoubleTy());`
`4266`	`4266`	`C = constantFolder.CreateCanonicalize(C0, flushVal);`
`4267`	`4267`	`}`
`4268`	`4268`	`}`
Original file line number	Diff line number	Diff line change
`@@ -136,7 +136,7 @@ bool CustomUnsafeOptPass::runOnFunction(Function& F)`
`136`	`136`	`{`
`137`	`137`	`m_disableReorderingOpt = true;`
`138`	`138`	`}`
`139`		`- if (m_ctx->type == ShaderType::COMPUTE_SHADER && m_ctx->m_floatDenormMode64 == FLOAT_DENORM_RETAIN)`
	`139`	`+ if (m_ctx->type == ShaderType::COMPUTE_SHADER && m_ctx->getModuleMetaData()->compOpt.FloatDenormMode64 == FLOAT_DENORM_RETAIN)`
`140`	`140`	`{`
`141`	`141`	`m_disableReorderingOpt = true;`
`142`	`142`	`}`