From 957bb77bb9bd631388b47a12a9552e6a45c776b8 Mon Sep 17 00:00:00 2001
From: Chang Sun <chsun@cern.ch>
Date: Mon, 21 Jul 2025 10:54:39 -0700
Subject: [PATCH 1/5] bit exact extension

---
 hls4ml/converters/__init__.py                 |  2 +
 hls4ml/converters/keras/qkeras.py             |  1 +
 hls4ml/model/optimizer/passes/bit_exact.py    | 44 ++++++++++++++++++-
 .../model/optimizer/passes/hgq_proxy_model.py | 29 +++++++-----
 4 files changed, 63 insertions(+), 13 deletions(-)

diff --git a/hls4ml/converters/__init__.py b/hls4ml/converters/__init__.py
index 89f4fc04b9..9e6ba15c2b 100644
--- a/hls4ml/converters/__init__.py
+++ b/hls4ml/converters/__init__.py
@@ -165,6 +165,7 @@ def convert_from_keras_model(
     output_data_tb=None,
     backend='Vivado',
     hls_config=None,
+    bit_exact=None,
     **kwargs,
 ):
     """Convert Keras model to hls4ml model based on the provided configuration.
@@ -214,6 +215,7 @@ def convert_from_keras_model(
 
     model_config = hls_config.get('Model', None)
     config['HLSConfig']['Model'] = _check_model_config(model_config)
+    config['HLSConfig']['Model']['BitExact'] = bit_exact
 
     _check_hls_config(config, hls_config)
     if 'KerasModel' in config:
diff --git a/hls4ml/converters/keras/qkeras.py b/hls4ml/converters/keras/qkeras.py
index fd670ad0d9..7cf6e6b0a5 100644
--- a/hls4ml/converters/keras/qkeras.py
+++ b/hls4ml/converters/keras/qkeras.py
@@ -174,6 +174,7 @@ def get_activation_quantizer(keras_layer, input_names, activation_name='activati
         layer[activation_name] = activation_config['class_name'].replace('quantized_', '')
 
     layer[f'{activation_name}_quantizer'] = activation_config
+    layer['trusted'] = True
 
     return layer
 
diff --git a/hls4ml/model/optimizer/passes/bit_exact.py b/hls4ml/model/optimizer/passes/bit_exact.py
index b2de23a390..56bda53ee6 100644
--- a/hls4ml/model/optimizer/passes/bit_exact.py
+++ b/hls4ml/model/optimizer/passes/bit_exact.py
@@ -133,6 +133,30 @@ def _(layer: Reshape):
 @_request_kif.register
 def _(layer: Activation):
     fn_name = layer.attributes.get('activation')
+
+    if layer.attributes.get('trusted', False):
+        result_t = layer.get_output_variable().type.precision
+        if fn_name in ('linear', 'relu'):
+            output_shape = get_output_shape(layer)
+            k, w, f = result_t.signed, result_t.width, result_t.fractional
+            i = w - k - f
+            k = np.full(output_shape, k, dtype=np.int8)
+            i = np.full(output_shape, i, dtype=np.int8)
+            f = np.full(output_shape, f, dtype=np.int8)
+            if result_t.rounding_mode == RoundingMode.RND:
+                f += 1
+            elif result_t.rounding_mode != RoundingMode.TRN:
+                f = np.full(output_shape, 126, dtype=np.int8)
+            if result_t.saturation_mode != SaturationMode.WRAP:
+                k = np.ones(output_shape, dtype=np.int8)
+                i = np.full(output_shape, 126, dtype=np.int8)
+            if fn_name == 'linear':
+                return ((k, i, f),)
+            else:
+                k = np.ones(output_shape, dtype=np.int8)
+                i = np.full(output_shape, 126, dtype=np.int8)
+                return ((k, i, f),)
+
     if fn_name == 'linear':
         return (requested_kif(layer),)
     if fn_name == 'relu':
@@ -531,6 +555,16 @@ def _(layer: Concatenate):
 @_produce_kif.register
 def _(layer: Activation):
     fn_name = layer.attributes['activation'].lower()
+    if layer.attributes.get('trusted', False):
+        output_shape = get_output_shape(layer)
+        result_t = layer.get_output_variable().type.precision
+        k, w, f = result_t.signed, result_t.width, result_t.fractional
+        i = w - k - f
+        k = np.full(output_shape, k, dtype=np.int8)
+        i = np.full(output_shape, i, dtype=np.int8)
+        f = np.full(output_shape, f, dtype=np.int8)
+        return k, i, f
+
     k, i, f = get_input_kifs(layer)[0]
 
     match fn_name:
@@ -603,6 +637,10 @@ def requested_by_non_saturating_quantizer(layer: Layer) -> bool:
 
 
 def default_register_precision(layer: Layer):
+    if layer.attributes.get('trusted', False):
+        # Trusted layers have their precision already set
+        return
+
     _pk, _pi, _pf = produce_kif(layer)  # Maximum possible k,i,f output from this layer
     _rk, _ri, _rf = requested_kif(layer)  # Maximum possible k,i,f may be utilized by the next layer
     _oi, _of = np.minimum(_pi, _ri), np.minimum(_pf, _rf)
@@ -791,7 +829,11 @@ def has_fixed_quantizer(self, model: 'ModelGraph'):
         return True
 
     def _match(self, model: 'ModelGraph'):
-        return self.has_fixed_quantizer(model)
+        enabled = model.config.config['HLSConfig']['Model'].get('BitExact', None)
+        if enabled is None:
+            # Enable by default if any FixedPointQuantizer is present
+            enabled = self.has_fixed_quantizer(model)
+        return enabled
 
     def transform(self, model: 'ModelGraph'):
         if not self._match(model):
diff --git a/hls4ml/model/optimizer/passes/hgq_proxy_model.py b/hls4ml/model/optimizer/passes/hgq_proxy_model.py
index 60889bc536..86639eb833 100644
--- a/hls4ml/model/optimizer/passes/hgq_proxy_model.py
+++ b/hls4ml/model/optimizer/passes/hgq_proxy_model.py
@@ -6,7 +6,7 @@
 import numpy as np
 
 from hls4ml.model.attributes import Attribute, TypeAttribute, WeightAttribute
-from hls4ml.model.layers import Layer, Reshape, register_layer
+from hls4ml.model.layers import Activation, Layer, Reshape, register_layer
 from hls4ml.model.optimizer import OptimizerPass, register_pass
 from hls4ml.model.types import FixedPrecisionType, UnspecifiedPrecisionType
 
@@ -77,11 +77,13 @@ def userconf_ifdef(key: str, layer_name: str, model):
 
 class FuseFixedPointQuantizer(OptimizerPass):
     def match(self, node: Layer):
-        if not isinstance(node, FixedPointQuantizer):
-            return False
-        if any(np.unique(x).size > 1 for x in node.mask_kbi):
-            return False
-        return True
+        if isinstance(node, FixedPointQuantizer):
+            return all(np.unique(x).size == 1 for x in node.mask_kbi)
+
+        if isinstance(node, Activation):
+            return node.get_attr('activation') == 'linear' and node.get_attr('trusted', False)
+
+        return False
 
     def propagate(self, node: Layer, precision: FixedPrecisionType):
         from hls4ml.model.optimizer.passes.bit_exact import get_input_layers, get_output_layers
@@ -113,13 +115,16 @@ def propagate(self, node: Layer, precision: FixedPrecisionType):
     def transform(self, model: 'ModelGraph', node: FixedPointQuantizer):
         from hls4ml.model.optimizer.passes.bit_exact import get_input_layers, get_output_layers
 
-        # Rounding and saturation for FixedPointQuantizer are applied in generated code, thus not reflected in result_t.
-        if node.RND == 'TRN' and node.SAT == 'WRAP':
-            precision: FixedPrecisionType = copy(node.get_output_variable().type.precision)
+        if isinstance(node, FixedPointQuantizer):
+            # Rounding and saturation for FixedPointQuantizer are applied in generated code, thus not reflected in result_t.
+            if node.RND == 'TRN' and node.SAT == 'WRAP':
+                precision: FixedPrecisionType = copy(node.get_output_variable().type.precision)
+            else:
+                k, b, i = node.mask_kbi
+                k, b, i = bool(k.ravel()[0]), max(int(b.ravel()[0]), 1), int(i.ravel()[0])
+                precision = FixedPrecisionType(b, i, k, node.RND, node.SAT)
         else:
-            k, b, i = node.mask_kbi
-            k, b, i = bool(k.ravel()[0]), max(int(b.ravel()[0]), 1), int(i.ravel()[0])
-            precision = FixedPrecisionType(b, i, k, node.RND, node.SAT)
+            precision = copy(node.get_output_variable().type.precision)
 
         inp_layer = get_input_layers(node)[0]
         can_fuse = len(get_output_layers(inp_layer)) == 1

From d4afd3e6b82211746317ae699fc00a1c021c809f Mon Sep 17 00:00:00 2001
From: Chang Sun <chsun@cern.ch>
Date: Wed, 23 Jul 2025 02:46:53 -0700
Subject: [PATCH 2/5] add qkeras test, (maybe) support qonnx

---
 hls4ml/converters/__init__.py              | 10 +++++
 hls4ml/model/optimizer/passes/quant_opt.py |  2 +-
 test/pytest/test_qkeras.py                 | 44 ++++++++++++----------
 3 files changed, 36 insertions(+), 20 deletions(-)

diff --git a/hls4ml/converters/__init__.py b/hls4ml/converters/__init__.py
index 9e6ba15c2b..7954ae6965 100644
--- a/hls4ml/converters/__init__.py
+++ b/hls4ml/converters/__init__.py
@@ -195,6 +195,10 @@ def convert_from_keras_model(
             'io_parallel' or 'io_stream'. Defaults to 'io_parallel'.
         hls_config (dict, optional): The HLS config.
         kwargs** (dict, optional): Additional parameters that will be used to create the config of the specified backend
+        bit_exact (bool, optional): If True, enable model-wise precision propagation
+        with **only fixed-point data types**. If None, enable if there is at least one
+        FixedPointQuantizer layer in the model (only resulting from converting HGQ1/2
+        models for now). By default, None.
 
     Raises:
         Exception: If precision and reuse factor are not present in 'hls_config'.
@@ -308,6 +312,7 @@ def convert_from_onnx_model(
     output_data_tb=None,
     backend='Vivado',
     hls_config=None,
+    bit_exact=None,
     **kwargs,
 ):
     """Convert Keras model to hls4ml model based on the provided configuration.
@@ -337,6 +342,10 @@ def convert_from_onnx_model(
             'io_parallel' or 'io_stream'. Defaults to 'io_parallel'.
         hls_config (dict, optional): The HLS config.
         kwargs** (dict, optional): Additional parameters that will be used to create the config of the specified backend
+        bit_exact (bool, optional): If True, enable model-wise precision propagation
+        with **only fixed-point data types**. If None, enable if there is at least one
+        FixedPointQuantizer layer in the model (only resulting from converting HGQ1/2
+        models for now). By default, None.
 
     Raises:
         Exception: If precision and reuse factor are not present in 'hls_config'.
@@ -357,6 +366,7 @@ def convert_from_onnx_model(
 
     model_config = hls_config.get('Model', None)
     config['HLSConfig']['Model'] = _check_model_config(model_config)
+    config['HLSConfig']['Model']['BitExact'] = bit_exact
 
     _check_hls_config(config, hls_config)
 
diff --git a/hls4ml/model/optimizer/passes/quant_opt.py b/hls4ml/model/optimizer/passes/quant_opt.py
index 6c9badd832..d54e307302 100644
--- a/hls4ml/model/optimizer/passes/quant_opt.py
+++ b/hls4ml/model/optimizer/passes/quant_opt.py
@@ -130,7 +130,7 @@ def transform(self, model, node):
 
         precision, quantizer = _calculate_precision_quantizer(bitwidth, integer, signed, narrow, rounding_mode)
 
-        attributes = {'activation': 'linear', 'quantizer': quantizer}
+        attributes = {'activation': 'linear', 'quantizer': quantizer, 'trusted': True}
 
         # update the configuration
         config = model.config.get_layer_config(node)
diff --git a/test/pytest/test_qkeras.py b/test/pytest/test_qkeras.py
index 8cff159df9..5e852c2853 100644
--- a/test/pytest/test_qkeras.py
+++ b/test/pytest/test_qkeras.py
@@ -3,6 +3,9 @@
 
 import numpy as np
 import pytest
+from keras.layers import BatchNormalization, Input
+from keras.models import Model, Sequential, model_from_json
+from keras.utils import to_categorical
 from qkeras import QGRU, QLSTM, QSimpleRNN
 from qkeras.qconv2d_batchnorm import QConv2DBatchnorm
 from qkeras.qconvolutional import QDepthwiseConv2D, QSeparableConv1D, QSeparableConv2D
@@ -20,9 +23,6 @@
 from sklearn.datasets import fetch_openml
 from sklearn.model_selection import train_test_split
 from sklearn.preprocessing import LabelEncoder, StandardScaler
-from tensorflow.keras.layers import BatchNormalization, Input
-from tensorflow.keras.models import Model, Sequential, model_from_json
-from tensorflow.keras.utils import to_categorical
 
 import hls4ml
 
@@ -142,33 +142,39 @@ def test_single_dense_activation_exact(randX_100_16, bits, alpha, backend, io_ty
     bit exactness with number of bits parameter
     '''
     X = randX_100_16
-    model = Sequential()
-    model.add(
-        QDense(
-            16,
-            input_shape=(16,),
-            name='fc1',
-            kernel_quantizer=quantized_bits(bits, 0, alpha=alpha),
-            bias_quantizer=quantized_bits(bits, 0, alpha=1),
-            kernel_initializer='lecun_uniform',
-        )
+    model = Sequential(
+        [
+            QActivation(activation=quantized_bits(bits, 0, alpha=1), input_shape=(16,), name='inp_quant'),
+            QDense(
+                16,
+                name='fc1',
+                kernel_quantizer=quantized_bits(bits, 0, alpha=alpha),
+                bias_quantizer=quantized_bits(bits, 0, alpha=1),
+                kernel_initializer='lecun_uniform',
+                activation=quantized_relu(bits, 0),
+            ),
+        ]
     )
-    model.add(QActivation(activation=quantized_relu(bits, 0), name='relu1'))
     model.compile()
 
     config = hls4ml.utils.config_from_keras_model(model, granularity='name', backend=backend)
     output_dir = str(test_root_path / f'hls4mlprj_qkeras_single_dense_activation_exact_{bits}_{alpha}_{backend}_{io_type}')
+
+    bit_exact = alpha == 1
+    # alpha!=po2 case uses non-fixed-point data types, unsupported by the precision propagation flow
     hls_model = hls4ml.converters.convert_from_keras_model(
-        model, hls_config=config, output_dir=output_dir, backend=backend, io_type=io_type
+        model, hls_config=config, output_dir=output_dir, backend=backend, io_type=io_type, bit_exact=bit_exact
     )
     hls_model.compile()
 
     y_qkeras = model.predict(X)
     y_hls4ml = hls_model.predict(X)
-    # Goal is to get it passing with all equal
-    # np.testing.assert_array_equal(y_qkeras, y_hls4ml)
-    # For now allow matching within 1 bit
-    np.testing.assert_allclose(y_qkeras.ravel(), y_hls4ml.ravel(), atol=2**-bits, rtol=1.0)
+
+    # alpha!=1 case for weights can be supported if weight conversion is done before writing
+    if bit_exact:
+        np.testing.assert_array_equal(y_qkeras, y_hls4ml)
+    else:
+        np.testing.assert_allclose(y_qkeras.ravel(), y_hls4ml.ravel(), atol=2**-bits, rtol=1.0)
 
 
 @pytest.fixture

From a5383c0fb7f8c89078b03df5a9504f738ab7ce4e Mon Sep 17 00:00:00 2001
From: Chang Sun <chsun@cern.ch>
Date: Wed, 23 Jul 2025 06:55:28 -0700
Subject: [PATCH 3/5] revert onnx chnages

---
 hls4ml/converters/__init__.py              | 1 -
 hls4ml/model/optimizer/passes/quant_opt.py | 2 +-
 test/pytest/test_qkeras.py                 | 2 +-
 3 files changed, 2 insertions(+), 3 deletions(-)

diff --git a/hls4ml/converters/__init__.py b/hls4ml/converters/__init__.py
index 7954ae6965..0d7b6ef802 100644
--- a/hls4ml/converters/__init__.py
+++ b/hls4ml/converters/__init__.py
@@ -366,7 +366,6 @@ def convert_from_onnx_model(
 
     model_config = hls_config.get('Model', None)
     config['HLSConfig']['Model'] = _check_model_config(model_config)
-    config['HLSConfig']['Model']['BitExact'] = bit_exact
 
     _check_hls_config(config, hls_config)
 
diff --git a/hls4ml/model/optimizer/passes/quant_opt.py b/hls4ml/model/optimizer/passes/quant_opt.py
index d54e307302..6c9badd832 100644
--- a/hls4ml/model/optimizer/passes/quant_opt.py
+++ b/hls4ml/model/optimizer/passes/quant_opt.py
@@ -130,7 +130,7 @@ def transform(self, model, node):
 
         precision, quantizer = _calculate_precision_quantizer(bitwidth, integer, signed, narrow, rounding_mode)
 
-        attributes = {'activation': 'linear', 'quantizer': quantizer, 'trusted': True}
+        attributes = {'activation': 'linear', 'quantizer': quantizer}
 
         # update the configuration
         config = model.config.get_layer_config(node)
diff --git a/test/pytest/test_qkeras.py b/test/pytest/test_qkeras.py
index 5e852c2853..09f5c8760d 100644
--- a/test/pytest/test_qkeras.py
+++ b/test/pytest/test_qkeras.py
@@ -151,8 +151,8 @@ def test_single_dense_activation_exact(randX_100_16, bits, alpha, backend, io_ty
                 kernel_quantizer=quantized_bits(bits, 0, alpha=alpha),
                 bias_quantizer=quantized_bits(bits, 0, alpha=1),
                 kernel_initializer='lecun_uniform',
-                activation=quantized_relu(bits, 0),
             ),
+            QActivation(activation=quantized_relu(bits, 0), name='relu1'),
         ]
     )
     model.compile()

From 68de69001ccb853ad1d933bb52d6c9b0b8217d1f Mon Sep 17 00:00:00 2001
From: Chang Sun <chsun@cern.ch>
Date: Sun, 17 Aug 2025 22:58:57 -0700
Subject: [PATCH 4/5] allow transpose after inputs

---
 hls4ml/model/optimizer/passes/bit_exact.py | 18 ++++++++++++------
 1 file changed, 12 insertions(+), 6 deletions(-)

diff --git a/hls4ml/model/optimizer/passes/bit_exact.py b/hls4ml/model/optimizer/passes/bit_exact.py
index 56bda53ee6..319821a657 100644
--- a/hls4ml/model/optimizer/passes/bit_exact.py
+++ b/hls4ml/model/optimizer/passes/bit_exact.py
@@ -3,7 +3,7 @@
 
 import re
 import typing
-from collections.abc import Sequence
+from collections.abc import Generator, Sequence
 from copy import copy
 from functools import reduce, singledispatch
 from math import ceil, log2, prod
@@ -866,6 +866,16 @@ def transform(self, model: 'ModelGraph'):
         return True
 
 
+def get_output_quantizers(node: Layer) -> Generator[FixedPointQuantizer, None, None]:
+    for _node in get_output_layers(node):
+        if isinstance(_node, FixedPointQuantizer):
+            yield _node
+        elif isinstance(_node, (Reshape, Transpose)):
+            yield from get_output_quantizers(_node)
+        else:
+            raise ValueError(f'Layer {node.name} ({node.class_name}) unexpected input layer chain.')
+
+
 class FixInputPrecision(OptimizerPass):
     def match(self, node: Layer):
         if not isinstance(node, Input):
@@ -875,11 +885,7 @@ def match(self, node: Layer):
         return node.get_output_variable().type.precision.width > 100
 
     def transform(self, model, node: Layer):
-        out_layers: list[FixedPointQuantizer] = get_output_layers(node)  # type: ignore
-        for layer in out_layers:
-            assert isinstance(
-                layer, FixedPointQuantizer
-            ), f'Input {node.name} connected to non-quantizer {layer.name} with non-trivial configuration'
+        out_layers = list(get_output_quantizers(node))
 
         if len(out_layers) == 0:  # Input connected to nothing
             new_type = to_hls4ml_fixed(0, 0, 1, f'{node.name}_t')

From 5da636eb432c78a88d7105ee96f0c655de03a44e Mon Sep 17 00:00:00 2001
From: Chang Sun <chsun@cern.ch>
Date: Mon, 18 Aug 2025 10:41:00 -0700
Subject: [PATCH 5/5] support more general case

---
 hls4ml/converters/keras_v3/merge.py           |  3 +-
 hls4ml/model/optimizer/passes/bit_exact.py    | 62 ++++++++++++++-----
 .../model/optimizer/passes/hgq_proxy_model.py |  4 +-
 3 files changed, 49 insertions(+), 20 deletions(-)

diff --git a/hls4ml/converters/keras_v3/merge.py b/hls4ml/converters/keras_v3/merge.py
index 73cb5bd03d..52f7102dbe 100644
--- a/hls4ml/converters/keras_v3/merge.py
+++ b/hls4ml/converters/keras_v3/merge.py
@@ -39,7 +39,8 @@ def handle(
         match cls_name:
             case 'Concatenate':
                 rank = len(output_shape)
-                class_name = f'Concatenate{rank}d'
+                class_name = 'Concatenate'
+                op = f'Concatenate{rank}d'
                 config['axis'] = layer.axis
             case 'Dot':
                 msg = (
diff --git a/hls4ml/model/optimizer/passes/bit_exact.py b/hls4ml/model/optimizer/passes/bit_exact.py
index 319821a657..f4d24951ec 100644
--- a/hls4ml/model/optimizer/passes/bit_exact.py
+++ b/hls4ml/model/optimizer/passes/bit_exact.py
@@ -3,7 +3,7 @@
 
 import re
 import typing
-from collections.abc import Generator, Sequence
+from collections.abc import Sequence
 from copy import copy
 from functools import reduce, singledispatch
 from math import ceil, log2, prod
@@ -220,8 +220,16 @@ def _produce_kif(layer: Layer) -> KIF_t:
 
 @_produce_kif.register
 def _(layer: Input):
-    k = np.ones(get_output_shape(layer), dtype=np.int8)
-    i = f = np.full(get_output_shape(layer), 126, dtype=np.int8)
+    shape = get_output_shape(layer)
+    if layer.attributes.get('trusted', False):
+        precision: FixedPrecisionType = layer.get_output_variable().type.precision
+        k, i, f = precision.signed, precision.integer - precision.signed, precision.fractional
+        k = np.full(shape, k, dtype=np.int8)
+        i = np.full(shape, i, dtype=np.int8)
+        f = np.full(shape, f, dtype=np.int8)
+    else:
+        k = np.ones(shape, dtype=np.int8)
+        i = f = np.full(shape, 126, dtype=np.int8)
     return k, i, f
 
 
@@ -603,8 +611,8 @@ def kif_arrs_to_ints(arr: tuple[np.ndarray, np.ndarray, np.ndarray]):
     return tuple(int(np.max(a)) for a in arr)
 
 
-def produce_kif(layer: Layer) -> KIF_t:
-    if layer.attributes.get('_produce_kif'):
+def produce_kif(layer: Layer, force_reset=False) -> KIF_t:
+    if layer.attributes.get('_produce_kif') and not force_reset:
         return layer.attributes['_produce_kif']
     kif = _produce_kif(layer)
     layer.attributes['_produce_kif'] = kif
@@ -849,7 +857,9 @@ def transform(self, model: 'ModelGraph'):
         for node in model.graph.values():
             if node.attributes.get('bit_exact_transformed'):
                 continue
-            produce_kif(node)  # Shrink FixedPointQuantizer bits when possible to be used in backward flow (requested_kif).
+            produce_kif(
+                node, force_reset=True
+            )  # Shrink FixedPointQuantizer bits when possible to be used in backward flow (requested_kif).
 
         for node in model.graph.values():
             if node.attributes.get('bit_exact_transformed'):
@@ -858,22 +868,29 @@ def transform(self, model: 'ModelGraph'):
             node.attributes['bit_exact_transformed'] = True
 
         for node in model.graph.values():
-            if node.attributes.get('_produce_kif'):
+            if '_produce_kif' in node.attributes:
                 del node.attributes['_produce_kif']
-            if node.attributes.get('_request_kif'):
+            if '_request_kif' in node.attributes:
                 del node.attributes['_request_kif']
 
         return True
 
 
-def get_output_quantizers(node: Layer) -> Generator[FixedPointQuantizer, None, None]:
+def get_output_layers_and_quantizers(
+    node: Layer, layers: list | None = None, quantizers: list | None = None
+) -> tuple[list[Layer], list[FixedPointQuantizer]]:
+
+    layers = layers if layers is not None else []
+    quantizers = quantizers if quantizers is not None else []
     for _node in get_output_layers(node):
         if isinstance(_node, FixedPointQuantizer):
-            yield _node
-        elif isinstance(_node, (Reshape, Transpose)):
-            yield from get_output_quantizers(_node)
+            quantizers.append(_node)
+        elif isinstance(_node, (Reshape, Transpose, Concatenate)):
+            layers.append(_node)
+            get_output_layers_and_quantizers(_node, layers, quantizers)
         else:
             raise ValueError(f'Layer {node.name} ({node.class_name}) unexpected input layer chain.')
+    return layers, quantizers
 
 
 class FixInputPrecision(OptimizerPass):
@@ -885,17 +902,17 @@ def match(self, node: Layer):
         return node.get_output_variable().type.precision.width > 100
 
     def transform(self, model, node: Layer):
-        out_layers = list(get_output_quantizers(node))
+        layers, out_quantizers = get_output_layers_and_quantizers(node)
 
-        if len(out_layers) == 0:  # Input connected to nothing
+        if len(out_quantizers) == 0:  # Input connected to nothing
             new_type = to_hls4ml_fixed(0, 0, 1, f'{node.name}_t')
             node.get_output_variable().type = new_type
             node.model.config.layer_name_precision[node.name] = str(new_type)
             return False
 
-        sat_modes = [l.SAT for l in out_layers]
+        sat_modes = [l.SAT for l in out_quantizers]
         sat_modes_set = set(sat_modes)
-        rnd_modes = [l.RND for l in out_layers]
+        rnd_modes = [l.RND for l in out_quantizers]
         rnd_modes_set = set(rnd_modes)
         illegal_sat_modes = sat_modes_set - {'WRAP', 'SAT', 'SAT_SYM'}
         illegal_rnd_modes = rnd_modes_set - {'TRN', 'RND'}
@@ -906,7 +923,7 @@ def transform(self, model, node: Layer):
         if illegal_rnd_modes:
             warn(f'Saturation mode {illegal_rnd_modes} may compromise bit-exactness. Forcing at maximum 24 fractional bits.')
 
-        kifs = [_produce_kif(l) for l in out_layers]
+        kifs = [_produce_kif(l) for l in out_quantizers]
         i = np.max([np.max(i) for _, i, _ in kifs])
         k = np.max([np.max(k) for k, _, _ in kifs])
         if illegal_rnd_modes:
@@ -921,4 +938,15 @@ def transform(self, model, node: Layer):
             new_type.precision.saturation_mode = 'SAT'
         node.get_output_variable().type = new_type
         node.model.config.layer_name_precision[node.name] = str(new_type)
+        node.attributes['trusted'] = True
+
+        for layer in layers:
+            produce_kif(layer, force_reset=True)
+        for layer in layers:
+            register_precision(layer)
+        for layer in layers:
+            if '_produce_kif' in layer.attributes:
+                del layer.attributes['_produce_kif']
+            if '_request_kif' in layer.attributes:
+                del layer.attributes['_request_kif']
         return False
diff --git a/hls4ml/model/optimizer/passes/hgq_proxy_model.py b/hls4ml/model/optimizer/passes/hgq_proxy_model.py
index 86639eb833..83ba277385 100644
--- a/hls4ml/model/optimizer/passes/hgq_proxy_model.py
+++ b/hls4ml/model/optimizer/passes/hgq_proxy_model.py
@@ -6,7 +6,7 @@
 import numpy as np
 
 from hls4ml.model.attributes import Attribute, TypeAttribute, WeightAttribute
-from hls4ml.model.layers import Activation, Layer, Reshape, register_layer
+from hls4ml.model.layers import Activation, Layer, Reshape, Transpose, register_layer
 from hls4ml.model.optimizer import OptimizerPass, register_pass
 from hls4ml.model.types import FixedPrecisionType, UnspecifiedPrecisionType
 
@@ -97,7 +97,7 @@ def propagate(self, node: Layer, precision: FixedPrecisionType):
         node.attributes['result_t'].precision = precision
         node.attributes['_result_t_propagated'] = True
 
-        if not isinstance(node, Reshape):
+        if not isinstance(node, (Reshape, Transpose)):
             return node
 
         inp_layer = get_input_layers(node)[0]