fix the layer name (#2247)

kanpuriyanawab · web-flow · commit 38ca305338ec · 2025-05-06T09:12:26.000-07:00
diff --git a/keras_hub/src/utils/transformers/convert_mixtral.py b/keras_hub/src/utils/transformers/convert_mixtral.py
@@ -50,19 +50,19 @@ def transpose_and_reshape(x, shape):
         # Attention layers
         ## Query
         loader.port_weight(
-            keras_variable=decoder_layer._self_attention_layer._query_dense.kernel,
+            keras_variable=decoder_layer._self_attention_layer.query_dense.kernel,
             hf_weight_key=f"model.layers.{i}.self_attn.q_proj.weight",
             hook_fn=transpose_and_reshape,
         )
         ## Key
         loader.port_weight(
-            keras_variable=decoder_layer._self_attention_layer._key_dense.kernel,
+            keras_variable=decoder_layer._self_attention_layer.key_dense.kernel,
             hf_weight_key=f"model.layers.{i}.self_attn.k_proj.weight",
             hook_fn=transpose_and_reshape,
         )
         ## Value
         loader.port_weight(
-            keras_variable=decoder_layer._self_attention_layer._value_dense.kernel,
+            keras_variable=decoder_layer._self_attention_layer.value_dense.kernel,
             hf_weight_key=f"model.layers.{i}.self_attn.v_proj.weight",
             hook_fn=transpose_and_reshape,
         )
diff --git a/keras_hub/src/utils/transformers/convert_qwen_moe.py b/keras_hub/src/utils/transformers/convert_qwen_moe.py
@@ -64,34 +64,34 @@ def transpose_and_reshape(x, shape):
 
         ## Query
         loader.port_weight(
-            keras_variable=decoder_layer._self_attention_layer._query_dense.kernel,
+            keras_variable=decoder_layer._self_attention_layer.query_dense.kernel,
             hf_weight_key=f"model.layers.{i}.self_attn.q_proj.weight",
             hook_fn=transpose_and_reshape,
         )
         loader.port_weight(
-            keras_variable=decoder_layer._self_attention_layer._query_dense.bias,
+            keras_variable=decoder_layer._self_attention_layer.query_dense.bias,
             hf_weight_key=f"model.layers.{i}.self_attn.q_proj.bias",
             hook_fn=transpose_and_reshape,
         )
         ## Key
         loader.port_weight(
-            keras_variable=decoder_layer._self_attention_layer._key_dense.kernel,
+            keras_variable=decoder_layer._self_attention_layer.key_dense.kernel,
             hf_weight_key=f"model.layers.{i}.self_attn.k_proj.weight",
             hook_fn=transpose_and_reshape,
         )
         loader.port_weight(
-            keras_variable=decoder_layer._self_attention_layer._key_dense.bias,
+            keras_variable=decoder_layer._self_attention_layer.key_dense.bias,
             hf_weight_key=f"model.layers.{i}.self_attn.k_proj.bias",
             hook_fn=transpose_and_reshape,
         )
         ## Value
         loader.port_weight(
-            keras_variable=decoder_layer._self_attention_layer._value_dense.kernel,
+            keras_variable=decoder_layer._self_attention_layer.value_dense.kernel,
             hf_weight_key=f"model.layers.{i}.self_attn.v_proj.weight",
             hook_fn=transpose_and_reshape,
         )
         loader.port_weight(
-            keras_variable=decoder_layer._self_attention_layer._value_dense.bias,
+            keras_variable=decoder_layer._self_attention_layer.value_dense.bias,
             hf_weight_key=f"model.layers.{i}.self_attn.v_proj.bias",
             hook_fn=transpose_and_reshape,
         )