Removed CB regard kw args for functionin non CB models

quic-rishinr · quic-rishinr · commit 3bdeb0f9951e · 2025-10-31T18:24:31.000Z
Signed-off-by: Rishin Raj &lt;rishinr@qti.qualcomm.com&gt;
diff --git a/QEfficient/transformers/models/modeling_auto.py b/QEfficient/transformers/models/modeling_auto.py
@@ -858,7 +858,7 @@ class _QEffAutoModelForImageTextToTextDualQPC:
     def __init__(
         self,
         model: nn.Module,
-        continuous_batching,
+        continuous_batching: bool = False,
         **kwargs,
     ):
         """
@@ -982,8 +982,15 @@ def export(
         List[str]
             A list containing the paths to the generated ONNX graph files for both components.
         """
-        inputs = self.model.get_dummy_inputs(kv_offload=True, continuous_batching=self.continuous_batching)
-        dynamic_axes = self.model.get_onnx_dynamic_axes(kv_offload=True, continuous_batching=self.continuous_batching)
+        # TODO This is a temporary change as continous batching is enabled only for few models. Once support is added for all the models this exception handing can be removed.
+        try:
+            inputs = self.model.get_dummy_inputs(kv_offload=True, continuous_batching=self.continuous_batching)
+            dynamic_axes = self.model.get_onnx_dynamic_axes(
+                kv_offload=True, continuous_batching=self.continuous_batching
+            )
+        except TypeError:
+            inputs = self.model.get_dummy_inputs(kv_offload=True)
+            dynamic_axes = self.model.get_onnx_dynamic_axes(kv_offload=True)
         output_names = self.model.get_output_names(kv_offload=True)
 
         self.vision_model.export(
@@ -1124,6 +1131,11 @@ def compile(
         ):
             self.export()
 
+        # TODO this hould be removed once the continous batching is supported for all the models.
+        compiler_options.pop("continuous_batching", None)
+        compiler_options.pop("kv_cache_batch_size", None)
+        compiler_options.pop("full_batch_size", None)
+
         if not skip_vision:
             self.vision_model._compile(
                 compile_dir=compile_dir,