PaddlePaddle
/

PaddleOCR-VL

Image-Text-to-Text

Model card Files Files and versions

fix: allow pass image kwargs to image processor

#90

by bigmoyan - opened Mar 13

base: refs/heads/main

←

from: refs/pr/90

Discussion Files changed

Files changed (1) hide show

processing_paddleocr_vl.py +1 -1

processing_paddleocr_vl.py CHANGED Viewed

@@ -158,7 +158,7 @@ class PaddleOCRVLProcessor(ProcessorMixin):
         )
         if images is not None:
-            image_inputs = self.image_processor(images=images, return_tensors="pt")
             image_inputs["pixel_values"] = image_inputs["pixel_values"]
             image_grid_thw = image_inputs["image_grid_thw"]

         )
         if images is not None:
+            image_inputs = self.image_processor(images=images, **output_kwargs["images_kwargs"])
             image_inputs["pixel_values"] = image_inputs["pixel_values"]
             image_grid_thw = image_inputs["image_grid_thw"]