Spaces:

Ansemin101
/

Markit_v2

Runtime error

AnseMin commited on Mar 18

Commit

84a7af0

1 Parent(s): 6372663

Error: Error processing document with GOT-OCR: Current CUDA Device does not support bfloat16. Please switch dtype to float16.

Files changed (1) hide show

src/parsers/got_ocr_parser.py CHANGED Viewed

@@ -107,13 +107,19 @@ class GotOcrParser(DocumentParser):
                     logger.warning("No GPU available, falling back to CPU (not recommended)")
                     device_map = 'auto'
                 cls._model = AutoModel.from_pretrained(
                     'stepfun-ai/GOT-OCR2_0',
                     trust_remote_code=True,
                     low_cpu_mem_usage=True,
                     device_map=device_map,
                     use_safetensors=True,
-                    pad_token_id=cls._tokenizer.eos_token_id
                 )
                 # Set model to evaluation mode
@@ -121,6 +127,10 @@ class GotOcrParser(DocumentParser):
                     cls._model = cls._model.eval().cuda()
                 else:
                     cls._model = cls._model.eval()
                 logger.info("GOT-OCR model loaded successfully")
             except Exception as e:

                     logger.warning("No GPU available, falling back to CPU (not recommended)")
                     device_map = 'auto'
+                # Set torch default dtype to float16 since the CUDA device doesn't support bfloat16
+                logger.info("Setting default tensor type to float16")
+                torch.set_default_tensor_type(torch.FloatTensor)
+                torch.set_default_dtype(torch.float16)
                 cls._model = AutoModel.from_pretrained(
                     'stepfun-ai/GOT-OCR2_0',
                     trust_remote_code=True,
                     low_cpu_mem_usage=True,
                     device_map=device_map,
                     use_safetensors=True,
+                    pad_token_id=cls._tokenizer.eos_token_id,
+                    torch_dtype=torch.float16  # Explicitly specify float16 dtype
                 )
                 # Set model to evaluation mode
                     cls._model = cls._model.eval().cuda()
                 else:
                     cls._model = cls._model.eval()
+                # Reset default dtype to float32 after model loading
+                torch.set_default_dtype(torch.float32)
+                torch.set_default_tensor_type(torch.FloatTensor)
                 logger.info("GOT-OCR model loaded successfully")
             except Exception as e: