Spaces:

pmelnechuk
/

MathQA

Running

pmelnechuk commited on Feb 20

Commit

3f9f23a

verified ·

1 Parent(s): 3749dd3

prueba enable cpu offload

Files changed (1) hide show

src/model_load.py CHANGED Viewed

@@ -18,7 +18,8 @@ def load_model():
                                                      "transformer.h.0": "cpu",  # Por ejemplo, mover ciertas capas al CPU
                                                      "transformer.h.1": "cuda",  # Mantener otras capas en la GPU
                                                  },
-                                                 quantization_config=BitsAndBytesConfig(load_in_8bit=True))
     # Crear pipeline de generación de texto
     text_generation_pipeline = pipeline(

                                                      "transformer.h.0": "cpu",  # Por ejemplo, mover ciertas capas al CPU
                                                      "transformer.h.1": "cuda",  # Mantener otras capas en la GPU
                                                  },
+                                                 quantization_config=BitsAndBytesConfig(load_in_8bit=True),
+                                                 llm_int8_enable_fp32_cpu_offload=True)
     # Crear pipeline de generación de texto
     text_generation_pipeline = pipeline(