aiplanet
/

panda-coder-13B

Text Generation

text-generation-inference

Model card Files Files and versions Community

lucifertrj commited on Mar 30, 2024

Commit

588bfaf

·

verified ·

1 Parent(s): a3ba5f8

Update README.md

Files changed (1) hide show

README.md +15 -0

README.md CHANGED Viewed

@@ -26,6 +26,21 @@ import torch
 import transformers
 from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments,BitsAndBytesConfig
 prompt = f"""### Instruction:
 Below is an instruction that describes a task. Write a response that appropriately completes the request.

 import transformers
 from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments,BitsAndBytesConfig
+bnb_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_use_double_quant=True,
+    bnb_4bit_quant_type="nf4",
+    bnb_4bit_compute_dtype=torch.bfloat16
+)
+model = "aiplanet/panda-coder-13B"
+base_model = AutoModelForCausalLM.from_pretrained(model, quantization_config=bnb_config, device_map="cuda")
+tokenizer = AutoTokenizer.from_pretrained(model, trust_remote_code=True)
+tokenizer.pad_token = tokenizer.eos_token
+tokenizer.padding_side = "right"
 prompt = f"""### Instruction:
 Below is an instruction that describes a task. Write a response that appropriately completes the request.