Spaces:

JuanJoseMV
/

neuraltextgen_BERT

Paused

JuanJoseMV commited on Mar 20, 2023

Commit

16814ca

1 Parent(s): 769b214

changing model

Files changed (2) hide show

NeuralTextGenerator.py CHANGED Viewed

@@ -47,7 +47,7 @@ class BertTextGenerator:
             self.model, optimizer = amp.initialize(self.model, optimizer, opt_level="O2", keep_batchnorm_fp32=True,
                                                    loss_scale="dynamic")
-        self.tokenizer = AutoTokenizer.from_pretrained('bert-base-uncased', do_lower_case="uncased" in model_version,
                                                        use_fast=use_fast,
                                                        do_basic_tokenize=do_basic_tokenize)  # added to avoid splitting of unused tokens
         self.num_attention_masks = len(self.model.base_model.base_model.encoder.layer)

             self.model, optimizer = amp.initialize(self.model, optimizer, opt_level="O2", keep_batchnorm_fp32=True,
                                                    loss_scale="dynamic")
+        self.tokenizer = AutoTokenizer.from_pretrained(model_version, do_lower_case="uncased" in model_version,
                                                        use_fast=use_fast,
                                                        do_basic_tokenize=do_basic_tokenize)  # added to avoid splitting of unused tokens
         self.num_attention_masks = len(self.model.base_model.base_model.encoder.layer)

app.py CHANGED Viewed

@@ -15,7 +15,7 @@ from NeuralTextGenerator import BertTextGenerator
 # generator = pipeline("sentiment-analysis")
 # print('dfg')
-model_name = "JuanJoseMV/BERT_text_gen" #"dbmdz/bert-base-italian-uncased"
 en_model = BertTextGenerator(model_name)
 tokenizer = en_model.tokenizer
 model = en_model.model

 # generator = pipeline("sentiment-analysis")
 # print('dfg')
+model_name = "cardiffnlp/twitter-xlm-roberta-base" #"dbmdz/bert-base-italian-uncased"
 en_model = BertTextGenerator(model_name)
 tokenizer = en_model.tokenizer
 model = en_model.model