Spaces:

nvidia
/

P2A-test-NV

Running on L40S

App Files Files Community

KuangDW commited on 3 days ago

Commit

1d63826

1 Parent(s): a6d920a

add chunk size function

Browse files

Files changed (1) hide show

app.py +48 -50

app.py CHANGED Viewed

@@ -289,62 +289,60 @@ def process_text(text, src_language, target_language, max_iterations_value, thre
     source_segments = segment_sentences_by_punctuation(source_sentence, src_nlp)
     if chunk_size == -1:
-        chunks = [' '.join(source_segments)]
-    else:
-        chunks = [' '.join(source_segments[i:i+chunk_size]) for i in range(0, len(source_segments), chunk_size)]
-    org_translated_chunks = []
-    p2a_translated_chunks = []
-    bfn_translated_chunks = []
-    mpc_translated_chunks = []
-    for chunk in chunks:
         if "Original" in translation_methods:
-            translation, _ = original_translation(chunk, src_language, target_language, session_id)
-            org_translated_chunks.append(translation)
         if "Plan2Align" in translation_methods:
-            translation, _ = plan2align_translate_text(
-                chunk, session_id, model, tokenizer, device, src_language, target_language,
                 max_iterations_value, threshold_value, good_ref_contexts_num_value, "metricx"
             )
-            p2a_translated_chunks.append(translation)
         if "Best-of-N" in translation_methods:
-            translation, _ = best_of_n_translation(chunk, src_language, target_language, max_iterations_value, session_id)
-            bfn_translated_chunks.append(translation)
         if "MPC" in translation_methods:
-            translation, _ = mpc_translation(chunk, src_language, target_language, max_iterations_value, session_id)
-            mpc_translated_chunks.append(translation)
-    org_combined_translation = ' '.join(org_translated_chunks)
-    p2a_combined_translation = ' '.join(p2a_translated_chunks)
-    bfn_combined_translation = ' '.join(bfn_translated_chunks)
-    mpc_combined_translation = ' '.join(mpc_translated_chunks)
-    orig, best_score = summary_translate(text, org_combined_translation, target_language, session_id)
-    orig_output = f"{orig}\n\nScore: {best_score:.2f}"
-    plan2align_trans, best_score = summary_translate(text, p2a_combined_translation, target_language, session_id)
-    plan2align_output = f"{plan2align_trans}\n\nScore: {best_score:.2f}"
-    best_candidate, best_score = summary_translate(text, bfn_combined_translation, target_language, session_id)
-    best_of_n_output = f"{best_candidate}\n\nScore: {best_score:.2f}"
-    mpc_candidate, best_score = summary_translate(text, mpc_combined_translation, target_language, session_id)
-    mpc_output = f"{mpc_candidate}\n\nScore: {mpc_score:.2f}"
-    # if "Original" in translation_methods:
-    #     orig, best_score = original_translation(text, src_language, target_language, session_id)
-    #     orig_output = f"{orig}\n\nScore: {best_score:.2f}"
-    # if "Plan2Align" in translation_methods:
-    #     plan2align_trans, best_score = plan2align_translate_text(
-    #         text, session_id, model, tokenizer, device, src_language, target_language,
-    #         max_iterations_value, threshold_value, good_ref_contexts_num_value, "metricx"
-    #     )
-    #     plan2align_output = f"{plan2align_trans}\n\nScore: {best_score:.2f}"
-    # if "Best-of-N" in translation_methods:
-    #     best_candidate, best_score = best_of_n_translation(text, src_language, target_language, max_iterations_value, session_id)
-    #     best_of_n_output = f"{best_candidate}\n\nScore: {best_score:.2f}"
-    # if "MPC" in translation_methods:
-    #     mpc_candidate, mpc_score = mpc_translation(text, src_language, target_language,
-    #                                                max_iterations_value, session_id)
-    #     mpc_output = f"{mpc_candidate}\n\nScore: {mpc_score:.2f}"
     return orig_output, plan2align_output, best_of_n_output, mpc_output

     source_segments = segment_sentences_by_punctuation(source_sentence, src_nlp)
     if chunk_size == -1:
         if "Original" in translation_methods:
+            orig, best_score = original_translation(text, src_language, target_language, session_id)
+            orig_output = f"{orig}\n\nScore: {best_score:.2f}"
         if "Plan2Align" in translation_methods:
+            plan2align_trans, best_score = plan2align_translate_text(
+                text, session_id, model, tokenizer, device, src_language, target_language,
                 max_iterations_value, threshold_value, good_ref_contexts_num_value, "metricx"
             )
+            plan2align_output = f"{plan2align_trans}\n\nScore: {best_score:.2f}"
         if "Best-of-N" in translation_methods:
+            best_candidate, best_score = best_of_n_translation(text, src_language, target_language, max_iterations_value, session_id)
+            best_of_n_output = f"{best_candidate}\n\nScore: {best_score:.2f}"
         if "MPC" in translation_methods:
+            mpc_candidate, mpc_score = mpc_translation(text, src_language, target_language,
+                                                       max_iterations_value, session_id)
+            mpc_output = f"{mpc_candidate}\n\nScore: {mpc_score:.2f}"
+    else:
+        chunks = [' '.join(source_segments[i:i+chunk_size]) for i in range(0, len(source_segments), chunk_size)]
+        org_translated_chunks = []
+        p2a_translated_chunks = []
+        bfn_translated_chunks = []
+        mpc_translated_chunks = []
+        for chunk in chunks:
+            if "Original" in translation_methods:
+                translation, _ = original_translation(chunk, src_language, target_language, session_id)
+                org_translated_chunks.append(translation)
+            if "Plan2Align" in translation_methods:
+                translation, _ = plan2align_translate_text(
+                    chunk, session_id, model, tokenizer, device, src_language, target_language,
+                    max_iterations_value, threshold_value, good_ref_contexts_num_value, "metricx"
+                )
+                p2a_translated_chunks.append(translation)
+            if "Best-of-N" in translation_methods:
+                translation, _ = best_of_n_translation(chunk, src_language, target_language, max_iterations_value, session_id)
+                bfn_translated_chunks.append(translation)
+            if "MPC" in translation_methods:
+                translation, _ = mpc_translation(chunk, src_language, target_language, max_iterations_value, session_id)
+                mpc_translated_chunks.append(translation)
+        org_combined_translation = ' '.join(org_translated_chunks)
+        p2a_combined_translation = ' '.join(p2a_translated_chunks)
+        bfn_combined_translation = ' '.join(bfn_translated_chunks)
+        mpc_combined_translation = ' '.join(mpc_translated_chunks)
+        orig, best_score = summary_translate(text, org_combined_translation, target_language, session_id)
+        orig_output = f"{orig}\n\nScore: {best_score:.2f}"
+        plan2align_trans, best_score = summary_translate(text, p2a_combined_translation, target_language, session_id)
+        plan2align_output = f"{plan2align_trans}\n\nScore: {best_score:.2f}"
+        best_candidate, best_score = summary_translate(text, bfn_combined_translation, target_language, session_id)
+        best_of_n_output = f"{best_candidate}\n\nScore: {best_score:.2f}"
+        mpc_candidate, best_score = summary_translate(text, mpc_combined_translation, target_language, session_id)
+        mpc_output = f"{mpc_candidate}\n\nScore: {best_score:.2f}"
     return orig_output, plan2align_output, best_of_n_output, mpc_output