Spaces:
Running
on
Zero
Running
on
Zero
update
Browse files- demo/binary_classifier_demo.py +10 -12
demo/binary_classifier_demo.py
CHANGED
@@ -9,9 +9,9 @@ import gc
|
|
9 |
from model_utils import load_model, load_ternary_model, classify_text
|
10 |
from binoculars_utils import compute_scores, cleanup_model, cleanup_models
|
11 |
|
12 |
-
MINIMUM_TOKENS =
|
13 |
|
14 |
-
SAMPLE_TEXT = """
|
15 |
|
16 |
css = """
|
17 |
.human-text {
|
@@ -325,12 +325,12 @@ def reset_outputs():
|
|
325 |
with gr.Blocks(css=css, theme=gr.themes.Base()) as binary_app:
|
326 |
with gr.Row():
|
327 |
with gr.Column(scale=3):
|
328 |
-
gr.HTML("<h1
|
329 |
|
330 |
with gr.Row():
|
331 |
with gr.Column():
|
332 |
input_text = gr.Textbox(value=SAMPLE_TEXT, placeholder="Введите текст для анализа",
|
333 |
-
lines=10, label="Текст для анализа")
|
334 |
|
335 |
with gr.Row():
|
336 |
model_mode = gr.Radio(
|
@@ -353,9 +353,8 @@ with gr.Blocks(css=css, theme=gr.themes.Base()) as binary_app:
|
|
353 |
with gr.Column():
|
354 |
analysis_output = gr.Markdown(label="Анализ")
|
355 |
|
356 |
-
with gr.Accordion("О
|
357 |
gr.Markdown("""
|
358 |
-
### О классификаторе AI-текста
|
359 |
|
360 |
Эта демонстрация использует нейронные сети для классификации текста в двух режимах:
|
361 |
|
@@ -368,14 +367,13 @@ with gr.Blocks(css=css, theme=gr.themes.Base()) as binary_app:
|
|
368 |
- Raw AI (Чистый ИИ) - текст сгенерирован искусственным интеллектом без редактирования
|
369 |
- Rephrased AI (Перефразированный ИИ) - текст сгенерирован ИИ и затем отредактирован
|
370 |
|
371 |
-
####
|
372 |
-
-
|
373 |
-
-
|
374 |
-
- Вычисляются показатели лексического разнообразия и читабельности
|
375 |
|
376 |
#### Рекомендации:
|
377 |
-
- Для более точной классификации рекомендуется использовать тексты
|
378 |
-
- Модели обучены
|
379 |
""")
|
380 |
|
381 |
# Set up event handlers
|
|
|
9 |
from model_utils import load_model, load_ternary_model, classify_text
|
10 |
from binoculars_utils import compute_scores, cleanup_model, cleanup_models
|
11 |
|
12 |
+
MINIMUM_TOKENS = 1000
|
13 |
|
14 |
+
SAMPLE_TEXT = """Привет!\tЯ хотел бы поделиться с вами своим опытом путешествия по Санкт-Петербургу — одному из самых красивых и удивительных городов России.\tЭто было по-настоящему незабываемое приключение, которое оставило множество ярких впечатлений.\tСанкт-Петербург сразу поразил меня своей атмосферой.\tГород буквально дышит историей: старинные здания, величественные соборы, широкие проспекты и, конечно же, каналы — всё это создает уникальный облик.\tПрогуливаясь по улицам, я чувствовал себя так, будто перенёсся в другое время, в эпоху империи, великих художников, писателей и архитекторов.\tОсобенно яркое впечатление на меня произвёл Эрмитаж.\tЭто не просто музей — это настоящий дворец искусства.\tОгромное здание Зимнего дворца снаружи выглядит торжественно и величественно, а внутри скрывает одну из крупнейших коллекций произведений искусства в мире.\tЯ провёл там несколько часов, но мне показалось, что этого времени всё равно недостаточно, чтобы увидеть и осмыслить всё, что там представлено.\tКартины, скульптуры, антикварная мебель, уникальные экспозиции — всё это завораживало и вдохновляло.\tНе менее захватывающим оказалось путешествие по каналам города.\tСанкт-Петербург не зря называют «Северной Венецией»: реки и каналы буквально пронизывают его карту, а прогулка на теплоходе позволила взглянуть на город с нового, водного ракурса.\tЯ любовался старинными мостами — каждый со своей историей и архитектурным стилем — и фасадами домов, отражающимися в воде.\tЭто было невероятно романтично и красиво, особенно когда солнце начинало садиться, заливая город золотистым светом.\tВ целом, поездка в Петербург стала для меня настоящим открытием.\tЭтот город невозможно охватить за одно путешествие — он требует времени, внимания и желания узнавать всё больше.\tЯ бы с радостью вернулся туда снова, чтобы ещё глубже погрузиться в его атмосферу, посетить новые музеи, открыть для себя скрытые уголки и просто снова почувствовать эту магию, которую излучает Петербург."""
|
15 |
|
16 |
css = """
|
17 |
.human-text {
|
|
|
325 |
with gr.Blocks(css=css, theme=gr.themes.Base()) as binary_app:
|
326 |
with gr.Row():
|
327 |
with gr.Column(scale=3):
|
328 |
+
gr.HTML("<h1>Детектор AI-текста на русском языке</h1>")
|
329 |
|
330 |
with gr.Row():
|
331 |
with gr.Column():
|
332 |
input_text = gr.Textbox(value=SAMPLE_TEXT, placeholder="Введите текст для анализа",
|
333 |
+
lines=10, label="Текст для анализа от 1000 токенов")
|
334 |
|
335 |
with gr.Row():
|
336 |
model_mode = gr.Radio(
|
|
|
353 |
with gr.Column():
|
354 |
analysis_output = gr.Markdown(label="Анализ")
|
355 |
|
356 |
+
with gr.Accordion("О методе", open=False):
|
357 |
gr.Markdown("""
|
|
|
358 |
|
359 |
Эта демонстрация использует нейронные сети для классификации текста в двух режимах:
|
360 |
|
|
|
367 |
- Raw AI (Чистый ИИ) - текст сгенерирован искусственным интеллектом без редактирования
|
368 |
- Rephrased AI (Перефразированный ИИ) - текст сгенерирован ИИ и затем отредактирован
|
369 |
|
370 |
+
#### Демонстрация основана на комплексном анализе текста, который включает::
|
371 |
+
- Вычисление показателей перплексии и кросс-перплексии с использованием подхода Binoculars
|
372 |
+
- Анализ морфологических, синтаксических, семантических и других особенностей текста
|
|
|
373 |
|
374 |
#### Рекомендации:
|
375 |
+
- Для более точной классификации рекомендуется использовать длинные тексты
|
376 |
+
- Модели подготовлены и обучены для русскоязычных текстов
|
377 |
""")
|
378 |
|
379 |
# Set up event handlers
|