CoffeBank commited on
Commit
a52adbc
·
1 Parent(s): 406d15e
Files changed (1) hide show
  1. demo/binary_classifier_demo.py +10 -12
demo/binary_classifier_demo.py CHANGED
@@ -9,9 +9,9 @@ import gc
9
  from model_utils import load_model, load_ternary_model, classify_text
10
  from binoculars_utils import compute_scores, cleanup_model, cleanup_models
11
 
12
- MINIMUM_TOKENS = 200
13
 
14
- SAMPLE_TEXT = """Привет! Я хотел бы рассказать вам о своём опыте путешествия по Петербургу. Невероятный город с богатой историей и красивой архитектурой. Особенно запомнился Эрмитаж с его огромной коллекцией произведений искусства. Также понравилась прогулка по каналам города, где можно увидеть множество старинных мостов и зданий."""
15
 
16
  css = """
17
  .human-text {
@@ -325,12 +325,12 @@ def reset_outputs():
325
  with gr.Blocks(css=css, theme=gr.themes.Base()) as binary_app:
326
  with gr.Row():
327
  with gr.Column(scale=3):
328
- gr.HTML("<h1>Классификатор AI-текста</h1>")
329
 
330
  with gr.Row():
331
  with gr.Column():
332
  input_text = gr.Textbox(value=SAMPLE_TEXT, placeholder="Введите текст для анализа",
333
- lines=10, label="Текст для анализа")
334
 
335
  with gr.Row():
336
  model_mode = gr.Radio(
@@ -353,9 +353,8 @@ with gr.Blocks(css=css, theme=gr.themes.Base()) as binary_app:
353
  with gr.Column():
354
  analysis_output = gr.Markdown(label="Анализ")
355
 
356
- with gr.Accordion("О модели", open=False):
357
  gr.Markdown("""
358
- ### О классификаторе AI-текста
359
 
360
  Эта демонстрация использует нейронные сети для классификации текста в двух режимах:
361
 
@@ -368,14 +367,13 @@ with gr.Blocks(css=css, theme=gr.themes.Base()) as binary_app:
368
  - Raw AI (Чистый ИИ) - текст сгенерирован искусственным интеллектом без редактирования
369
  - Rephrased AI (Перефразированный ИИ) - текст сгенерирован ИИ и затем отредактирован
370
 
371
- #### Особенности:
372
- - Используется анализ текста и оценки качества текста с помощью Binoculars
373
- - Анализируются морфологические, синтаксические и семантические особенности текста
374
- - Вычисляются показатели лексического разнообразия и читабельности
375
 
376
  #### Рекомендации:
377
- - Для более точной классификации рекомендуется использовать тексты длиннее 200 слов
378
- - Модели обучены на русскоязычных текстах
379
  """)
380
 
381
  # Set up event handlers
 
9
  from model_utils import load_model, load_ternary_model, classify_text
10
  from binoculars_utils import compute_scores, cleanup_model, cleanup_models
11
 
12
+ MINIMUM_TOKENS = 1000
13
 
14
+ SAMPLE_TEXT = """Привет!\tЯ хотел бы поделиться с вами своим опытом путешествия по Санкт-Петербургу одному из самых красивых и удивительных городов России.\tЭто было по-настоящему незабываемое приключение, которое оставило множество ярких впечатлений.\tСанкт-Петербург сразу поразил меня своей атмосферой.\tГород буквально дышит историей: старинные здания, величественные соборы, широкие проспекты и, конечно же, каналы — всё это создает уникальный облик.\tПрогуливаясь по улицам, я чувствовал себя так, будто перенёсся в другое время, в эпоху империи, великих художников, писателей и архитекторов.\tОсобенно яркое впечатление на меня произвёл Эрмитаж.\tЭто не просто музей — это настоящий дворец искусства.\tОгромное здание Зимнего дворца снаружи выглядит торжественно и величественно, а внутри скрывает одну из крупнейших коллекций произведений искусства в мире.\tЯ провёл там несколько часов, но мне показалось, что этого времени всё равно недостаточно, чтобы увидеть и осмыслить всё, что там представлено.\tКартины, скульптуры, антикварная мебель, уникальные экспозиции — всё это завораживало и вдохновляло.\tНе менее захватывающим оказалось путешествие по каналам города.\tСанкт-Петербург не зря называют «Северной Венецией»: реки и каналы буквально пронизывают его карту, а прогулка на теплоходе позволила взглянуть на город с нового, водного ракурса.\tЯ любовался старинными мостами — каждый со своей историей и архитектурным стилем — и фасадами домов, отражающимися в воде.\tЭто было невероятно романтично и красиво, особенно когда солнце начинало садиться, заливая город золотистым светом.\tВ целом, поездка в Петербург стала для меня настоящим открытием.\tЭтот город невозможно охватить за одно путешествие — он требует времени, внимания и желания узнавать всё больше.\tЯ бы с радостью вернулся туда снова, чтобы ещё глубже погрузиться в его атмосферу, посетить новые музеи, открыть для себя скрытые уголки и просто снова почувствовать эту магию, которую излучает Петербург."""
15
 
16
  css = """
17
  .human-text {
 
325
  with gr.Blocks(css=css, theme=gr.themes.Base()) as binary_app:
326
  with gr.Row():
327
  with gr.Column(scale=3):
328
+ gr.HTML("<h1>Детектор AI-текста на русском языке</h1>")
329
 
330
  with gr.Row():
331
  with gr.Column():
332
  input_text = gr.Textbox(value=SAMPLE_TEXT, placeholder="Введите текст для анализа",
333
+ lines=10, label="Текст для анализа от 1000 токенов")
334
 
335
  with gr.Row():
336
  model_mode = gr.Radio(
 
353
  with gr.Column():
354
  analysis_output = gr.Markdown(label="Анализ")
355
 
356
+ with gr.Accordion("О методе", open=False):
357
  gr.Markdown("""
 
358
 
359
  Эта демонстрация использует нейронные сети для классификации текста в двух режимах:
360
 
 
367
  - Raw AI (Чистый ИИ) - текст сгенерирован искусственным интеллектом без редактирования
368
  - Rephrased AI (Перефразированный ИИ) - текст сгенерирован ИИ и затем отредактирован
369
 
370
+ #### Демонстрация основана на комплексном анализе текста, который включает::
371
+ - Вычисление показателей перплексии и кросс-перплексии с использованием подхода Binoculars
372
+ - Анализ морфологических, синтаксических, семантических и других особенностей текста
 
373
 
374
  #### Рекомендации:
375
+ - Для более точной классификации рекомендуется использовать длинные тексты
376
+ - Модели подготовлены и обучены для русскоязычных текстов
377
  """)
378
 
379
  # Set up event handlers