Spaces:

fossbk
/

VNSLR

Sleeping

fossbk commited on Mar 18

Commit

d3d18f9

verified ·

1 Parent(s): b94db6f

sử dụng mô hình phân loại video có sẵn từ Hugging Face

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,15 +1,15 @@
 import gradio as gr
-import torch
 from transformers import pipeline
-from moviepy.editor import VideoFileClip
 from PIL import Image
-import os
 # Kiểm tra thiết bị sử dụng GPU hay CPU
 device = "cuda" if torch.cuda.is_available() else "cpu"
 # Tải các mô hình phân loại ảnh và video từ Hugging Face
 image_classifier = pipeline("image-classification", model="google/vit-base-patch16-224-in21k", device=0 if device == "cuda" else -1)
 video_classifier = pipeline("video-classification", model="google/vit-base-patch16-224-in21k", device=0 if device == "cuda" else -1)
 # Hàm phân loại ảnh
@@ -32,13 +32,8 @@ def classify_video(video, model_name):
     else:
         classifier = video_classifier  # Chỉnh sửa ở đây nếu muốn hỗ trợ thêm các mô hình khác
-    # Đọc video và trích xuất các frame (ở đây đơn giản là lấy 1 frame đầu tiên)
-    clip = VideoFileClip(video.name)
-    frame = clip.get_frame(0)
-    image = Image.fromarray(frame)
-    # Phân loại frame đầu tiên của video
-    result = classifier(image)
     return result[0]['label'], result[0]['score']
 # Giao diện Gradio

 import gradio as gr
 from transformers import pipeline
 from PIL import Image
+import torch
 # Kiểm tra thiết bị sử dụng GPU hay CPU
 device = "cuda" if torch.cuda.is_available() else "cpu"
 # Tải các mô hình phân loại ảnh và video từ Hugging Face
 image_classifier = pipeline("image-classification", model="google/vit-base-patch16-224-in21k", device=0 if device == "cuda" else -1)
+# Sử dụng mô hình phân loại video có sẵn trên Hugging Face
 video_classifier = pipeline("video-classification", model="google/vit-base-patch16-224-in21k", device=0 if device == "cuda" else -1)
 # Hàm phân loại ảnh
     else:
         classifier = video_classifier  # Chỉnh sửa ở đây nếu muốn hỗ trợ thêm các mô hình khác
+    # Phân loại video trực tiếp mà không cần trích xuất frame
+    result = classifier(video)
     return result[0]['label'], result[0]['score']
 # Giao diện Gradio