DenseAV-Lowell

Running

lorocksUMD commited on Mar 26

Commit

ecbe2cb

verified ·

1 Parent(s): ffd2c9b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,6 +14,8 @@ from PIL import Image
 from torchaudio.functional import resample
 from os.path import join
 from DenseAV.denseav.train import LitAVAligner
 from DenseAV.denseav.plotting import plot_attention_video, plot_2head_attention_video, plot_feature_video
 from DenseAV.denseav.shared import norm, crop_to_divisor, blur_dim
@@ -81,14 +83,14 @@ def process_video(video, model_option):
     original_frames, audio, info = torchvision.io.read_video(video, end_pts=10, pts_unit='sec')
     sample_rate = 16000
-    print("---"*20)
-    print(type(info["video_fps"]))
-    print("---"*20)
     if info["audio_fps"] != sample_rate:
         audio = resample(audio, info["audio_fps"], sample_rate)
     audio = audio[0].unsqueeze(0)
     img_transform = T.Compose([
         T.Resize(load_size, Image.BILINEAR),
         lambda x: crop_to_divisor(x, 8),

 from torchaudio.functional import resample
 from os.path import join
+from fractions import Fraction
 from DenseAV.denseav.train import LitAVAligner
 from DenseAV.denseav.plotting import plot_attention_video, plot_2head_attention_video, plot_feature_video
 from DenseAV.denseav.shared import norm, crop_to_divisor, blur_dim
     original_frames, audio, info = torchvision.io.read_video(video, end_pts=10, pts_unit='sec')
     sample_rate = 16000
     if info["audio_fps"] != sample_rate:
         audio = resample(audio, info["audio_fps"], sample_rate)
     audio = audio[0].unsqueeze(0)
+    info["video_fps"] = Fraction(info["video_fps"]).limit_denominator(1000)
+    print(info["video_fps"].numerator)
     img_transform = T.Compose([
         T.Resize(load_size, Image.BILINEAR),
         lambda x: crop_to_divisor(x, 8),