Spaces:

victor
/

omni-docker

Sleeping

hswu commited on Sep 6, 2024

Commit

816c7cd

1 Parent(s): 2541285

feat:增加device 参数

fix: set_kv_cache使用默认device问题

Files changed (2) hide show

inference.py CHANGED Viewed

@@ -399,7 +399,7 @@ class OmniInference:
         model = self.model
         with self.fabric.init_tensor():
-            model.set_kv_cache(batch_size=2)
         mel, leng = load_audio(audio_path)
         audio_feature, input_ids = get_input_ids_whisper_ATBatch(mel, leng, self.whispermodel, self.device)

         model = self.model
         with self.fabric.init_tensor():
+            model.set_kv_cache(batch_size=2,device=self.device)
         mel, leng = load_audio(audio_path)
         audio_feature, input_ids = get_input_ids_whisper_ATBatch(mel, leng, self.whispermodel, self.device)

server.py CHANGED Viewed

@@ -46,9 +46,9 @@ def create_app():
     return server.server
-def serve(ip='0.0.0.0', port=60808):
-    OmniChatServer(ip, port=port, run_app=True)
 if __name__ == "__main__":

     return server.server
+def serve(ip='0.0.0.0', port=60808, device='cuda:0'):
+    OmniChatServer(ip, port=port,run_app=True, device=device)
 if __name__ == "__main__":