arda-argmax commited on Mar 29

Commit

3d5a59e

verified ·

1 Parent(s): ab5bc64

Update pyannote-v3-pro speaker_embedder (#2)

- Update pyannote-v3-pro W16A16 speaker_embedder (9c6071f8c660cb14a083f34bd0311924427b6fc9)
- Update pyannote-v3-pro W8A16 speaker_embedder (c0aba8c02aee63b54e77794284460b802ee64c29)

Files changed (17) hide show

speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedder.mlmodelc/analytics/coremldata.bin +1 -1
speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedder.mlmodelc/coremldata.bin +1 -1
speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedder.mlmodelc/metadata.json +7 -7
speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedder.mlmodelc/model.mil +0 -0
speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedderPreprocessor.mlmodelc/analytics/coremldata.bin +1 -1
speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedderPreprocessor.mlmodelc/coremldata.bin +1 -1
speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedderPreprocessor.mlmodelc/metadata.json +3 -3
speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedderPreprocessor.mlmodelc/model.mil +1 -1
speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedder.mlmodelc/analytics/coremldata.bin +1 -1
speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedder.mlmodelc/coremldata.bin +1 -1
speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedder.mlmodelc/metadata.json +6 -6
speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedder.mlmodelc/model.mil +0 -0
speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedder.mlmodelc/weights/weight.bin +1 -1
speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedderPreprocessor.mlmodelc/analytics/coremldata.bin +1 -1
speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedderPreprocessor.mlmodelc/coremldata.bin +1 -1
speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedderPreprocessor.mlmodelc/metadata.json +3 -3
speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedderPreprocessor.mlmodelc/model.mil +1 -1

speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedder.mlmodelc/analytics/coremldata.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:31ebd86f9f3a87ee2bb1aa32722968e3f6821d6b393171bb6b92683213f173e1
 size 243

 version https://git-lfs.github.com/spec/v1
+oid sha256:17d567af44a172e09251880ccdb8bca4431a2ebdeaf0167fb033dc5d03654c31
 size 243

speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedder.mlmodelc/coremldata.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1bbb69d66cdb7f69a6c9d4dc1ff9b114d6097bb69581e12a706cf16e27ce10be
 size 370

 version https://git-lfs.github.com/spec/v1
+oid sha256:a45c627a63eb0a24cfbdb5baf7bca25b6755170841cc62c026f1522fedcdafb6
 size 370

speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedder.mlmodelc/metadata.json CHANGED Viewed

@@ -55,17 +55,17 @@
     },
     "userDefinedMetadata" : {
       "com.github.apple.coremltools.source_dialect" : "TorchScript",
-      "com.github.apple.coremltools.version" : "8.2",
-      "com.github.apple.coremltools.source" : "torch==2.6.0"
     },
     "inputSchema" : [
       {
         "hasShapeFlexibility" : "0",
         "isOptional" : "0",
         "dataType" : "Float16",
-        "formattedType" : "MultiArray (Float16 1 × 998 × 80)",
         "shortDescription" : "",
-        "shape" : "[1, 998, 80]",
         "name" : "preprocessor_output_1",
         "type" : "MultiArray"
       },
@@ -73,14 +73,14 @@
         "hasShapeFlexibility" : "0",
         "isOptional" : "0",
         "dataType" : "Float16",
-        "formattedType" : "MultiArray (Float16 1 × 64 × 589)",
         "shortDescription" : "",
-        "shape" : "[1, 64, 589]",
         "name" : "speaker_masks",
         "type" : "MultiArray"
       }
     ],
-    "generatedClassName" : "SpeakerEmbedding",
     "method" : "predict"
   }
 ]

     },
     "userDefinedMetadata" : {
       "com.github.apple.coremltools.source_dialect" : "TorchScript",
+      "com.github.apple.coremltools.source" : "torch==2.5.1",
+      "com.github.apple.coremltools.version" : "8.1"
     },
     "inputSchema" : [
       {
         "hasShapeFlexibility" : "0",
         "isOptional" : "0",
         "dataType" : "Float16",
+        "formattedType" : "MultiArray (Float16 1 × 2998 × 80)",
         "shortDescription" : "",
+        "shape" : "[1, 2998, 80]",
         "name" : "preprocessor_output_1",
         "type" : "MultiArray"
       },
         "hasShapeFlexibility" : "0",
         "isOptional" : "0",
         "dataType" : "Float16",
+        "formattedType" : "MultiArray (Float16 1 × 64 × 1767)",
         "shortDescription" : "",
+        "shape" : "[1, 64, 1767]",
         "name" : "speaker_masks",
         "type" : "MultiArray"
       }
     ],
+    "generatedClassName" : "SpeakerEmbedder",
     "method" : "predict"
   }
 ]

speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedder.mlmodelc/model.mil CHANGED Viewed

The diff for this file is too large to render. See raw diff

speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedderPreprocessor.mlmodelc/analytics/coremldata.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1383750df1af99af002f0c3403bcf19a18c3d749706eb3498d34b0fe01abf2fc
 size 243

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce9bef9fb3125a5401300b5c5998c5d8f211094692cae780645d3e2757410f2c
 size 243

speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedderPreprocessor.mlmodelc/coremldata.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dc230803421bf4fe14f843ea5b5fa0035487fd19cdd69ed670d72560b6a44586
 size 330

 version https://git-lfs.github.com/spec/v1
+oid sha256:b4ebd0b9ce5a84768672663aff426eb19f9648d4b9f74286f0e19fc753ad76ba
 size 330

speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedderPreprocessor.mlmodelc/metadata.json CHANGED Viewed

@@ -56,8 +56,8 @@
     },
     "userDefinedMetadata" : {
       "com.github.apple.coremltools.source_dialect" : "TorchScript",
-      "com.github.apple.coremltools.source" : "torch==2.6.0",
-      "com.github.apple.coremltools.version" : "8.2"
     },
     "inputSchema" : [
       {
@@ -71,7 +71,7 @@
         "type" : "MultiArray"
       }
     ],
-    "generatedClassName" : "SpeakerEmbeddingPreprocessor",
     "method" : "predict"
   }
 ]

     },
     "userDefinedMetadata" : {
       "com.github.apple.coremltools.source_dialect" : "TorchScript",
+      "com.github.apple.coremltools.source" : "torch==2.5.1",
+      "com.github.apple.coremltools.version" : "8.1"
     },
     "inputSchema" : [
       {
         "type" : "MultiArray"
       }
     ],
+    "generatedClassName" : "SpeakerEmbedderPreprocessor",
     "method" : "predict"
   }
 ]

speaker_embedder/pyannote-v3-pro/W16A16/SpeakerEmbedderPreprocessor.mlmodelc/model.mil CHANGED Viewed

@@ -1,5 +1,5 @@
 program(1.0)
-[buildInfo = dict<tensor<string, []>, tensor<string, []>>({{"coremlc-component-MIL", "3402.3.2"}, {"coremlc-version", "3402.4.1"}, {"coremltools-component-torch", "2.6.0"}, {"coremltools-source-dialect", "TorchScript"}, {"coremltools-version", "8.2"}})]
 {
     func main<ios16>(tensor<fp16, [1, 480000]> waveforms) {
             tensor<string, []> cast_0_dtype_0 = const()[name = tensor<string, []>("cast_0_dtype_0"), val = tensor<string, []>("fp32")];

 program(1.0)
+[buildInfo = dict<tensor<string, []>, tensor<string, []>>({{"coremlc-component-MIL", "3401.3.1"}, {"coremlc-version", "3401.4.1"}, {"coremltools-component-torch", "2.5.1"}, {"coremltools-source-dialect", "TorchScript"}, {"coremltools-version", "8.1"}})]
 {
     func main<ios16>(tensor<fp16, [1, 480000]> waveforms) {
             tensor<string, []> cast_0_dtype_0 = const()[name = tensor<string, []>("cast_0_dtype_0"), val = tensor<string, []>("fp32")];

speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedder.mlmodelc/analytics/coremldata.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:642e75621f11e461372ebf68c2861b4d56b48b89027295cfac05b518f88fc8f7
 size 243

 version https://git-lfs.github.com/spec/v1
+oid sha256:ba8405dfc9b9348ade705e052888b4bdc7fb8d079ef3ff71108a5f692d0209f2
 size 243

speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedder.mlmodelc/coremldata.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1bbb69d66cdb7f69a6c9d4dc1ff9b114d6097bb69581e12a706cf16e27ce10be
 size 370

 version https://git-lfs.github.com/spec/v1
+oid sha256:1597d6c037ac52436b5c2e1abc47e6c68483c19eeac75267dfb8795a78ec07c5
 size 370

speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedder.mlmodelc/metadata.json CHANGED Viewed

@@ -56,17 +56,17 @@
     },
     "userDefinedMetadata" : {
       "com.github.apple.coremltools.source_dialect" : "TorchScript",
-      "com.github.apple.coremltools.source" : "torch==2.6.0",
-      "com.github.apple.coremltools.version" : "8.2"
     },
     "inputSchema" : [
       {
         "hasShapeFlexibility" : "0",
         "isOptional" : "0",
         "dataType" : "Float16",
-        "formattedType" : "MultiArray (Float16 1 × 998 × 80)",
         "shortDescription" : "",
-        "shape" : "[1, 998, 80]",
         "name" : "preprocessor_output_1",
         "type" : "MultiArray"
       },
@@ -74,9 +74,9 @@
         "hasShapeFlexibility" : "0",
         "isOptional" : "0",
         "dataType" : "Float16",
-        "formattedType" : "MultiArray (Float16 1 × 64 × 589)",
         "shortDescription" : "",
-        "shape" : "[1, 64, 589]",
         "name" : "speaker_masks",
         "type" : "MultiArray"
       }

     },
     "userDefinedMetadata" : {
       "com.github.apple.coremltools.source_dialect" : "TorchScript",
+      "com.github.apple.coremltools.version" : "8.2",
+      "com.github.apple.coremltools.source" : "torch==2.6.0"
     },
     "inputSchema" : [
       {
         "hasShapeFlexibility" : "0",
         "isOptional" : "0",
         "dataType" : "Float16",
+        "formattedType" : "MultiArray (Float16 1 × 2998 × 80)",
         "shortDescription" : "",
+        "shape" : "[1, 2998, 80]",
         "name" : "preprocessor_output_1",
         "type" : "MultiArray"
       },
         "hasShapeFlexibility" : "0",
         "isOptional" : "0",
         "dataType" : "Float16",
+        "formattedType" : "MultiArray (Float16 1 × 64 × 1767)",
         "shortDescription" : "",
+        "shape" : "[1, 64, 1767]",
         "name" : "speaker_masks",
         "type" : "MultiArray"
       }

speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedder.mlmodelc/model.mil CHANGED Viewed

The diff for this file is too large to render. See raw diff

speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedder.mlmodelc/weights/weight.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14c666c28766dd780a3afc3dbb4b44078e418e16f44d97780b9f8555407213a1
 size 6661888

 version https://git-lfs.github.com/spec/v1
+oid sha256:a02861969f47cf3a67e3b0d276e54b3c8bc3a6e43d40d77d1cccbd57da0e5795
 size 6661888

speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedderPreprocessor.mlmodelc/analytics/coremldata.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1383750df1af99af002f0c3403bcf19a18c3d749706eb3498d34b0fe01abf2fc
 size 243

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce9bef9fb3125a5401300b5c5998c5d8f211094692cae780645d3e2757410f2c
 size 243

speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedderPreprocessor.mlmodelc/coremldata.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dc230803421bf4fe14f843ea5b5fa0035487fd19cdd69ed670d72560b6a44586
 size 330

 version https://git-lfs.github.com/spec/v1
+oid sha256:b4ebd0b9ce5a84768672663aff426eb19f9648d4b9f74286f0e19fc753ad76ba
 size 330

speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedderPreprocessor.mlmodelc/metadata.json CHANGED Viewed

@@ -56,8 +56,8 @@
     },
     "userDefinedMetadata" : {
       "com.github.apple.coremltools.source_dialect" : "TorchScript",
-      "com.github.apple.coremltools.source" : "torch==2.6.0",
-      "com.github.apple.coremltools.version" : "8.2"
     },
     "inputSchema" : [
       {
@@ -71,7 +71,7 @@
         "type" : "MultiArray"
       }
     ],
-    "generatedClassName" : "SpeakerEmbeddingPreprocessor",
     "method" : "predict"
   }
 ]

     },
     "userDefinedMetadata" : {
       "com.github.apple.coremltools.source_dialect" : "TorchScript",
+      "com.github.apple.coremltools.source" : "torch==2.5.1",
+      "com.github.apple.coremltools.version" : "8.1"
     },
     "inputSchema" : [
       {
         "type" : "MultiArray"
       }
     ],
+    "generatedClassName" : "SpeakerEmbedderPreprocessor",
     "method" : "predict"
   }
 ]

speaker_embedder/pyannote-v3-pro/W8A16/SpeakerEmbedderPreprocessor.mlmodelc/model.mil CHANGED Viewed

@@ -1,5 +1,5 @@
 program(1.0)
-[buildInfo = dict<tensor<string, []>, tensor<string, []>>({{"coremlc-component-MIL", "3402.3.2"}, {"coremlc-version", "3402.4.1"}, {"coremltools-component-torch", "2.6.0"}, {"coremltools-source-dialect", "TorchScript"}, {"coremltools-version", "8.2"}})]
 {
     func main<ios16>(tensor<fp16, [1, 480000]> waveforms) {
             tensor<string, []> cast_0_dtype_0 = const()[name = tensor<string, []>("cast_0_dtype_0"), val = tensor<string, []>("fp32")];

 program(1.0)
+[buildInfo = dict<tensor<string, []>, tensor<string, []>>({{"coremlc-component-MIL", "3401.3.1"}, {"coremlc-version", "3401.4.1"}, {"coremltools-component-torch", "2.5.1"}, {"coremltools-source-dialect", "TorchScript"}, {"coremltools-version", "8.1"}})]
 {
     func main<ios16>(tensor<fp16, [1, 480000]> waveforms) {
             tensor<string, []> cast_0_dtype_0 = const()[name = tensor<string, []>("cast_0_dtype_0"), val = tensor<string, []>("fp32")];