Spaces:

tanbushi
/

embedding

Running

geqintan commited on Mar 2

Commit

c302efc

1 Parent(s): e0922e7

update

Files changed (1) hide show

app.py CHANGED Viewed

@@ -33,42 +33,32 @@ class EmbeddingRequest(BaseModel):
     input: Union[str, List[str]]  # 修复类型定义
 @app.post("/v1/embeddings")
-async def embeddings(request:EmbeddingRequest, authorization: str = Depends(check_authorization)):
-    input = request.input
-    try:
-        if not input:
-            return {
-                "object": "list",
-                "data": [],
-                "model": "BAAI/bge-large-zh-v1.5",
-                "usage": {
-                    "prompt_tokens": 0,
-                    "total_tokens": 0
-                }
-            }
-        # Calculate embeddings
-        embeddings = model.encode(input, normalize_embeddings=True)
-        # Format the embeddings in OpenAI compatible format
-        data = {
-            "object": "list",
-            "data": [
-                {
-                    "object": "embedding",
-                    "embedding": embeddings.tolist(),
-                    "index": 0
-                }
-            ],
-            "model": "BAAI/bge-large-zh-v1.5",
-            "usage": {
-                "prompt_tokens": len(input),
-                "total_tokens": len(input)
-            }
-        }
-        return data
-    except Exception as e:
-        logger.error(f"Error processing embeddings: {e}")
-        raise HTTPException(status_code=500, detail="Internal Server Error")

     input: Union[str, List[str]]  # 修复类型定义
 @app.post("/v1/embeddings")
+async def embeddings(request: EmbeddingRequest, authorization: str = Depends(check_authorization)):
+    input_data = request.input
+    # 统一转换为列表处理
+    inputs = [input_data] if isinstance(input_data, str) else input_data
+    if not inputs:
+        return { ... }  # 空输入处理
+    # 计算嵌入向量（二维numpy数组）
+    embeddings = model.encode(inputs, normalize_embeddings=True)
+    # 构建符合OpenAI格式的响应
+    data_entries = []
+    for idx, embed in enumerate(embeddings):
+        data_entries.append({
+            "object": "embedding",
+            "embedding": embed.tolist(),  # 每个embed是一维数组
+            "index": idx
+        })
+    return {
+        "object": "list",
+        "data": data_entries,  # 包含每个输入的嵌入对象
+        "model": "BAAI/bge-large-zh-v1.5",
+        "usage": {
+            "prompt_tokens": sum(len(text) for text in inputs),  # 粗略估计token数
+            "total_tokens": sum(len(text) for text in inputs)
+        }
+    }