Spaces:

Lhumpal
/

hb-llm

Sleeping

App Files Files Community

Lhumpal commited on Mar 24

Commit

4283479

verified ·

1 Parent(s): d29852f

Update app.py

Browse files

Files changed (1) hide show

app.py +2 -55

app.py CHANGED Viewed

@@ -2,6 +2,7 @@ from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from huggingface_hub import InferenceClient
 import os
 app = FastAPI()
@@ -40,58 +41,4 @@ async def chat(request: ChatRequest):
         return {"response": response.choices[0].message.content}
     except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
-# from fastapi import FastAPI, HTTPException
-# from pydantic import BaseModel
-# from huggingface_hub import InferenceClient
-# import os
-# app = FastAPI()
-# # Get the token from the environment variable
-# hf_token = os.environ.get("HF_TOKEN")
-# if hf_token:
-#     client = InferenceClient("HuggingFaceH4/zephyr-7b-beta", token=hf_token)
-# else:
-#     raise ValueError("HF_TOKEN environment variable not set. Please add it as a secret in your Hugging Face Space.")
-# # Rest of your code...
-# class ChatRequest(BaseModel):
-#     message: str
-#     history: list[tuple[str, str]] = []
-#     system_message: str = "You are a friendly Chatbot."
-#     max_tokens: int = 512
-#     temperature: float = 0.7
-#     top_p: float = 0.95
-# class ChatResponse(BaseModel):
-#     response: str
-# @app.post("/chat", response_model=ChatResponse)
-# async def chat(request: ChatRequest):
-#     try:
-#         messages = [{"role": "system", "content": request.system_message}]
-#         for val in request.history:
-#             if val[0]:
-#                 messages.append({"role": "user", "content": val[0]})
-#             if val[1]:
-#                 messages.append({"role": "assistant", "content": val[1]})
-#         messages.append({"role": "user", "content": request.message})
-#         response = ""
-#         for message in client.chat_completion(
-#             messages,
-#             max_tokens=request.max_tokens,
-#             stream=True,
-#             temperature=request.temperature,
-#             top_p=request.top_p,
-#         ):
-#             token = message.choices[0].delta.content
-#             response += token
-#         return {"response": response}
-#     except Exception as e:
-#         raise HTTPException(status_code=500, detail=str(e))

 from pydantic import BaseModel
 from huggingface_hub import InferenceClient
 import os
+import ollama
 app = FastAPI()
         return {"response": response.choices[0].message.content}
     except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))