dhwani-server-workshop

Running

App Files Files Community

sachin commited on 4 days ago

Commit

8ca8b71

1 Parent(s): d2e6815

a-i server

Browse files

Files changed (1) hide show

src/server/main.py +104 -417

src/server/main.py CHANGED Viewed

@@ -1,49 +1,28 @@
 import argparse
-import io
-from time import time
-from typing import List, Optional
 from abc import ABC, abstractmethod
 import uvicorn
-from fastapi import Depends, FastAPI, File, HTTPException, Query, Request, UploadFile, Header, Form
 from fastapi.middleware.cors import CORSMiddleware
-from fastapi.responses import JSONResponse, RedirectResponse, StreamingResponse
-from fastapi.security import HTTPBearer, HTTPAuthorizationCredentials
-from pydantic import BaseModel, field_validator, Field
-from slowapi import Limiter
-from slowapi.util import get_remote_address
 import requests
-from PIL import Image
-import base64
-from Crypto.Cipher import AES
-# Import from auth.py
-from utils.auth import get_current_user, get_current_user_with_admin, login, refresh_token, register, app_register, TokenResponse, Settings, LoginRequest, RegisterRequest, bearer_scheme
-# Import decryption utility
-from utils.crypto import decrypt_data
 # Assuming these are in your project structure
 from config.tts_config import SPEED, ResponseFormat, config as tts_config
 from config.logging_config import logger
-settings = Settings()
 # FastAPI app setup with enhanced docs
 app = FastAPI(
     title="Dhwani API",
-    description="A multilingual AI-powered API supporting Indian languages for chat, text-to-speech, audio processing, and transcription. "
-                "**Authentication Guide:** \n"
-                "1. Obtain an access token by sending a POST request to `/v1/token` with `username` and `password`. \n"
-                "2. Click the 'Authorize' button (top-right), enter your access token (e.g., `your_access_token`) in the 'bearerAuth' field, and click 'Authorize'. \n"
-                "All protected endpoints require this token for access. \n",
     version="1.0.0",
     redirect_slashes=False,
     openapi_tags=[
         {"name": "Chat", "description": "Chat-related endpoints"},
         {"name": "Audio", "description": "Audio processing and TTS endpoints"},
         {"name": "Translation", "description": "Text translation endpoints"},
-        {"name": "Authentication", "description": "User authentication and registration"},
         {"name": "Utility", "description": "General utility endpoints"},
     ],
 )
@@ -56,17 +35,6 @@ app.add_middleware(
     allow_headers=["*"],
 )
-# Rate limiting based on user_id with fallback to IP
-async def get_user_id_for_rate_limit(request: Request):
-    try:
-        credentials = bearer_scheme(request)
-        user_id = await get_current_user(credentials)
-        return user_id
-    except Exception:
-        return get_remote_address(request)
-limiter = Limiter(key_func=get_user_id_for_rate_limit)
 # Request/Response Models
 class TranscriptionResponse(BaseModel):
     text: str = Field(..., description="Transcribed text from the audio")
@@ -87,24 +55,16 @@ class AudioProcessingResponse(BaseModel):
         schema_extra = {"example": {"result": "Processed audio output"}}
 class ChatRequest(BaseModel):
-    prompt: str = Field(..., description="Base64-encoded encrypted prompt (max 1000 characters after decryption)")
-    src_lang: str = Field(..., description="Base64-encoded encrypted source language code")
-    tgt_lang: str = Field(..., description="Base64-encoded encrypted target language code")
-    @field_validator("prompt", "src_lang", "tgt_lang")
-    def must_be_valid_base64(cls, v):
-        try:
-            base64.b64decode(v)
-        except Exception:
-            raise ValueError("Field must be valid base64-encoded data")
-        return v
     class Config:
         schema_extra = {
             "example": {
-                "prompt": "base64_encoded_encrypted_prompt",
-                "src_lang": "base64_encoded_encrypted_kan_Knda",
-                "tgt_lang": "base64_encoded_encrypted_kan_Knda"
             }
         }
@@ -115,31 +75,16 @@ class ChatResponse(BaseModel):
         schema_extra = {"example": {"response": "Hi there, I'm doing great!"}}
 class TranslationRequest(BaseModel):
-    sentences: List[str] = Field(..., description="List of base64-encoded encrypted sentences")
-    src_lang: str = Field(..., description="Base64-encoded encrypted source language code")
-    tgt_lang: str = Field(..., description="Base64-encoded encrypted target language code")
-    @field_validator("sentences", "src_lang", "tgt_lang")
-    def must_be_valid_base64(cls, v):
-        if isinstance(v, list):
-            for item in v:
-                try:
-                    base64.b64decode(item)
-                except Exception:
-                    raise ValueError("Each sentence must be valid base64-encoded data")
-        else:
-            try:
-                base64.b64decode(v)
-            except Exception:
-                raise ValueError("Field must be valid base64-encoded data")
-        return v
     class Config:
         schema_extra = {
             "example": {
-                "sentences": ["base64_encoded_encrypted_hello", "base64_encoded_encrypted_how_are_you"],
-                "src_lang": "base64_encoded_encrypted_en",
-                "tgt_lang": "base64_encoded_encrypted_kan_Knda"
             }
         }
@@ -150,24 +95,16 @@ class TranslationResponse(BaseModel):
         schema_extra = {"example": {"translations": ["ನಮಸ್ಕಾರ", "ನೀವು ಹೇಗಿದ್ದೀರಿ?"]}}
 class VisualQueryRequest(BaseModel):
-    query: str = Field(..., description="Base64-encoded encrypted text query")
-    src_lang: str = Field(..., description="Base64-encoded encrypted source language code")
-    tgt_lang: str = Field(..., description="Base64-encoded encrypted target language code")
-    @field_validator("query", "src_lang", "tgt_lang")
-    def must_be_valid_base64(cls, v):
-        try:
-            base64.b64decode(v)
-        except Exception:
-            raise ValueError("Field must be valid base64-encoded data")
-        return v
     class Config:
         schema_extra = {
             "example": {
-                "query": "base64_encoded_encrypted_describe_image",
-                "src_lang": "base64_encoded_encrypted_kan_Knda",
-                "tgt_lang": "base64_encoded_encrypted_kan_Knda"
             }
         }
@@ -183,8 +120,7 @@ class TTSService(ABC):
 class ExternalTTSService(TTSService):
     async def generate_speech(self, payload: dict) -> requests.Response:
         try:
-            base_url = f"{settings.external_api_base_url}/v1/audio/speech"
             return requests.post(
                 base_url,
                 json=payload,
@@ -209,7 +145,7 @@ def get_tts_service() -> TTSService:
          tags=["Utility"],
          response_model=dict)
 async def health_check():
-    return {"status": "healthy", "model": settings.llm_model_name}
 @app.get("/",
          summary="Redirect to Docs",
@@ -218,118 +154,34 @@ async def health_check():
 async def home():
     return RedirectResponse(url="/docs")
-@app.post("/v1/token",
-          response_model=TokenResponse,
-          summary="User Login",
-          description="Authenticate a user with encrypted email and device token to obtain an access token and refresh token. Requires X-Session-Key header.",
-          tags=["Authentication"],
-          responses={
-              200: {"description": "Successful login", "model": TokenResponse},
-              400: {"description": "Invalid encrypted data"},
-              401: {"description": "Invalid email or device token"}
-          })
-async def token(
-    login_request: LoginRequest,
-    x_session_key: str = Header(..., alias="X-Session-Key")
-):
-    return await login(login_request, x_session_key)
-@app.post("/v1/refresh",
-          response_model=TokenResponse,
-          summary="Refresh Access Token",
-          description="Generate a new access token and refresh token using an existing valid refresh token.",
-          tags=["Authentication"],
-          responses={
-              200: {"description": "New tokens issued", "model": TokenResponse},
-              401: {"description": "Invalid or expired refresh token"}
-          })
-async def refresh(credentials: HTTPAuthorizationCredentials = Depends(bearer_scheme)):
-    return await refresh_token(credentials)
-@app.post("/v1/register",
-          response_model=TokenResponse,
-          summary="Register New User (Admin Only)",
-          description="Create a new user account in the `users` table. Only admin accounts can register new users (use 'admin' user with password 'admin54321' initially). Non-admin users are forbidden from modifying the users table.",
-          tags=["Authentication"],
-          responses={
-              200: {"description": "User registered successfully", "model": TokenResponse},
-              400: {"description": "Username already exists"},
-              401: {"description": "Unauthorized - Valid admin token required"},
-              403: {"description": "Forbidden - Admin access required"},
-              500: {"description": "Registration failed due to server error"}
-          })
-async def register_user(
-    register_request: RegisterRequest,
-    current_user: str = Depends(get_current_user_with_admin)
-):
-    return await register(register_request, current_user)
-@app.post("/v1/app/register",
-          response_model=TokenResponse,
-          summary="Register New App User",
-          description="Create a new user account for the mobile app in the `app_users` table using an encrypted email and device token. Returns an access token and refresh token. Rate limited to 5 requests per minute per IP. Requires X-Session-Key header.",
-          tags=["Authentication"],
-          responses={
-              200: {"description": "User registered successfully", "model": TokenResponse},
-              400: {"description": "Email already registered or invalid encrypted data"},
-              429: {"description": "Rate limit exceeded"}
-          })
-@limiter.limit(settings.speech_rate_limit)
-async def app_register_user(
-    request: Request,
-    register_request: RegisterRequest,
-    x_session_key: str = Header(..., alias="X-Session-Key")
-):
-    logger.info(f"App registration attempt")
-    return await app_register(register_request, x_session_key)
 @app.post("/v1/audio/speech",
           summary="Generate Speech from Text",
-          description="Convert encrypted text to speech using an external TTS service. Rate limited to 5 requests per minute per user. Requires authentication and X-Session-Key header.",
           tags=["Audio"],
           responses={
               200: {"description": "Audio stream", "content": {"audio/mp3": {"example": "Binary audio data"}}},
               400: {"description": "Invalid or empty input"},
-              401: {"description": "Unauthorized - Token required"},
-              429: {"description": "Rate limit exceeded"},
               502: {"description": "External TTS service unavailable"},
               504: {"description": "TTS service timeout"}
           })
-@limiter.limit(settings.speech_rate_limit)
 async def generate_audio(
     request: Request,
-    input: str = Query(..., description="Base64-encoded encrypted text to convert to speech (max 1000 characters after decryption)"),
     response_format: str = Query("mp3", description="Audio format (ignored, defaults to mp3 for external API)"),
-    credentials: HTTPAuthorizationCredentials = Depends(bearer_scheme),
-    x_session_key: str = Header(..., alias="X-Session-Key"),
     tts_service: TTSService = Depends(get_tts_service)
 ):
-    user_id = await get_current_user(credentials)
-    session_key = base64.b64decode(x_session_key)
-    # Decrypt input
-    try:
-        encrypted_input = base64.b64decode(input)
-        decrypted_input = decrypt_data(encrypted_input, session_key).decode("utf-8")
-    except Exception as e:
-        logger.error(f"Input decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted input")
-    if not decrypted_input.strip():
         raise HTTPException(status_code=400, detail="Input cannot be empty")
-    if len(decrypted_input) > 1000:
-        raise HTTPException(status_code=400, detail="Decrypted input cannot exceed 1000 characters")
     logger.info("Processing speech request", extra={
         "endpoint": "/v1/audio/speech",
-        "input_length": len(decrypted_input),
-        "client_ip": get_remote_address(request),
-        "user_id": user_id
     })
-    payload = {
-        "text": decrypted_input
-    }
     try:
         response = await tts_service.generate_speech(payload)
@@ -353,62 +205,30 @@ async def generate_audio(
 @app.post("/v1/chat",
           response_model=ChatResponse,
           summary="Chat with AI",
-          description="Generate a chat response from an encrypted prompt and encrypted language code. Rate limited to 100 requests per minute per user. Requires authentication and X-Session-Key header.",
           tags=["Chat"],
           responses={
               200: {"description": "Chat response", "model": ChatResponse},
-              400: {"description": "Invalid prompt, encrypted data, or language code"},
-              401: {"description": "Unauthorized - Token required"},
-              429: {"description": "Rate limit exceeded"},
               504: {"description": "Chat service timeout"}
           })
-@limiter.limit(settings.chat_rate_limit)
 async def chat(
     request: Request,
-    chat_request: ChatRequest,
-    credentials: HTTPAuthorizationCredentials = Depends(bearer_scheme),
-    x_session_key: str = Header(..., alias="X-Session-Key")
 ):
-    user_id = await get_current_user(credentials)
-    session_key = base64.b64decode(x_session_key)
-    # Decrypt the prompt
-    try:
-        encrypted_prompt = base64.b64decode(chat_request.prompt)
-        decrypted_prompt = decrypt_data(encrypted_prompt, session_key).decode("utf-8")
-    except Exception as e:
-        logger.error(f"Prompt decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted prompt")
-    # Decrypt the source language
-    try:
-        encrypted_src_lang = base64.b64decode(chat_request.src_lang)
-        decrypted_src_lang = decrypt_data(encrypted_src_lang, session_key).decode("utf-8")
-    except Exception as e:
-        logger.error(f"Source language decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted source language")
-    # Decrypt the target language
-    try:
-        encrypted_tgt_lang = base64.b64decode(chat_request.tgt_lang)
-        decrypted_tgt_lang = decrypt_data(encrypted_tgt_lang, session_key).decode("utf-8")
-    except Exception as e:
-        logger.error(f"Target language decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted target language")
-    if not decrypted_prompt:
         raise HTTPException(status_code=400, detail="Prompt cannot be empty")
-    if len(decrypted_prompt) > 1000:
-        raise HTTPException(status_code=400, detail="Decrypted prompt cannot exceed 1000 characters")
-    logger.info(f"Received prompt: {decrypted_prompt}, src_lang: {decrypted_src_lang}, user_id: {user_id}")
     try:
-        external_url = f"{settings.external_api_base_url}/v1/chat"
         payload = {
-            "prompt": decrypted_prompt,
-            "src_lang": decrypted_src_lang,
-            "tgt_lang": decrypted_tgt_lang
         }
         response = requests.post(
@@ -440,43 +260,28 @@ async def chat(
 @app.post("/v1/transcribe/",
           response_model=TranscriptionResponse,
           summary="Transcribe Audio File",
-          description="Transcribe an encrypted audio file into text in the specified encrypted language. Requires authentication and X-Session-Key header.",
           tags=["Audio"],
           responses={
               200: {"description": "Transcription result", "model": TranscriptionResponse},
-              400: {"description": "Invalid encrypted audio or language"},
-              401: {"description": "Unauthorized - Token required"},
               504: {"description": "Transcription service timeout"}
           })
 async def transcribe_audio(
-    file: UploadFile = File(..., description="Encrypted audio file to transcribe"),
-    language: str = Query(..., description="Base64-encoded encrypted language of the audio (kannada, hindi, tamil after decryption)"),
-    credentials: HTTPAuthorizationCredentials = Depends(bearer_scheme),
-    x_session_key: str = Header(..., alias="X-Session-Key")
 ):
-    user_id = await get_current_user(credentials)
-    session_key = base64.b64decode(x_session_key)
-    # Decrypt the language
-    try:
-        encrypted_language = base64.b64decode(language)
-        decrypted_language = decrypt_data(encrypted_language, session_key).decode("utf-8")
-    except Exception as e:
-        logger.error(f"Language decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted language")
     # Validate language
     allowed_languages = ["kannada", "hindi", "tamil"]
-    if decrypted_language not in allowed_languages:
         raise HTTPException(status_code=400, detail=f"Language must be one of {allowed_languages}")
     start_time = time()
     try:
-        encrypted_content = await file.read()
-        file_content = decrypt_data(encrypted_content, session_key)
         files = {"file": (file.filename, file_content, file.content_type)}
-        external_url = f"{settings.external_api_base_url}/v1/transcribe/?language={decrypted_language}"
         response = requests.post(
             external_url,
             files=files,
@@ -489,8 +294,6 @@ async def transcribe_audio(
         logger.info(f"Transcription completed in {time() - start_time:.2f} seconds")
         return TranscriptionResponse(text=transcription)
-    except HTTPException:
-        raise
     except requests.Timeout:
         logger.error("Transcription service timed out")
         raise HTTPException(status_code=504, detail="Transcription service timeout")
@@ -501,78 +304,38 @@ async def transcribe_audio(
 @app.post("/v1/translate",
           response_model=TranslationResponse,
           summary="Translate Text",
-          description="Translate a list of base64-encoded encrypted sentences from an encrypted source to an encrypted target language. Requires authentication and X-Session-Key header.",
           tags=["Translation"],
           responses={
               200: {"description": "Translation result", "model": TranslationResponse},
-              400: {"description": "Invalid encrypted sentences or languages"},
-              401: {"description": "Unauthorized - Token required"},
               500: {"description": "Translation service error"},
               504: {"description": "Translation service timeout"}
           })
 async def translate(
-    request: TranslationRequest,
-    credentials: HTTPAuthorizationCredentials = Depends(bearer_scheme),
-    x_session_key: str = Header(..., alias="X-Session-Key")
 ):
-    user_id = await get_current_user(credentials)
-    try:
-        session_key = base64.b64decode(x_session_key)
-    except Exception as e:
-        logger.error(f"Invalid X-Session-Key: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid session key")
-    # Decrypt sentences
-    decrypted_sentences = []
-    for sentence in request.sentences:
-        try:
-            encrypted_sentence = base64.b64decode(sentence)
-            decrypted_sentence = decrypt_data(encrypted_sentence, session_key).decode("utf-8")
-            if not decrypted_sentence.strip():
-                raise ValueError("Decrypted sentence is empty")
-            decrypted_sentences.append(decrypted_sentence)
-        except Exception as e:
-            logger.error(f"Sentence decryption failed: {str(e)}")
-            raise HTTPException(status_code=400, detail=f"Invalid encrypted sentence: {str(e)}")
-    # Decrypt source language
-    try:
-        encrypted_src_lang = base64.b64decode(request.src_lang)
-        decrypted_src_lang = decrypt_data(encrypted_src_lang, session_key).decode("utf-8")
-        if not decrypted_src_lang.strip():
-            raise ValueError("Decrypted source language is empty")
-    except Exception as e:
-        logger.error(f"Source language decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail=f"Invalid encrypted source language: {str(e)}")
-    # Decrypt target language
-    try:
-        encrypted_tgt_lang = base64.b64decode(request.tgt_lang)
-        decrypted_tgt_lang = decrypt_data(encrypted_tgt_lang, session_key).decode("utf-8")
-        if not decrypted_tgt_lang.strip():
-            raise ValueError("Decrypted target language is empty")
-    except Exception as e:
-        logger.error(f"Target language decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail=f"Invalid encrypted target language: {str(e)}")
     # Validate language codes
     supported_languages = [
         "eng_Latn", "hin_Deva", "kan_Knda", "tam_Taml", "mal_Mlym", "tel_Telu",
         "deu_Latn", "fra_Latn", "nld_Latn", "spa_Latn", "ita_Latn", "por_Latn",
         "rus_Cyrl", "pol_Latn"
     ]
-    if decrypted_src_lang not in supported_languages or decrypted_tgt_lang not in supported_languages:
-        logger.error(f"Unsupported language codes: src={decrypted_src_lang}, tgt={decrypted_tgt_lang}")
-        raise HTTPException(status_code=400, detail=f"Unsupported language codes: src={decrypted_src_lang}, tgt={decrypted_tgt_lang}")
-    logger.info(f"Received translation request: {len(decrypted_sentences)} sentences, src_lang: {decrypted_src_lang}, tgt_lang: {decrypted_tgt_lang}, user_id: {user_id}")
-    external_url = f"{settings.external_api_base_url}/v1/translate"
     payload = {
-        "sentences": decrypted_sentences,
-        "src_lang": decrypted_src_lang,
-        "tgt_lang": decrypted_tgt_lang
     }
     try:
@@ -590,7 +353,7 @@ async def translate(
         response_data = response.json()
         translations = response_data.get("translations", [])
-        if not translations or len(translations) != len(decrypted_sentences):
             logger.warning(f"Unexpected response format: {response_data}")
             raise HTTPException(status_code=500, detail="Invalid response from translation service")
@@ -620,56 +383,38 @@ class PDFTextExtractionResponse(BaseModel):
 @app.post("/v1/extract-text",
           response_model=PDFTextExtractionResponse,
           summary="Extract Text from PDF",
-          description="Extract text from a specified page of an encrypted PDF file by calling an external API. Rate limited to 100 requests per minute per user. Requires authentication and X-Session-Key header.",
           tags=["PDF"],
           responses={
               200: {"description": "Extracted text", "model": PDFTextExtractionResponse},
-              400: {"description": "Invalid encrypted PDF or page number"},
-              401: {"description": "Unauthorized - Token required"},
-              429: {"description": "Rate limit exceeded"},
               500: {"description": "External API error"},
               504: {"description": "External API timeout"}
           })
-@limiter.limit(settings.chat_rate_limit)
 async def extract_text(
     request: Request,
-    file: UploadFile = File(..., description="Encrypted PDF file to extract text from"),
     page_number: int = Query(1, description="Page number to extract text from (1-based indexing)"),
-    encrypted_language: str = Query(..., description="Base64-encoded encrypted language of the audio (kannada, hindi, tamil after decryption)"),
-    credentials: HTTPAuthorizationCredentials = Depends(bearer_scheme),
-    x_session_key: str = Header(..., alias="X-Session-Key")
 ):
-    user_id = await get_current_user(credentials)
-    session_key = base64.b64decode(x_session_key)
     # Validate page number
     if page_number < 1:
         raise HTTPException(status_code=400, detail="Page number must be at least 1")
-    # Decrypt PDF content
-    try:
-        encrypted_content = await file.read()
-        decrypted_content = decrypt_data(encrypted_content, session_key)
-        #decrpyted_language = decrypt_data(encrypted_language, session_key)
-    except Exception as e:
-        logger.error(f"PDF decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted PDF")
     logger.info("Processing PDF text extraction request", extra={
         "endpoint": "/v1/extract-text",
         "file_name": file.filename,
         "page_number": page_number,
-        "decrpyted_language" : encrypted_language,
-        "client_ip": get_remote_address(request),
-        "user_id": user_id
     })
     start_time = time()
     try:
-        # Call external API
-        external_url = f"{settings.external_pdf_api_base_url}/extract-text/?page_number={page_number}&language={encrypted_language}"
-        files = {"file": (file.filename, decrypted_content, file.content_type)}
         response = requests.post(
             external_url,
             files=files,
@@ -700,27 +445,19 @@ async def extract_text(
 @app.post("/v1/visual_query",
           response_model=VisualQueryResponse,
           summary="Visual Query with Image",
-          description="Process a visual query with an encrypted text query, encrypted image, and encrypted language codes provided in a JSON body named 'data'. Rate limited to 100 requests per minute per user. Requires authentication and X-Session-Key header.",
           tags=["Chat"],
           responses={
               200: {"description": "Query response", "model": VisualQueryResponse},
-              400: {"description": "Invalid query, encrypted data, or language codes"},
-              401: {"description": "Unauthorized - Token required"},
               422: {"description": "Validation error in request body"},
-              429: {"description": "Rate limit exceeded"},
               504: {"description": "Visual query service timeout"}
           })
-@limiter.limit(settings.chat_rate_limit)
 async def visual_query(
     request: Request,
-    data: str = Form(..., description="JSON string containing encrypted query, src_lang, and tgt_lang"),
-    file: UploadFile = File(..., description="Encrypted image file to analyze"),
-    credentials: HTTPAuthorizationCredentials = Depends(bearer_scheme),
-    x_session_key: str = Header(..., alias="X-Session-Key")
 ):
-    user_id = await get_current_user(credentials)
-    session_key = base64.b64decode(x_session_key)
     # Parse and validate JSON data
     try:
         import json
@@ -730,58 +467,26 @@ async def visual_query(
         logger.error(f"Failed to parse JSON data: {str(e)}")
         raise HTTPException(status_code=422, detail=f"Invalid JSON data: {str(e)}")
-    # Decrypt query
-    try:
-        encrypted_query = base64.b64decode(visual_query_request.query)
-        decrypted_query = decrypt_data(encrypted_query, session_key).decode("utf-8")
-    except Exception as e:
-        logger.error(f"Query decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted query")
-    # Decrypt source language
-    try:
-        encrypted_src_lang = base64.b64decode(visual_query_request.src_lang)
-        decrypted_src_lang = decrypt_data(encrypted_src_lang, session_key).decode("utf-8")
-    except Exception as e:
-        logger.error(f"Source language decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted source language")
-    # Decrypt target language
-    try:
-        encrypted_tgt_lang = base64.b64decode(visual_query_request.tgt_lang)
-        decrypted_tgt_lang = decrypt_data(encrypted_tgt_lang, session_key).decode("utf-8")
-    except Exception as e:
-        logger.error(f"Target language decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted target language")
-    if not decrypted_query.strip():
         raise HTTPException(status_code=400, detail="Query cannot be empty")
-    if len(decrypted_query) > 1000:
-        raise HTTPException(status_code=400, detail="Decrypted query cannot exceed 1000 characters")
-    # Decrypt image
-    try:
-        encrypted_content = await file.read()
-        decrypted_content = decrypt_data(encrypted_content, session_key)
-    except Exception as e:
-        logger.error(f"Image decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted image")
     logger.info("Processing visual query request", extra={
         "endpoint": "/v1/visual_query",
-        "query_length": len(decrypted_query),
         "file_name": file.filename,
-        "client_ip": get_remote_address(request),
-        "user_id": user_id,
-        "src_lang": decrypted_src_lang,
-        "tgt_lang": decrypted_tgt_lang
     })
-    external_url = f"{settings.external_api_base_url}/v1/visual_query/?src_lang={decrypted_src_lang}&tgt_lang={decrypted_tgt_lang}"
     try:
-        files = {"file": (file.filename, decrypted_content, file.content_type)}
-        data = {"query": decrypted_query}
         response = requests.post(
             external_url,
@@ -821,53 +526,35 @@ class SupportedLanguage(str, Enum):
 @app.post("/v1/speech_to_speech",
           summary="Speech-to-Speech Conversion",
-          description="Convert input encrypted speech to processed speech in the specified encrypted language by calling an external speech-to-speech API. Rate limited to 5 requests per minute per user. Requires authentication and X-Session-Key header.",
           tags=["Audio"],
           responses={
               200: {"description": "Audio stream", "content": {"audio/mp3": {"example": "Binary audio data"}}},
-              400: {"description": "Invalid input, encrypted audio, or language"},
-              401: {"description": "Unauthorized - Token required"},
-              429: {"description": "Rate limit exceeded"},
               504: {"description": "External API timeout"},
               500: {"description": "External API error"}
           })
-@limiter.limit(settings.speech_rate_limit)
 async def speech_to_speech(
     request: Request,
-    file: UploadFile = File(..., description="Encrypted audio file to process"),
-    language: str = Query(..., description="Base64-encoded encrypted language of the audio (kannada, hindi, tamil after decryption)"),
-    credentials: HTTPAuthorizationCredentials = Depends(bearer_scheme),
-    x_session_key: str = Header(..., alias="X-Session-Key")
 ) -> StreamingResponse:
-    user_id = await get_current_user(credentials)
-    session_key = base64.b64decode(x_session_key)
-    # Decrypt the language
-    try:
-        encrypted_language = base64.b64decode(language)
-        decrypted_language = decrypt_data(encrypted_language, session_key).decode("utf-8")
-    except Exception as e:
-        logger.error(f"Language decryption failed: {str(e)}")
-        raise HTTPException(status_code=400, detail="Invalid encrypted language")
     # Validate language
     allowed_languages = [lang.value for lang in SupportedLanguage]
-    if decrypted_language not in allowed_languages:
         raise HTTPException(status_code=400, detail=f"Language must be one of {allowed_languages}")
     logger.info("Processing speech-to-speech request", extra={
         "endpoint": "/v1/speech_to_speech",
         "audio_filename": file.filename,
-        "language": decrypted_language,
-        "client_ip": get_remote_address(request),
-        "user_id": user_id
     })
     try:
-        encrypted_content = await file.read()
-        file_content = decrypt_data(encrypted_content, session_key)
         files = {"file": (file.filename, file_content, file.content_type)}
-        external_url = f"{settings.external_api_base_url}/v1/speech_to_speech?language={decrypted_language}"
         response = requests.post(
             external_url,
@@ -891,15 +578,15 @@ async def speech_to_speech(
         )
     except requests.Timeout:
-        logger.error("External speech-to-speech API timed out", extra={"user_id": user_id})
         raise HTTPException(status_code=504, detail="External API timeout")
     except requests.RequestException as e:
-        logger.error(f"External speech-to-speech API error: {str(e)}", extra={"user_id": user_id})
         raise HTTPException(status_code=500, detail=f"External API error: {str(e)}")
 if __name__ == "__main__":
     parser = argparse.ArgumentParser(description="Run the FastAPI server.")
-    parser.add_argument("--port", type=int, default=settings.port, help="Port to run the server on.")
-    parser.add_argument("--host", type=str, default=settings.host, help="Host to run the server on.")
     args = parser.parse_args()
     uvicorn.run(app, host=args.host, port=args.port)

 import argparse
+from typing import List
 from abc import ABC, abstractmethod
 import uvicorn
+from fastapi import FastAPI, File, HTTPException, Query, Request, UploadFile
 from fastapi.middleware.cors import CORSMiddleware
+from fastapi.responses import RedirectResponse, StreamingResponse
+from pydantic import BaseModel, Field
 import requests
+from time import time
 # Assuming these are in your project structure
 from config.tts_config import SPEED, ResponseFormat, config as tts_config
 from config.logging_config import logger
 # FastAPI app setup with enhanced docs
 app = FastAPI(
     title="Dhwani API",
+    description="A multilingual AI-powered API supporting Indian languages for chat, text-to-speech, audio processing, and transcription.",
     version="1.0.0",
     redirect_slashes=False,
     openapi_tags=[
         {"name": "Chat", "description": "Chat-related endpoints"},
         {"name": "Audio", "description": "Audio processing and TTS endpoints"},
         {"name": "Translation", "description": "Text translation endpoints"},
         {"name": "Utility", "description": "General utility endpoints"},
     ],
 )
     allow_headers=["*"],
 )
 # Request/Response Models
 class TranscriptionResponse(BaseModel):
     text: str = Field(..., description="Transcribed text from the audio")
         schema_extra = {"example": {"result": "Processed audio output"}}
 class ChatRequest(BaseModel):
+    prompt: str = Field(..., description="Prompt for chat (max 1000 characters)")
+    src_lang: str = Field(..., description="Source language code")
+    tgt_lang: str = Field(..., description="Target language code")
     class Config:
         schema_extra = {
             "example": {
+                "prompt": "Hello, how are you?",
+                "src_lang": "kan_Knda",
+                "tgt_lang": "kan_Knda"
             }
         }
         schema_extra = {"example": {"response": "Hi there, I'm doing great!"}}
 class TranslationRequest(BaseModel):
+    sentences: List[str] = Field(..., description="List of sentences to translate")
+    src_lang: str = Field(..., description="Source language code")
+    tgt_lang: str = Field(..., description="Target language code")
     class Config:
         schema_extra = {
             "example": {
+                "sentences": ["Hello", "How are you?"],
+                "src_lang": "en",
+                "tgt_lang": "kan_Knda"
             }
         }
         schema_extra = {"example": {"translations": ["ನಮಸ್ಕಾರ", "ನೀವು ಹೇಗಿದ್ದೀರಿ?"]}}
 class VisualQueryRequest(BaseModel):
+    query: str = Field(..., description="Text query")
+    src_lang: str = Field(..., description="Source language code")
+    tgt_lang: str = Field(..., description="Target language code")
     class Config:
         schema_extra = {
             "example": {
+                "query": "Describe the image",
+                "src_lang": "kan_Knda",
+                "tgt_lang": "kan_Knda"
             }
         }
 class ExternalTTSService(TTSService):
     async def generate_speech(self, payload: dict) -> requests.Response:
         try:
+            base_url = "http://example.com/v1/audio/speech"  # Placeholder URL
             return requests.post(
                 base_url,
                 json=payload,
          tags=["Utility"],
          response_model=dict)
 async def health_check():
+    return {"status": "healthy", "model": "llm_model_name"}  # Placeholder model name
 @app.get("/",
          summary="Redirect to Docs",
 async def home():
     return RedirectResponse(url="/docs")
 @app.post("/v1/audio/speech",
           summary="Generate Speech from Text",
+          description="Convert text to speech using an external TTS service.",
           tags=["Audio"],
           responses={
               200: {"description": "Audio stream", "content": {"audio/mp3": {"example": "Binary audio data"}}},
               400: {"description": "Invalid or empty input"},
               502: {"description": "External TTS service unavailable"},
               504: {"description": "TTS service timeout"}
           })
 async def generate_audio(
     request: Request,
+    input: str = Query(..., description="Text to convert to speech (max 1000 characters)"),
     response_format: str = Query("mp3", description="Audio format (ignored, defaults to mp3 for external API)"),
     tts_service: TTSService = Depends(get_tts_service)
 ):
+    if not input.strip():
         raise HTTPException(status_code=400, detail="Input cannot be empty")
+    if len(input) > 1000:
+        raise HTTPException(status_code=400, detail="Input cannot exceed 1000 characters")
     logger.info("Processing speech request", extra={
         "endpoint": "/v1/audio/speech",
+        "input_length": len(input),
+        "client_ip": request.client.host
     })
+    payload = {"text": input}
     try:
         response = await tts_service.generate_speech(payload)
 @app.post("/v1/chat",
           response_model=ChatResponse,
           summary="Chat with AI",
+          description="Generate a chat response from a prompt and language code.",
           tags=["Chat"],
           responses={
               200: {"description": "Chat response", "model": ChatResponse},
+              400: {"description": "Invalid prompt or language code"},
               504: {"description": "Chat service timeout"}
           })
 async def chat(
     request: Request,
+    chat_request: ChatRequest
 ):
+    if not chat_request.prompt:
         raise HTTPException(status_code=400, detail="Prompt cannot be empty")
+    if len(chat_request.prompt) > 1000:
+        raise HTTPException(status_code=400, detail="Prompt cannot exceed 1000 characters")
+    logger.info(f"Received prompt: {chat_request.prompt}, src_lang: {chat_request.src_lang}")
     try:
+        external_url = "http://example.com/v1/chat"  # Placeholder URL
         payload = {
+            "prompt": chat_request.prompt,
+            "src_lang": chat_request.src_lang,
+            "tgt_lang": chat_request.tgt_lang
         }
         response = requests.post(
 @app.post("/v1/transcribe/",
           response_model=TranscriptionResponse,
           summary="Transcribe Audio File",
+          description="Transcribe an audio file into text in the specified language.",
           tags=["Audio"],
           responses={
               200: {"description": "Transcription result", "model": TranscriptionResponse},
+              400: {"description": "Invalid audio or language"},
               504: {"description": "Transcription service timeout"}
           })
 async def transcribe_audio(
+    file: UploadFile = File(..., description="Audio file to transcribe"),
+    language: str = Query(..., description="Language of the audio (kannada, hindi, tamil)")
 ):
     # Validate language
     allowed_languages = ["kannada", "hindi", "tamil"]
+    if language not in allowed_languages:
         raise HTTPException(status_code=400, detail=f"Language must be one of {allowed_languages}")
     start_time = time()
     try:
+        file_content = await file.read()
         files = {"file": (file.filename, file_content, file.content_type)}
+        external_url = f"http://example.com/v1/transcribe/?language={language}"  # Placeholder URL
         response = requests.post(
             external_url,
             files=files,
         logger.info(f"Transcription completed in {time() - start_time:.2f} seconds")
         return TranscriptionResponse(text=transcription)
     except requests.Timeout:
         logger.error("Transcription service timed out")
         raise HTTPException(status_code=504, detail="Transcription service timeout")
 @app.post("/v1/translate",
           response_model=TranslationResponse,
           summary="Translate Text",
+          description="Translate a list of sentences from a source to a target language.",
           tags=["Translation"],
           responses={
               200: {"description": "Translation result", "model": TranslationResponse},
+              400: {"description": "Invalid sentences or languages"},
               500: {"description": "Translation service error"},
               504: {"description": "Translation service timeout"}
           })
 async def translate(
+    request: TranslationRequest
 ):
+    # Validate inputs
+    if not request.sentences:
+        raise HTTPException(status_code=400, detail="Sentences cannot be empty")
     # Validate language codes
     supported_languages = [
         "eng_Latn", "hin_Deva", "kan_Knda", "tam_Taml", "mal_Mlym", "tel_Telu",
         "deu_Latn", "fra_Latn", "nld_Latn", "spa_Latn", "ita_Latn", "por_Latn",
         "rus_Cyrl", "pol_Latn"
     ]
+    if request.src_lang not in supported_languages or request.tgt_lang not in supported_languages:
+        raise HTTPException(status_code=400, detail=f"Unsupported language codes: src={request.src_lang}, tgt={request.tgt_lang}")
+    logger.info(f"Received translation request: {len(request.sentences)} sentences, src_lang: {request.src_lang}, tgt_lang: {request.tgt_lang}")
+    external_url = "http://example.com/v1/translate"  # Placeholder URL
     payload = {
+        "sentences": request.sentences,
+        "src_lang": request.src_lang,
+        "tgt_lang": request.tgt_lang
     }
     try:
         response_data = response.json()
         translations = response_data.get("translations", [])
+        if not translations or len(translations) != len(request.sentences):
             logger.warning(f"Unexpected response format: {response_data}")
             raise HTTPException(status_code=500, detail="Invalid response from translation service")
 @app.post("/v1/extract-text",
           response_model=PDFTextExtractionResponse,
           summary="Extract Text from PDF",
+          description="Extract text from a specified page of a PDF file by calling an external API.",
           tags=["PDF"],
           responses={
               200: {"description": "Extracted text", "model": PDFTextExtractionResponse},
+              400: {"description": "Invalid PDF or page number"},
               500: {"description": "External API error"},
               504: {"description": "External API timeout"}
           })
 async def extract_text(
     request: Request,
+    file: UploadFile = File(..., description="PDF file to extract text from"),
     page_number: int = Query(1, description="Page number to extract text from (1-based indexing)"),
+    language: str = Query(..., description="Language of the PDF content (kannada, hindi, tamil)")
 ):
     # Validate page number
     if page_number < 1:
         raise HTTPException(status_code=400, detail="Page number must be at least 1")
     logger.info("Processing PDF text extraction request", extra={
         "endpoint": "/v1/extract-text",
         "file_name": file.filename,
         "page_number": page_number,
+        "language": language,
+        "client_ip": request.client.host
     })
     start_time = time()
     try:
+        file_content = await file.read()
+        files = {"file": (file.filename, file_content, file.content_type)}
+        external_url = f"http://example.com/extract-text/?page_number={page_number}&language={language}"  # Placeholder URL
         response = requests.post(
             external_url,
             files=files,
 @app.post("/v1/visual_query",
           response_model=VisualQueryResponse,
           summary="Visual Query with Image",
+          description="Process a visual query with a text query, image, and language codes provided in a JSON body named 'data'.",
           tags=["Chat"],
           responses={
               200: {"description": "Query response", "model": VisualQueryResponse},
+              400: {"description": "Invalid query or language codes"},
               422: {"description": "Validation error in request body"},
               504: {"description": "Visual query service timeout"}
           })
 async def visual_query(
     request: Request,
+    data: str = Form(..., description="JSON string containing query, src_lang, and tgt_lang"),
+    file: UploadFile = File(..., description="Image file to analyze")
 ):
     # Parse and validate JSON data
     try:
         import json
         logger.error(f"Failed to parse JSON data: {str(e)}")
         raise HTTPException(status_code=422, detail=f"Invalid JSON data: {str(e)}")
+    if not visual_query_request.query.strip():
         raise HTTPException(status_code=400, detail="Query cannot be empty")
+    if len(visual_query_request.query) > 1000:
+        raise HTTPException(status_code=400, detail="Query cannot exceed 1000 characters")
     logger.info("Processing visual query request", extra={
         "endpoint": "/v1/visual_query",
+        "query_length": len(visual_query_request.query),
         "file_name": file.filename,
+        "client_ip": request.client.host,
+        "src_lang": visual_query_request.src_lang,
+        "tgt_lang": visual_query_request.tgt_lang
     })
+    external_url = f"http://example.com/v1/visual_query/?src_lang={visual_query_request.src_lang}&tgt_lang={visual_query_request.tgt_lang}"  # Placeholder URL
     try:
+        file_content = await file.read()
+        files = {"file": (file.filename, file_content, file.content_type)}
+        data = {"query": visual_query_request.query}
         response = requests.post(
             external_url,
 @app.post("/v1/speech_to_speech",
           summary="Speech-to-Speech Conversion",
+          description="Convert input speech to processed speech in the specified language by calling an external speech-to-speech API.",
           tags=["Audio"],
           responses={
               200: {"description": "Audio stream", "content": {"audio/mp3": {"example": "Binary audio data"}}},
+              400: {"description": "Invalid input or language"},
               504: {"description": "External API timeout"},
               500: {"description": "External API error"}
           })
 async def speech_to_speech(
     request: Request,
+    file: UploadFile = File(..., description="Audio file to process"),
+    language: str = Query(..., description="Language of the audio (kannada, hindi, tamil)")
 ) -> StreamingResponse:
     # Validate language
     allowed_languages = [lang.value for lang in SupportedLanguage]
+    if language not in allowed_languages:
         raise HTTPException(status_code=400, detail=f"Language must be one of {allowed_languages}")
     logger.info("Processing speech-to-speech request", extra={
         "endpoint": "/v1/speech_to_speech",
         "audio_filename": file.filename,
+        "language": language,
+        "client_ip": request.client.host
     })
     try:
+        file_content = await file.read()
         files = {"file": (file.filename, file_content, file.content_type)}
+        external_url = f"http://example.com/v1/speech_to_speech?language={language}"  # Placeholder URL
         response = requests.post(
             external_url,
         )
     except requests.Timeout:
+        logger.error("External speech-to-speech API timed out")
         raise HTTPException(status_code=504, detail="External API timeout")
     except requests.RequestException as e:
+        logger.error(f"External speech-to-speech API error: {str(e)}")
         raise HTTPException(status_code=500, detail=f"External API error: {str(e)}")
 if __name__ == "__main__":
     parser = argparse.ArgumentParser(description="Run the FastAPI server.")
+    parser.add_argument("--port", type=int, default=8000, help="Port to run the server on.")
+    parser.add_argument("--host", type=str, default="0.0.0.0", help="Host to run the server on.")
     args = parser.parse_args()
     uvicorn.run(app, host=args.host, port=args.port)