documentaitestv3

Sleeping

App Files Files Community

IAMTFRMZA commited on Apr 17

Commit

f310bae

verified ·

1 Parent(s): c9731af

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -11

app.py CHANGED Viewed

@@ -17,7 +17,6 @@ HEADERS = {"Authorization": f"Bearer {OPENAI_API_KEY}", "OpenAI-Beta": "realtime
 WS_URI = "wss://api.openai.com/v1/realtime?intent=transcription"
 connections = {}
-# WebSocket Client
 class WebSocketClient:
     def __init__(self, uri, headers, client_id):
         self.uri = uri
@@ -70,7 +69,6 @@ class WebSocketClient:
             if data["type"] == "conversation.item.input_audio_transcription.delta":
                 self.transcript += data["delta"]
-# Connection manager
 def create_ws():
     cid = str(uuid.uuid4())
     client = WebSocketClient(WS_URI, HEADERS, cid)
@@ -139,6 +137,12 @@ def clear_chat_and_transcript(client_id):
         connections[client_id].transcript = ""
     return [], "", None, None
 # UI
 with gr.Blocks(theme=gr.themes.Soft()) as app:
     gr.Markdown("# 📄 Document AI Assistant")
@@ -150,23 +154,24 @@ with gr.Blocks(theme=gr.themes.Soft()) as app:
         padding: 12px 28px !important;
         border-radius: 6px;
         margin-top: 10px;
-        background-color: #f2f2f2 !important;
-        color: #000 !important;
-        white-space: nowrap;
-        overflow: hidden;
-        text-overflow: ellipsis;
     }
     button {
         margin-right: 8px;
     }
-    /* Hide icon (optional) */
     #record-audio button svg {
         margin-right: 6px;
     }
-    /* Hide internal label if redundant */
     #record-audio label {
         display: none;
     }
@@ -197,11 +202,11 @@ with gr.Blocks(theme=gr.themes.Soft()) as app:
                     ask_btn = gr.Button("🟢 Ask", elem_id="ask-btn")
                     clear_chat_btn = gr.Button("🧹 Clear Chat", elem_id="clear-chat-btn")
-    # Bindings
     send_btn.click(fn=handle_chat,
                    inputs=[user_prompt, chat_state, thread_state, image_state],
                    outputs=[user_prompt, chat, thread_state, image_state])
-    image_state.change(fn=lambda x: x, inputs=image_state, outputs=image_display)
     voice_input.stream(fn=send_audio, inputs=[voice_input, client_id], outputs=voice_transcript, stream_every=0.5)
     ask_btn.click(fn=send_transcript_to_assistant,

 WS_URI = "wss://api.openai.com/v1/realtime?intent=transcription"
 connections = {}
 class WebSocketClient:
     def __init__(self, uri, headers, client_id):
         self.uri = uri
             if data["type"] == "conversation.item.input_audio_transcription.delta":
                 self.transcript += data["delta"]
 def create_ws():
     cid = str(uuid.uuid4())
     client = WebSocketClient(WS_URI, HEADERS, cid)
         connections[client_id].transcript = ""
     return [], "", None, None
+# Fix image viewer fallback
+def update_image_display(image_url):
+    if image_url and isinstance(image_url, str) and image_url.startswith("http"):
+        return image_url
+    return None
 # UI
 with gr.Blocks(theme=gr.themes.Soft()) as app:
     gr.Markdown("# 📄 Document AI Assistant")
         padding: 12px 28px !important;
         border-radius: 6px;
         margin-top: 10px;
+        background-color: #4b5563 !important;
+        color: white !important;
+        border: 1px solid #9ca3af !important;
+    }
+    #ask-btn:hover, #clear-chat-btn:hover, #record-audio button:hover {
+        background-color: #6b7280 !important;
+        color: #fff !important;
     }
     button {
         margin-right: 8px;
     }
     #record-audio button svg {
         margin-right: 6px;
     }
     #record-audio label {
         display: none;
     }
                     ask_btn = gr.Button("🟢 Ask", elem_id="ask-btn")
                     clear_chat_btn = gr.Button("🧹 Clear Chat", elem_id="clear-chat-btn")
+    # Functional bindings
     send_btn.click(fn=handle_chat,
                    inputs=[user_prompt, chat_state, thread_state, image_state],
                    outputs=[user_prompt, chat, thread_state, image_state])
+    image_state.change(fn=update_image_display, inputs=image_state, outputs=image_display)
     voice_input.stream(fn=send_audio, inputs=[voice_input, client_id], outputs=voice_transcript, stream_every=0.5)
     ask_btn.click(fn=send_transcript_to_assistant,