chatfinanz

Running on CPU Upgrade

App Files Files Community

dxdcx commited on 18 days ago

Commit

be9b7c8

verified ·

1 Parent(s): c5c8d37

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -12

app.py CHANGED Viewed

@@ -2,6 +2,7 @@
 import os
 import re
 import tempfile
 from collections.abc import Iterator
 from threading import Thread
@@ -149,9 +150,11 @@ def process_video(video_path: str) -> list[dict]:
 def encode_image_to_base64(image_path):
-    import base64
     with open(image_path, "rb") as image_file:
-        return base64.b64encode(image_file.read()).decode('utf-8')
 def process_interleaved_images(message: dict) -> list:
@@ -163,24 +166,21 @@ def process_interleaved_images(message: dict) -> list:
     for part in parts:
         if part == "<image>":
-            # If we have accumulated text, add it first
             if current_text.strip():
                 final_content.append({"type": "text", "text": current_text.strip()})
                 current_text = ""
-            # Add the image
             final_content.append({
                 "type": "image_url",
-                "image_url": {"url": f"file://{message['files'][image_index]}"}
             })
             image_index += 1
         else:
             current_text += part
-    # Add any remaining text
     if current_text.strip():
         final_content.append({"type": "text", "text": current_text.strip()})
     return final_content
@@ -189,27 +189,53 @@ def process_new_user_message(message: dict):
         return [{"role": "user", "content": message["text"]}]
     if message["files"][0].endswith(".mp4"):
-        # For video, return text message followed by frame messages
         text_message = {"role": "user", "content": message["text"]}
         video_messages = process_video(message["files"][0])
         return [text_message] + video_messages
     if "<image>" in message["text"]:
-        # For interleaved text and images
         content = process_interleaved_images(message)
         return [{"role": "user", "content": content}]
     # For text with images appended
     content = [{"type": "text", "text": message["text"]}]
     for path in message["files"]:
         content.append({
             "type": "image_url",
-            "image_url": {"url": f"file://{path}"}
         })
     return [{"role": "user", "content": content}]
 def process_history(history: list[dict]) -> list[dict]:
     messages = []

 import os
 import re
+import base64
 import tempfile
 from collections.abc import Iterator
 from threading import Thread
 def encode_image_to_base64(image_path):
+    import mimetypes
+    mime_type, _ = mimetypes.guess_type(image_path)
     with open(image_path, "rb") as image_file:
+        encoded = base64.b64encode(image_file.read()).decode("utf-8")
+    return f"data:{mime_type};base64,{encoded}"
 def process_interleaved_images(message: dict) -> list:
     for part in parts:
         if part == "<image>":
             if current_text.strip():
                 final_content.append({"type": "text", "text": current_text.strip()})
                 current_text = ""
+            encoded_image = encode_image_to_base64(message["files"][image_index])
             final_content.append({
                 "type": "image_url",
+                "image_url": {"url": encoded_image}
             })
             image_index += 1
         else:
             current_text += part
     if current_text.strip():
         final_content.append({"type": "text", "text": current_text.strip()})
     return final_content
         return [{"role": "user", "content": message["text"]}]
     if message["files"][0].endswith(".mp4"):
         text_message = {"role": "user", "content": message["text"]}
         video_messages = process_video(message["files"][0])
         return [text_message] + video_messages
     if "<image>" in message["text"]:
         content = process_interleaved_images(message)
         return [{"role": "user", "content": content}]
     # For text with images appended
     content = [{"type": "text", "text": message["text"]}]
     for path in message["files"]:
+        encoded_image = encode_image_to_base64(path)
         content.append({
             "type": "image_url",
+            "image_url": {"url": encoded_image}
         })
     return [{"role": "user", "content": content}]
+def process_history(history: list[dict]) -> list[dict]:
+    messages = []
+    for item in history:
+        if item["role"] == "assistant":
+            messages.append({"role": "assistant", "content": item["content"]})
+        else:
+            content = item["content"]
+            if isinstance(content, str):
+                messages.append({"role": "user", "content": content})
+            else:
+                # Assume content[0] is a file path
+                encoded_image = encode_image_to_base64(content[0])
+                messages.append({
+                    "role": "user",
+                    "content": [
+                        {
+                            "type": "image_url",
+                            "image_url": {"url": encoded_image}
+                        }
+                    ]
+                })
+    return messages
 def process_history(history: list[dict]) -> list[dict]:
     messages = []