Spaces:

dongsheng
/

docker_test

Sleeping

App Files Files Community

朱东升 commited on Mar 20

Commit

1046fcc

1 Parent(s): 254fe03

update38

Browse files

Files changed (2) hide show

app.py +158 -278
requirements.txt +1 -2

app.py CHANGED Viewed

@@ -13,8 +13,6 @@ import uuid
 import numpy as np
 from datetime import datetime
 from tqdm.auto import tqdm
-import redis
-import pickle
 from src.containerized_eval import eval_string_script
 # Add current directory and src directory to module search path
@@ -25,80 +23,29 @@ if current_dir not in sys.path:
 if src_dir not in sys.path:
     sys.path.append(src_dir)
-# Initialize Redis connection (will use environment variables in Hugging Face Space)
-REDIS_URL = os.environ.get('REDIS_URL', 'redis://localhost:6379/0')
-redis_client = redis.from_url(REDIS_URL)
-# Keys for Redis
-QUEUE_KEY = 'eval_task_queue'
-STATUS_KEY = 'eval_task_status'
-HISTORY_KEY = 'eval_task_history'
-TASK_TIMES_KEY = 'eval_task_times'
-# Local queue for worker threads
-local_task_queue = queue.Queue()
 # Lock for shared resources
 lock = threading.Lock()
 # Number of worker threads
 worker_threads = max(1, multiprocessing.cpu_count() // 2)  # Using half the available cores for better stability
 # Flag for running background threads
 running = True
-def redis_queue_monitor():
-    """Monitor Redis queue and add tasks to local queue"""
-    last_check = 0
-    while running:
-        try:
-            # Check Redis queue every second
-            if time.time() - last_check >= 1:
-                last_check = time.time()
-                # Get all tasks in the queue
-                task_list = redis_client.lrange(QUEUE_KEY, 0, -1)
-                for task_data in task_list:
-                    task = pickle.loads(task_data)
-                    task_id = task['id']
-                    # Check if task is already in processing
-                    status_data = redis_client.hget(STATUS_KEY, task_id)
-                    if status_data:
-                        status = pickle.loads(status_data)
-                        if status['status'] == 'queued':
-                            # Add to local queue if not already processing
-                            local_task_queue.put((task_id, task['input_data'], task['request_time']))
-                            # Update status to processing
-                            with lock:
-                                status['status'] = 'processing'
-                                status['start_time'] = time.time()
-                                redis_client.hset(STATUS_KEY, task_id, pickle.dumps(status))
-                            # Remove from Redis queue
-                            redis_client.lrem(QUEUE_KEY, 1, task_data)
-            time.sleep(0.1)
-        except Exception as e:
-            print(f"Redis queue monitor error: {e}")
-            time.sleep(1)
 def queue_processor():
-    """Process tasks in the local queue"""
     while running:
         try:
-            task_id, input_data, request_time = local_task_queue.get(timeout=0.1)
-            # Get current status
-            status_data = redis_client.hget(STATUS_KEY, task_id)
-            if status_data:
-                task_status = pickle.loads(status_data)
-            else:
-                task_status = {
-                    'status': 'processing',
-                    'queued_time': request_time,
-                    'start_time': time.time()
-                }
-            # Update status
-            task_status['status'] = 'processing'
-            task_status['start_time'] = time.time()
-            redis_client.hset(STATUS_KEY, task_id, pickle.dumps(task_status))
             if isinstance(input_data, list) and len(input_data) > 0:
                 sample_task = input_data[0]
@@ -106,83 +53,56 @@ def queue_processor():
                 task_size = len(input_data)
                 task_complexity = _estimate_task_complexity(input_data)
-                estimated_factors = {
-                    'language': language,
-                    'size': task_size,
-                    'complexity': task_complexity
-                }
-                task_status['estimated_factors'] = estimated_factors
-                redis_client.hset(STATUS_KEY, task_id, pickle.dumps(task_status))
             result = evaluate(input_data)
             end_time = time.time()
-            process_time = end_time - task_status['start_time']
-            # Update status
-            task_status['status'] = 'completed'
-            task_status['result'] = result
-            task_status['end_time'] = end_time
-            task_status['process_time'] = process_time
-            redis_client.hset(STATUS_KEY, task_id, pickle.dumps(task_status))
-            # Update task type times
-            if 'estimated_factors' in task_status:
-                factors = task_status['estimated_factors']
-                key = f"{factors['language']}_{factors['complexity']}"
-                # Update task times in Redis
-                times_data = redis_client.hget(TASK_TIMES_KEY, key)
-                if times_data:
-                    times = pickle.loads(times_data)
-                else:
-                    times = []
-                times.append(process_time / factors['size'])
-                if len(times) > 10:
-                    times = times[-10:]
-                redis_client.hset(TASK_TIMES_KEY, key, pickle.dumps(times))
-            # Add to history
-            history_item = {
-                'task_id': task_id,
-                'request_time': request_time,
-                'process_time': process_time,
-                'status': 'completed',
-                'factors': task_status.get('estimated_factors', {})
-            }
-            # Get current history
-            history_data = redis_client.get(HISTORY_KEY)
-            if history_data:
-                history = pickle.loads(history_data)
-            else:
-                history = []
-            history.append(history_item)
-            while len(history) > 200:
-                history.pop(0)
-            redis_client.set(HISTORY_KEY, pickle.dumps(history))
-            local_task_queue.task_done()
         except queue.Empty:
             continue
         except Exception as e:
             if 'task_id' in locals():
-                status_data = redis_client.hget(STATUS_KEY, task_id)
-                if status_data:
-                    task_status = pickle.loads(status_data)
-                else:
-                    task_status = {}
-                task_status['status'] = 'error'
-                task_status['error'] = str(e)
-                task_status['end_time'] = time.time()
-                redis_client.hset(STATUS_KEY, task_id, pickle.dumps(task_status))
-            local_task_queue.task_done()
 def _estimate_task_complexity(tasks):
     """Estimate task complexity
@@ -313,41 +233,34 @@ def synchronous_evaluate(input_data):
     task_id = str(uuid.uuid4())
     request_time = time.time()
-    task_status = {
-        'status': 'queued',
-        'queued_time': request_time,
-        'queue_position': queue_info['queue_size'] + 1,
-        'synchronous': True,
-        'estimated_factors': {
-            'language': language,
-            'size': task_size,
-            'complexity': task_complexity
-        },
-        'estimated_time': estimated_total_time
-    }
-    redis_client.hset(STATUS_KEY, task_id, pickle.dumps(task_status))
-    # Add to queue
-    task = {
-        'id': task_id,
-        'input_data': input_data,
-        'request_time': request_time
-    }
-    redis_client.rpush(QUEUE_KEY, pickle.dumps(task))
     while True:
-        status_data = redis_client.hget(STATUS_KEY, task_id)
-        if status_data:
-            status_info = pickle.loads(status_data)
-            if status_info['status'] == 'completed':
-                result = status_info.get('result', {"status": "Exception", "error": "No result found"})
-                redis_client.hdel(STATUS_KEY, task_id)
-                return result
-            elif status_info['status'] == 'error':
-                error = status_info.get('error', 'Unknown error')
-                redis_client.hdel(STATUS_KEY, task_id)
-                return {"status": "Exception", "error": error}
         time.sleep(0.1)
@@ -355,11 +268,8 @@ def _get_estimated_time_for_task(language, complexity):
     """Get estimated processing time for a specific task type"""
     key = f"{language}_{complexity}"
-    times_data = redis_client.hget(TASK_TIMES_KEY, key)
-    if times_data:
-        times = pickle.loads(times_data)
-        if times:
-            return np.median(times)
     if complexity == 'simple':
         return 1.0
@@ -386,128 +296,104 @@ def enqueue_task(input_data):
     task_id = str(uuid.uuid4())
     request_time = time.time()
-    queue_info = get_queue_status()
-    task_status = {
-        'status': 'queued',
-        'queued_time': request_time,
-        'queue_position': queue_info['queue_size'] + 1,
-        'estimated_factors': {
-            'language': language,
-            'size': task_size,
-            'complexity': task_complexity
-        },
-        'estimated_time': estimated_total_time
-    }
-    redis_client.hset(STATUS_KEY, task_id, pickle.dumps(task_status))
-    # Add to queue
-    task = {
-        'id': task_id,
-        'input_data': input_data,
-        'request_time': request_time
-    }
-    redis_client.rpush(QUEUE_KEY, pickle.dumps(task))
     est_wait = queue_info['estimated_wait']
     return {
         'task_id': task_id,
         'status': 'queued',
-        'queue_position': task_status['queue_position'],
         'estimated_wait': est_wait,
         'estimated_processing': estimated_total_time
     }
 def check_status(task_id):
     """Check task status"""
-    status_data = redis_client.hget(STATUS_KEY, task_id)
-    if not status_data:
-        return {'status': 'not_found'}
-    status_info = pickle.loads(status_data)
-    if status_info['status'] in ['completed', 'error'] and time.time() - status_info.get('end_time', 0) > 3600:
-        redis_client.hdel(STATUS_KEY, task_id)
-    return status_info
 def get_queue_status():
     """Get queue status"""
-    # Get all task statuses
-    all_statuses = redis_client.hgetall(STATUS_KEY)
-    queued_tasks = []
-    processing_tasks = []
-    for task_id, status_data in all_statuses.items():
-        status_info = pickle.loads(status_data)
-        if status_info['status'] == 'queued':
-            queued_tasks.append(status_info)
-        elif status_info['status'] == 'processing':
-            processing_tasks.append(status_info)
-    queue_size = redis_client.llen(QUEUE_KEY)
-    active_tasks = len(processing_tasks)
-    waiting_tasks = len(queued_tasks)
-    remaining_processing_time = 0
-    for task in processing_tasks:
-        if 'start_time' in task and 'estimated_time' in task:
-            elapsed = time.time() - task['start_time']
-            remaining = max(0, task['estimated_time'] - elapsed)
-            remaining_processing_time += remaining
-        else:
-            remaining_processing_time += 2
-    if active_tasks > 0:
-        remaining_processing_time = remaining_processing_time / min(active_tasks, worker_threads)
-    queued_processing_time = 0
-    for task in queued_tasks:
-        if 'estimated_time' in task:
-            queued_processing_time += task['estimated_time']
-        else:
-            queued_processing_time += 5
-    if worker_threads > 0 and queued_processing_time > 0:
-        queued_processing_time = queued_processing_time / worker_threads
-    estimated_wait = remaining_processing_time + queued_processing_time
-    # Get task history
-    history_data = redis_client.get(HISTORY_KEY)
-    if history_data:
-        task_history = pickle.loads(history_data)
-    else:
-        task_history = []
-    if task_history:
-        prediction_ratios = []
-        for task in task_history:
-            if 'factors' in task and 'estimated_time' in task:
-                prediction_ratios.append(task['process_time'] / task['estimated_time'])
-        if prediction_ratios:
-            correction_factor = np.median(prediction_ratios)
-            correction_factor = max(0.5, min(2.0, correction_factor))
-            estimated_wait *= correction_factor
-    estimated_wait = max(0.1, estimated_wait)
-    if waiting_tasks == 0 and active_tasks == 0:
-        estimated_wait = 0
-    recent_tasks = task_history[-5:] if task_history else []
-    return {
-        'queue_size': queue_size,
-        'active_tasks': active_tasks,
-        'waiting_tasks': waiting_tasks,
-        'worker_threads': worker_threads,
-        'estimated_wait': estimated_wait,
-        'recent_tasks': recent_tasks
-    }
 def format_time(seconds):
     """Format time into readable format"""
@@ -591,12 +477,6 @@ def launch_workers():
     global running
     running = True
-    # Start Redis queue monitor
-    monitor = threading.Thread(target=redis_queue_monitor)
-    monitor.daemon = True
-    monitor.start()
-    # Start worker threads
     for _ in range(worker_threads):
         worker = threading.Thread(target=queue_processor)
         worker.daemon = True

 import numpy as np
 from datetime import datetime
 from tqdm.auto import tqdm
 from src.containerized_eval import eval_string_script
 # Add current directory and src directory to module search path
 if src_dir not in sys.path:
     sys.path.append(src_dir)
+# Create message queue
+task_queue = queue.Queue()
+# Dictionary to store task status
+task_status = {}
+# List to store task history, max 200 tasks
+task_history = []
 # Lock for shared resources
 lock = threading.Lock()
 # Number of worker threads
 worker_threads = max(1, multiprocessing.cpu_count() // 2)  # Using half the available cores for better stability
 # Flag for running background threads
 running = True
+# Mapping from task type to processing time
+task_type_times = {}
 def queue_processor():
+    """Process tasks in the queue"""
     while running:
         try:
+            task_id, input_data, request_time = task_queue.get(timeout=0.1)
+            with lock:
+                task_status[task_id]['status'] = 'processing'
+                task_status[task_id]['start_time'] = time.time()
             if isinstance(input_data, list) and len(input_data) > 0:
                 sample_task = input_data[0]
                 task_size = len(input_data)
                 task_complexity = _estimate_task_complexity(input_data)
+                with lock:
+                    task_status[task_id]['estimated_factors'] = {
+                        'language': language,
+                        'size': task_size,
+                        'complexity': task_complexity
+                    }
             result = evaluate(input_data)
             end_time = time.time()
+            process_time = end_time - task_status[task_id]['start_time']
+            with lock:
+                task_status[task_id]['status'] = 'completed'
+                task_status[task_id]['result'] = result
+                task_status[task_id]['end_time'] = end_time
+                task_status[task_id]['process_time'] = process_time
+                if 'estimated_factors' in task_status[task_id]:
+                    factors = task_status[task_id]['estimated_factors']
+                    key = f"{factors['language']}_{factors['complexity']}"
+                    if key not in task_type_times:
+                        task_type_times[key] = []
+                    task_type_times[key].append(process_time / factors['size'])
+                    if len(task_type_times[key]) > 10:
+                        task_type_times[key] = task_type_times[key][-10:]
+                task_history.append({
+                    'task_id': task_id,
+                    'request_time': request_time,
+                    'process_time': process_time,
+                    'status': 'completed',
+                    'factors': task_status[task_id].get('estimated_factors', {})
+                })
+                while len(task_history) > 200:
+                    task_history.pop(0)
+            task_queue.task_done()
         except queue.Empty:
             continue
         except Exception as e:
             if 'task_id' in locals():
+                with lock:
+                    task_status[task_id]['status'] = 'error'
+                    task_status[task_id]['error'] = str(e)
+                    task_status[task_id]['end_time'] = time.time()
+            task_queue.task_done()
 def _estimate_task_complexity(tasks):
     """Estimate task complexity
     task_id = str(uuid.uuid4())
     request_time = time.time()
+    with lock:
+        task_status[task_id] = {
+            'status': 'queued',
+            'queued_time': request_time,
+            'queue_position': task_queue.qsize() + 1,
+            'synchronous': True,
+            'estimated_factors': {
+                'language': language,
+                'size': task_size,
+                'complexity': task_complexity
+            },
+            'estimated_time': estimated_total_time
+        }
+    task_queue.put((task_id, input_data, request_time))
     while True:
+        with lock:
+            if task_id in task_status:
+                status = task_status[task_id]['status']
+                if status == 'completed':
+                    result = task_status[task_id]['result']
+                    task_status.pop(task_id, None)
+                    return result
+                elif status == 'error':
+                    error = task_status[task_id].get('error', 'Unknown error')
+                    task_status.pop(task_id, None)
+                    return {"status": "Exception", "error": error}
         time.sleep(0.1)
     """Get estimated processing time for a specific task type"""
     key = f"{language}_{complexity}"
+    if key in task_type_times and len(task_type_times[key]) > 0:
+        return np.median(task_type_times[key])
     if complexity == 'simple':
         return 1.0
     task_id = str(uuid.uuid4())
     request_time = time.time()
+    with lock:
+        task_status[task_id] = {
+            'status': 'queued',
+            'queued_time': request_time,
+            'queue_position': task_queue.qsize() + 1,
+            'estimated_factors': {
+                'language': language,
+                'size': task_size,
+                'complexity': task_complexity
+            },
+            'estimated_time': estimated_total_time
+        }
+    queue_info = get_queue_status()
     est_wait = queue_info['estimated_wait']
+    task_queue.put((task_id, input_data, request_time))
     return {
         'task_id': task_id,
         'status': 'queued',
+        'queue_position': task_status[task_id]['queue_position'],
         'estimated_wait': est_wait,
         'estimated_processing': estimated_total_time
     }
 def check_status(task_id):
     """Check task status"""
+    with lock:
+        if task_id not in task_status:
+            return {'status': 'not_found'}
+        status_info = task_status[task_id].copy()
+        if status_info['status'] in ['completed', 'error'] and time.time() - status_info.get('end_time', 0) > 3600:
+            task_status.pop(task_id, None)
+        return status_info
 def get_queue_status():
     """Get queue status"""
+    with lock:
+        queued_tasks = [t for t in task_status.values() if t['status'] == 'queued']
+        processing_tasks = [t for t in task_status.values() if t['status'] == 'processing']
+        queue_size = task_queue.qsize()
+        active_tasks = len(processing_tasks)
+        waiting_tasks = len(queued_tasks)
+        remaining_processing_time = 0
+        for task in processing_tasks:
+            if 'start_time' in task and 'estimated_time' in task:
+                elapsed = time.time() - task['start_time']
+                remaining = max(0, task['estimated_time'] - elapsed)
+                remaining_processing_time += remaining
+            else:
+                remaining_processing_time += 2
+        if active_tasks > 0:
+            remaining_processing_time = remaining_processing_time / min(active_tasks, worker_threads)
+        queued_processing_time = 0
+        for task in queued_tasks:
+            if 'estimated_time' in task:
+                queued_processing_time += task['estimated_time']
+            else:
+                queued_processing_time += 5
+        if worker_threads > 0 and queued_processing_time > 0:
+            queued_processing_time = queued_processing_time / worker_threads
+        estimated_wait = remaining_processing_time + queued_processing_time
+        if task_history:
+            prediction_ratios = []
+            for task in task_history:
+                if 'factors' in task and 'estimated_time' in task:
+                    prediction_ratios.append(task['process_time'] / task['estimated_time'])
+            if prediction_ratios:
+                correction_factor = np.median(prediction_ratios)
+                correction_factor = max(0.5, min(2.0, correction_factor))
+                estimated_wait *= correction_factor
+        estimated_wait = max(0.1, estimated_wait)
+        if waiting_tasks == 0 and active_tasks == 0:
+            estimated_wait = 0
+        recent_tasks = task_history[-5:] if task_history else []
+        return {
+            'queue_size': queue_size,
+            'active_tasks': active_tasks,
+            'waiting_tasks': waiting_tasks,
+            'worker_threads': worker_threads,
+            'estimated_wait': estimated_wait,
+            'recent_tasks': recent_tasks
+        }
 def format_time(seconds):
     """Format time into readable format"""
     global running
     running = True
     for _ in range(worker_threads):
         worker = threading.Thread(target=queue_processor)
         worker.daemon = True

requirements.txt CHANGED Viewed

	@@ -1,2 +1 @@
1	- gradio==4.44.1
2	- redis==5.0.1


1	+ gradio==4.44.1