Spaces:

Oxbridge-Economics
/

Mailbox

Running

gavinzli commited on Mar 31

Commit

7097576

1 Parent(s): 5a42f57

Refactor Dockerfile to create cache directory and update DocRetriever to filter by user_id

Files changed (2) hide show

Dockerfile CHANGED Viewed

@@ -8,9 +8,7 @@ COPY . .
 WORKDIR /app
 # Create a cache directory and set permissions
-# RUN chmod -R 777 /app
 RUN mkdir -p /app/cache && chmod -R 777 /app/cache
-# RUN mkdir -p /app/nltk_data && chmod -R 777 /app/nltk_data
 # Install requirements.txt
 RUN pip install --no-cache-dir --upgrade -r requirements.txt

 WORKDIR /app
 # Create a cache directory and set permissions
 RUN mkdir -p /app/cache && chmod -R 777 /app/cache
 # Install requirements.txt
 RUN pip install --no-cache-dir --upgrade -r requirements.txt

app/retriever/__init__.py CHANGED Viewed

@@ -26,16 +26,14 @@ class DocRetriever(BaseRetriever):
     def __init__(self, req, k: int = 10) -> None:
         super().__init__()
-        # _filter={}
-        # if req.site != []:
-        #     _filter.update({"site": {"$in": req.site}})
-        # if req.id != []:
-        #     _filter.update({"id": {"$in": req.id}})
         self.retriever = vectorstore.as_retriever(
             search_type='similarity',
             search_kwargs={
                 "k": k,
-                # "filter": _filter,
                 # "score_threshold": .1
             }
         )
@@ -44,6 +42,7 @@ class DocRetriever(BaseRetriever):
         try:
             retrieved_docs = self.retriever.invoke(query)
             # doc_lst = []
             for doc in retrieved_docs:
                 doc.metadata['id'] = doc.id
                 # date = str(doc.metadata['publishDate'])

     def __init__(self, req, k: int = 10) -> None:
         super().__init__()
+        _filter={}
+        _filter.update({"user_id": req.user_id})
+        print(_filter)
         self.retriever = vectorstore.as_retriever(
             search_type='similarity',
             search_kwargs={
                 "k": k,
+                "filter": _filter,
                 # "score_threshold": .1
             }
         )
         try:
             retrieved_docs = self.retriever.invoke(query)
             # doc_lst = []
+            print(retrieved_docs)
             for doc in retrieved_docs:
                 doc.metadata['id'] = doc.id
                 # date = str(doc.metadata['publishDate'])