Spaces:

nlpblogs
/

artificial-intelligence-resume-analysis-app1

Running

nlpblogs commited on 22 days ago

Commit

36fcfae

verified ·

1 Parent(s): 712f786

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -40,22 +40,16 @@ for uploaded_file in uploaded_files:
         data = pd.Series(text_data, name = 'Text')
         st.dataframe(data)
         frames = [job, data]
-        result = pd.concat(frames)
         st.dataframe(result)
-import re
-def preprocess_text(text):
-    text = text.lower()  # Lowercase text
-    text = re.sub(f"[{re.escape(string.punctuation)}]", "", text)  # Remove punctuation
-    text = " ".join(text.split())  # Remove extra spaces, tabs, and new lines
-    return text
-result['Text']= result['Text'].map(preprocess_text)
-st.dataframe(result['Text'])
 vectorizer = TfidfVectorizer()
-tfidf_matrix = vectorizer.fit_transform(result['Text'])
 tfidf_df = pd.DataFrame(tfidf_matrix.toarray(), columns=vectorizer.get_feature_names_out())
 st.subheader("TF-IDF Values:")

         data = pd.Series(text_data, name = 'Text')
         st.dataframe(data)
         frames = [job, data]
+        result1 = pd.concat(frames)
+        st.dataframe(result1)
+        result = result1['Text'].drop_duplicates().to_list()
         st.dataframe(result)
 vectorizer = TfidfVectorizer()
+tfidf_matrix = vectorizer.fit_transform(result)
 tfidf_df = pd.DataFrame(tfidf_matrix.toarray(), columns=vectorizer.get_feature_names_out())
 st.subheader("TF-IDF Values:")