Spaces:

Yerzhxn
/

Course_Recommendation

Sleeping

App Files Files Community

Yerzhxn commited on Nov 29, 2024

Commit

17278fa

verified ·

1 Parent(s): 475e44d

Update app.py

Browse files

Files changed (1) hide show

app.py +40 -49

app.py CHANGED Viewed

@@ -1,52 +1,43 @@
-import torch
-import torch.nn.functional as F
-import streamlit as st
-from transformers import BertTokenizer, BertForSequenceClassification
 import joblib
-# Загрузка модели, токенизатора и label_encoder
-model = torch.load("logistic_regression_model.pkl", map_location=torch.device('cpu'))
-tokenizer = joblib.load("tfidf_vectorizer.pkl")
-def predict_class_with_probabilities(text, model, tokenizer, max_len=128):
-    model.eval()
-    encodings = tokenizer(
-        text,
-        truncation=True,
-        padding="max_length",
-        max_length=max_len,
-        return_tensors="pt"
-    )
-    with torch.no_grad():
-        outputs = model(**encodings)
-        logits = outputs.logits
-        probabilities = F.softmax(logits, dim=1).squeeze().cpu().numpy()
-        predicted_class = torch.argmax(logits, dim=1).item()
-        predicted_label = str(predicted_class)
-    return predicted_label, probabilities
-def main():
-    st.title("Text Classification App with Hugging Face Space")
-    st.write("Введите текст, чтобы получить предсказание и вероятности классов.")
-    input_text = st.text_input("Введите текст для классификации:")
-    if st.button("Предсказать"):
-        if input_text:
-            predicted_class, probabilities = predict_class_with_probabilities(input_text, model, tokenizer, label_encoder)
-            st.write(f"**Предсказанный класс:** {predicted_class}")
-            st.write("**Вероятности для каждого класса:**")
-            for idx, prob in enumerate(probabilities):
-                class_label = str(idx)
-                st.write(f"{class_label}: {prob:.4f}")
         else:
-            st.write("Пожалуйста, введите текст для предсказания.")
-if __name__ == "__main__":
-    main()

 import joblib
+import streamlit as st
+import pandas as pd
+import torch
+# Загрузка модели и векторизатора
+model = joblib.load('bert_model.pkl')
+vectorizer = joblib.load('bert_tokenizer.pkl')
+# Загрузка данных
+data = pd.read_excel('DATA_new.xlsx')
+# Функция для предсказания кода профессии
+def predict_profession_code(profession_name):
+    profession_vector = vectorizer.transform([profession_name])
+    predicted_code = model.predict(profession_vector)[0]
+    return predicted_code
+# Функция для поиска подходящих курсов по предсказанному коду
+def get_matching_courses(predicted_code):
+    matching_courses = data[data['NKZ'] == predicted_code]['Course Title'].drop_duplicates().tolist()
+    return matching_courses[:10]
+# Streamlit интерфейс
+st.title("Поиск курсов по навыкам")
+st.write("Введите навык")
+profession_name = st.text_input("Название навыка")
+if st.button("Найти курсы"):
+    if profession_name:
+        predicted_code = predict_profession_code(profession_name)
+        st.success(f"Предсказанный код профессии '{profession_name}': {predicted_code}")
+        matching_courses = get_matching_courses(predicted_code)
+        if matching_courses:
+            st.write("Подходящие курсы:")
+            for course in matching_courses:
+                st.write(f"- {course}")
         else:
+            st.write("Нет подходящих курсов для данного навыка.")
+    else:
+        st.error("Пожалуйста, введите название профессии.")