merve HF Staff commited on
Commit
dca24c8
·
1 Parent(s): 2ea44ac

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +6 -0
README.md CHANGED
@@ -22,6 +22,12 @@ Bu model pipeline'da openAI davinci'nin yükünü hafifletiyor.
22
  Benchmark'ları şu dataset'te görebilirsiniz: <a href="https://huggingface.co/datasets/deprem-ml/butun_model_benchmarklari">deprem-ml/butun_model_benchmarklari</a> <br>
23
  Benchmark ettiğimiz notebook'u <a href="https://colab.research.google.com/drive/1NxQe-EPjF0Sckf54ZqOKkDP7HlpBkk8P?usp=sharing">burada</a> bulabilirsiniz.
24
  </p>
 
 
 
 
 
 
25
  <h2>OCR</h2>
26
  <p> OCR için easyocr kullandık. Space OCR'ın çıktısını davinci'ye veriyor, sonraki adımda NER'i swap edeceğiz. Bu Space'i iki türlü kullanabilirsiniz:<br>
27
  - GUI olarak kullanıp metin içeren screenshot ya da metnin kendisini verip input'un DB'ye düşmesini sağlayabilirsiniz.<br>
 
22
  Benchmark'ları şu dataset'te görebilirsiniz: <a href="https://huggingface.co/datasets/deprem-ml/butun_model_benchmarklari">deprem-ml/butun_model_benchmarklari</a> <br>
23
  Benchmark ettiğimiz notebook'u <a href="https://colab.research.google.com/drive/1NxQe-EPjF0Sckf54ZqOKkDP7HlpBkk8P?usp=sharing">burada</a> bulabilirsiniz.
24
  </p>
25
+ <h2> Intent Classification </h2>
26
+ <p>
27
+ - Pipeline'da zero-shot Türkçe metin sınıflandırma kullanıyoruz: emrecan/convbert-base-turkish-mc4-cased-allnli_tr
28
+ <br>
29
+ - Candidate label'ları belirlemek için clustering modeli eğitildi, embedding'ler <a href="https://huggingface.co/deprem-ml/distilroberta-tweet-clustering-embeddings">burada</a><br>.
30
+ </p>
31
  <h2>OCR</h2>
32
  <p> OCR için easyocr kullandık. Space OCR'ın çıktısını davinci'ye veriyor, sonraki adımda NER'i swap edeceğiz. Bu Space'i iki türlü kullanabilirsiniz:<br>
33
  - GUI olarak kullanıp metin içeren screenshot ya da metnin kendisini verip input'un DB'ye düşmesini sağlayabilirsiniz.<br>