Update README.md
Browse files
README.md
CHANGED
@@ -22,6 +22,12 @@ Bu model pipeline'da openAI davinci'nin yükünü hafifletiyor.
|
|
22 |
Benchmark'ları şu dataset'te görebilirsiniz: <a href="https://huggingface.co/datasets/deprem-ml/butun_model_benchmarklari">deprem-ml/butun_model_benchmarklari</a> <br>
|
23 |
Benchmark ettiğimiz notebook'u <a href="https://colab.research.google.com/drive/1NxQe-EPjF0Sckf54ZqOKkDP7HlpBkk8P?usp=sharing">burada</a> bulabilirsiniz.
|
24 |
</p>
|
|
|
|
|
|
|
|
|
|
|
|
|
25 |
<h2>OCR</h2>
|
26 |
<p> OCR için easyocr kullandık. Space OCR'ın çıktısını davinci'ye veriyor, sonraki adımda NER'i swap edeceğiz. Bu Space'i iki türlü kullanabilirsiniz:<br>
|
27 |
- GUI olarak kullanıp metin içeren screenshot ya da metnin kendisini verip input'un DB'ye düşmesini sağlayabilirsiniz.<br>
|
|
|
22 |
Benchmark'ları şu dataset'te görebilirsiniz: <a href="https://huggingface.co/datasets/deprem-ml/butun_model_benchmarklari">deprem-ml/butun_model_benchmarklari</a> <br>
|
23 |
Benchmark ettiğimiz notebook'u <a href="https://colab.research.google.com/drive/1NxQe-EPjF0Sckf54ZqOKkDP7HlpBkk8P?usp=sharing">burada</a> bulabilirsiniz.
|
24 |
</p>
|
25 |
+
<h2> Intent Classification </h2>
|
26 |
+
<p>
|
27 |
+
- Pipeline'da zero-shot Türkçe metin sınıflandırma kullanıyoruz: emrecan/convbert-base-turkish-mc4-cased-allnli_tr
|
28 |
+
<br>
|
29 |
+
- Candidate label'ları belirlemek için clustering modeli eğitildi, embedding'ler <a href="https://huggingface.co/deprem-ml/distilroberta-tweet-clustering-embeddings">burada</a><br>.
|
30 |
+
</p>
|
31 |
<h2>OCR</h2>
|
32 |
<p> OCR için easyocr kullandık. Space OCR'ın çıktısını davinci'ye veriyor, sonraki adımda NER'i swap edeceğiz. Bu Space'i iki türlü kullanabilirsiniz:<br>
|
33 |
- GUI olarak kullanıp metin içeren screenshot ya da metnin kendisini verip input'un DB'ye düşmesini sağlayabilirsiniz.<br>
|