Spaces:

Circhastic
/

Code-Readability-Classifier

Sleeping

Circhastic commited on Mar 10

Commit

9fd42b6

1 Parent(s): fe0e2ec

aaaa

Files changed (2) hide show

app.py CHANGED Viewed

@@ -3,17 +3,18 @@ import numpy as np
 import tensorflow as tf
 import re
 from tree_sitter import Language, Parser
-import tree_sitter_languages  # Pre-built parsers for multiple languages
 from tokenizers import Tokenizer
 from tensorflow.keras.preprocessing.sequence import pad_sequences
 tokenizer = Tokenizer.from_file("syntax_bpe_tokenizer.json")  # New BPE tokenizer
 model = tf.keras.models.load_model("crv3.keras")  # CNN model
 parser = Parser()
 parser.set_language(tree_sitter_languages.get_language("java"))
 def syntax_aware_tokenize(code):
     """Tokenizes Java code using Tree-Sitter (AST-based)."""
     tree = parser.parse(bytes(code, "utf8"))

 import tensorflow as tf
 import re
 from tree_sitter import Language, Parser
+# import tree_sitter_languages  # Pre-built parsers for multiple languages
 from tokenizers import Tokenizer
 from tensorflow.keras.preprocessing.sequence import pad_sequences
 tokenizer = Tokenizer.from_file("syntax_bpe_tokenizer.json")  # New BPE tokenizer
 model = tf.keras.models.load_model("crv3.keras")  # CNN model
 parser = Parser()
 parser.set_language(tree_sitter_languages.get_language("java"))
+PY_LANGUAGE = Language(tspython.language())
 def syntax_aware_tokenize(code):
     """Tokenizes Java code using Tree-Sitter (AST-based)."""
     tree = parser.parse(bytes(code, "utf8"))

requirements.txt CHANGED Viewed

@@ -1,5 +1,5 @@
 gradio
 tensorflow
 tokenizers
-tree_sitter
 tree_sitter_languages==1.10.2

 gradio
 tensorflow
 tokenizers
+tree_sitter==0.21.3
 tree_sitter_languages==1.10.2