我发现Qwen2.5-VL-3B-Instruct中它的tokenizer里面的vocabsize是151643,然而在我打印大模型的token的embed层时结果显示为Embedding(151936, 2048)
请问为什么两个token的共计大小对不上呢?
· Sign up or log in to comment