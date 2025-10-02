Oczywiście tekst przeszukiwany liczony jest w tokenach. Czyli w przypadku języka polskiego, tekst był krótszy, a w przypadku chińskiego był o wiele dłuższy.



A wynika to z tego, że język polski marnuje więcej tokenów niż chiński. Słowo, które po chińsku ma jeden token, po polsku ma:

- token na temat

- token na końcówkę fleksyjną (odmiana przez przypadki, czasy)

- token na przedrostek jeżeli to tryb dokonany