Mirki moze ktos z was ogarnia, openclaw i bot telegram(ale bot/agent ogolnie), generuje mase tokenow przy prostym 2+2 - spamuje na maxa zbednym kontentem. Zauwazylem to dopiero na lokalnym llmie ktory stoi na mac studio. Wczesniej po api do deepseek nie zwrocilem uwagi na tokeny przy zapytaniach. Nic nie pomaga na ograniczenie bota, zawsze n--------a po korek, taka przypadlosc openclaw czy ja jestem na to zbyt glupi?
@Pan_Slon: Problem leży w systemowym prompcie frameworka. OpenClaw domyślnie pakuje ogromny kontekst przy każdym zapytaniu niezależnie od jego prostoty, do tego agent "myśli na głos" przed odpowiedzią co generuje dodatkowe tokeny. Rozwiązanie to albo przycięcie systemu promptu do minimum, albo ustawienie max_tokens w odpowiedzi, albo wywalenie narzędzi których bot nie potrzebuje bo sam ich opis zjada konteksty.
@Pan_Slon: a co jest największym bootleneckiem obecnie z Twoich obserwacji? Faza prefill czy faza decode po stronie lokalnego LLMa? Gdyby prefill było znacznie szybsze to działałoby to w Twojej ocenie znacznie sprawniej?
Rozwiązanie to albo przycięcie systemu promptu do minimum, albo ustawienie max_tokens w odpowiedzi, albo wywalenie narzędzi których bot nie potrzebuje bo sam ich opis zjada konteksty.
@JamesJoyce: jak by to było tak trywialne to nie pisałbym posta ;)
@JamesJoyce: default oraz workspace pusty, wcześniej przycinałem tokeny na output i co się dało ale wiele to nie dało. W sumie jakby te parametry w agencie i workspace nic nie robiły
@Pan_Slon: Sam sobie odpowiem, jest jakis problem z ogarnianiem kontekstu pytania, bot z openclaw i tak jest ustawiony "zajebiscie" Testowo odpalilem Hermesa i j--------e jaki kontekst wali, trwa to 4 razy dluzej niz problem z openclaw Tak wiec nie jest zle ale musze dowiedziec sie jak ogarnac "zlewanie" spamu kontekstem bota nt jego bzdurnych umiejetnosci itp przy prompt typu 2+2
Nic nie pomaga na ograniczenie bota, zawsze n--------a po korek, taka przypadlosc openclaw czy ja jestem na to zbyt glupi?
#ai #llm #programista15k #komputery #sztucznainteligencja #openclaw #chatgpt
źródło: Screenshot 2026-05-10 at 11.52.57
Pobierz@JamesJoyce: jak by to było tak trywialne to nie pisałbym posta ;)
@JamesJoyce: