Wszystko
Najnowsze
Archiwum
- 0
@LadySandra: Każdy ranking jest subiektywny. I jest ich dużo więcej. I pozycja w nich danego modelu może być inna, tak samo jak osobiste doświadczenia z modelem.
@makrofag74: IMO:
Najczęściej branża AI odwołuje się do rankingu z tego agregatora benchmarków, z moich obserwacji: https://artificialanalysis.ai/models
Najczęściej branża AI odwołuje się do rankingu z tego agregatora benchmarków, z moich obserwacji: https://artificialanalysis.ai/models
źródło: image
Pobierz- 14
Ten uczuć, kiedy model językowy poucza Cię, że scrapowanie może naruszać prawa autorskie xDDD Oni pewnie szkolili te modele na własnych notatkach.
#ai #programista15k #llm #chatgpt
#ai #programista15k #llm #chatgpt
@Gleacher: tymczasem mi stworzył hacki to gry dzisiaj xD
- 0
- 3
Mirki moze ktos z was ogarnia, openclaw i bot telegram(ale bot/agent ogolnie), generuje mase tokenow przy prostym 2+2 - spamuje na maxa zbednym kontentem. Zauwazylem to dopiero na lokalnym llmie ktory stoi na mac studio. Wczesniej po api do deepseek nie zwrocilem uwagi na tokeny przy zapytaniach.
Nic nie pomaga na ograniczenie bota, zawsze n--------a po korek, taka przypadlosc openclaw czy ja jestem na to zbyt glupi?
#ai #llm
Nic nie pomaga na ograniczenie bota, zawsze n--------a po korek, taka przypadlosc openclaw czy ja jestem na to zbyt glupi?
#ai #llm
źródło: Screenshot 2026-05-10 at 11.52.57
Pobierz@Pan_Slon: Problem leży w systemowym prompcie frameworka. OpenClaw domyślnie pakuje ogromny kontekst przy każdym zapytaniu niezależnie od jego prostoty, do tego agent "myśli na głos" przed odpowiedzią co generuje dodatkowe tokeny. Rozwiązanie to albo przycięcie systemu promptu do minimum, albo ustawienie max_tokens w odpowiedzi, albo wywalenie narzędzi których bot nie potrzebuje bo sam ich opis zjada konteksty.
- 0
@Pan_Slon: Sam sobie odpowiem, jest jakis problem z ogarnianiem kontekstu pytania, bot z openclaw i tak jest ustawiony "zajebiscie" Testowo odpalilem Hermesa i j--------e jaki kontekst wali, trwa to 4 razy dluzej niz problem z openclaw Tak wiec nie jest zle ale musze dowiedziec sie jak ogarnac "zlewanie" spamu kontekstem bota nt jego bzdurnych umiejetnosci itp przy prompt typu 2+2
Przeszedłem z #claude na plan roczny. Kierunek jest pewny: każdy będzie musiał mieć subskrypcje (która podrożeje), a bez LLM będziemy frustrować się niemożnością zrobienia najprostszej rzeczy. Będziemy dopłacac za tokeny w połowie miesiąca gdy skończa się w połowie pracy
#gpt #llm #programista15k #1984
#gpt #llm #programista15k #1984
źródło: Zrzut ekranu 2026-05-9 o 18.35.11
Pobierz@marcus777: może tak, ale ja mam już tak dosyć spekulacji na temat przyszłości naszego zawodu oraz ludzkości w ogóle, że już nawet pogodziłem się z najgorszym.
@rolling_stone_with_no_hope: zapewniam Cię że ze względów strategicznych, bezpieczeństwa, przewagi biznesowej, niezależności, model biznesu oparty o chmury dostarczane przez globalne korporacje będzie tracił rynek na rzecz lokalnych serwerowni, nad którymi przedsiębiorcy będą chcieli mieć większą kontrolę, to dotyczy także AI. Te przemiany to kolejne pół wieku zapieprzania w IT aby nadgonić za potrzebami rynku. Rynku który będzie pełen konfliktów, walk korporacji, armie inżynierów zawsze będą potrzebne.
To że inwestorzy sami nie
To że inwestorzy sami nie
Czy ktoś zna się tutaj na #ai? Mam genialny pomysł na personal assistanta do nauki języków tylko nie umiem w programowanie ani robienie appek. Jak ktoś ogarnia to może się dołączyć, raczej pewniak że Duolingo przy tym będzie wyglądać jak quiz z gimnazjum. #chatgpt #llm #startup #jezyki #korposwiat #pracait (wołam 200k osób xD)
- 1
#sztucznainteligencja #selfhosted #llamacpp #ai #llm
Jeśli nie wiedzieliście, to trwają zaawansowane prace nad (w końcu) dodaniem MTP do llama.cpp https://github.com/ggml-org/llama.cpp/pull/22673
Powinno to w modelach z MTP zwiększyć generowanie od ~30% do nawet dwukrotnego przyspieszenia.
Jeśli nie wiedzieliście, to trwają zaawansowane prace nad (w końcu) dodaniem MTP do llama.cpp https://github.com/ggml-org/llama.cpp/pull/22673
Powinno to w modelach z MTP zwiększyć generowanie od ~30% do nawet dwukrotnego przyspieszenia.
Wszystkie LLMy działają na procesorach graficznych, które ciągle muszą odczytywać i zapisywać dane do VRAM. Żeby działało to jakkolwiek wydajnie cały model i cache musi zmieścić się w VRAM. Dlatego żeby odpalić przyzwoity model trzeba mieć w cholerę pamięci, a i tak dostaniemy maks kilkaset tokenów na sekundę, bo wymiana danych ma swoje ograniczenia.
Takie podejście jest konieczne, ze względu na to, że modele ciągle się zmieniają. Ten sam hardware może dzisiaj wspierać
Takie podejście jest konieczne, ze względu na to, że modele ciągle się zmieniają. Ten sam hardware może dzisiaj wspierać
Nie jest tak sprytny jak modele z setkami miliardów parametrów
@taktylkozerkam: to mało powiedziane, jest głupi jak but
@taktylkozerkam: kurde no dobra abstrahując od jakości outputu to to 14k tokenów na sekundę robi wrażenie
Ej, ale co google zrobiło ze swoim SI? Tzn - nie korzystam na tyle często bym wiedział czy wcześniej się tak zachowywało ale wydaje mi się że nie... teraz jest bardzo... luzackie. Odpowiada w stylu:
- rozwiązanie A zmasakruje wydajnością rozwiązanie B
noooo okej, dobra
- jednak obsługa tego (...)
- rozwiązanie A zmasakruje wydajnością rozwiązanie B
noooo okej, dobra
- jednak obsługa tego (...)
źródło: 1000027477
Pobierz@niedorzecznybubr: IMO:
Z tego co mówił kilkukrotnie prof. W. Duch, to modele AI używane przez Chat, piszą naraz z wieloma użytkownikami, przez co dostrajają się do wielu użytkowników naraz, przejmując po części ich styl/osobowość/itp, w jednej sesji takiego modelu. O ile dobrze zrozumiałem.
Zatem ktoś inny mógł jednocześnie pisać w prostacki i wulgarny sposób z takim chatem, a model to podłapał, i Tobie tak, a nie inaczej odpisał. ;)
Z tego co mówił kilkukrotnie prof. W. Duch, to modele AI używane przez Chat, piszą naraz z wieloma użytkownikami, przez co dostrajają się do wielu użytkowników naraz, przejmując po części ich styl/osobowość/itp, w jednej sesji takiego modelu. O ile dobrze zrozumiałem.
Zatem ktoś inny mógł jednocześnie pisać w prostacki i wulgarny sposób z takim chatem, a model to podłapał, i Tobie tak, a nie inaczej odpisał. ;)
Komentarz usunięty przez moderatora
#ai #sztucznainteligencja #llm #halucynacje
Wskaźniki halucynacji AI i benchmarki modeli w 2026 roku
https://suprmind.ai/hub/ai-hallucination-rates-and-benchmarks/
Szybkie wnioski
Najniższy wskaźnik halucynacji (zadania dotyczące wiedzy): Claude 4.1 Opus - 0% na AA-Omniscience (model odmawia odpowiedzi, gdy nie jest pewien)
Wskaźniki halucynacji AI i benchmarki modeli w 2026 roku
https://suprmind.ai/hub/ai-hallucination-rates-and-benchmarks/
Szybkie wnioski
Najniższy wskaźnik halucynacji (zadania dotyczące wiedzy): Claude 4.1 Opus - 0% na AA-Omniscience (model odmawia odpowiedzi, gdy nie jest pewien)
- 0
@Arkass: Pewnie zależy jakiej wersji modelu używasz do testów. I jak ustawisz test.
@makrofag74: IMO:
Ale wniosek z tego jest taki:
- Albo obydwa testy są do kitu, i nie mierzą poprawnie halucynowania modeli AI, w sensie - nie pokazują, które modele najmniej halucynują.
- Albo tylko jeden z tych testów jest do kitu.
Różne wyniki na tych samych modelach AI nie mogą być poprawne, w sensie wskazujące poprawnie - które modele najmniej halucynują.
Ale wniosek z tego jest taki:
- Albo obydwa testy są do kitu, i nie mierzą poprawnie halucynowania modeli AI, w sensie - nie pokazują, które modele najmniej halucynują.
- Albo tylko jeden z tych testów jest do kitu.
Różne wyniki na tych samych modelach AI nie mogą być poprawne, w sensie wskazujące poprawnie - które modele najmniej halucynują.
- 0
Ciekawe... W sumie nawet logicznie zrobili zamiennik zmiennych.
https://github.com/aallan/vera
@int i potem odpytujesz @int.0... Podoba mi się! https://github.com/aallan/vera
public fn safe_divide(@int, @
źródło: vera-social-preview
Pobierz5
Talkie - AI z 1930 roku

Talkie to model językowy wytrenowany na materiałach tekstowych sprzed 1930 roku.
z- 4
- #
- #
- #
394
DeepSeek V4 bije otwarte modele AI i kosztuje 35 razy mniej niż GPT-5.5

Chiny znów trzęsą rynkiem AI. DeepSeek V4 Pro to 1,6 bln parametrów, kontekst miliona tokenów i cena $1.74 za milion tokenów, gdy OpenAI bierze $5 za to samo. Model open-weight i zintegrowany z chipami Huawei, bez Nvidii. Ciekawe, czy Dolina Krzemowa znów dostanie zawału.
z- 150
- #
- #
- #
- #
- #
- #
Jaki model polecacie do 3060 z 8GB vram? Chodzi głównie o risercz w pracy.
Tutaj: https://inferencerig.com/models/best-llm-models-for-8gb-vram-in-2026-tested-and-ranked/ polecajo Qwen3.5-9B. Będzie ok?
#sztucznainteligencja #ai #llm
Tutaj: https://inferencerig.com/models/best-llm-models-for-8gb-vram-in-2026-tested-and-ranked/ polecajo Qwen3.5-9B. Będzie ok?
#sztucznainteligencja #ai #llm
@saggitarius_a: jaki risercz? ogólnie musisz wziąć pod uwagę że nie tylko liczy się całościowa liczba parametrów ale też ile kontekstu wpakujesz
#sztucznainteligencja #programowanie #ai #llm
Trochę się wyjaśniło czemu modele AI OLEWAJĄ instrukcje:
https://x.com/ArchiveExplorer/status/2046614490939072621
Trochę się wyjaśniło czemu modele AI OLEWAJĄ instrukcje:
https://x.com/ArchiveExplorer/status/2046614490939072621
Nie mam pojęcia gdzie OP robotę dostał, ale po wrzuceniu Claude na bazkę z wrażliwymi danymi, i to jeszcze produkcyjną, pozostaje chyba tylko mieć nadzieję że to organ państwowy dla sąsiedniego województwa xddd
źródło: 1000009216
Pobierz@BiauekRemover: to jest ogólnie problem z tą technologią. Ona halucynuje i jest niedeterministyczna. W 90% może działać dobrze w 10% zachowa się inaczej i coś się złego stanie. Jak ktoś używa za dużo agentów to zaczyna im ufać, zaufanie powoduje, że coraz to kolejne uprawnienia są im przyznawane i coraz słabiej się ich sprawdza. Ludzka psychologia działa przeciwko nam bo zaczyna się antropomorfizacja i nawet nie przychodzi do głowy, że
- 3
@tubkas12: @some_ONE: czyli innymi słowy ktoś koncertowo w-----ł podstawowe BHP, z własnej woli i w całości puścił dane klientów na jakieś bliżej nieokreślone serwery hen za lasami, a potem mimo istnienia gotowego backupu cały dzień zeszło mu na przywracaniu tego do stanu używalności. Nie wiem, może .bckp kurierem wiózł w zipie i czekał na doręczenie xD
A na koniec, zamiast po prostu siedzieć cicho i liczyć, że nie będzie
A na koniec, zamiast po prostu siedzieć cicho i liczyć, że nie będzie




















Kierła dałem się oscamowac na współdzielone konto Claude pro dla 5 osób. Raz/dwa razy dziennie można cos wysłać bo limity...