Wpis z mikrobloga

Skopiuj link

14.02.2026, 13:18:00

#sztucznainteligencja #programista15k #programowanie #rynekpracy #it

https://wykop.pl/link/7888915/ai-blednie-wykonuje-96-zadan-wedlug-nowego-badania

"Badanie" https://www.remotelabor.ai/paper.pdf

Nazywanie czegos takiego badaniem jest komiczne. Recenzja na szybko:

- wykluczyli pisanie treści bo ai juz to potrafi a potem mówią że ai automatyzuje tylko 2.5% pracy
- ludzie mieli nielimitowany czas i mogli dopytywać klienta, ai dostał jedną próbę i godzinę
- 240 projektów z 23 kategorii z 64 to za mało żeby mówić o automatyzacji zdalnej pracy jako całości
- ocena jest binarna - albo projekt zaliczony w 100% albo zero, nawet jak ai zrobił 90% dobrze
- czas i koszt projektów podawali sami freelancerzy bez żadnej weryfikacji
- projekty robione przez ludzi średnio 29 godzin były oceniane w 11 minut
- różne modele testowane w różnych środowiskach więc porównywanie ich ze sobą jest wątpliwe
- sonnet 4.5 dostał dodatkowe instrukcje których inne modele nie miały
- tytuł sugeruje pomiar całej zdalnej gospodarki a w rzeczywistości pominięto pracę zespołową, kontakt z klientem i długoterminowe zlecenia
- metryki ekonomiczne typu dollars earned opierają się na niezweryfikowanych danych i nie są skorygowane o inflację

@iggy_p 14

AI błędnie wykonuje 96% zadań według nowego badania

tubkas12

14.02.2026, 13:41:24 via Wykop

@JamesJoyce: ten kanał na yt jest strasznie sensacyjny i manipulatorski, kiedyś go oglądałem ale przestałem ze względu na niską wiarygodność. tak propo bo tego konkretnego filmu nie oglądałem

cebulowy_krezus

14.02.2026, 16:27:52 via Wykop

@JamesJoyce: A ja tam ich bardzo szanuję. W odróżnieniu od naganiaczy na youtube przynajmniej opisali co sprawdzili i jak. Teraz możesz przejść punkt po punkcie i się doczepić, że jest bez sensu.

A youtubowy naganiacz przez 20 minut p------i o niczym, pokazuje rzekomy efekt pracy AI, ale jakoś nigdy nie rzuci linka do:
1. stanu repo "przed"
2. użytych promptów/narzędzi i dokładnych instrukcji krok po kroku
3. stanu repo "po"