Nazywanie czegos takiego badaniem jest komiczne. Recenzja na szybko:
- wykluczyli pisanie treści bo ai juz to potrafi a potem mówią że ai automatyzuje tylko 2.5% pracy - ludzie mieli nielimitowany czas i mogli dopytywać klienta, ai dostał jedną próbę i godzinę - 240 projektów z 23 kategorii z 64 to za mało żeby mówić o automatyzacji zdalnej pracy jako całości - ocena jest binarna - albo projekt zaliczony w 100% albo zero, nawet jak ai zrobił 90% dobrze - czas i koszt projektów podawali sami freelancerzy bez żadnej weryfikacji - projekty robione przez ludzi średnio 29 godzin były oceniane w 11 minut - różne modele testowane w różnych środowiskach więc porównywanie ich ze sobą jest wątpliwe - sonnet 4.5 dostał dodatkowe instrukcje których inne modele nie miały - tytuł sugeruje pomiar całej zdalnej gospodarki a w rzeczywistości pominięto pracę zespołową, kontakt z klientem i długoterminowe zlecenia - metryki ekonomiczne typu dollars earned opierają się na niezweryfikowanych danych i nie są skorygowane o inflację
@JamesJoyce: ten kanał na yt jest strasznie sensacyjny i manipulatorski, kiedyś go oglądałem ale przestałem ze względu na niską wiarygodność. tak propo bo tego konkretnego filmu nie oglądałem
@JamesJoyce: A ja tam ich bardzo szanuję. W odróżnieniu od naganiaczy na youtube przynajmniej opisali co sprawdzili i jak. Teraz możesz przejść punkt po punkcie i się doczepić, że jest bez sensu.
A youtubowy naganiacz przez 20 minut p------i o niczym, pokazuje rzekomy efekt pracy AI, ale jakoś nigdy nie rzuci linka do: 1. stanu repo "przed" 2. użytych promptów/narzędzi i dokładnych instrukcji krok po kroku 3. stanu repo "po"
https://wykop.pl/link/7888915/ai-blednie-wykonuje-96-zadan-wedlug-nowego-badania
"Badanie" https://www.remotelabor.ai/paper.pdf
Nazywanie czegos takiego badaniem jest komiczne. Recenzja na szybko:
- wykluczyli pisanie treści bo ai juz to potrafi a potem mówią że ai automatyzuje tylko 2.5% pracy
- ludzie mieli nielimitowany czas i mogli dopytywać klienta, ai dostał jedną próbę i godzinę
- 240 projektów z 23 kategorii z 64 to za mało żeby mówić o automatyzacji zdalnej pracy jako całości
- ocena jest binarna - albo projekt zaliczony w 100% albo zero, nawet jak ai zrobił 90% dobrze
- czas i koszt projektów podawali sami freelancerzy bez żadnej weryfikacji
- projekty robione przez ludzi średnio 29 godzin były oceniane w 11 minut
- różne modele testowane w różnych środowiskach więc porównywanie ich ze sobą jest wątpliwe
- sonnet 4.5 dostał dodatkowe instrukcje których inne modele nie miały
- tytuł sugeruje pomiar całej zdalnej gospodarki a w rzeczywistości pominięto pracę zespołową, kontakt z klientem i długoterminowe zlecenia
- metryki ekonomiczne typu dollars earned opierają się na niezweryfikowanych danych i nie są skorygowane o inflację
AI błędnie wykonuje 96% zadań według nowego badania
A youtubowy naganiacz przez 20 minut p------i o niczym, pokazuje rzekomy efekt pracy AI, ale jakoś nigdy nie rzuci linka do:
1. stanu repo "przed"
2. użytych promptów/narzędzi i dokładnych instrukcji krok po kroku
3. stanu repo "po"