Wpis z mikrobloga

#sztucznainteligencja #programista15k #programowanie

Ciekawy artykuł od Daksha Gupty, CEO Greptile, o obecnym stanie rynku narzędzi do automatycznego przeglądu kodu przez AI.

Autor porównuje obecną sytuację do ery hard seltzerów – nagle wszyscy robią to samo. OpenAI, Anthropic, Cursor, Augment, Cognition, a czy Linear ogłosiły swoje rozwiązania do code review. Co ciekawe, dwa z tych ogłoszeń pojawiły się praktycznie w ciągu 24 godzin od siebie.

Wady:

1. Niezależność – agent recenzujący kod powinien być inny niż agent piszący kod. Audytor nie przygotowuje ksiąg, lis nie pilnuje kurnika, student nie ocenia własnych wypracowań. W przyszłości znaczna część kodu będzie automatycznie zatwierdzana przez agenta code review – człowiek napisze ticket, agent napisze PR, inny agent zwaliduje i zmerguje.
2. Autonomia -wszystko co może być zautomatyzowane, zostanie zautomatyzowane. Walidacja kodu to praca, której ludzie nie chcą wykonywać i nie są w niej szczególnie dobrzy. Greptile nie ma interfejsu do code review – postrzegają siebie jako automatyzację działającą w tle.
3. Pętle zwrotne – wizja przyszłości: człowiek wyraża intencję, agent kodujący wykonuje, agent walidujący znajduje problemy i przekazuje je z powrotem – tworząc pętlę aż do zatwierdzenia i merge’a. Gdy pojawi się niejasność, agenci piszą do człowieka na Slacku.
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@JamesJoyce:
W zasadzie brzmi w porządku, ale jak określimy niejasność, o której mowa w punkcie 3.
Na podstawie zasad i planu spisanego w .MD?
To kolejna rzecz, której nie chce się nikomu robić.
Wydaje mi się, że wizja większego udziału human in the loop w procesie pisania i review kodu jest bardziej prawdziwa, choć z drugiej strony zanik umiejętności przy zbyt dużym angażu agentów może to uniemożliwiać.
Trochę smutno, że
  • Odpowiedz