Wpis z mikrobloga

Skopiuj link

02.08.2024, 11:47:09

#programista15k #programowanie #it #sztucznainteligencja

Robiliśmy niedawno projekt, w którym model okazał się trochę za duży do deployu, na jakiejś starej platformie. Uzyskiwanie wyników klasyfikacji przez userów trwało zwyczajnie za długo.

Skonwertowaliśmy więc dla testu znacznie mniejszy (6linijek kodu) model i przepisaliśmy go na c++. Wrzuciliśmy na platformę obydwa, python i c++. Efekt? Różnica w szybkości c++ kolosalna. Niemal real time.

Pisał o tym Andriy Burkov, tylko on konwertował Pythona na c:

Napisałem klasę w Pythonie, aby wykonać intensywne przetwarzanie dużego korpusu tekstu. Upewniłem się, że działa zgodnie z oczekiwaniami. Potem poprosiłem Claude'a, aby przepisał moją klasę w C (język, którego nie znam) i wyjaśnił, jak ją uruchomić.

Wynik: Czas przetwarzania Pythona: 63 minuty. Czas przetwarzania C: 2,3 minuty. To jest przyszłość dla oszczędności kosztów produkcji.

Procedura działania wg. Burkova

1. Use LLM to write Python.
2. Debug and fix Python.
3. Use LLM to generate unit tests for Python.
4. Make sure all unit tests pass.
5. Use LLM in a separate call to rewrite unit test from Python to C.
6. While true:
6.1 Use LLM to rewrite Python to C.
6.2 If C passes all unit tests, break.
7. Compile C for prod, deploy.

Dla obecnego klienta nie możemy konwertować kodu w llmie, więc ta opcja odpada, nie przekażemy całego modelu na c++, ale patrząc szerzej brzmi bardzo ciekawie. Zwlaszacza, gdy llmy będą lepsze w pisaniu i konwertowaniu kodu.

groman43

02.08.2024, 12:40:44 via Wykop

@JamesJoyce: C++ jest szybsze od Pythona. Ale hamerykę odkryłeś xDDD

vviktor123488

02.08.2024, 13:00:16 via Wykop

@JamesJoyce: Nic odkrywczego, każda aplikacja napisana w pythonie, nodejs, php, ror, bash itp, można napisać w c++, ba nawet można napisać w asemblerze! To jest dopiero prędkość aplikacji!

Tylko wiesz gdzie jest problem? Napisanie czegoś w "tych wolnych" technologiach zajmuje np godzine, a to samo w c++ 4h albo i więcej. Koszt utrzymania aplikacji? A to już inna sprawa. Jak potrzebujesz g---o kod do automyzacji generowania raportu to łatwiej to napisać w pythonie/nodej/php w 20 minut, czas wykonywania kodu - 20s! niż pisać kod 2h - czas wykonania 5s. Tutaj trzeba też brać pod uwage czasu konfiguracji środowiska i deploymentu tego. Dla normalnego śmiertlenika nie ma to znaczenia czy kod sie wykonuje 20s czy 5s. Ale ma znaczenie czy na rozwiazanie bedzie czekał 2h czy 8h.

Dlatego też np. embedded - sterownik do jakiegoś urządzenia jest pisany w c/c++ a nie w pythonie. To samo rozwiazanie w pythonie bedzie potrzebowało 4 kostki pamieci, każda po $1 a c++ tylko 1 kostke pamieci. Pomijamy tutaj prędkość działania (dla uproszczenia). $3 oszczędności na produkcji 10 milionów egzemplarzy tego urządzenia - $30 M. Tutaj jest realatywna

Saly

02.08.2024, 13:14:09 via Wykop

@JamesJoyce: można też pisać w jakimś języku o podobnej wygodzie pisania jak Python np. Kotlin i mieć dużo lepszy performance od samego początku.

JamesJoyce

02.08.2024, 13:49:33 via iOS

@groman43 byku, ale nie o to chodzi. C czy c++ nie mają bibliotek czy narzędzi do robienia takich rzeczy, plus nie są natywnie wspierane przez niektóre platformy. Dodatkowo pisanie od zera aplikacji w c jest o wiele żmudniejszym zadaniem niż napisanie tego samego w Pythonie. Autokonwersja przez llmy jest tu kluczem.

JamesJoyce

02.08.2024, 13:50:58 via iOS

@vviktor123488 no oczywiście. O to mi chodzi. Nie o to że c jest szybsze od Pythona, ale że napisanie czegoś w Pythonie vs w C to ogromna różnica w zaangażowaniu i czasie pracy. Natomiast autokonwersja już nie.

Strus

02.08.2024, 14:20:28 via Wykop

1. Use LLM to write Python.

2. Debug and fix Python.

3. Use LLM to generate unit tests for Python.

4. Make sure all unit tests pass.

@JamesJoyce: Swietny sposob na uzyskanie kodu co do ktorego masz zerowa pewnosc, ze

c137

02.08.2024, 15:42:56 via Wykop

@JamesJoyce:

1. Use LLM to write Python.

2. Debug and fix Python.

3. Use LLM to generate unit tests for Python.

4. Make sure all unit

JamesJoyce

02.08.2024, 16:30:16 via iOS

@Strus byku, ale ja to wiem. To jest tylko przykład. Wiem, że to nowa nazwa starych rzeczy, że nie musi być c, że wiele bibliotek, w tym tych do ai to wrappery na c itd. Podaje jedynie przykład tego, co jak się okazuje (po późniejszym researchu) robi się modne. I tyle.

1. Co do pewności i jakości kodu, to niestety nie zgadzam się. Wiadomo, zależy od zadania. Ale posługując się dobrze

JamesJoyce

02.08.2024, 16:38:39 via iOS

@c137 bo bez spełnienia wielu wymagań do tego się jedynie nadaje. Lub do prostych skryptów, które są „duże” przez liczbę features, albo dane.

W przykładzie Burkova nie chodziło o cały program. Ja też o nim nie myślę. Myślę, że tego nie napisałem jasno. Jemu (mam nadzieję) i mnie chodzi o coś, co jest znane (w kontekście ai). Różnią się jedynie dane i pewne zmienne w parametrach, czy preprocessingu danych wejściowych. Problemem

Strus

02.08.2024, 18:06:08 via Wykop

Ale posługując się dobrze dobrymi modelami, do programowania, można osiągnąć świetne rezultaty.

@JamesJoyce: Wiele osob tak pisze, ale jak dotad nie widzialem dowodu ( ͡° ͜ʖ ͡°)

JamesJoyce

02.08.2024, 20:28:27 via Wykop

@Strus: Musisz uwierzyć bez dowodu bracie ( ͡° ͜ʖ ͡°)

proteina_sin_huevos

02.08.2024, 21:50:28 via Wykop

@JamesJoyce: czemu nie https://github.com/oracle/graalpython ?

Saly

02.08.2024, 22:13:44 via Wykop

czemu nie https://github.com/oracle/graalpython ?

@proteina_sin_huevos: wątpie, że grall osiągnie wydajność porównywalną z C. Problemem są struktury danych. Co z tego, że grall ogarnie super optymalizacje do jakiejś pętli jak pod spodem i tak będą wołane wolne operacje na listach, gdzie każdy element jest dynamiczny.

Szybkie języki nie koniecznie są szybkie dlatego, że mają dobry JIT/optymalizacje tylko dlatego, że design języka naturalnie wymusza na tobie pisanie optymalnego kodu. Tak samo jest

wafel93

03.08.2024, 08:33:13 via Wykop

@JamesJoyce: przeciez te wieksze biblioteki do data w pythonie są napisane w C wlasnie

JamesJoyce

03.08.2024, 08:36:53 via Wykop

@wafel93: nie zawsze w C. Czasem w cpp czy czymś jeszcze innym niż Python. Wiem i pisałem o tym.

Krolik

05.08.2024, 07:02:10 via Wykop

@vviktor123488: napisanie w asemblerze nie gwarantuje że będzie szybciej niż w C++ chyba że jesteś mega ogarniaczem asemblera i znasz bardzo dokładnie mikroprocesor na który piszesz kod. Najczęściej daje się pobić kompilatory w takich kwestiach jak użycie instrukcji SIMD ale w „zwykłym kodzie” gra jest niewarta świeczki.

Napisanie czegoś w "tych wolnych" technologiach zajmuje np godzine, a to samo w c++ 4h albo i więcej. Koszt utrzymania aplikacji?

Stwierdzenie niepoparte

Aktywne Wpisy

wykop

wykop +32

5 godz. i 14 min temu

Drodzy Wykopowicze,

w odpowiedzi na Wasze liczne pytania udostępniamy listę słów, które obecnie są domyślnie ukrywane na Wykopie: LINK

Dobór słów na tej liście nie jest przypadkowy. Czerpiemy je z wypracowanych standardów, stosowanych m.in. przez Google w ich ocenie treści. Jednocześnie, jest to pierwsza wersja tej listy i zakładamy, że będzie ona rozwijana (zarówno dodawanie nowych słów, jak i usuwanie tych, które okażą się nietrafione).

Nadrzędnym

Reepo

Reepo +1020

5 godz. i 12 min temu

O, już wiem czemu wprowadzono listę słów zakazanych przez reklamodawców XD @mickpl spodoba ci się XD
Otóż lista słów jest zasysana stąd: https://a.spolecznosci.net/core/6e512ac68bd38321c2381b069fa14a43/main.js (czytaj - wykop nią nie zarządza, reklamodawcy se wrzucają słowa jakie chcą, dzisiaj ma taką formę, a jutro może mieć inną. Zaczniesz obrażać jedną firmę co daje hajs, to pewnie nagle ta nazwa będzie usuwana z całego serwisu) jak wejdziesz w spolecznosci.net przenosi cię na stronę tri-table. Sprawdzamy

Reepo - O, już wiem czemu wprowadzono listę słów zakazanych przez reklamodawców XD @m... — **źródło:** Screenshot 2024-08-29 145425
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Psia patologia znów winna pogryzienia człowieka, kiedy się to skończy?

Murzynek Bambo - Julian Tuwim (TEST)

Nie będzie wzrostu zasiłku pogrzebowego. W budżecie brakuje pieniędzy

Zrobiłem skrypt który usuwa cenzurę na Wykopie

Strajk! W sobotę (31.08) nie włączaj wykopu

Popularne tagi