Aktywne Wpisy
wykop +32
Drodzy Wykopowicze,
w odpowiedzi na Wasze liczne pytania udostępniamy listę słów, które obecnie są domyślnie ukrywane na Wykopie: LINK
Dobór słów na tej liście nie jest przypadkowy. Czerpiemy je z wypracowanych standardów, stosowanych m.in. przez Google w ich ocenie treści. Jednocześnie, jest to pierwsza wersja tej listy i zakładamy, że będzie ona rozwijana (zarówno dodawanie nowych słów, jak i usuwanie tych, które okażą się nietrafione).
Nadrzędnym
w odpowiedzi na Wasze liczne pytania udostępniamy listę słów, które obecnie są domyślnie ukrywane na Wykopie: LINK
Dobór słów na tej liście nie jest przypadkowy. Czerpiemy je z wypracowanych standardów, stosowanych m.in. przez Google w ich ocenie treści. Jednocześnie, jest to pierwsza wersja tej listy i zakładamy, że będzie ona rozwijana (zarówno dodawanie nowych słów, jak i usuwanie tych, które okażą się nietrafione).
Nadrzędnym
Reepo +1020
O, już wiem czemu wprowadzono listę słów zakazanych przez reklamodawców XD @mickpl spodoba ci się XD
Otóż lista słów jest zasysana stąd: https://a.spolecznosci.net/core/6e512ac68bd38321c2381b069fa14a43/main.js (czytaj - wykop nią nie zarządza, reklamodawcy se wrzucają słowa jakie chcą, dzisiaj ma taką formę, a jutro może mieć inną. Zaczniesz obrażać jedną firmę co daje hajs, to pewnie nagle ta nazwa będzie usuwana z całego serwisu) jak wejdziesz w spolecznosci.net przenosi cię na stronę tri-table. Sprawdzamy
Otóż lista słów jest zasysana stąd: https://a.spolecznosci.net/core/6e512ac68bd38321c2381b069fa14a43/main.js (czytaj - wykop nią nie zarządza, reklamodawcy se wrzucają słowa jakie chcą, dzisiaj ma taką formę, a jutro może mieć inną. Zaczniesz obrażać jedną firmę co daje hajs, to pewnie nagle ta nazwa będzie usuwana z całego serwisu) jak wejdziesz w spolecznosci.net przenosi cię na stronę tri-table. Sprawdzamy
Robiliśmy niedawno projekt, w którym model okazał się trochę za duży do deployu, na jakiejś starej platformie. Uzyskiwanie wyników klasyfikacji przez userów trwało zwyczajnie za długo.
Skonwertowaliśmy więc dla testu znacznie mniejszy (6linijek kodu) model i przepisaliśmy go na c++. Wrzuciliśmy na platformę obydwa, python i c++. Efekt? Różnica w szybkości c++ kolosalna. Niemal real time.
Pisał o tym Andriy Burkov, tylko on konwertował Pythona na c:
Napisałem klasę w Pythonie, aby wykonać intensywne przetwarzanie dużego korpusu tekstu. Upewniłem się, że działa zgodnie z oczekiwaniami. Potem poprosiłem Claude'a, aby przepisał moją klasę w C (język, którego nie znam) i wyjaśnił, jak ją uruchomić.
Wynik: Czas przetwarzania Pythona: 63 minuty. Czas przetwarzania C: 2,3 minuty. To jest przyszłość dla oszczędności kosztów produkcji.
Procedura działania wg. Burkova
1. Use LLM to write Python.
2. Debug and fix Python.
3. Use LLM to generate unit tests for Python.
4. Make sure all unit tests pass.
5. Use LLM in a separate call to rewrite unit test from Python to C.
6. While true:
6.1 Use LLM to rewrite Python to C.
6.2 If C passes all unit tests, break.
7. Compile C for prod, deploy.
Dla obecnego klienta nie możemy konwertować kodu w llmie, więc ta opcja odpada, nie przekażemy całego modelu na c++, ale patrząc szerzej brzmi bardzo ciekawie. Zwlaszacza, gdy llmy będą lepsze w pisaniu i konwertowaniu kodu.
Tylko wiesz gdzie jest problem? Napisanie czegoś w "tych wolnych" technologiach zajmuje np godzine, a to samo w c++ 4h albo i więcej. Koszt utrzymania aplikacji? A to już inna sprawa. Jak potrzebujesz g---o kod do automyzacji generowania raportu to łatwiej to napisać w pythonie/nodej/php w 20 minut, czas wykonywania kodu - 20s! niż pisać kod 2h - czas wykonania 5s. Tutaj trzeba też brać pod uwage czasu konfiguracji środowiska i deploymentu tego. Dla normalnego śmiertlenika nie ma to znaczenia czy kod sie wykonuje 20s czy 5s. Ale ma znaczenie czy na rozwiazanie bedzie czekał 2h czy 8h.
Dlatego też np. embedded - sterownik do jakiegoś urządzenia jest pisany w c/c++ a nie w pythonie. To samo rozwiazanie w pythonie bedzie potrzebowało 4 kostki pamieci, każda po $1 a c++ tylko 1 kostke pamieci. Pomijamy tutaj prędkość działania (dla uproszczenia). $3 oszczędności na produkcji 10 milionów egzemplarzy tego urządzenia - $30 M. Tutaj jest realatywna
@JamesJoyce: Swietny sposob na uzyskanie kodu co do ktorego masz zerowa pewnosc, ze
1. Co do pewności i jakości kodu, to niestety nie zgadzam się. Wiadomo, zależy od zadania. Ale posługując się dobrze
W przykładzie Burkova nie chodziło o cały program. Ja też o nim nie myślę. Myślę, że tego nie napisałem jasno. Jemu (mam nadzieję) i mnie chodzi o coś, co jest znane (w kontekście ai). Różnią się jedynie dane i pewne zmienne w parametrach, czy preprocessingu danych wejściowych. Problemem
@JamesJoyce: Wiele osob tak pisze, ale jak dotad nie widzialem dowodu ( ͡° ͜ʖ ͡°)
@proteina_sin_huevos: wątpie, że grall osiągnie wydajność porównywalną z C. Problemem są struktury danych. Co z tego, że grall ogarnie super optymalizacje do jakiejś pętli jak pod spodem i tak będą wołane wolne operacje na listach, gdzie każdy element jest dynamiczny.
Szybkie języki nie koniecznie są szybkie dlatego, że mają dobry JIT/optymalizacje tylko dlatego, że design języka naturalnie wymusza na tobie pisanie optymalnego kodu. Tak samo jest
Stwierdzenie niepoparte