Wpis z mikrobloga

Tak prawdopodobnie działają systemy HFT, które ogrywają was na giełdzie.

Wszyscy jarają się LLM-ami i ChatGPT, a tymczasem po cichu, w serwerowniach blisko Wall Street, działa coś, co można nazwać "Wąskim AGI". I nie pisze wierszy, tylko kosi potężny hajs na mikrosekundach.

Chciałem Wam pokazać, jak wygląda "Three-Agent Stack". To standard u gigantów takich jak Renaissance, Citadel czy Jane Street. To w zasadzie autonomiczny organizm, który walczy o przetrwanie na rynku.

Dlaczego przegrywasz z rynkiem? Bo po drugiej stronie stoi ten potwór:

1. AGENT 2: Mózg (Alpha Generation)

To jest strateg. On nie patrzy na wykresy jak człowiek. Analizuje zdjęcia satelitarne parkingów przed Walmartem, sentyment na Twitterze, raporty makro i tysiące innych zmiennych (Alternative Data).

Cel: Znaleźć "Alphę" (przewagę).

Mindset: Myślenie rekurencyjne. Nie pyta "ile to jest warte", tylko "ile inni myślą, że to jest warte i kiedy zmienią zdanie" (Keynesian Beauty Contest). Często używa sieci GAN (jedna sieć generuje fake newsy/szum, druga uczy się je wykrywać), żeby nie dać się oszukać innym botom.

2. AGENT 3: Taktyk (Execution)

Dostaje info od Mózgu: "Sprzedaj Nvidia". Ale jak kupisz za dużo na raz, to cena wystrzeli. Taktyk tnie to zlecenie na tysiące kawałków (Child Orders). Używa algorytmów VWAP/TWAP i "Iceberg Orders" (góry lodowej), żeby ukryć, co tak naprawdę robi przed innymi graczami.

3. AGENT 1: Egzekutor (HFT / Microstructure)

Tu już nie ma AI, tu jest czysta fizyka i FPGA. Liczą się nanosekundy. Ten agent walczy o miejsce w kolejce zleceń. Jest "głupi", ale piekielnie szybki. Jeśli Taktyk mówi "bierz", Egzekutor wbija się przed Ciebie, zanim Twój broker w ogóle odświeży cenę.

Schemat architektury (uproszczony):

Architektura Multi-Agentowa Systemów Quant (The 3-Agent Stack)


│ ŚWIAT ZEWNĘTRZNY │
│ (Globalne rynki, Big Data, Sentyment, Newsy) │



│ │
AGENT 2: ALPHA GENERATION MODEL
│ ("The Strategist" - Warstwa Strategiczna) │
│ │

Wejście (Input Data):
│ - Alternative Data: Obrazowanie satelitarne, │
│ dane geolokalizacyjne, IoT, transakcje kartowe. │
│ - NLP & Sentyment: Analiza języka naturalnego │
│ (Social Media, Newsy, Raporty SEC/ESPI). │
│ - Fundamental Data: Makroekonomia, sprawozdania. │

Metody i Technologie:
│ - Signal Processing: Modele Bayesowskie, Regresja.│
│ - Deep Learning: Transformers (BERT/GPT), LSTM. │
│ - Big Data: Apache Kafka, Spark, Data Lakes. │

Wyjście (Output):
│ - Sygnał Alpha: Decyzja kierunkowa (Long/Short). │
│ - Expected Value (EV): Szacowana wartość zysku. │
│ - Horyzont czasowy: (Intraday / Swing). │

│ Sygnał Inwestycyjny
│ (Target Position)


│ │
AGENT 3: ALGORITHMIC EXECUTION
│ ("The Tactician" - Smart Order Routing) │
│ │

Wejście (Input Data):
│ - Target Position od Agenta 2. │
│ - Market Depth: Głębokość rynku, płynność. │
│ - Historyczna zmienność (Volatility).

Metody i Technologie:
│ - Algorytmy Egzekucyjne: VWAP, TWAP, POV. │
│ - Game Theory: Optymalizacja kosztu wejścia. │
│ - Obfuskacja: Iceberg Orders (ukrywanie │
│ wolumenu), Randomizacja czasu (Jitter). │
│ - Reinforcement Learning: Adaptacja strategii.│

Wyjście (Output):
│ - Child Orders: Zlecenia potomne (poszatkowane).│
│ - Harmonogram: Timing wysyłania zleceń. │

│ Zlecenia Limit/Market


│ │
AGENT 1: MARKET MICROSTRUCTURE / HFT
│ ("The Executor" - Low Latency) │
│ │

Wejście (Input Data):
│ - Child Orders od Agenta 3. │
│ - Raw Data Feed: Bezpośredni strumień giełdowy.│
│ - Order Book: Kolejka zleceń (Level 3 Data). │

Metody i Technologie:
│ - Hardware Acceleration: FPGA, ASIC. │
│ - Low Latency: Kernel bypass, Direct Market │
│ Access (DMA), Kolokacja serwerów. │
│ - Protokóły: FIX, ITCH/OUCH. │

Wyjście (Output):
│ - Egzekucja Transakcji: Nanosekundy. │
│ - Queue Priority: Walka o miejsce w kolejce. │




│ CENTRAL ORDER BOOK │
│ (Giełda / Rynek) │


Dlaczego to jest przerażające/genialne?

Ten system ma cechy homeostazy. Działa jak żywy organizm.

Jeśli Agent 1 widzi, że nie ma płynności, wysyła sygnał w górę. Agent 3 zmienia taktykę z agresywnej na pasywną. Jeśli to nie działa – Agent 2 rewiduje całą tezę inwestycyjną. Wszystko autonomicznie.

Dla Agenta 2 Wasza "irracjonalność" i emocje na giełdzie to tylko kolejna zmienna w równaniu. Jeśli wyprzedajecie się w panice – on to widzi i bezlitośnie wykorzystuje, bo nie ma emocji, ma tylko Expected Value (EV).

Źródła:
A. Potwierdzenie dla "Agenta 3" (Reinforcement Learning w Egzekucji)
Algorytm LOXM (JP Morgan): To jest dokładnie "Agent 3". LOXM to pierwsza głośna aplikacja Deep Reinforcement Learning do egzekucji zleceń klienta. Uczył się na miliardach transakcji historycznych, jak realizować duże zlecenia (np. sprzedać 1 mln akcji Apple), nie ruszając ceny i nie dając się wykryć HFT.
Google: JP Morgan LOXM deep reinforcement learning execution

Praca naukowa: Nevmyvaka, Feng, Kearns "Reinforcement Learning for Optimized Trade Execution" (2006/2019). To klasyczna praca pokazująca, jak AI uczy się optymalizować moment wysłania zlecenia.

B. Potwierdzenie dla "Agenta 2" (Alternative Data & Signal)
Książka "The Man Who Solved the Market" (o Jimie Simonsie i Renaissance Technologies): Biblia quantów. Opisuje, jak ich system Medallion (Agent 2) szukał korelacji, których ludzie nie widzą (nie-intuicyjne wzorce), i ignorował fundamenty ekonomiczne.

Przykład "Parkingów Walmartu": To klasyczny case firmy Orbital Insight. Analizowali cienie rzucane przez samochody na zdjęciach satelitarnych, by przewidzieć wyniki kwartalne sieci handlowych przed oficjalnym raportem.

C. Potwierdzenie dla "Agenta 1" (Wojna o nanosekundy)
Książka "Flash Boys" (Michael Lewis): Choć trochę sensacyjna, idealnie opisuje wojnę Agenta 1. Opisuje budowę światłowodu Spread Networks tylko po to, by zyskać kilka milisekund między Chicago a Nowym Jorkiem.

Firmy technologiczne: Xilinx (AMD) czy Arista Networks, które produkują switche o ultra-niskim opóźnieniu (low latency switches) dedykowane pod HFT. Tam kod jest "wypalany" w krzemie.

D. Potwierdzenie "Hierarchii i Homeostazy"
Hierarchical Reinforcement Learning (HRL): W literaturze naukowej "Three-Agent Stack" nazywa się HRL. "Meta-Controller" (Agent 2), który wyznacza cel, i "Sub-Policies" (Agent 3/1), które go realizują.

#gielda #sztucznainteligencja #ciekawostki #gruparatowaniapoziomu #programowanie #finanse
plaisant - Tak prawdopodobnie działają systemy HFT, które ogrywają was na giełdzie.

...

źródło: Three-Agent Stack

Pobierz
  • 24
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@plaisant: chciałbym tylko nadmienić, że agent 3 i agent 1 to standard w branży i większość mid freq hedge fundów i z pewnością wszystkie high frequency mają to zaimplementowane - jest to zwykły, klasyczny software. prawdziwa przewaga wynika z agenta 2.
  • Odpowiedz
  • 12
@m-mmmm_marysia: W punkt. Agent 1 i 3 to w dużej mierze inżynieria i wyścig zbrojeń (kto ma lepsze FPGA, szybsze łącze, lżejszy kod). To środowisko deterministyczne.

Prawdziwa magia (i ryzyko) jest w Agencie 2, bo on jako jedyny operuje na niepełnej informacji (Incomplete Information Game). Reszta systemu widzi to, co jest (order book), a Strateg musi wywnioskować to, czego nie widać (ukryte intencje, sentyment, czy ruch jest szumem czy sygnałem).

I właśnie
  • Odpowiedz
  • 3
myślę że to jednak ty mylisz inwestowanie z tradingiem ja nie płacące i nigdy nie będę płacił żadnych spreadow, ale wpis ciekawy.


@kokot1: Dzięki! Myślę, że możesz mylić prowizję dla brokera (którą faktycznie możesz mieć 0 zł) ze spreadem rynkowym (różnicą między ofertami Kupno/Sprzedaż w karnecie).

Spread to nie jest opłata, którą widzisz na wyciągu. To mechanika rynku. Jeśli cena akcji to 100 zł (kupno) i 99,90 zł (sprzedaż), to
  • Odpowiedz
  • 4
@armin-van-kutonger: To popularny mit, ale w rzeczywistości Chiny przeżywają właśnie boom na fundusze ilościowe (Quant Funds). Firmy takie jak High-Flyer czy Ubiquant używają tam dokładnie tej samej technologii – superkomputerów i AI do handlu, tylko pod ścisłym nadzorem regulatora.

Nie wrzuciłem tego wpisu, żeby oceniać moralność czy politykę, ale ze względu na fascynującą inżynierię. Ten system (Three-Agent Stack) to prawdopodobnie jeden z niewielu działających przykładów autonomicznej współpracy agentów w czasie
  • Odpowiedz
Chiny nie mają takiego szulerskiego systemu dlatego wygrają.


deepseek wywodzi się z hedge fundu.

Pytanie dlaczego z taką architekturą i wiedzą nie implementują tego w medycynie.


pierwsze
  • Odpowiedz
@plaisant: widzę, że teraz dołożono do tego AI, bo teraz wszędzie się wpycha AI ;) ale generalnie tę historię w różnych wersjach i z naciskiem na różne aspekty to już od dobrych 10 lat słyszę. Że na wall street pomontowane są serwerownie blisko giełdy, które mają przewagę nad innymi bo lagi mniejsze, i zanim inni zareagują to oni na mikrosekundach różnicy koszą miliony ¯\(ツ)/¯
  • Odpowiedz
@kubako: kolokacja silnika egzekucji z giełda to standardowa praktyka, nic nadzwyczajnego. Niektóre giełdy (przynajmniej krypto) dają wjazd wybranym klientom bez sanity checkow i jest trochę szybciej, pewnie o tym mówisz. Nie wiem jak na tradycyjnych giełdach, ale w krypto to nic dziwnego
  • Odpowiedz
@plaisant: To co napisałeś jest ciekawe samo w sobie, ale myślę, że to w ogóle nie dotyczy zwykłych ludzi. Z punktu widzenia wykopkowego inwestora to cena jakichś akcji XYZ będzie dzisiaj się wahała między 20,10 zł a 20,70 zł i nie ma to znaczenia czy wykopek kupi na górce czy na dołku, skoro planuje te akcje sprzedać jak urosną do 30 zł. Także może i quanty kupiły działkę za miliony
  • Odpowiedz
  • 2
@kubako: Masz 100% racji co do Agenta 1 (HFT/szybkość) – o tym pisał Michael Lewis we "Flash Boys" dekadę temu. Tu fizyki już bardziej nie oszukasz, walka o nanosekundy to "stara" inżynieria.

"Wpychanie AI" dotyczy jednak Agenta 2 (Strategii). Jeszcze 5-7 lat temu to była prosta statystyka (powrót do średniej). Dzisiaj, dzięki modelom Transformer (jak te w GPT), Agent 2 potrafi "czytać" i "rozumieć" kontekst – np. analizuje ton głosu
  • Odpowiedz
  • 1
Ciekawe, czy ów mityczny Bloomberg Terminal kosztujący majątek za subskrybcję, to implementacja Agenta 2


@BedzieDobraGra: Szczerze? Nie wiem, co dokładnie Bloomberg trzyma teraz "pod maską" (choć chwalili się modelem BloombergGPT).

Ale idąc tokiem rozumowania o AGI – Terminal to dla mnie raczej "oczy" i "uszy" (najszybszy dostęp do danych). Natomiast Agent 2 to ten mityczny "mózg", który te dane mieli.

Właśnie to mnie w tym zafascynowało, próba stworzenia bytu, który
  • Odpowiedz
@plaisant: A mnie bardziej martwi długotrwały efekt wywołany takimi narzędziami. Dają najmocniejszym i najbogatszym ludziom monopol na bogacenie się i całkowite rozwarstwienie ludzi na grupkę kosmicznie bogatych i resztę.
Wiem, że to nie na temat, ale poznanie mechanizmu działania 3 agentów tylko uświadamia nam naszą bezbronność.
  • Odpowiedz
5-7 lat temu to była prosta statystyka


@plaisant: A teraz jest skomplikowana statystyka, bo tym są duże modele językowe, zwane popularnie AI ;)

Zgadzam się, że komputerowo można zanalizować szybko duże ilości newsów i wyciągnąć wspólny sentyment. Ale czy tembr głosu naprawdę coś może powiedzieć ai czego i tak nie domyśliłby się człowiek? nie sądzę (nawet nie sądzę, żeby istniały takie narzędzia w skutecznej formie, ale kto wie - na youtubie i
  • Odpowiedz
  • 1
@kubako Masz rację, że pod spodem to nadal "tylko" matematyka i statystyka. Ale pamiętaj, że ludzki mózg na poziomie neuronów to też "tylko" biochemia i impulsy elektryczne.

Ten schemat (3 Agentów) traktuję jako modelową wizualizację tego, czym może być "Wąska AGI". To nie jest jeden magiczny algorytm, ale system naczyń połączonych. Gdzie "statystyka" (LLM) łączy się z "teorią gier" (Exec) i "fizyką" (HFT). Z tej współpracy wyłania się nowa jakość –
  • Odpowiedz
@plaisant: W mojej opinii nie jest to jakieś kosmiczne odkrycie i praktycznie nie zmienia niczego nawet dla daytradera, nie mówiąc już o średnio terminowych graczach. Co więcej wpływ HFT na giełdę w dłuższym terminie jest nawet pozytywny, bo po pierwsze jest większa płynność i właśnie mniejszy poślizg cenowy, bo po drugiej stronie może być drugi bot HFT, dwa ich wyjście i wejście z pozycji finalnie i tak opiera się na
  • Odpowiedz