Stripe Payment Foundation Model: Jak AI tworzy praktycznie nie do pokonania przewagę konkurencyjną #EN290

Poniższe notatki powstały na podstawie rozmowy z Emily Sands, Head of Data and AI w Stripe, w podcaście „The Cognitive Revolution”. Wszystkie przedstawione przemyślenia, obserwacje i strategie pochodzą od rozmówców.

Stripe operuje na niewyobrażalną skalę. W 2024 roku przetworzyła płatności o wartości 1.4 tryliona dolarów (1.3% globalnego GDP). Jak wyjaśnia Emily Sands, każda z tych transakcji staje się danymi treningowymi dla zaawansowanych systemów AI, które w rezultacie optymalizują cały cykl życia płatności.

TL;DR

Stripe przetwarza 1.4 tryliona dolarów rocznie (1.3% globalnego GDP) i wykorzystuje te dane do trenowania Payment Foundation Model
Payment Foundation Model traktuje płatności jako odrębną modalność, nie język – z własną „składnią” i „semantyką”
Wykrywanie card testing wzrosło z 59% do 97% dzięki analizie sekwencji transakcji zamiast pojedynczych płatności
Embeddings jako features – modularny system pozwala dodawać sygnały z foundation model do istniejących klasyfikatorów
92% kart już widzianych w systemie tworzy gęstą sieć połączeń i przewagę konkurencyjną
LLM as a judge waliduje etykiety tam, gdzie nie ma ground truth
Agentic commerce – płatności embedded bezpośrednio w narzędziach developerskich jak Cursor czy Vercel

Płatności jako nowa modalność AI

Emily Sands przedstawia Payment Foundation Model jako coś więcej niż kolejny large language model. Według niej, płatności są traktowane jako odrębna modalność danych, podobnie jak obrazy czy tekst.

Na poziomie architektury to transformer, który zamienia każdą płatność w zwarty wektor matematyczny. Sands opisuje podejście Stripe jako „dawanie każdej transakcji jej własnych współrzędnych na mapie”, co pozwala na zaawansowane analizy przestrzeni płatności.

Jednak kluczem do sukcesu jest skala. Stripe przetwarza około 50 000 nowych transakcji co minutę. W rezultacie przy takiej gęstości płatności zaczynają przypominać język – mają swoją „składnię” w postaci numerów kart i kodów merchantów oraz „semantykę” w sposobie wykorzystania urządzeń i kart w czasie.

Przełom w wykrywaniu oszustw

Najbardziej spektakularny sukces Payment Foundation Model osiągnął w wykrywaniu card testing. Sands opisuje ten rodzaj oszustwa jako proces, w którym przestępcy testują setki małych autoryzacji na skradzionych kartach, ukrywając te próby w natłoku legalnego ruchu.

Skuteczność wykrywania card testing wzrosła z 59% do 97%. Co więcej, podczas gdy globalnie oszustwa w e-commerce wzrosły o 15% rok do roku, wskaźnik sporów dla firm korzystających ze Stripe spadł o 17% rok do roku – co pokazuje rzeczywistą przewagę konkurencyjną.

Mimo to tradycyjne podejście miało poważne ograniczenia:

Nie radziło sobie z „igłami w stogu siana”
Kilkaset oszustw na tle setek tysięcy legalnych transakcji
Brak możliwości analizy wzorców w sekwencjach

Z kolei foundation model przewrócił dotychczasowe podejście:

Traktuje sekwencje transakcji jak klatki w filmie
Wykrywa wzorce: ten sam user agent o niskiej entropii
Identyfikuje rotację przez proxy co 40 sekund
Oszustwo świeci jak wyspa w przestrzeni embeddingów

Ewolucja zamiast rewolucji: Strategia wdrożenia

Sands podkreśla, że Stripe nie wdraża foundation model bezpośrednio. Zamiast tego udostępnia embeddings przez swoją platformę feature engineering o nazwie Shepherd.

Dlatego modelarze mogą po prostu dodać embeddings jako features do istniejących modeli. „Projekt weekendowy zamiast projektu kwartalnego” – tak Sands opisuje korzyści tego podejścia.

Ta modularność pozwala na szybkie testowanie. W rezultacie zespoły mogą sprawdzić, czy otrzymują dodatkowy sygnał z embeddingów, bez konieczności przebudowy całego systemu. Niektórych przypadkach otrzymują natychmiastowy wzrost wydajności praktycznie za darmo.

Talk to your data z wyjaśnieniami

Stripe rozwiązuje klasyczny problem „talk to your data” – brak zaufania do odpowiedzi AI. Sands wyjaśnia, że ich Sigma Assistant nie tylko generuje odpowiedzi, ale również dostarcza wyjaśnienia w naturalnym języku.

System w praktyce:

Opisuje jakie daty użył dla Black Friday
Wyjaśnia jakie strefy czasowe zastosował (większość rzeczy w Stripe dzieje się w UTC)
Pokazuje jak obliczył wzrost procentowy
Pozwala osobom niebędącym analitykami zbudować zaufanie do wyników

Jednak kluczowe warunki sukcesu według Sands to dobrze ustrukturyzowane i udokumentowane dane przed zainwestowaniem w interfejs naturalnego języka. Mimo to system dodaje wyjaśnienia w naturalnym języku, w czym LLM są bardzo dobre.

LLM as a judge dla brakującej prawdy

Interesujące zastosowanie AI opisuje Sands w kontekście „friendly fraud” – oszustw, które nigdy nie skutkują formalną dispute. Obejmują one nadużycia darmowych okresów próbnych, abuse reseller’ów czy abuse refundów, które są szczególnie kosztowne dla firm AI z wysokimi kosztami marginalnymi. 47% firm twierdzi, że friendly fraud szkodzi im bardziej niż tradycyjne oszustwa z kradzionych kart.

Payment Foundation Model identyfikuje podejrzane płatności i generuje wyjaśnienia – wygenerowane adresy email, rotacja przez małą liczbę adresów IP. Jednak pytanie brzmi: jak sprawdzić, czy te etykiety są prawidłowe?

Stripe używa LLM as a judge, który analizuje każdą kombinację transakcji i etykiety. W rezultacie system ocenia jakość etykiety na podstawie wszystkiego, co wie o transakcji i klastrze, do którego należy. Duża część etykiet okazuje się wystarczająco wiarygodna do przekazania klientom AI.

Przewaga przez efekt sieci danych

Sands ujawnia statystykę: 92% kart, które merchant widzi po raz pierwszy, Stripe już wcześniej widział u innego merchanta. Ta gęstość sieci tworzy ogromną przewagę konkurencyjną.

Compounding loop według Sands:

Więcej danych → lepsze modele
Lepsze modele → większa wartość dla biznesów
Większa wartość → szybszy wzrost biznesów
Szybszy wzrost → więcej transakcji przez Stripe
Więcej transakcji → więcej danych

Mimo to Sands wskazuje na dodatkową strategię wzmacniania pozycji – modularność produktów. Produkty takie jak Radar czy Billing są teraz dostępne jako rozwiązania multiprocesorowe, działające nie tylko na transakcjach Stripe, ale także spoza Stripe.

Agentic commerce już dzieje się dziś

Podczas gdy większość branży spekuluje o przyszłości agentów AI w e-commerce, Sands pokazuje, że to już się dzieje. Perplexity pozwala odkrywać i rezerwować hotele bezpośrednio w aplikacji. Z kolei Hip Camp używa agentów z wirtualnymi kartami do rezerwacji miejsc campingowych off-platform.

Szczególnie interesujące jest embedded commerce w narzędziach developerskich. Programiści mogą teraz kupować usługi Vercel bezpośrednio w edytorze Cursor. To zupełnie nowy kanał sprzedaży – transakcje wbudowane bezpośrednio w workflow.

Przykłady działających rozwiązań:

Cursor + Vercel – kupowanie usług bezpośrednio w edytorze
Business in a box – agent AI buduje cały biznes, wybierając narzędzia
Agent toolkit – Stripe ma tysiące pobrań tygodniowo

Sands wspomina o koncepcji „business in a box”, gdzie agent AI może zbudować cały biznes, wybierając odpowiednie narzędzia zewnętrzne. Mimo że to jeszcze przyszłość dla szerokiego spektrum biznesów, w kontekście fokusowej fali AI startupów staje się realistyczne.

Praktyczne wnioski dla innych branż

Z analizy Sands wynikają konkretne lekcje dla firm rozwijających AI.

Kluczowe strategie:

Dodaj opcje środkowe zamiast binarnych decyzji. Stripe używa adaptive 3DS – dodatkową weryfikację dla podejrzanych transakcji. W rezultacie dobrzy użytkownicy przechodzą weryfikację, źli rezygnują.

Łącz reguły z modelami. Sands podkreśla, że reguły są dobre, ale tępe. Dlatego Stripe łączy model scores z informacjami zwrotnymi w czasie rzeczywistym. Jeśli transakcja wygląda marginalnie ryzykownie i CVC się nie zgadza – blokuj. Jednak jeśli to znany dobry użytkownik – przepuść.

Lista kontrolna wdrożenia AI:

Udostępnij embeddings jako features w istniejących systemach
Zacznij od dodawania sygnałów do obecnych modeli
Stwórz modularny system pozwalający na „projekty weekendowe”
Używaj LLM as a judge tam, gdzie nie ma ground truth
Upewnij się, że dane są dobrze ustrukturyzowane przed AI
Zbuduj warstwę wyjaśnień w naturalnym języku

Przyszłość platform i władzy rynkowej

Sands przyznaje, że pozycja Stripe staje się trudna do podważenia. 1.3% globalnego GDP przepływającego przez system plus 38% wzrost rok do roku tworzy masywny, rosnący zbiór danych treningowych.

Prawdziwa przewaga jednak nie tkwi w samym rozmiarze danych, ale w pętli wzmacniającej się. Im więcej danych przetwarza Stripe, tym lepsze są modele. Z kolei im lepsze modele, tym większa wartość dla biznesów. W rezultacie im większa wartość, tym szybszy wzrost biznesów i więcej transakcji przez Stripe.

Mimo to Stripe nie planuje konkurować na poziomie foundation models jak GPT czy Claude. Zamiast tego koncentruje się na czterech obszarach: być najlepszym partnerem dla firm AI, umożliwić agentic commerce, sprawić by płatności były natywne w narzędziach developerskich, oraz rozwijać warstwę inteligencji dla całej sieci.

Kluczowy insight

Foundation model jako data generator

Standardowo myślimy: Foundation model musi zastąpić istniejące systemy ML – albo wdrażasz nowy model, albo zostaniesz przy starym.

W praktyce okazuje się, że: Foundation model może być używany jako generator lepszych danych treningowych dla istniejących modeli. Emily Sands ujawnia, że Stripe najpierw użył Payment Foundation Model wewnętrznie do generowania labeli, potem walidacji przez ekspertów, a dopiero potem przekazywania tych labeli do tradycyjnych modeli ML.

Dlaczego to jest istotne: Otrzymujesz boost wydajności bez ryzyka przepisywania systemów produkcyjnych. W rezultacie tradycyjny model ML nagle zaczyna działać „way better” bo ma lepsze dane treningowe.

Test na jutro: Następnym razem gdy planujesz wdrożenie foundation model, zamiast zastępować istniejący system spróbuj użyć go do generowania lepszych labeli dla obecnych modeli i sprawdź wzrost accuracy przy minimalnym ryzyku.

Ten wpis jest częścią kolekcji notatek z ciekawych podcastów, webinarów i innych treści. Oryginalne źródło: Stripe’s Payments Foundation Model： How Data & Infra Create Compounding Advantage, w⧸ Emily Sands