Dlaczego chiński model AI DeepSeek potrząsnął światem?


Chiński model DeepSeek to tańszy odpowiednik ChatGPT
Chiński model DeepSeek to tańszy odpowiednik ChatGPT

Mało znany chiński startup DeepSeek zaprezentował model AI, który jest tak dobry albo nawet lepszy niż ChatGPT, a jego opracowanie kosztowało tylko 6 mln USD, czyli 40 razy mniej niż w przypadku konkurencji. Jeśli to prawda, jesteśmy świadkami „momentu Sputnika”.

Chiny przejmują pozycję lidera AI

Kiedy w 1957 roku ZSRR wystrzeliły niespodziewanie w kosmos pierwszego sztucznego satelitę „Sputnik”, Związek Radziecki w jeden dzień przejął pozycję lidera w wyścigu o dominację w kosmosie. Upokorzone USA nie mogły tego tak zostawić i 12 lat później, w 1969 roku, odzyskały miejsce na podium dzięki zakończonej sukcesem pierwszej załogowej misji na Księżyc Apollo 11.

Moment Sputnika w przypadku AI to analogia do zaskakującego postępu, którego nikt nie przewidział. Tym razem Chińczycy pokazują USA, kto rozdaje karty w grze o nowe technologie. O tym, jak bardzo DeepSeek zaskoczył rynek, świadczy tąpnięcie na giełdzie. Akcje Nvidii, światowego lidera produkcji mikro-chipów, straciły 17% na wartości, co przelicza się na 279 miliardów USA.

Dlaczego to Nvidia ucierpiała najmocniej? Od 2022 roku – czyli premiery ChatGPT – liderzy modeli generatywnej AI jak OpenAI, Microsoft albo Google napędzają popyt na chipy wysokiej wydajności, bo trenowanie i rozwój coraz to wydajniejszych modeli wymaga coraz to większych mocy obliczeniowych. Na tym boomie korzystała przez ostatnie lata właśnie Nvidia, której procesory stosowane są w komputerach i centrach obliczeniowych na całym świecie.

Bezprecedensowy postęp AI czy tylko propagandowy show?

Co jeśli opracowanie modeli generatywnej AI jak ChatGPT (OpenAI), Gemini (Google) czy AI Pilot (Microsoft) wcale nie wymaga tak potężnych mocy obliczeniowych, jak dotąd uważaliśmy, a co potwierdza DeepSeek? Porównajmy: DeepSeek twierdzi, że wytrenowanie jego modelu zajęło jedynie dwa miesiące i kosztowało ok. 6 mln USD. W przypadku najnowszego modelu ChatGPT, kwota ta była nawet 40-krotnie wyższa. Do tego nowe modele DeepSeek, V3 i R1, nie tylko są równie dobre, ale czasami nawet lepsze w radzeniu sobie z różnymi zapytaniami.

Historia DeepSeek dzieli opinię publiczną. Dla jednych to klasyczny przykład, że „potrzeba jest matką wynalazku” – z powodu amerykańskich sankcji eksportowych, DeepSeek miał ograniczony dostęp do układów scalonych i został zmuszony do znalezienia innego sposobu trenowania modeli, w tym do skorzystania z dostępnych rozwiązań open-source. Nie mając wystarczającej ilości chipów, firma zmieniła o 360 stopni dotychczasowe podejście do tworzenia modeli AI, co okazało się strzałem w dziesiątkę.

Są jednak i tacy, którzy twierdzą, że nie powinniśmy ślepo wierzyć w informacje deklarowane przez twórców DeepSeek. Prawda o czasie i kosztach rozwoju AI być może być znacznie inna niż informacje przekazane przez firmę. Do tego DeepSeek jest ocenzurowany. Przykładowo, nie odpowie na pytania o wydarzenia z 1989 roku na placu Niebiańskiego Spokoju (Tiananmen) w Pekinie oraz jasno daje do zrozumienia, że Tajwan to część Chin. W audycie precyzji dostarczania informacji NewsGuard, DeepSeek osiągnął jedynie 17% dokładności, zajmując 10. miejsce na 11., plasując się daleko za takimi konkurentami jak ChatGPT od OpenAI i Gemini od Google.

Geopolityczna wojna potęg AI

Spekulacje podkręca data premiery DeepSeek, zaledwie kilka dni po tym, jak Prezydent Donald Trump ogłosił bezprecedensowy program rozwoju sztucznej inteligencji i inwestycje w AI o wartości 500 mld USA. Czy to zbieg okoliczności, czy zaplanowany ruch Chin w wojnie gospodarczej z USA? Prezydent Trump nazwał nawet DeepSeek „momentem przebudzenia” dla amerykańskich firm AI. Chiny od dawna nie ukrywają, że ich celem jest dominacja w dziedzinie sztucznej inteligencji. Potwierdzają to liczby: ok. 60% patentów na innowacje AI rejestrowanych jest w Chinach, w USA – jedynie 20%. Europa z 3% nie liczy się w tym wyścigu.

Zakłócenia na giełdzie po premierze DeepSeek pokazują czarno na białym, że wkraczamy w erę, w której siła konkurencyjna państw będzie mierzona kondycją gospodarek cyfrowych. Akcje Nvidia czy Meta zanurkowały, bo okazało się, że są inne firmy, które potrafią tworzyć AI lepiej, szybciej i taniej. W globalnej gospodarce nie ma znaczenia, gdzie te firmy mają siedzibę.