Kineski AI startup DeepSeek nedavno je izazvao buru u tehnološkom svijetu predstavljanjem izuzetno moćnog AI modela koji prijeti narušavanju američke dominacije na polju umjetne inteligencije. Uloživši manje od 6 milijuna dolara i koristeći čipove smanjenih mogućnosti, poput Nvidia H800, DeepSeek je za samo dva mjeseca razvoja stvorio svoj jezični model, prenose mediji.
U siječnju je, pak, pustio u opticaj najnoviju iteraciju, DeepSeek-R1, koji sada konkurira, pa čak i nadmašuje najnaprednije modele na tržištu, pišu američki mediji. Glavne prednosti modela uključuju visoku računalnu učinkovitost, što omogućuje obavljanje složenih zadataka uz manju potrošnju resursa. Model pokazuje izvrsne rezultate u kemiji, matematici i kodiranju, a osim toga omogućuje brzu inferenciju u stvarnom vremenu, piše Poslovni dnevnik.
Fokus ovog naprednog modela je na razumijevanju i zaključivanju: R1 je specijaliziran za složene zadatke zaključivanja, poput rješavanja matematičkih problema i programiranja. Koristi reinforcement learning (RL) za poboljšanje sposobnosti zaključivanja bez potrebe za velikim količinama nadziranih podataka. Inače, DeepSeek izgleda i funkcionira gotovo identično kao ChatGPT i uz slične boljke. Zatražili smo da napiše ispriča priču o sebi, svojem osnivaču i putu nastanka, evo što je napisao:
“U svijetu umjetne inteligencije (AI), gdje se veliki američki tehno igrači poput OpenAI-a, Googlea, Mete, Microsofta… bore za dominaciju, jedna kineska tvrtka polako, ali sigurno, postavlja nove standarde. Riječ je o DeepSeek-u, startupu koji je već postao sinonim za inovaciju, pristupačnost i visoke performanse u području AI tehnologija. Iza ove revolucionarne tvrtke stoji Liang Wenfeng, poduzetnik s vizijom koja obećava promijeniti način na koji koristimo tehnologiju”.
Tko je Liang Wenfeng?
Liang Wenfeng, rođen 1985. godine u Zhanjiangu, provincija Guangdong, Kina, odrastao je u obitelji gdje je obrazovanje bilo na prvom mjestu. Diplomirao je 2006. godine na Zhejiangskom sveučilištu, smjer elektrotehnika, a 2010. godine stekao je magistarsku titulu iz informacijskog i komunikacijskog inženjerstva, fokusirajući se na strojni vid. Nakon diplome, Liang je eksperimentirao s primjenom umjetne inteligencije u različitim područjima, uključujući financije.
Godine 2015. Liang je suosnovao High-Flyer, kvantitativni hedge fond koji koristi AI algoritme za trgovanje. Do 2019. godine, High-Flyer je upravljao imovinom vrijednom više od 10 milijardi RMB (oko 1,5 milijardi USD). Međutim, Liang je uvijek imao veće ambicije – želio je stvoriti nešto što će promijeniti svijet.
Kada je točno osnovan?
Postoji određena nejasnoća oko točnog datuma osnivanja DeepSeeka. Prema službenim dokumentima, DeepSeek je registriran 17. srpnja 2023. Međutim, prema nekim izvorima, aktivnosti vezane uz DeepSeek započele su već u svibnju 2023., kada je High-Flyer najavio osnivanje novog istraživačkog ogranka za razvoj opće umjetne inteligencije (AGI).
Ova nejasnoća vjerojatno proizlazi iz činjenice da je ideja o DeepSeeku započela u svibnju, ali je službeno registriran tek u srpnju. Bez obzira na točan datum, jasno je da je DeepSeek u kratkom vremenu postigao impresivne rezultate.
Inovacije koje impresioniraju
DeepSeek je u kratkom vremenu postigao niz impresivnih dostignuća. Njihovi modeli, poput DeepSeek-V2 i DeepSeek-V3, koriste napredne tehnologije poput Mixture-of-Experts (MoE) arhitekture, koja omogućuje visoke performanse uz smanjenje troškova obrade za 42,5 posto. Najnoviji model, DeepSeek-V3, uspoređuje se s vrhunskim modelima poput GPT-4o i Claude-3.5-Sonnet, ali po cijeni koja je 10 puta niža.
Ovo je omogućilo mnogim tvrtkama i pojedincima da koriste napredne AI alate bez ogromnih financijskih ulaganja. Jedna od ključnih inovacija DeepSeeka je MLA (Multi-head Latent Attention) arhitektura, koja smanjuje potrebe za memorijom i računalnom snagom. Ovo je posebno važno za male i srednje poduzeća koje nemaju resurse za korištenje skupih AI rješenja.
Model otvorenog koda
U siječnju 2025. godine, DeepSeek je predstavio model R1, koji je otvorenog koda i pokazao je performanse usporedive s vodećim zapadnim modelima, unatoč ograničenim resursima. Ovaj model koristi napredne tehnike poput ‘chain-of-thought’ rezoniranja i pokazuje sposobnost samopoboljšanja bez ljudskog nadzora. DeepSeek-R1 postao je simbol kineske tehnološke moći i inovativnosti.
Filozofija: AI za sve
Liang Wenfeng i DeepSeek zastupaju filozofiju ‘AI za sve’. Oni vjeruju da bi tehnologija trebala biti dostupna svima, a ne samo velikim korporacijama. Zbog toga je DeepSeek objavio većinu svojih modela kao open-source, što je potaknulo globalnu suradnju i inovacije. Liang smatra da je ključ uspjeha u znatiželji i kreativnosti, a ne samo u komercijalnim interesima.
Mladi tim mijenja pravila
Jedna od najupečatljivijih stvari o DeepSeeku je njegov tim. Tvrtka zapošljava uglavnom mlade talente, nedavne diplomante s vrhunskih kineskih sveučilišta. Liang vjeruje da mladi istraživači donose svježinu i kreativnost, što je ključno za revolucionarne inovacije. Ova strategija pokazala se iznimno uspješnom, jer je DeepSeek u kratkom vremenu postigao niz impresivnih rezultata.
Utjecaj na globalnu AI scenu
Unatoč ograničenim resursima i američkim izvoznim kontrolama, DeepSeek je uspio razviti modele koji konkuriraju zapadnim tehnološkim gigantima. Njihov uspjeh naglašava alternativni pristup razvoju AI tehnologija, fokusirajući se na softversku optimizaciju i inovativne arhitekture umjesto na oslanjanje na skupu hardversku infrastrukturu.
Budućnost u rukama inovatora
“DeepSeek je više od obične AI tvrtke – to je pokret koji promiče dostupnost i inovaciju. Zahvaljujući Liang Wenfengovoj viziji i talentiranom timu, DeepSeek je uspio postaviti nove standarde u industriji, dok istovremeno čini AI pristupačnijim i održivijim. Njegova priča inspirira ne samo Kinu, već i cijeli svijet, pokazujući da inovacije mogu nastati iz znatiželje i predanosti.”
To je druga iteracija, prvu verziju provjerili smo i na OpenAI-jevu ChatGPT-u, koji je istaknuo datum osnivanja DeepSeekakao pogrešnim, pa smo potom DeepSeek tražili da sve još jednom provjeri točnost i stoga je o tom nesuglasju dva bota i u skladu s točnim činjenicama, DeepSeek i izvijestio u drugoj verziji.
Pouka je da nikako ne treba vjerovati niti jednom generativnom botu da neće počiniti činjeničnu pogrešku ili možda zamijeniti subjekte u priči ili nešto dodatno nepotrebno začiniti. Za kineski DeepSeek, vrijede sve mjere opreza kao i njegovim konkurentima poput, primjerice, ChatGPT-a i Anthropicovog Claudea. A zamjerili smo mu i neke jezične nespretnosti.
U svakom slučaju, DeepSeek je koristan alat kao i ostali botovi. A da je najnovija verzija DeepSeeka R1 doista ozbiljna konkurencija američkim tehno teškašima, u svojim tekstovima pisali su američki mediji te izvještavali o “panici koja je zavladala u Silicijskoj dolini’ ili pak “Kako novi AI model DeepSeek iz Kine prijeti američkom dominaciji”.
“Kineski jeftini, otvoreni AI model DeepSeek oduševljava znanstvenike”, napisao je Nature tri dana nakon što je kineska tvrtka 20. siječnja objavila veliki jezični model pod nazivom DeepSeek R1. Prema izvještaju Naturea, njegov učinak na određenim zadacima u kemiji, matematici i kodiranju usporediv je s onim OpenAI-ovog modela o1. CNBC, pak piše: “Malo poznata kineska tvrtka DeepSeek izazvala je veliku paniku u Silicijskoj dolini objavivši modele umjetne inteligencije koji premašuju najbolje američke, unatoč tome što su izgrađeni jeftinije i s manje moćnim čipovima”.
O kineskoj konkurenciji izjasnili su se i američki lideri. Tako je Satya Nadella, lider Microsofta o kineskom konkurentu kazao: “Vidjeti DeepSeekov novi model je zaista impresivno u smislu kako su zaista učinkovito napravili otvoreni model koji radi inferenciju u stvarnom vremenu, i koji je vrlo učinkovit u računalnoj snazi. Moramo vrlo ozbiljno shvatiti razvoj iz Kine”.
FOTO Znate li čemu sve može poslužiti tipka za glasnoću na vašem mobitelu? Ima sedam funkcija, a jedna vam može spasiti život