DeepSeek med ny AI-modell

Kinesiske DeepSeek lanserte mandag en ny språkmodell, V3.2-Exp. Selskapet ble verdenskjent da den første modellen, R1, sendte sjokkbølger gjennom Wall Street i fjor.

Da R1 kom ut i 2024, stupte flere av de største amerikanske teknologiselskapene. Nvidia alene mistet nær 600 milliarder dollar i markedsverdi på én dag. Også Meta, Microsoft og Alphabet ble hardt rammet, og usikkerheten spredte seg gjennom hele det amerikanske aksjemarkedet.

DeepSeek viste da at det er mulig å trene språkmodeller langt billigere enn Silicon Valley hadde trodd, på mindre kraftige brikker og med langt færre ressurser.

Halverer kostnadene

Den nye modellen V3.2-Exp er en eksperimentell utgave av V3.1-Terminus, publisert mandag på Hugging Face. Modellen er utstyrt med en mekanisme kalt sparse attention, som gjør at systemet bare behandler data det anser som relevant. Ifølge Hugging Face halverer dette driftskostnadene sammenlignet med forrige versjon.

— Det er betydelig fordi det gjør modellen raskere og mer kostnadseffektiv å bruke uten merkbar ytelsessvekkelse. Dette gjør kraftig AI mer tilgjengelig for utviklere, forskere og mindre selskaper. Og kan føre til en bølge av nye og innovative applikasjoner, sier Nick Patience, analysesjef i The Futurum Group, til CNBC.

Risiko for feil

Metoden er likevel ikke uten svakheter. Flere eksperter peker på at sparse attention kan gjøre modellene mindre pålitelige.

— Det virkelige spørsmålet er om mekanismen faktisk kutter uvesentlig data, eller om den risikerer å utelate vesentlig informasjon. Og da blir utfallet mindre relevant, sier Ekaterina Almasque, investor og medgründer av BlankPage Capital, til CNBC.

Geopolitisk kappløp

DeepSeeks modeller kan kjøres direkte på kinesiskproduserte brikker som Ascend og Cambricon, uten behov for amerikanske leverandører. Dermed får lanseringen en tydelig geopolitisk dimensjon. Kina tar nye steg for å bli selvforsynt på AI, mens USA kjemper for å bevare sin posisjon.

Begrensninger og forbud

Samtidig har DeepSeek møtt bred regulatorisk motstand. Myndigheter i Italia, Australia, Tyskland og Tsjekkia har innført forbud eller restriksjoner, hovedsakelig i offentlig sektor. I Italia ble appen blokkert i app-butikker etter ordre fra datatilsynet, mens Australia har forbudt bruken på regjeringsenheter.

Tyske tilsynsmyndigheter har bedt Apple og Google fjerne appen fra sine butikker. Med henvisning til EUs personvernregler. Tsjekkia har på sin side forbudt bruken i statlig administrasjon av hensyn til nasjonal sikkerhet.

Mellomsteg

DeepSeek selv omtaler V3.2-Exp som et mellomsteg på vei mot neste generasjons arkitektur. Selskapet holder dermed tempoet oppe i utviklingsløpet. Og satser på å holde utviklermiljøet engasjert ved å kombinere lavere kostnader med åpen kildekode.

Hvorvidt tilnærmingen blir både pålitelig og lønnsom gjenstår å se.

DeepSeek med ny AI-modell

Kinesiske DeepSeek lanserte mandag en ny språkmodell, V3.2-Exp. Selskapet ble verdenskjent da den første modellen, R1, sendte sjokkbølger gjennom Wall Street i fjor.

Halverer kostnadene

Risiko for feil

Geopolitisk kappløp

Begrensninger og forbud

Mellomsteg

Relatert Innlegg

Huddlestock guider Visigon mot 100 mill.

Eide: – Frykten er at Norge havner på B-laget i EU

Sterk åpning snudde til børsfall i USA

Lufthansa-piloter varsler streik

Velkommen tilbake!

Opprette ny konto!

Hent passordet ditt

Er du sikker på at du vil låse opp dette innlegget?

Er du sikker på at du vil si opp abonnementet?