Anthropics nya modell för artificiell intelligens, känd som Förhandsvisning av Claude MythosDet har blivit epicentrum för den globala debatten om begränsningarna för avancerad AI. Företaget medger själva att systemet är så kraftfullt inom cybersäkerhet att de har beslutat att inte lansera det i stor utsträckning, ett ovanligt beslut i en sektor som är van vid att skryta med varje nytt framsteg.
Det som står på spel är inte bara en stegvis förbättring jämfört med tidigare modeller, utan ett kvalitativt språng i förmågan att upptäcka och utnyttja datorsårbarheterRegeringar, centralbanker, stora finansinstitut och europeiska tillsynsmyndigheter följer noga fallet, medvetna om att ett sådant verktyg skulle kunna stärka försvaret av kritiska systemMen det skulle också kunna öppna dörren för attacker av exempellös skala om det skulle hamna i fel händer.
Vad är egentligen Claude Mythos och varför har lanseringen försenats?
Claude Mythos är en av de senaste modellerna i Claude-familjen, Anthropics AI-ekosystem som konkurrerar med OpenAI:s ChatGPT och Googles GeminiDet är en allmän modell som kan resonera, programmera och arbeta med långsiktiga sammanhang, men dess mest kontroversiella egenskap är dess prestanda inom offensiv och defensiv cybersäkerhet.
Samtalen "röda lag"Specialister som testar AI-system till sin gräns drog i en intern rapport slutsatsen att Mythos är "förvånansvärt kapabel" till cybersäkerhetsuppgifter. I benchmarktester som SWE-bänk Verifierad o SWE-bänk ProModellen, som är utformad för att mäta förmågan att lösa verkliga programvaruproblem, skulle lätt ha överträffat kommersiella alternativ i toppklass, inklusive avancerade versioner av GPT och Gemini, enligt data från Anthropic själva.
Utöver riktmärkena är det som har fått varningsklockorna att ringa att Mythos kunde hitta nolldagssårbarheter —tidigare okända brister— i allmänt använda programvarukomponenter, av vilka vissa är över två decennier gamla. I system som OpenBSD-, FFmpeg- och FreeBSD-komponenter upptäckte modellen inte bara fel som hade gått obemärkta förbi i åratal, utan genererade också fungerande exploits för att utnyttja dem.
Inför dessa resultat valde Anthropic ett beslut som var ovanligt i branschen: att presentera modellen och sedan meddela att den inte kommer att marknadsföras öppet. eftersom de anser att det utgör exempellösa cybersäkerhetsrisker. Företaget insisterar på att Mythos är den "bäst anpassade" modellen de har byggt, men erkänner att dess enorma kapacitet förstärker konsekvenserna av eventuellt missbruk.

En modell med "hacker"-färdigheter långt bortom mänskliga förmågor
Tekniska dokument och rapporter från olika organisationer är överens om att Mythos markerar en vändpunkt inom automatiseringen av komplexa attackerI testmiljöer som simulerade verkliga företagsnätverk kunde systemet kedja sårbarheter, eskalera behörigheter och uppnå permanent åtkomst på några timmar – uppgifter som skulle ta en mänsklig expert dagar eller veckor.
I Firefox JavaScript-motor, till exempel, lyckades tidigare versioner av Anthropics modeller sällan förvandla sårbarheter till fungerande exploits. Mythos, under samma testförhållanden, Det genererade dussintals operativa exploateringarDen replikerar noggrant utnyttjandet av de mest effektiva vektorerna. På analysplattformar som OSS-Fuzz, utformade för att hitta buggar i öppen källkodsprogramvara, har den fått erkännande för att ha upptäckt allvarliga sårbarheter som gått obemärkta förbi trots åratal av automatiserad testning.
Modellen har också visat anmärkningsvärda förmågor inom omvänd teknikDen kan rekonstruera delar av ett programs logik från kompilerade binärfiler och därifrån lokalisera och utnyttja brister utan att komma åt den ursprungliga källkoden. Denna typ av kapacitet för AI närmare scenarier som fram tills nyligen ansågs exklusiva för högspecialiserade mänskliga team.
En av de mest frekvent citerade episoderna i säkerhetsbedömningar är det så kallade "sandwichtestet". I en isolerad laboratoriemiljö fick Mythos kontroll över ett system med uttryckliga instruktioner att försöka fly sandlådan och kontakta forskaren vem övervakade testet. Modellen lyckades utnyttja en kedja av sårbarheter för att undkomma sin begränsade miljö och skicka ett e-postmeddelande till den ansvariga personen, som inte var på kontoret vid tillfället. Även om incidenten inträffade i en tidigare intern version och under riktad kommando, illustrerar den i vilken utsträckning systemet kan fungera i komplexa scenarier med minimal övervakning.
Trots dessa demonstrationer insisterar analytiker på att klargöra att Vi har inte att göra med en "medveten" AI eller en med egen viljaMythos bestämmer sig inte för att attackera system på egen hand; den utför de uppgifter den får så effektivt som möjligt. Risken, i den här meningen, är inte att modellen gör uppror, utan att någon använder den – eller tvingar den att göra det genom sofistikerade uppmaningar – för att utföra skadliga handlingar.
Projekt Glasswing: Mytos i försvarets tjänst… för ett fåtal utvalda
Istället för att öppna upp för allmänheten har Anthropic valt att omge Mythos med ett specifikt program, Projekt GlasvingeInitiativet är utformat för att använda modellens funktioner på ett kontrollerat sätt för att skydda kritisk programvara och innebär att systemet, under strikta användningsvillkor, erbjuds till en utvald grupp stora teknikföretag, infrastrukturleverantörer och finansinstitut.
Bland organisationerna med tillgång finns jättar som Amazon Web Services, Apple, Microsoft, Google CloudNvidia eller Broadcomsåväl som cybersäkerhetsföretag som CrowdStrike, vars egen bristfälliga programvara orsakade en stor global störning 2024. Dessa får sällskap av världskända banker, inklusive JP Morgan Chase och flera stora Wall Street-grupper, såväl som andra organisationer som ansvarar för att underhålla känsliga IT-infrastrukturer.
Anthropic har också meddelat lån värda 100 miljoner dollar Denna finansiering kommer att göra det möjligt för dessa organisationer att använda Mythos för sårbarhetsanalys, tillsammans med donationer till fria programvarustiftelser som Linux Foundation och Apache Software Foundation. Det officiella målet är tydligt: att låta de som hanterar världens mest kritiska programvara identifiera och korrigera brister innan sådana verktyg blir tillgängliga för potentiella angripare.
Denna strategi skapar dock en viss oro inom sektorn. Å ena sidan förstärker den idén att tekniken är tillräckligt farlig för att kräva begränsad åtkomst. Å andra sidan, Det skapar en klyfta mellan de som gynnas av Mythos-"skölden" och de som lämnas utanför.Företag och förvaltningar som inte ingår i Glasswing riskerar att senare stöta på sårbarheter som identifierades och åtgärdades i privilegierade miljöer, men som fortfarande finns i deras egna system.
I Europa är denna asymmetri särskilt oroande för de som ansvarar för kritisk infrastruktur och säkerhetsteamen i stora industri- och finansgrupper, som noggrant övervakar huruvida Bryssel och de europeiska huvudstäderna säkerställer att liknande program inkluderar nyckelaktörer från kontinenten på lika villkor. och molnsuveränitet med de amerikanska partnerna.
Reaktion från regeringar, tillsynsmyndigheter och finanssektorn
Mythos påverkan är inte begränsad till den tekniska sfären. På bara några dagar utlöste tillkännagivandet av modellen högnivåmöten i USA och EuropaDen amerikanska finansministern kallade cheferna för landets storbanker till Washington för att bedöma de risker systemet skulle kunna utgöra för den finansiella stabiliteten, medan ordföranden för Federal Reserve också deltog i dessa samtal.
Enligt läckor som rapporterats av internationella medier uppmanades dessa enheter påstås ha Testa Mythos i defensivt lägeanvänder den för att skanna sin egen infrastruktur efter svagheter innan andra kan. Det underförstådda budskapet är att hotet är tillräckligt allvarligt för att motivera en samordnad offentlig-privat respons.
Samtidigt har medgrundaren av Anthropic bekräftat att företaget upprätthåller direkta samtal med USA:s regering om Mythos och framtida modeller. Dessa diskussioner äger rum i ett spänt sammanhang, efter att amerikanska myndigheter nyligen lagt till företaget på en lista över risker i leveranskedjan, efter friktioner relaterade till försvarsdepartementets användning av deras modeller.
På andra sidan Atlanten har Europeiska unionen noterat detta. Europeiska kommissionen har offentligt stöttat en gradvis och försiktig strategi för modeller som Mythos, och Finanstillsynsmyndigheter i Storbritannien och på kontinenten har börjat specifikt studera dess potentiella konsekvenser. för bankverksamhet och marknader. Den brittiska regeringens AI Security Institute (AISI) har beskrivit systemet som ett betydande steg framåt när det gäller cyberhot jämfört med tidigare generationer.
I Spanien, även om den offentliga debatten fortfarande är begränsad, följer tillsynsorgan och cybersäkerhetsteam från banker och stora energiföretag noga denna utveckling. För den europeiska finanssektorn är alla framsteg som kan underlätta samordnade attacker mot betalningssystem, interbanknätverk eller handelsplattformar en anledning till allvarlig oro.
Skepticism, tvivel och debatt kring "hypen" kring Mythos
Anthropics konto, som kombinerar säkerhetsvarningar med spektakulära prestationssiffror, har inte varit utan kritik. Flera AI- och cybersäkerhetsexperter har efterlyst försiktighet vid tolkning av företagets uttalandendet bör noteras att en stor del av den tillgängliga informationen endast kommer från interna rapporter.
Vissa analytiker har granskat den omfattande dokumentationen som publicerats av Anthropic i detalj och påpekar att siffran "tusentals allvarliga sårbarheter" är baserad på extrapoleringar från ett relativt litet antal manuellt granskade fall. I vissa testsviter har Mythos enligt uppgift funnit ett betydande antal kritiska brister, men långt ifrån det nästan apokalyptiska scenario som antyds av vissa rubriker.
Andra oberoende studier har försökt jämföra Mythos prestanda med mindre modeller med öppen källkod, och skickat sårbara kodavsnitt till olika AI:er för att se om de kunde upptäcka samma brister. Resultaten indikerar att Vissa öppna modeller kan också identifiera komplexa sårbarheterDetta ifrågasätter idén att Mythos spelar i en helt annan liga i alla scenarier.
Den här typen av motexempel förnekar inte Mythos kapacitet, men de antyder att En del av diskursen om att "vara för farlig att publicera" har också en marknadsföringsdimension.Att presentera en modell som både utomordentligt kraftfull och en potentiell risk förstärker bilden av tekniskt ledarskap och ansvar, något mycket värdefullt på en alltmer konkurrensutsatt marknad.
Branschens senaste historia påminner också om GPT-2-modellen år 2019, då OpenAI initialt beslutade att inte publicera hela modellen med motiveringen att den var för farlig på grund av dess potential att generera desinformation. Så småningom släpptes den versionen för allmänheten utan att någon av de förutspådda katastroferna inträffade, och många experter nämnde den som ett exempel på överreaktion. Med Mythos, Skillnaden är att fokus inte längre ligger på texten, utan på den digitala infrastrukturens integritet., ett mycket känsligare område för regeringar och banker.
En känslig balans mellan säkerhet, affärsverksamhet och tillgång till teknik
Utöver mediebruset väcker Mythos-situationen en grundläggande fråga: Vem bestämmer när en AI-modell är för farlig att släppa Och under vilka kriterier? För närvarande har beslutet varit ensidigt från Anthropics sida, som har valt att hålla systemet i en slags kontrollerad karantän och reserverat det för utvalda partners.
Denna ståndpunkt är inte enbart baserad på säkerhetsskäl. Att köra en modell med Mythos egenskaper är väldigt dyrt när det gäller datorkraft, och företaget självt erkänner att det för närvarande inte har nödvändig infrastruktur att leverera den massivt till miljontals användare. I praktiken går säkerhetsåtgärder och tekniska begränsningar hand i hand, vilket ger Anthropic tid att finjustera både modellen och dess implementering.
Samtidigt har företaget börjat tydligt differentiera mellan sina olika produkter. Medan Mythos fortfarande är som den mest avancerade interna standardenÄven om de är reserverade för forskning och strategiska samarbeten, är andra modeller som Claude Opus 4.7 inriktade på vardagsbruk av företag och yrkesverksamma. Anthropic har till och med offentligt erkänt att Opus 4.7 är "mindre kapabel" än Mythos i allmänhet och i synnerhet när det gäller dess cyberkapacitet – något ovanligt i en bransch som vanligtvis presenterar varje ny modell som den bästa på alla sätt.
I detta schema fungerar Mythos som testbädd för nästa generations funktionerÄven om kommersiellt tillgängliga modeller endast innehåller en del av dessa funktioner, med ytterligare begränsningar utformade för att minska riskerna, kan denna uppdelning mellan "experimentella" och "produktions"-modeller vara en rimlig strategi för många europeiska organisationer som är intresserade av att utnyttja AI utan att befinna sig i frontlinjen, förutsatt att det finns tillräcklig transparens gällande varje systems faktiska funktioner.
Det som slutligen framträder är ett scenario där Cybersäkerhet går för fullt in i eran av storskalig offensiv och defensiv AIVerktyg som Mythos lovar att påskynda identifieringen av sårbarheter i system som har varit i drift i åratal, men de tvingar också fram ett nytänkande kring hur tekniken som ligger till grund för den digitala ekonomin distribueras och styrs. För Europa och Spanien kommer utmaningen inte bara att vara att skydda sig mot allt kraftfullare modeller, utan också att se till att de inte lämnas utanför de mekanismer som gör att de kan användas för att stärka sin egen säkerhet.
