Anthropic bemutatta a Claude Fable 5 modellt – minden eddiginél erősebb mesterséges intelligencia érkezett

Az Anthropic hivatalosan bemutatta a Claude Fable 5 modellt, amelyet a vállalat történetének legerősebb mesterséges intelligenciájaként mutat be. Az újdonság azonban nem csupán a teljesítménye miatt figyelemre méltó, hanem azért is, mert az Anthropic teljesen új megközelítést alkalmazott a biztonsági kockázatok kezelésére.

A vállalat gyakorlatilag két verziót hozott létre ugyanabból az alapmodellből:

Claude Fable 5 – nyilvánosan elérhető változat
Claude Mythos 5 – korlátozott hozzáférésű, kiberbiztonsági korlátozások nélküli változat

A Mythos 5 kizárólag ellenőrzött kiberbiztonsági szakemberek, kutatók, kritikus infrastruktúrát üzemeltető szervezetek és kormányzati partnerek számára érhető el.

Miért különleges a Claude Fable 5?

A korábbi modellekkel ellentétben az Anthropic nem csökkentette a modell képességeit.

A Fable 5 és a Mythos 5 ugyanazt az alapmodellt használja.

A különbség egy külső biztonsági rétegben található, amely figyeli a felhasználói kéréseket és eldönti:

válaszolhat-e a Fable 5,
vagy át kell irányítani a kérést egy korábbi modellhez.

Ha a rendszer veszélyesnek ítéli meg a kérést, akkor automatikusan a korábbi generációs Claude Opus 4.8 veszi át a válaszadást.

A felhasználó erről értesítést kap.

Milyen témákat figyel a rendszer?

Az Anthropic elsősorban az alábbi területeken aktiválja a korlátozásokat:

Kiberbiztonság

exploit fejlesztés
sérülékenységkutatás
támadási láncok építése
privilege escalation
lateral movement
védelmi mechanizmusok megkerülése

Biológia

veszélyes kutatások
laboratóriumi eljárások

Kémia

potenciálisan káros vegyületek

AI modellek

modelldesztilláció
AI-rendszerek reprodukálása

Miért vezették be a korlátozásokat?

Az Anthropic szerint a korábbi Mythos modellek már képesek voltak:

✅ ismeretlen sérülékenységek felkutatására

✅ nagy kódbázisok elemzésére

✅ exploitok készítésére

✅ támadási útvonalak azonosítására

✅ jogosultságkiterjesztési lehetőségek felismerésére

A vállalat szerint ezek a képességek nem külön kiberbiztonsági tréning eredményeként jelentek meg, hanem a modell általános gondolkodási és programozási képességeinek fejlődéséből következtek.

Több mint 10 000 sérülékenységet talált

A korábbi Project Glasswing program során a Mythos előzetes verzióját mintegy 50 szervezet használta.

Az eredmények figyelemre méltóak voltak:

több mint 10 000 magas vagy kritikus súlyosságú sérülékenységet találtak,
ezek közül több ezer valódi hibának bizonyult.

Különösen aktív résztvevő volt:

A Cloudflare önmagában közel 2 000 sérülékenységet azonosított a program során.

Egy új probléma: könnyebb megtalálni a hibát, mint kijavítani

Az Anthropic szerint a szoftveripar egy új kihívással szembesül.

A mesterséges intelligencia:

gyorsan talál hibákat,
gyorsan elemzi a kódot,
gyorsan priorizálja a sérülékenységeket.

Viszont a javítás továbbra is emberi erőforrást igényel:

reprodukálás
tesztelés
fejlesztés
minőségbiztosítás
telepítés

A Glasswing programban a kritikus hibák átlagos javítási ideje körülbelül két hét volt.

Univerzális jailbreak még nincs

Az Anthropic több mint:

1 000 órányi tesztelést,
külső red team vizsgálatokat,
bug bounty programokat

használt annak ellenőrzésére, hogy a biztonsági korlátozások megkerülhetők-e.

A vállalat szerint jelenleg:

❌ nincs ismert univerzális jailbreak

amely teljesen kiiktatná a védelmi mechanizmust.

Ugyanakkor elismerik, hogy tökéletes védelem valószínűleg nem létezik.

30 napos adatmegőrzés

A bejelentés egyik legvitatottabb része az új adatkezelési szabály.

A Fable 5 és Mythos 5 használata során:

minden interakciót 30 napig tárolnak,
biztonsági elemzés céljából,
visszaélés-felderítés céljából,
jailbreak-vizsgálatok céljából.

Az Anthropic szerint:

az adatokat nem használják modelltanításra,
a hozzáféréseket naplózzák,
a 30 nap letelte után törlik az adatokat (ha nincs jogi vagy biztonsági ok a megőrzésre).

Ez különösen fontos lehet GDPR, pénzügyi, egészségügyi vagy közigazgatási környezetben.

Mit jelent ez a gyakorlatban?

A Claude Fable 5 nem egyszerűen egy újabb AI modell.

Az Anthropic most először ismeri el nyíltan, hogy a legújabb generációs mesterséges intelligenciák már olyan kiberbiztonsági képességekkel rendelkeznek, amelyek potenciálisan felgyorsíthatják:

a sérülékenységkutatást,
az exploitfejlesztést,
a támadási láncok kialakítását.

Ezért a vállalat nem a modell képességeit csökkentette, hanem a hozzáférést kezdte szabályozni.

A Fable 5 megjelenése jól mutatja, hogy az AI-ipar egy új korszakba lépett: a kérdés már nem csupán az, hogy egy modell mennyire okos, hanem az is, hogy milyen képességekhez ki férhet hozzá.

Sió-Informatika Rendszerház