Az Anthropic hivatalosan bemutatta a Claude Fable 5 modellt, amelyet a vállalat történetének legerősebb mesterséges intelligenciájaként mutat be. Az újdonság azonban nem csupán a teljesítménye miatt figyelemre méltó, hanem azért is, mert az Anthropic teljesen új megközelítést alkalmazott a biztonsági kockázatok kezelésére.
A vállalat gyakorlatilag két verziót hozott létre ugyanabból az alapmodellből:
- Claude Fable 5 – nyilvánosan elérhető változat
- Claude Mythos 5 – korlátozott hozzáférésű, kiberbiztonsági korlátozások nélküli változat
A Mythos 5 kizárólag ellenőrzött kiberbiztonsági szakemberek, kutatók, kritikus infrastruktúrát üzemeltető szervezetek és kormányzati partnerek számára érhető el.
Miért különleges a Claude Fable 5?
A korábbi modellekkel ellentétben az Anthropic nem csökkentette a modell képességeit.
A Fable 5 és a Mythos 5 ugyanazt az alapmodellt használja.
A különbség egy külső biztonsági rétegben található, amely figyeli a felhasználói kéréseket és eldönti:
- válaszolhat-e a Fable 5,
- vagy át kell irányítani a kérést egy korábbi modellhez.
Ha a rendszer veszélyesnek ítéli meg a kérést, akkor automatikusan a korábbi generációs Claude Opus 4.8 veszi át a válaszadást.
A felhasználó erről értesítést kap.
Milyen témákat figyel a rendszer?
Az Anthropic elsősorban az alábbi területeken aktiválja a korlátozásokat:
Kiberbiztonság
- exploit fejlesztés
- sérülékenységkutatás
- támadási láncok építése
- privilege escalation
- lateral movement
- védelmi mechanizmusok megkerülése
Biológia
- veszélyes kutatások
- laboratóriumi eljárások
Kémia
- potenciálisan káros vegyületek
AI modellek
- modelldesztilláció
- AI-rendszerek reprodukálása
Miért vezették be a korlátozásokat?
Az Anthropic szerint a korábbi Mythos modellek már képesek voltak:
✅ ismeretlen sérülékenységek felkutatására
✅ nagy kódbázisok elemzésére
✅ exploitok készítésére
✅ támadási útvonalak azonosítására
✅ jogosultságkiterjesztési lehetőségek felismerésére
A vállalat szerint ezek a képességek nem külön kiberbiztonsági tréning eredményeként jelentek meg, hanem a modell általános gondolkodási és programozási képességeinek fejlődéséből következtek.
Több mint 10 000 sérülékenységet talált
A korábbi Project Glasswing program során a Mythos előzetes verzióját mintegy 50 szervezet használta.
Az eredmények figyelemre méltóak voltak:
- több mint 10 000 magas vagy kritikus súlyosságú sérülékenységet találtak,
- ezek közül több ezer valódi hibának bizonyult.
Különösen aktív résztvevő volt:
A Cloudflare önmagában közel 2 000 sérülékenységet azonosított a program során.
Egy új probléma: könnyebb megtalálni a hibát, mint kijavítani
Az Anthropic szerint a szoftveripar egy új kihívással szembesül.
A mesterséges intelligencia:
- gyorsan talál hibákat,
- gyorsan elemzi a kódot,
- gyorsan priorizálja a sérülékenységeket.
Viszont a javítás továbbra is emberi erőforrást igényel:
- reprodukálás
- tesztelés
- fejlesztés
- minőségbiztosítás
- telepítés
A Glasswing programban a kritikus hibák átlagos javítási ideje körülbelül két hét volt.
Univerzális jailbreak még nincs
Az Anthropic több mint:
- 1 000 órányi tesztelést,
- külső red team vizsgálatokat,
- bug bounty programokat
használt annak ellenőrzésére, hogy a biztonsági korlátozások megkerülhetők-e.
A vállalat szerint jelenleg:
❌ nincs ismert univerzális jailbreak
amely teljesen kiiktatná a védelmi mechanizmust.
Ugyanakkor elismerik, hogy tökéletes védelem valószínűleg nem létezik.
30 napos adatmegőrzés
A bejelentés egyik legvitatottabb része az új adatkezelési szabály.
A Fable 5 és Mythos 5 használata során:
- minden interakciót 30 napig tárolnak,
- biztonsági elemzés céljából,
- visszaélés-felderítés céljából,
- jailbreak-vizsgálatok céljából.
Az Anthropic szerint:
- az adatokat nem használják modelltanításra,
- a hozzáféréseket naplózzák,
- a 30 nap letelte után törlik az adatokat (ha nincs jogi vagy biztonsági ok a megőrzésre).
Ez különösen fontos lehet GDPR, pénzügyi, egészségügyi vagy közigazgatási környezetben.
Mit jelent ez a gyakorlatban?
A Claude Fable 5 nem egyszerűen egy újabb AI modell.
Az Anthropic most először ismeri el nyíltan, hogy a legújabb generációs mesterséges intelligenciák már olyan kiberbiztonsági képességekkel rendelkeznek, amelyek potenciálisan felgyorsíthatják:
- a sérülékenységkutatást,
- az exploitfejlesztést,
- a támadási láncok kialakítását.
Ezért a vállalat nem a modell képességeit csökkentette, hanem a hozzáférést kezdte szabályozni.
A Fable 5 megjelenése jól mutatja, hogy az AI-ipar egy új korszakba lépett: a kérdés már nem csupán az, hogy egy modell mennyire okos, hanem az is, hogy milyen képességekhez ki férhet hozzá.




