Anthropic bemutatta a Claude Fable 5 modellt – minden eddiginél erősebb mesterséges intelligencia érkezett

Claude Fable 5: az Anthropic bemutatta minden eddiginél erősebb AI modelljét

Az Anthropic hivatalosan bemutatta a Claude Fable 5 modellt, amelyet a vállalat történetének legerősebb mesterséges intelligenciájaként mutat be. Az újdonság azonban nem csupán a teljesítménye miatt figyelemre méltó, hanem azért is, mert az Anthropic teljesen új megközelítést alkalmazott a biztonsági kockázatok kezelésére.

A vállalat gyakorlatilag két verziót hozott létre ugyanabból az alapmodellből:

  • Claude Fable 5 – nyilvánosan elérhető változat
  • Claude Mythos 5 – korlátozott hozzáférésű, kiberbiztonsági korlátozások nélküli változat

A Mythos 5 kizárólag ellenőrzött kiberbiztonsági szakemberek, kutatók, kritikus infrastruktúrát üzemeltető szervezetek és kormányzati partnerek számára érhető el.


Miért különleges a Claude Fable 5?

A korábbi modellekkel ellentétben az Anthropic nem csökkentette a modell képességeit.

A Fable 5 és a Mythos 5 ugyanazt az alapmodellt használja.

A különbség egy külső biztonsági rétegben található, amely figyeli a felhasználói kéréseket és eldönti:

  • válaszolhat-e a Fable 5,
  • vagy át kell irányítani a kérést egy korábbi modellhez.

Ha a rendszer veszélyesnek ítéli meg a kérést, akkor automatikusan a korábbi generációs Claude Opus 4.8 veszi át a válaszadást.

A felhasználó erről értesítést kap.


Milyen témákat figyel a rendszer?

Az Anthropic elsősorban az alábbi területeken aktiválja a korlátozásokat:

Kiberbiztonság
  • exploit fejlesztés
  • sérülékenységkutatás
  • támadási láncok építése
  • privilege escalation
  • lateral movement
  • védelmi mechanizmusok megkerülése
Biológia
  • veszélyes kutatások
  • laboratóriumi eljárások
Kémia
  • potenciálisan káros vegyületek
AI modellek
  • modelldesztilláció
  • AI-rendszerek reprodukálása

Miért vezették be a korlátozásokat?

Az Anthropic szerint a korábbi Mythos modellek már képesek voltak:

✅ ismeretlen sérülékenységek felkutatására

✅ nagy kódbázisok elemzésére

✅ exploitok készítésére

✅ támadási útvonalak azonosítására

✅ jogosultságkiterjesztési lehetőségek felismerésére

A vállalat szerint ezek a képességek nem külön kiberbiztonsági tréning eredményeként jelentek meg, hanem a modell általános gondolkodási és programozási képességeinek fejlődéséből következtek.


Több mint 10 000 sérülékenységet talált

A korábbi Project Glasswing program során a Mythos előzetes verzióját mintegy 50 szervezet használta.

Az eredmények figyelemre méltóak voltak:

  • több mint 10 000 magas vagy kritikus súlyosságú sérülékenységet találtak,
  • ezek közül több ezer valódi hibának bizonyult.

Különösen aktív résztvevő volt:

A Cloudflare önmagában közel 2 000 sérülékenységet azonosított a program során.


Egy új probléma: könnyebb megtalálni a hibát, mint kijavítani

Az Anthropic szerint a szoftveripar egy új kihívással szembesül.

A mesterséges intelligencia:

  • gyorsan talál hibákat,
  • gyorsan elemzi a kódot,
  • gyorsan priorizálja a sérülékenységeket.

Viszont a javítás továbbra is emberi erőforrást igényel:

  • reprodukálás
  • tesztelés
  • fejlesztés
  • minőségbiztosítás
  • telepítés

A Glasswing programban a kritikus hibák átlagos javítási ideje körülbelül két hét volt.


Univerzális jailbreak még nincs

Az Anthropic több mint:

  • 1 000 órányi tesztelést,
  • külső red team vizsgálatokat,
  • bug bounty programokat

használt annak ellenőrzésére, hogy a biztonsági korlátozások megkerülhetők-e.

A vállalat szerint jelenleg:

❌ nincs ismert univerzális jailbreak

amely teljesen kiiktatná a védelmi mechanizmust.

Ugyanakkor elismerik, hogy tökéletes védelem valószínűleg nem létezik.


30 napos adatmegőrzés

A bejelentés egyik legvitatottabb része az új adatkezelési szabály.

A Fable 5 és Mythos 5 használata során:

  • minden interakciót 30 napig tárolnak,
  • biztonsági elemzés céljából,
  • visszaélés-felderítés céljából,
  • jailbreak-vizsgálatok céljából.

Az Anthropic szerint:

  • az adatokat nem használják modelltanításra,
  • a hozzáféréseket naplózzák,
  • a 30 nap letelte után törlik az adatokat (ha nincs jogi vagy biztonsági ok a megőrzésre).

Ez különösen fontos lehet GDPR, pénzügyi, egészségügyi vagy közigazgatási környezetben.


Mit jelent ez a gyakorlatban?

A Claude Fable 5 nem egyszerűen egy újabb AI modell.

Az Anthropic most először ismeri el nyíltan, hogy a legújabb generációs mesterséges intelligenciák már olyan kiberbiztonsági képességekkel rendelkeznek, amelyek potenciálisan felgyorsíthatják:

  • a sérülékenységkutatást,
  • az exploitfejlesztést,
  • a támadási láncok kialakítását.

Ezért a vállalat nem a modell képességeit csökkentette, hanem a hozzáférést kezdte szabályozni.

A Fable 5 megjelenése jól mutatja, hogy az AI-ipar egy új korszakba lépett: a kérdés már nem csupán az, hogy egy modell mennyire okos, hanem az is, hogy milyen képességekhez ki férhet hozzá.

Az oldal tartalma nem másolható!