Cloudflare Kiderítette a Globális Internetleállás Okát

Cloudflare internet outage 2025

2025 november 18-án, 11:20 UTC körül a Cloudflare hálózata jelentős forgalom-szolgáltatási hibákat kezdett mutatni. A felhasználók világszerte HTTP 5XX hibakódokat láttak – tipikusan olyan szerveroldali hibákat, amelyek kritikus meghibásodást jeleznek. A vállalat hangsúlyozta, hogy nem kibertámadás vagy rosszindulatú aktivitás okozta az incidenst.

A hatás viszont óriási volt: olyan nagy szolgáltatások, mint az X (Twitter), az OpenAI / ChatGPT, valamint számos webalkalmazás és API leállt vagy súlyosan lelassult.

Miért ennyire jelentős ez? Mert a Cloudflare az internet egyik „láthatatlan gerince”: saját adatai szerint világszerte több mint az összes weboldal 20%-a támaszkodik valamilyen Cloudflare-szolgáltatásra. A vállalat védi, gyorsítja és optimalizálja weboldalak, API-k és AI-folyamatok működését – így egyetlen hiba is globális zavarokat okozhat.


Mi történt? – A technikai hiba részletes feltárása

A Cloudflare részletes incidensjelentése alapján a probléma egy látszólag apró, de súlyos következményekkel járó változtatásból indult ki.

🔧 1. Jogosultságmódosítás a ClickHouse adatbázisban

11:05 UTC körül módosították a ClickHouse-adatbázis egyik jogosultsági beállítását. Ennek hatására a rendszer olyan metaadatokat is megmutatott az úgynevezett „r0” shardokból, amelyek normál esetben nem lettek volna láthatók.

Ez duplikált metaadat-sorokhoz vezetett a lekérdezésekben.

🔧 2. A Bot Management modul „feature file”-ja duplájára hízott

A Cloudflare Bot Management rendszere egy globálisan terjesztett konfigurációs fájlt („feature file”) használ. A duplikált metaadatok miatt:

  • a fájl több mint duplájára nőtt,
  • a rendszer jóval több bejegyzést érzékelt (kb. 60 helyett 150–200+),
  • ami túllépte a modul memóriahatárait,
  • és összeomlást váltott ki a Cloudflare forgalomirányító moduljaiban.
🔧 3. Összeomlások és láncreakció

Az érvénytelen konfiguráció az egész hálózatra szétterjedt, minden szerverre, beleértve:

  • FL („Frontline”) proxyk
  • új generációs FL2 proxyk

Az FL2-n HTTP 5XX hibák jelentek meg.
A régebbi FL motoron a bot-score 0 értéket vett fel, ami hamis blokkolásokat generált.

🔧 4. Helyreállítás

A Cloudflare felismerte, hogy nem DDoS-ról van szó. Ezután:

  • 14:24-kor leállították a hibás fájl terjesztését,
  • visszaállították az utolsó stabil verziót,
  • újraindították a rendszereket.

14:30-ra a fő hiba megszűnt,
17:06-ra teljesen normalizálódott a működés.


Tágabb következmények és tanulságok

🌐 1. A globális internet néhány szereplőn múlik

A Cloudflare-hez hasonló infrastruktúraszolgáltatók hibái világszintű dominóhatást okozhatnak.

Egy szakértő szerint:

„A Cloudflare a digitális közlekedésirányító – ha ő hibázik, mindenki megérzi.”

🧩 2. A komplexitás törékennyé teszi a rendszereket

A probléma nem rosszindulatból, hanem egy jó szándékú jogosultsági módosításból indult.
Ez láncreakciót indított a:

  • adatbázis-metaadatok →
  • feature file gyártás →
  • memóriahasználat →
  • proxy összeomlás útvonalon.
📢 3. Transzparencia és felelősség

A Cloudflare elismerte:

„Ez volt a 2019 óta tapasztalt legrosszabb leállásunk.”

A vállalat részletesen és átláthatóan kommunikált – ami kiemelten fontos az internet ökoszisztéma bizalmának fenntartásához.


Mi változik a Cloudflare-nél?

A vállalat az alábbi lépéseket vezeti be:

  • Automatikusan generált konfigurációk keményítése (úgy kezelik, mint a felhasználói inputot).
  • Globális kill-switch mechanizmusok kulcskomponensekre.
  • Folyamatok felülvizsgálata, hogy egyetlen összeomlás se okozhasson hálózatszintű hibaállapotot.
  • Jobb hibatűrés és biztonsági szeparáció a proxy modulok között.

Mit tegyenek az ügyfelek?

Ha Cloudflare-en fut a weboldalad vagy API-d:

✔ Ellenőrizd a függőségeket

Mérd fel, mennyire vagy Cloudflare-függő.
Fontold meg:

  • több CDN használatát,
  • multi-provider architektúrákat,
  • vagy fallback útvonalakat fontos rendszerekhez.
✔ Kövesd a saját hibamutatóidat

Ha hirtelen megugrik a hiba vagy a késleltetés, lehet, hogy nem a te rendszered hibás, hanem upstream probléma.

✔ Végfelhasználók számára

Ha a kedvenc oldalad 500-as hibát dob,
lehet, hogy:

  • nem az oldal van gondban,
  • hanem valamelyik internetes infrastruktúra-réteg.

Következtetés

A 2025. november 18-i Cloudflare-leállás éles emlékeztető:
az internet felszíne mögött hihetetlenül komplex infrastruktúra működik.

Egy aprónak tűnő jogosultságmódosítás olyan láncreakciót indíthat el, amely világszerte szolgáltatások millióit érinti.

Ahogy a társadalom egyre inkább a webes, felhős és AI-alapú szolgáltatásokra támaszkodik, a hibahatár folyamatosan csökken. A nagy infrastruktúraszereplők felelőssége pedig nő:

  • tűrni a váratlant,
  • minimalizálni a single-point-of-failure helyzeteket,
  • és megtartani a bizalmat, amelyre a teljes digitális világ épül.

Az oldal tartalma nem másolható!