- Za výpadek Cloudflaru nemohl hackerský útok, ale interní chyba
- Kvůli ní přestala fungovat velká část internetu, včetně našich webových stránek
- Výpadek služby byl nejhorší od roku 2019
Ačkoli internet působí robustním a decentralizovaným dojmem, v praxi stojí na několika málo službách, které využívá velká část subjektů pohybujících se na síti. Jednou z nich jsou například servery Amazonu v rámci jeho Web Services, jejichž nedávný výpadek postihl značnou část internetu. Jinak tomu není ani v případě služby Cloudflare, která včera zažila poměrně kuriózní výpadek – nestalo se tak po útoku zlotřilých hackerů, ale vinou interní chyby.
Nikoli DDoS útok, ale interní chyba
Po prošetření celého výpadku zaměstnanci Cloudflare zjistili, že problém měl vnitřní příčinu: důležitý soubor se neočekávaně zdvojnásobil a rozšířil po celé síti. To způsobilo problémy softwaru, který potřebuje číst tento soubor pro údržbu systému správy botů Cloudflare, který využívá model strojového učení k ochraně před bezpečnostními hrozbami. Tím byly ovlivněny základní služby CDN, bezpečnostní služby a několik dalších služeb Cloudflaru.
„Poté, co jsme zpočátku mylně předpokládali, že příznaky, které jsme pozorovali, byly způsobeny hyper-scale DDoS útokem, jsme správně identifikovali jádro problému a podařilo se nám zastavit šíření většího než očekávaného souboru funkcí a nahradit jej dřívější verzí souboru,“ napsal CEO Cloudfaru Matthew Prince v posmrtné analýze výpadku. Prince vysvětlil, že problém „byl vyvolán změnou oprávnění v jednom z našich databázových systémů, která způsobila, že databáze vygenerovala více záznamů do funkčního souboru používaného naším systémem správy botů“. Velikost tohoto funkčního souboru se tak zdvojnásobila. Funkční soubor, který byl větší, než se očekávalo, se poté rozšířil do všech počítačů, které tvoří síť Cloudfaru.
K celé nepříjemné záležitosti, která mimo jiné postihla i naše webové stránky, se vyjádřili také bezpečnostní experti z Check Pointu. „Výpadek služby Cloudflare se odehrál podle podobného scénáře, jaký jsme viděli u nedávných výpadků AWS a Azure. Jedná se o rozsáhlé platformy, které prostupují téměř všemi oblastmi moderního života. Jejich využití přináší řadu výhod, jako je snižování provozních nákladů či zvýšení dostupnosti bezpečnostních nástrojů, a i malé organizace s jejich pomocí získají výkon, který by dříve byl nemožný. Nevýhodou je, že pokud dojde k výpadku tak kritické platformy, dopady jsou globální,“ uvedl Jiří Kohout z Check Pointu.
„Z pohledu kybernetické bezpečnosti se jakákoli platforma, na které záleží tak velká část světového provozu, stává terčem. A i náhodný výpadek vyvolává rozruch a nejistotu, čehož umí útočníci také zneužít. Pokud by navíc incident podobného rozsahu byl vyvolán úmyslně, může dojít ke kolapsu komunikace s veřejností a ke zhroucení značného množství základních služeb,“ dodal Kohout. Tento výpadek Cloudflaru byl nejhorší od roku 2019 a společnost se zavázala přijmout opatření, aby v budoucnu podobným selháním zabránila.
