- Internet Archive patří mezi nejznámější internetové archivy
- Uchovává mimo jiné více než 866 miliard webových stránek
- Za dobu jeho existence se mu nevyhnuly ani některé kontroverze
Dnes už většina uživatelů internetu ví, že cokoli se na síti objeví, už tam navždy zůstane. V případě internetového archivu jednoduše nazvaného Internet Archive to nicméně platí dvojnásob. Tato nenápadná americká nezisková organizace už 28 let uchovává velkou porci veřejně přístupného internetu na svých stránkách – poskytuje bezplatný přístup ke sbírkám digitalizovaných materiálů včetně webových stránek, softwarových aplikací, hudby, audiovizuálních a tištěných materiálů. Archiv se rovněž zasazuje o svobodný a otevřený internet. Internetový archiv umožňuje veřejnosti nahrávat a stahovat digitální materiál do svého datového clusteru, ale většinu dat shromažďuje automaticky pomocí svých webových crawlerů, které se snaží zachovat co největší část veřejného webu. Jaká je ale jeho historie?
Internetový archiv existuje už téměř tři dekády
Internetový archiv založil Brewster Kahle v květnu 1996, přibližně ve stejné době, kdy založil výdělečnou společnost Alexa Internet, která se zabývá procházením webových stránek. Nejstarší známá archivovaná stránka na webu byla uložena 10. května 1996. V říjnu téhož roku začal Internet Archive ve velkém archivovat a uchovávat veřejnou internetovou síť.
Koncem roku 1999 rozšířil archiv své sbírky i mimo webový archiv, a to o Prelingerův archiv. Nyní internetový archiv zahrnuje texty, zvukové záznamy, pohyblivé obrázky a software. Nachází se v něm i řada dalších projektů, kupříklad archiv snímků NASA, smluvní procházení služby Archive-It a webu Open Library, který umožňuje editaci knihovního katalogu a informací o knihách pomocí wiki. Brzy poté začal Archiv pracovat na poskytování specializovaných služeb pro osoby se zdravotním handicapem, přičemž veřejně přístupné knihy byly zpřístupněny v chráněném formátu DAISY. Archivovaný obsah je široké veřejnosti lépe dostupný od roku 2001 prostřednictvím Wayback Machine.
V srpnu 2012 Internet Archive oznámil, že přidal novou možnost pro stahování souborů BitTorrent pro více než 1,3 milionu existujících souborů a všechny nově nahrané soubory. Tato metoda je nejrychlejším způsobem stahování médií z Archivu, protože soubory jsou obsluhovány ze dvou datových center a navíc z dalších uživatelů, kteří soubory stáhli a nadále je sdílí.
Požár málem Internetový archiv ukončil
Šestého listopadu 2013 došlo v sídle Internetového archivu v sanfranciské čtvrti Richmond k požáru, který zničil vybavení a poškodil několik okolních bytů. Archiv tehdy přišel o budovu, v níž se nacházelo jedno z 30 skenovacích center, kamery, světla a skenovací zařízení v hodnotě stovek tisíc dolarů, a pravděpodobně také o 20 krabic knih a filmů, z nichž některé jsou nenahraditelné. Neziskový archiv se snažil získat dary na pokrytí škod v odhadované výši 600 tisíc dolarů (cca 14 milionů korun).

V listopadu 2016 Kahle oznámil, že Internet Archive buduje Internet Archive of Canada – kopii archivu, která bude sídlit na území Kanady. Toto oznámení se dočkalo velkého ohlasu především kvůli narážce, že rozhodnutí vybudovat záložní archiv v zahraničí bylo způsobeno nadcházejícím prezidentstvím Donalda Trumpa.
V květnu letošního roku byl archiv vystaven sérii distribuovaných útoků typu DDoS, které způsobily rozsáhlé výpadky populární služby. K útoku se 28. května přihlásila hackerská skupina SN_BLACKMETA, s možnými vazbami na Anonymous Sudan. Incident vyvolal srovnání s kybernetickým útokem na Britskou knihovnu z roku 2023, který postihl britský webový archiv.
Archivu se nevyhnuly ani kontroverze
V únoru 2016 začal Internet Archive archivovat digitální kopie časopisu Nintendo Power, oficiálního časopisu společnosti Nintendo zaměřeného na její hry a produkty, který vycházel v letech 1988 až 2012. Prvních 140 čísel už bylo archivováno, avšak společnost Nintendo nechala 8. srpna 2016 tyto záznamy odstranit. V srpnu 2017 ministerstvo telekomunikací indické vlády zablokovalo Internet Archive spolu s dalšími webovými stránkami pro sdílení souborů. V srpnu 2023 zažalovaly společnosti Universal Music Group, Sony Music a Concord archiv kvůli projektu Great 78 a tvrdily, že projekt porušuje autorská práva.
Ačkoli Internet Archive nejspíše nevyužíváme každý den, stále se jedná o velmi důležitou službu, která nám dává nahlédnout do minulosti dynamicky se rozvíjejícího internetu. V jeho archivech najdeme přes 42 milionu tištěných materiálů, 13 milionů videí, 1,2 milionu softwarových programů, 14 milionů zvukových souborů, 5 milionů obrázků, 272 660 koncertů a více než 866 miliard webových stránek. Jakou stránku jste si naposledy prohlíželi? Dejte nám vědět v komentářích.