Digitální rozklad postihuje téměř 40 procent webových stránek starších 10 let

Ani digitální informace nebo webové stránky nejsou věčné. Nedávný výzkum ukazuje, že podléhají digitálnímu rozkladu, který je možná až překvapivě rychlý.

27.05.2024 - Stanislav Mihulka



Stalo se vám už, že jste na internetu hledali nějaký článek, který jste četli před lety a nemůžete ho najít? Pokud šlo o text z roku 2013 a starší, existuje poměrně vysoká šance, že jednoduše zmizel z internetu. Tak vypadá fenomén moderní doby, kterému se anglicky říká digital decay, tedy digitální rozklad.

Na digitální rozklad se zaměřil nedávný výzkum týmu odborníků amerického nezávislého think tanku Pew Research Center. Odborníci zjišťovali, jak postupuje degradace a zastarávání digitálních informací v průběhu času. Podle jejich analýz je zhruba 38 procent webových stránek, které byly k dispozici v roce 2013, v dnešní době nedostupných. Většinou to znamená, že byly smazány anebo odstraněny ze stále fungujících serverů.

Rezivějící internet

Badatelé pro tuto zajímavou analýzu využili náhodné vzorky téměř milionu webových stránek, které čerpali z archivů Common Crawl. Tento archív periodicky ukládá snímky webových stránek, z čehož je možné odvodit jejich vývoj v čase. Jak říkají autoři, mezi staršími archivovanými stránkami je vyšší počet dnes nedostupných stránek, což není úplně překvapivé.

Velmi zajímavé ale bylo, že digitálnímu rozkladu podléhají i stránky, které byly archivované teprve v roce 2021. Dnes je jejich nedostupná zhruba jedna pětina. Pozoruhodné je, že vůči digitálnímu rozkladu není úplně imunní ani populární Wikipedia. Zhruba 11 procent odkazů na zdroje ve Wikipedii je dnes již nedostupných.

Některé webové stránky jsou digitálním rozkladem doslova prolezlé. Asi u dvou procent všech studovaných webových stránek nefunguje ani jeden odkaz, který je na nich uvedený. Zároveň asi 53 procent webových stránek zahrnuje alespoň jeden nefunkční odkaz. 

Zajímavá jsou i čísla pro sociální síť X (dříve Twitter). Z 5 milionů studovaných příspěvků, které zde byly publikovány mezi lety 2013 a 2023 jich dnes není dostupných zhruba 18 procent. Obzvláště náchylné k digitálnímu rozkladu přitom jsou příspěvky v méně běžně užívaných jazycích, například v turečtině nebo arabštině.


Další články v sekci