Інтернет, який ми сприймаємо як місце вічного зберігання інформації, насправді поступово втрачає свій контент.
Дослідження, проведене Pew Research Center, показує, що вебсторінки та онлайн-контент поступово зникають. Аналітики використали сервіс Common Crawl для архівування даних, обравши майже мільйон вебсторінок для аналізу. Вони перевірили, чи ці сторінки ще існують у період з 2013 по 2023 рік.
Результати виявилися приголомшливими: 25% відібраних сторінок більше не доступні. З них 16% зниклих сторінок розміщувалися на сайтах, які все ще працюють, а 9% – на тих, що повністю закрилися. Виявилося, що навіть для давнішого контенту ця тенденція актуальна: 38% вебсторінок, які існували у 2013 році, нині недоступні. Зникають навіть сторінки, створені нещодавно – 8% з тих, що були доступні у 2023 році, вже неможливо знайти.
Сторінки зникають переважно через видалення або переміщення, а не через закриття самих вебресурсів. Це призводить до втрати великої кількості новин і важливого довідкового контенту. Дослідження показало, що близько 23% новинних сайтів містять щонайменше одне недійсне посилання, 21% урядових вебсайтів мають подібну проблему, а 54% посилань у джерелах Вікіпедії більше не існує.
Аналогічна ситуація спостерігається і в соціальних мережах. П’ята частина твітів зникає з платформи протягом декількох місяців після публікації.
Таким чином, хоча інтернет здається невичерпним джерелом інформації, реальність така, що значна частина контенту зникає з часом. Це змушує замислитися про важливість архівування та збереження даних у цифровому світі.
Джерело Pew Research Center