Web Archives: The Future(s) – trzy scenariusze rozwoju archiwistyki internetowej

Przygotowany przez Oxford Internet Institute raport Web Archives: The Future(s) proponuje wielowątkowe spojrzenie na archiwizację internetu (Web archiving). Ostateczną wersję dokumentu opublikowano pod koniec lipca, jest to wersja uzupełniona komentarzami przedstawicieli instytucji współpracujących w ramach konsorcjum Netpreserve. Dokument prezentuje szeroką perspektywę problemu zabezpieczania zasobów Sieci dla przyszłych pokoleń: obok przedstawienia wyzwań związanych z nowymi formami tych treści (social media) pokazuje także nowe kierunki wykorzystywania danych gromadzonych w archiwach internetu (wizualizacje, budowanie aplikacji w oparciu o dane archiwalne, społecznościowe opracowywanie zasobów itp.).

We wstępie raportu jego autorzy podkreślają, że część treści przygotowanego przez nich dokumentu, proponująca określone interpretacje przyszłości archiwizacji internetu nie może być interpretowana w perspektywie naiwnej futurologii. Wykorzystać ją raczej należy jako inspirację dla osób odpowiedzialnych za kształt projektów archiwizacyjnych, dla twórców systemów i metodologii zabezpieczania zasobów Sieci. Warto mieć w pamięci tę uwagę zapoznając się ze scenariuszami dotyczącymi przyszłości programów archiwizacji internetu i form wykorzystywania gromadzonych przez nie treści w badaniach naukowych.

Scenariusz 1: archiwalna nirwana

To zdecydowanie idealistyczny scenariusz. Archiwa internetu działają prężnie i bezpiecznie na podstawie respektowanych powszechnie standardów, zachowując jednocześnie swój otwarty charakter i elastyczność. Korzystanie z nich jest zwyczajnym elementem badań historycznych, socjologicznych, ekonomicznych, kulturowych. Poza środowiskiem akademickim archiwa wykorzystywane są w bieżącej polityce, biznesie, działalności edukacyjnej i pozarządowej. Ta zdecydowanie optymistyczna perspektywa nie ma – co przyznają autorzy opracowania – zbyt wielkich szans na urzeczywistnienie się w najbliższym czasie, jednak inspiruje do zadawania pytań dotyczących współczesnych, funkcjonujących już projektów: czy udostępniają one odpowiednie narzędzia do analizy treści, czy materiały zebrane w takich archiwach są opisane za pomocą odpowiednich metadanych, czy systemy archiwów są otwarte na twórczą aktywność ich użytkowników (także w perspektywie gromadzenia zasobów z serwisów społecznościowych)?

Scenariusz 2: apokalipsa

Najczarniejszy scenariusz przewiduje sytuację, w której internet – przez swój dynamiczny rozwój (rozwiązania języka HTML5, urządzenia mobilne) zostawia w tyle projekty archiwizacyjne, których założenia i technologie bardzo szybko stają się przestarzałe. Jedynie niewielka część aktualnych internetowych treści jest zabezpieczana. Mimo to pojawiają się problemy związane z objętością gromadzonych danych (technologie i koszty ich przechowywania). Urzeczywistnianie idei internetu semantycznego (Semantic Web) zmienia pojęcie treści (content) – stają się nią choćby relacje sieciowe w serwisach społecznościowych. Nowe okoliczności są wyzwaniem nie tylko dla instytucji zajmujących się archiwizacją internetu, ale także dla firm (Google), które wykorzystują ją w swojej biznesowej działalności (“let Google do it” is no longer a solution). W efekcie naukowcy w przeszłości korzystać mogą jedynie ze stosunkowo niewielkich archiwalnych zasobów treści online.

Scenariusz 3: internet jakiego nie znacie

To zdecydowanie najciekawszy według mnie scenariusz. W tej perspektywie internet ewoluuje w zupełnie nową formę medium, które posiada własne inteligentne mechanizmy i funkcjonuje jako złożony wirtualny organizm. Granice między tym, co sztuczne i komputerowe oraz żywe i ludzkie zacierają się. W takim przypadku archiwizacja jego aktywności staje się tak samo bezsensowna jak próby sczytywania na bieżąco aktywności ludzkiego mózgu.

Scenariusz 4: tylko alternatywa?

Ostatni scenariusz proponuje – jak przekonują autorzy opracowania – najbardziej prawdopodobną, nawet więcej – już teraz aktualną – perspektywę. Archiwa cyfrowe to głównie komputerowe alternatywy tradycyjnych papierowych archiwów. Funkcjonują zazwyczaj w oparciu o odpowiednie standardy, jednak nie są specjalnie popularne. Projekty archiwizacji internetu stanowią tymczasem już zupełny margines, naukowcy prowadzący badania na podstawie zasobów internetowych sami na własną rękę archiwizują potrzebne im materiały. Archiwizowane są jednak głównie zasoby statyczne, treści dynamicznie generowane w Sieci (live web, głównie w mediach społecznościowych) znikają tak szybko jak się pojawiają.

Równocześnie – w związku ze zmianą formy zabezpieczanych zasobów – zmienia się perspektywa archiwum – XIX-wieczny model instytucji archiwum ewoluuje w kierunku bazy danych.

Serdecznie zachęcam do lektury raportu Web Archives: The Future(s). Oprócz naszkicowanych wyżej scenariuszy znaleźć tam można cały katalog zagadnień związanych z archiwizacją internetu: pytania o rodzaje treści, jakie można i jakie powinno się archiwizować, o modele wykorzystania aktywności użytkowników do uzupełniania zasobów archiwum, o narzędzia, metodologie i technologie archiwizacji, wyszukiwania i analizowania zabezpieczanych danych.