Digitalizacja nie ma sensu…

…jeśli ograniczamy ją tylko do wymiaru remediacji, zmiany formatu analogowego na cyfrowy i udostępniania takich zasobów opisanych odpowiednim standardem. Another boring digitisation project … but how does that really change things?pytają wprost autorzy oficjalnego bloga wspierającego program digitalizacji prowadzony przez JISC.

Problemów jest kilka: po pierwsze, chociaż prowadzone przez uznane instytucje (i firmy takie jak Google) wielkie programy masowej digitalizacji zwiększają nieustannie liczbę materiałów archiwalnych i publikacji w wersji cyfrowej, to wciąż jest to tylko niewielki wycinek wszystkich dostępnych potencjalnie zasobów. Świetnie wizualizuje to infografika opublikowana na stronach NYT, opisująca stan digitalizacji zasobów amerykańskich National Archives:

Skoro nie wszystkie zasoby są jeszcze zdigitalizowane, korzystanie wyłącznie z bibliotek i archiwów cyfrowych w badaniach historycznych staje się poważnym błędem. Tymczasem takie zasoby są bardzo łatwo osiągalne, można je przeglądać i analizować bez konieczności mniej lub bardziej uciążliwych wizyt w archiwum i bibliotece. Ostatecznie ich popularność i przydatność w badaniach może być zafałszowana, kiedy wykorzystuje się je nie dlatego, że mają odpowiednią zawartość, ale przede wszystkim dlatego, że są swobodnie dostępne. Te źródła i publikacje, które jeszcze nie zostały umieszczone online, mogą być marginalizowane.

Po drugie, standardowa digitalizacja przekształcająca analogowe dokumenty w ich cyfrowe wersje (choćby skan w formacie pdf, djvu itp.) uniemożliwia bardziej kreatywne i automatyczne przetwarzanie danych w nich zawartych. Tymczasem już przygotowany przez oprogramowanie OCR zestaw treści zdigitalizowanych materiałów pozwala budować indeksy, tworzyć wyszukiwarki, porównywać między sobą zawartość poszczególnych dokumentów. A to już otwarcie perspektywy na nowe formy edukacji i badań historycznych.