London Lives – poznaj ciemną stronę XVIII-wiecznego Londynu

Profesor Tim Hitchcock zrealizował kolejny już po The Old Bailey Proceedings internetowy projekt archiwalny oparty o mechanizm wyszukiwania pełnotekstowego w treści źródeł. London Lives to opisująca realia życia w XVIII-wiecznym Londynie baza danych stworzona z 250 tys. stron dokumentów i rękopisów, uzupełniona osiemnastoma zestawami źródeł pochodzących z innych projektów (m.in. z Old Bailey Proceedings właśnie).

Serwis London Lives udostępniania źródła do badań nad mieszkańcami Londynu żyjącymi poza kręgiem wyższych sfer i elit: stąd znajdują się w nim treści dokumentujące funkcjonowanie rozmaitych organizacji dobroczynnych i samopomocowych, gildii rzemieślniczych, instytucji związanych z ochroną zdrowia czy systemu karnego (policja, sądy, areszty i więzienia), księgi parafialne, gazety, ogłoszenia itp. Życiorysy londyńskich plebejuszy odkrywać można bezpośrednio wpisując określone nazwisko w wyszukiwarkę dostępną na stronie. Podział formalny materiałów źródłowych, ich przypisanie do różnych kolekcji i różne pochodzenie nie mają na tym etapie większego znaczenia. Oczywiście rozbudowana wyszukiwarka pozwala na wybór konkretnych opcji (daty wytworzenia i typu dokumentów). Możemy przeszukiwać zasób także za pomocą słów kluczowych lub pełnego katalogu.

Materiały archiwalne wykorzystane do budowy bazy London Lives zdigitalizowano, po czym treść każdego dokumentu została przepisana przez dwie pracujące niezależnie od siebie maszynistki (double rekeying). Po komputerowym porównaniu zgodności obu wersji opracowywano dokument dalej. Automatyczny algorytm generował dla niego listę słów kluczowych i zestaw podstawowych metadanych, które poprawiane były w razie potrzeby przez uczestników projektu. W ten sposób powstawała pełnotekstowa baza (której każdy element może być przeszukiwany), uzupełniona o system słów kluczowych i metadanych.

W jaki sposób udostępniane sa dokumenty w serwisie London Lives? Wybraną przykładowo dramatyczną historię niesprawiedliwego oskarżenia o kradzież kury rozpatrywaną przez sąd w podlondyńskim hrabstwie Middlesex w październiku 1732 roku odnaleźć możemy wpisując w wyszukiwarkę pełne dane osoby oskarżonej (niespełna 14-letniej sieroty Katherine Dearing) lub – za pomocą wyszukiwarki słów kluczowych. Kliknięcie w wersję XML tego rekordu pokaże zasadę działania całego systemu: w kodzie znajdujemy deklarację metadanych wskazujących wyszukiwarce imię i nazwisko osoby z dokumentu.

<rs type="persName" id="LMSMPS50286_n190-1">Katherine Dearing</rs>

Informacje o systemie tagowania źródeł udostępnianych w ramach London Lives znaleźć można na tej podstronie:

The digitised text can be searched for any character string from the keyword search page, but in order to facilitate structured searching the text was also marked up (or tagged) in XML. The particular focus of the project is on names, but we have also marked up occupations, places, and dates. Names are marked up only where there is both a surname and a forename. The markup, however, is neither comprehensive nor entirely accurate and searches on this tagged information should be supplemented by keyword searches.

Uzupełnienie wyszukiwania pełnotekstowego systemem znaczników metadanych zwiększa na pewno efektywność przeszukiwania. Realizacja tego projektu – jako bazy źródeł historycznych – może być dobrą inspiracją do budowy tego typu baz również w polskim internecie.

londonlives.org