Walka ze spamem ocaliła 17 tysięcy książek (przegląd prasy)

Co wspólnego ze sobą ma digitalizacja książek i walka ze spamem? Rok temu badacze z Carnegie Mellon University uruchomili system reCAPTCHA, który zabezpieczając formularze na stronach internetowych przed spamującymi botami wspierał również system automatycznego sczytywania treści (OCR) digitalizowanych książek. O systemie pisaliśmy już w grudniu, teraz – po roku funkcjonowania projektu – czas na pierwsze podsumowania.

Adam Golański na stronach portalu Webhosting.com za serwisem ScienceDaily.com opisuje efekty inicjatywy profesora Luisa von Ahna: Każdego dnia na łamach serwisów korzystających z tego systemu rozwiązuje się ponad 100 milionów testów CAPTCHA, a choć każdemu z użytkowników zajmuje to zaledwie kilka sekund, to przekłada się to setki tysięcy godzin ludzkiej pracy. Przez pierwszy rok działania systemu rozwiązano łącznie ponad 1,2 miliarda testów, co przełożyło się na odcyfrowanie 440 milionów słów i w konsekwencji ocalenie ponad 17600 książek.

87hfg.jpg
Formularz reCAPTCHA

Tymczasem Niemcy rozpoczynają projekt digitalizacji świadectw Holocaustu. Do tego celu zakupiono 15 specjalnie zaprojektowanych skanerów (za cenę $280,000). Jak Associated Press, 100 pracowników i wolontariuszy chce zdigitalizować cały zasób do 2009 roku. Do ucyfrowienia jest 50 milionów stron relacji i wspomnień przechowywanych w Międzynarodowym Biurze Poszukiwań (ITS). W katalogach Biura znajdują się materiały pochodzące od około 17.5 miliona ofiar nazistów.

Czy internet zagraża systemowi edukacji? Susan Kinzie w Washington Post pisze o problemach, jakie w nauce akademickiej powoduje internet – a zwłaszcza Wikipedia. Czy można i warto korzystać z niej podczas przygotowywania prac naukowych? It hit Mark Gruntz all at once, while he was sitting flat-broke in an airport in Greece: He had lost credit for three summer courses, wasted $11,474 in student loans and gotten kicked off a boat. All because he hadn’t cited Wikipedia enough in a paper about a movie. Polecamy też komentarz Barbary Fister na blogu Association of College & Research Libraries.

Ministerstwo Edukacji rekomenduje Open Source. Opublikowany 17 lipca Komunikat w sprawie stosowania oprogramowania typu Open Source w sektorze edukacji i nauki stwierdza, że oprogramowania Open Office, dystrybuowane nieodpłatnie, jest produktem dostatecznie dojrzałym i zaawansowanym zarówno dla potrzeb edukacyjnych, jak i dla zastosowań biurowych w sektorze edukacji i nauki. Wyżej wymienione oprogramowanie może z powodzeniem zastępować stosowane do tej pory oprogramowanie komercyjne, dając znaczne oszczędności środków przeznaczanych na opłaty licencyjne za korzystanie z większości dostępnych typów oprogramowania biurowego.

Problemy z prawem autorskim jeszcze się pogłębią? W tym samym kontekście artykuł Jarosława Lipszyca Dobro, zło, prawo autorskieDobro, zło, prawo autorskie, w którym pisze: Jeszcze na początku lat 90. każdy utwór objęty był prawem autorskim przez 25 lat od śmierci autora, ale w roku 1994 wydłużono ten okres do lat 50 po śmierci, a w 2001 do 70 lat po śmierci. To oznacza, że ogromna ilość utworów, które można było wykorzystywać bez ograniczeń, została odebrana domenie publicznej – czyli nam wszystkim. Rok temu wprowadzono nowe, nieistniejące wcześniej opłaty na rzecz producentów. W efekcie za samo hotlinkowanie filmów na serwisach typu YouTube czy Google Video obowiązkowo egzekwowane są opłaty przez odpowiednie organizacje zbiorowego zarządzania. I tak dalej, lista wprowadzonych przez ostatnią dekadę nowych restrykcji i opłat jest długa.

Chcesz polecić interesujący artykuł? Wyślij nam informację albo dodaj link w komentarzach.