Acasă IT DISPARIȚIA UNOR ARHIVE DIGITALE PERMANENTE

DISPARIȚIA UNOR ARHIVE DIGITALE PERMANENTE

73
0
(c) Bill Hinton/Getty Images

Internetul poate fi un loc problematic pentru arhivele web digitale concepute pentru a păstra permanent conținutul paginilor web. Conform unei analize a paginilor web ale unor biblioteci și a înregistrărilor publice, astfel de arhive sunt expuse riscului de a pierde informații.

Acest lucru se datorează faptului că unele dintre aceste pagini își modifică locația fixă pe internet, cunoscută sub numele de identificator uniform de resurse de bază (URI), fără a exista posibilitatea determinării în mod automat a noului URI. Acest lucru s-ar putea datora schimbărilor organizaționale, lipsei unor politici care să protejeze împotriva acestui tip de pierdere sau pur și simplu a unei greșeli.

Michael Nelson și colegii acestuia din cadrul Old Dominion University din Virginia au rulat un robot de căutare între lunile noiembrie 2017 și ianuarie 2019. Software-ul a accesat 16.627 de pagini arhivate de 17 servicii din SUA, Europa și unele care deservesc întregul internet. În această perioadă a avut loc modificarea a patru dintre URI-urile arhivelor. Acest lucru a afectat capacitatea software-ului de a localiza paginile arhivate.

Cele patru arhive, mai exact Biblioteca și Arhivele Canadei, Biblioteca Națională a Irlandei, Biroul de înregistrări publice din Irlanda de Nord și serviciul de arhivare web Perma.cc, găzduiau 1981 pagini web, dintre care 537 au fost afectate. Dintre acestea, 20 de pagini web nu au putut fi redescoperite deloc pe internet, ceea ce înseamnă este posibil ca ele să fie pierdute definitiv. Deși nu se știe ce informații au dispărut, existența acestora în bibliotecile și arhivele naționale indică faptul că ele trebuiau să fie permanente.

„O arhivă nu ar trebui să dispară”, a declarat Nelson. Descoperirile o îngrijorează și pe Jenny Mitcham din cadrul Coaliției de Prezervare Digitală (DPC), o organizație din Marea Britanie care încearcă să promoveze bune tehnici de arhivare și conservare.

„Posibilitatea de a oferi acces la arhive și de a demonstra integritatea și autenticitatea acelor arhive sunt probleme foarte importante pentru noi și pentru membrii noștri, iar arhivele web nu fac excepție”, a declarat ea.

Mitcham a declarat faptul că descoperirile nu sunt surprinzătoare. „Arhivarea web este un domeniu cu o expansiune și o complexitate ridicate, dar care este subfinanțat. Nu este de mirare că apar unele probleme”, a adăugat acesta.

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.

Acest site folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.