Acasă IT CIPURILE DEFECTE POT PRODUCE CORUPEREA DE DATE

CIPURILE DEFECTE POT PRODUCE CORUPEREA DE DATE

78
0
(c) Xuanyu Han/Getty Images

Tehnicienii din cadrul companiilor Google și Facebook au descoperit faptul că sistemele acestora se confruntă cu defecțiuni ale cipurilor care pot corupe datele sau pot face dificilă deblocarea fișierelor criptate. Reprezentanții companiei Facebook au declarat faptul că producătorii de hardware trebuie să ia în considerare problema, care a apărut din cauza creșterii cererii de resurse de calcul utilizate de către firme.

Inițial, problema a apărut în cadrul Google atunci când mai multe echipe de ingineri au raportat probleme cu privire la sistemele de calcul, dar instrumentele obișnuite de diagnostic nu au arătat nicio problemă. În urma unei investigații s-a observat faptul că procesoarele individuale erau responsabile pentru erorile repetate. În unele cazuri, cercetătorii ar fi putut produce erori doar prin modificarea temperaturii unui cip.

Aceste „erori silențioase” sunt cauzate de biții din cadrul cipurilor, care își modifică starea de la 0 la 1 sau invers. Radiația cosmică poate provoca această modificare a stării, astfel încât computerele destinate pentru uz spațial trebuie să fie special concepute pentru a preveni acest lucru. Erorile observate în cadrul Google și Facebook se manifestă într-un mod similar. În schimb, acestea se datorează reducerii constante a dimensiunilor cipurilor care prezintă comportamente imprevizibile.

Oficialii din cadrul Google au declarat faptul că problema rezidă în faptul că producătorii încearcă să obțină o densitate din ce în ce mai mare de componente pe cipuri cu scopul de a obține performanțe mai bunei, ceea ce lasă marje mai mici pentru eroare.

O regulă generală a industriei, cunoscută sub numele de legea lui Moore, afirmă faptul că numărul tranzistoarelor din cadrul unui circuit se va dubla aproximativ la fiecare doi ani. Totuși, rata de miniaturizare a încetinit, pe măsură ce inginerii au atins densități dincolo de care electronii nu mai pot fi controlați în mod fiabil.

Aceste defecte pot conduce la coruperea unor cantități mici de date, dar dacă aceste date sunt în sine chei pentru deblocarea sau identificarea altor date, atunci efectele devin mult mai mari. În cadrul unui incident, tehnicienii din cadrul Google au constatat faptul că fișierele criptate de o singură mașină pot fi decriptate numai de mașina respectivă, chiar și atunci când cheia corectă a fost utilizată și pe alte computere.

În timp ce defectele pot fi extrem de rare în cazul cipurilor individuale, companii precum Google și Facebook se bazează pe sute de mii de servere, fiecare conținând numeroase cipuri și dispozitive care pot conține peste un miliard de tranzistori.

Sriram Sankar din cadrul companiei Facebook, care a publicat lucrări cu privire la aceeași problemă, a declarat faptul că, din experiența sa, problemele ar putea fi regăsite la toți producătorii de cipuri. „Această problemă a erorilor silențioase se va întâmpla pe toate dispozitivele realizate din siliciu. Fie că sunt procesoare sau cipuri personalizate, vor exista erori silențioase”, a adăugat acesta.

Sankar este de părere că problema poate apărea în timpul proiectării, producției sau după luni sau ani de funcționare. „Motivul pentru care le numim erori silențioase este din cauză că nu există nicio corectare a erorilor sau o detectare a acestor erori. De aceea, acesta este un domeniu important pe care industria ar trebui să îl ia în considerare. Cred că toată industria ar trebui să ia în seamă aceste probleme”, a declarat acesta.

O soluție la aceste probleme este redundanța. Sistemele critice, precum computerele aeronavelor, ar putea avea trei sisteme care rulează toate același cod și compară în mod constant datele de la ieșire pentru a verifica acuratețea. Totuși, costul implementării acestui lucru în cadrul companiilor precum Google sau Facebook ar fi extrem de mare.

Sankar și colegii săi au propus mai multe remedieri mai puțin costisitoare, inclusiv efectuarea testelor automate pe cipuri în timpul întreținerii sau utilizarea aplicațiilor de testare mai puțin intensive care pot rula alături de sarcinile zilnice ale desfășurate în cadrul unui cip. „În ultimele luni Facebook a început să facă acest lucru în cadrul serverelor”, a declarat Sankar.

Odată ce aceste sisteme de detectare a erorilor identifică un cip problematic, inginerii îl pot pur și simplu opri fără a-l îndepărta, care este cea mai eficientă soluție, sau îl pot înlocui cu un cip nou.

Rob Hierons, din cadrul Universității din Sheffield, Marea Britanie, a declarat faptul că în prezent, cipurile sunt atât de complexe încât ar fi surprins dacă oricare dintre ele este proiectat și fabricat perfect.

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.

Acest site folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.