TehnoȘtiri

NOUA TEHNOLOGIE AUTONOMĂ A AUTOVEHICULELOR TESLA

(c) ISTOCKPHOTO

Cea mai recentă actualizare a tehnologiei autonome Tesla ridică miza companiei într-un pariu îndrăzneț: livrarea vehiculelor autonome care utilizează doar camere video. Dar, în ciuda îmbunătățirii capacităților de autopilot bazat pe viziune, experții susțin că se confruntă cu obstacole fundamentale.

Recent, Tesla a lansat mult-amânata versiune 9 a software-ului său „Full Self-Driving” (FSD), care oferă vehiculelor Tesla o capacitate limitată de a se deplasa în mod autonom. Pachetul, care este deja în vânzare cu 10.000 dolari, a fost în testare beta cu un grup select de drivere din octombrie anul trecut. Dar cea mai recentă actualizare marchează o schimbare semnificativă prin renunțarea la senzorii radar, autovehiculele bazându-se exclusiv pe camerele video ale mașinii.

Acest lucru vine după anunțul din luna mai, prin care s-a comunicat faptul că Tesla va elimina în întregime senzorii radar din dotarea mașinilor Model 3 și Model Y construite în SUA și sugerează că această companie își dublează strategia asumându-și un risc, având în vedere celelalte proiecte de dezvoltarea a tehnologiei autonome. Vehicule autonome, construite de filiala Waymo, deținută de Alphabet, și de compania Cruiese, deținută de General Motors, combină datele transmise de camerele video și senzorii lidar ultra-preciși cu străzile pre-cartografiate, folosind scanări laser 3D de înaltă rezoluție.

Directorul general al Tesla, Elon Musk, a adus critici la adresa senzorului lidar din cauza costurilor ridicate și a optat în schimb pentru o abordare „pur vizuală”. Acest lucru este controversat din cauza lipsei de redundanță, care înseamnă bazarea pe un singur senzor. Dar raționamentul este clar, spune Kilian Weinberger, profesor asociat la Universitatea Cornell, care lucrează la viziunea computerizată pentru vehicule autonome.

Vorbind în cadrul Conferinței privind Viziunea Computerizată și Recunoașterea Modelelor, șeful Tesla, Andrej Karpathy, a dezvăluit că această companie a construit un supercalculator, despre care a susținut că este al cincilea cel mai puternic din lume, pentru a procesa toate aceste date. De asemenea, acesta a explicat decizia de a renunța la tehnologia radar, susținâbd că, după un antrenament pe mai mult de 1,5 petabyte de videoclipuri augmentate, atât cu date radar, cât și cu etichetare umană, sistemul respectiv depășește în mod semnificativ abordarea lor anterioară.

Weinberger consideră că justificarea renunțării la radar are sens, iar diferența dintre senzorul lidar și camerele video s-a redus în ultimii ani. Avantajul major al senzorilor lidar este detectarea incredibil de precisă, obținută prin respingerea laserelor de pe obiecte, dar sistemele bazate pe viziune pot estima, de asemenea, adâncimea, iar capacitățile lor s-au îmbunătățit în mod semnificativ.

În anul 2019, Weinberger și colegii săi au făcut o descoperire prin conversia estimărilor de adâncime, bazate pe camere, în același tip de nori de puncte 3D utilizat de senzorii lidar, îmbunătățind semnificativ precizia. Karpathy a dezvăluit că această companie a folosit o astfel de tehnică „pseudo-lidar” la Conferința de Învățare Automată din anul 2020

Modul în care se estimează adâncimea este important. Este o abordare care compară imagini provenite de la două camere, aflate la o distanță suficientă pentru a triangula distanța față de obiecte. Celălalt este de a instrui modulul IA pe un număr foarte mare de imagini până când învață indicii de adâncime. Weinberger spune că aceasta este probabil abordarea pe care Tesla o folosește, deoarece camerele frontale sunt prea apropiate pentru utilizarea primei tehnici.

„Avantajul tehnicilor bazate pe triangulație este că măsurătorile se bazează pe fizică, la fel ca senzorul lidar”, spune Leaf Jiang, directorul general al lansării NODAR, care dezvoltă tehnologia viziunii 3D, fondate pe camere bazate pe această abordare. Deducerea distanței este în mod inerent mai vulnerabilă la greșeli în situații ambigue, spune el, de exemplu, distingând un adult aflat la o distanță de 50 de metri de un copil aflat la 25 de metri. ,,Acesta încearcă să-și dea seama de distanță pe baza indiciile de perspectivă sau indiciile de umbrire, dar nu este întotdeauna de încredere”, declară el.

Totuși, modul în care este detectată profunzimea reprezintă doar o parte a problemei. Învățarea automată de ultimă generație recunoaște pur și simplu modelele, ceea ce înseamnă întâmpină situații noi. Spre deosebire de un șofer uman, dacă nu a întâlnit un scenariu înainte, există posibilitatea ca sistemul autonom să nu aibă capacitatea de a raționa modul de reacție. „Orice sistem IA nu înțelege ce se întâmplă de fapt”, spune Weinberger.

„Logica din spatele colectării de date este că veți captura mai multe dintre scenariile rare care ar putea conduce la eșecul IA-ului dvs., dar există o limită fundamentală a acestei abordări. În cele din urmă aveți cazuri unice. Beneficiile adăugării progresive a mai multor date se diminuează la un moment dat”, declară Weinberger.

Aceasta este așa-numita ,,problemă a cozii lungi”, spune Marc Pollefeys, profesor în cadrul ETH Zurich, care a lucrat la conducerea autonomă, bazată pe cameră video și prezintă un obstacol major pentru a trece de la tipul de sisteme de asistență a șoferului, deja comune în mașinile moderne, la vehiculele cu adevărat autonome. Tehnologia de bază este similară, spune el. Dar, în timp ce un sistem automat de frânare, conceput pentru a spori reacțiile șoferului, își poate permite să rateze pietonul ocazional, marja de eroare atunci când se află sub controlul complet al mașinii este de fracțiuni de procent.

Alte companii producătoare de tehnologii autonome încearcă să obțină acest lucru prin reducerea posibilității de incertitudine. Dacă drumurile sunt pregătite, ei trebuie doar să se concentreze pe cantitatea mică de date de intrare care nu se potrivesc, spune Pollefeys. În mod similar, șansa ca trei senzori diferiți să facă aceeași greșeală simultan este extrem de mică.

Scalabilitatea unei astfel de abordări este cu siguranță discutabilă. Dar încercarea de a trece de la un sistem care funcționează în cea mai mare parte a timpului la unul care aproape niciodată nu face greșeli, prin simpla introducere a tot mai multor date în sistemul de învățare automată, este ,,sortită eșecului”, spune Pollefeys.

„Când vedem că ceva funcționează 99% din timp, credem că nu poate fi prea greu pentru a obține o funcționare la 100%”, spune el. „Și de fapt nu este cazul. A face de 10 ori mai puține greșeli este un efort gigantic”.

Videoclipurile postate de proprietarii Tesla după actualizarea FSD, care arată vehiculele lor staționate în afara autostrăzii, demonstrează lipsurile care încă mai trebuie rezolvate și sugerează că predicția lui Musk de autonomie completă, până la sfârșitul anului 2021, a fost prea optimistă.

Dar Pollefeys crede că este puțin probabil ca Tesla să abandoneze ideea de autonomie deplină. „O mulțime de oameni au plătit deja pentru pachetul FSD al Tesla, așa că trebuie să păstreze speranța vie”, a declarat acesta.