Acasă IT IMAGINI 3D GENERATE PRIN INTERMEDIUL LUMINII

IMAGINI 3D GENERATE PRIN INTERMEDIUL LUMINII

31
0
Un sistem bazat pe inteligență artificială folosește ecouri ușoare pentru a realiza un film 3D (stânga), cu rezoluție mai mică decât o cameră 3D. TURPIN ET AL., OPTICA 2020

O echipă de cercetători a realizat echivalentul fotografic al unui truc: au conceput o imagine 3D a unei scene prin sincronizarea reflexiilor luminii, pe un detector simplu. Cunoscută sub denumirea de „imagistică temporală”, noua tehnică demonstrează puterea unui tip de inteligență artificială, denumit „învățarea autonomă”, pentru a descoperi modele în ceea ce pare a fi doar zgomot.

„Pentru mine, este surprinzător faptul că pot obține orice din acest sistem, deoarece nu există informații suficiente despre acesta”, a declarat Laura Waller, informatician și inginer electric în cadrul Universității din California, Berkeley. „Acest lucru arată doar capacitatea învățării autonome de a rezolva lucruri care par de nerezolvat.”

În fotografia convențională, lumina ambientală reflectă un obiect, iar un obiectiv îl focalizează pe un ecran cu elemente sau pixeli sensibili la lumină. Imaginea este modelul unor pete luminoase și întunecate, pe care le creează lumina reflectată. O cameră care folosește tehnici de zbor poate chiar să adauge adâncime și să realizeze o imagine 3D prin cronometrare, exact în momentul în care lumina reflectată de către un obiect, ajunge la diverși pixeli.

În ultimele decenii, cercetătorii au inventat modalități subtile de a captura o imagine folosind doar un singur detector de pixeli. Pentru a face acest lucru posibil, aceștia nu expun obiectul la o iluminare uniformă, ci la flash-uri de lumină de diferite intensități, care seamănă vag cu codurile QR, acele mici coduri de bare pătrate, care se găsesc pe diferite ambalaje. Fiecare model va reflecta diferite părți ale obiectului, astfel încât intensitatea luminii măsurate de pixel să varieze în funcție de model. Urmărind aceste variante, cercetătorii pot reconstrui imaginea obiectului.

În prezent, cercetătorul Alex Turpin și fizicianul Daniele Faccio din cadrul Universității din Glasgow și colegii săi au inventat o modalitate de a genera o imagine 3D cu un singur pixel, fără să utilizeze modele ale flash-urilor de lumină. Utilizând un detector cu un singur foton rapid, aceștia au luminat o scenă cu flash-uri de lumină uniforme și au măsurat pur și simplu timpii de reflecție. Cu o precizie de un sfert de nanosecundă, detectorul numără fotonii care sosesc, în funcție de timp. Doar prin intermediul acestor informații, cercetătorii pot reconstrui o imagine a scenei.

Acest lucru este surprinzător, menționează Waller, pentru că, în principiu, nu există o relație de „unu la unu” între aranjamentul obiectelor din scenă și timpul de sincronizare al acestora. De exemplu, fotonii care reflectă orice suprafață la 3 metri de detector, vor ajunge la aceasta în 10 nanosecunde, indiferent de direcția către suprafață. La început, o astfel de ambiguitate pare să facă această problemă imposibil de rezolvat. „Când am auzit pentru prima dată de conceptul de imagistică cu un singur pixel, m-am gândit că acest lucru ar trebui să funcționeze”, a declarat Waller.

Pentru a depăși această problemă, Turpin și colegii săi au folosit un program de învățare autonomă, cunoscut sub denumirea de rețea neuronală, care poate fi instruit pentru a detecta corelații subtile între intrări și ieșiri. Cercetătorii și-au folosit flash-urile de lumină și detectorul pentru a înregistra datele unor persoane, care se deplasează în fața unei scene de fundal asimetrice fixe, precum laboratorul lor. În același timp, au folosit o „cameră a timpului de zbor” pentru a înregistra imagini reale 3D ale scenei.

Recent, cercetătorii au raportat, într-un studiu publicat în jurnalul Optica, faptul că după ce au utilizat cele două seturi de date pentru a pregăti rețeaua neuronală, programul a fost capabil să ofere imagini, cu oameni care se deplasează pe scenă, singuri. Comparativ cu imaginile obținute cu ajutorul camerei de zbor, imaginile temporale sunt încețoșate, iar anumite detalii lipsesc. Cu toate acestea, imaginile dezvăluie clar formele oamenilor.

Rețeaua neuronală poate descifra semnalele ambigue deoarece, datorită instruirii sale, va încerca să contureze doar scene și obiecte similare cu cele pe care le-a vizualizat deja. Însă, acest lucru presupune faptul că sistemul este limitat: trebuie să fie instruit cu privire la scena exactă pe care urmează să o contureze.

„Camera are nevoie de un fundal. Fără un fundal stabilit, camera nu ar mai funcționa în parametrii normali, iar sistemul ar produce o imagine greșită, la fel ca scena pe care s-a antrenat”, a declarat Turpin.

Tot acesta declară și faptul că sistemul de imagistică temporală are unele avantaje față de imaginile obținute în mod obișnuit. De exemplu, noul sistem ar putea fi extrem de rapid, funcționând cu aproximativ 1.000 de cadre pe secundă. O astfel de imagine 3D brută, dar rapidă, ar putea avea diverse aplicații. De asemenea, sistemul este ieftin și simplu. Teoretic, un tehnofil ar putea fi capabil să supravegheze o cameră folosind un laptop obișnuit și antena radio de la un router wireless.

Cu toate acestea, Waller menționează faptul că „nu este clar cât de util va fi sistemul, având în vedere că aceste camere sunt deja destul de ieftine. În schimb, experimentul accentuează o serie de întrebări conceptuale interesante: cum reușește rețeaua neuronală să realizeze imagini rezonabile, cum este posibil să funcționeze și care este fizica din spatele acestui dispozitiv?”

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.