Inteligența artificială poate fi utilizată pentru a genera un model 3D al limbii umane folosind o singură fotografie a feței unui subiect. Tehnica ar putea conduce la crearea unor personaje 3D mai realiste, care ar putea fi folosite în cadrul realității virtuale și în jocurile video.
„Deși tehnicile utilizate pentru crearea unui model 3D al capului uman folosind o singură imagine au fost demonstrate anterior, cercetările privind crearea unui model al limbii umane au fost neglijate, în ciuda faptului că aceasta are un impact mare asupra aspectului personajelor. Un avatar nu constă doar dintr-o față, așa cum s-au concentrat toți ceilalți, ci și din alte părți, precum ochii, pleoapele, limba sau urechile. Atunci când o persoană vorbește, pentru a înțelege mesajul, ascultătorul nu se concentrează doar asupra ochilor, ci și a gurii. Așadar, prin modelarea acelor mici componente se poate spori impresia de realism a personajului”, a declarat Stylianos Ploumpis din cadrul Colegiului Imperial din Londra.
Ploumpis susține faptul că personajele care prezintă și aceste elemente vor arăta mai realiste și vor ajuta la evitarea „văii neobișnuite”, acesta fiind termenul dat modelelor umane care par prea realiste pentru a fi imediat respinse ca false, dar nu suficient de realiste pentru a fi cu adevărat convingătoare.
Cu toate acestea, limba este un organ dificil de modelat, deoarece aceasta poate lua foarte multe forme. În plus, aspectul uniform al suprafeței nu are puncte de referință convenabile sau repere pe care algoritmii le pot folosi pentru a crea modele.
Pentru a căuta soluții, Ploumpis și colegii săi au colectat 1.800 de scanări 3D de la 700 de persoane care vizitează Muzeul Științei din Londra. Indivizii au fost instruiți să-și pună limba în diferite ipostaze pentru a obține o serie de date.
Echipa a folosit aceste scanări 3D, precum și fotografii 2D ale fețelor, pentru a antrena două rețele neuronale cu scopul de a crea noi modele 3D din imagini 2D care includeau fața și limba. Abordarea contradictorie implică existența a două rețele neuronale: una instruită pentru a crea imagini 3D din imagini 2D și alta concepută pentru a observa cât de autentice sunt rezultatele. Lucrând una împotriva celeilalte și împărtășind rezultatele, rețelele se pot îmbunătăți reciproc pentru a crea niveluri mai ridicate de realism.
Ploumpis a declarat faptul că algoritmul rezultat este capabil să creeze modele 3D convingătoare bazate pe imagini 2D preluate în condiții variabile, inclusiv imagini preluate de pe internet.