În curând, oamenii ar putea să comande un asistent virtual cu ajutorul unui dispozitiv de citire a urechii. Atunci când vorbim sau rostim cuvinte, mușchii feței se mișcă și canalele urechii își schimbă forma. Noua tehnologie detectează aceste modificări, permițând oamenilor să emită comenzi de vorbire silențioasă.
„O problemă esențială pentru utilizarea asistenților vocali în acest moment este că de fiecare dată când îi folosim, trebuie să rostim câteva cuvinte de activare, așa că acest lucru se va simți foarte ciudat în spațiile publice. Nu vrei să fi într-un spațiu public și să spui: „Hei, Siri, fă ceva”, a declarat Zhanpeng Jin din cadrul Universității Buffalo, New York.
Jin și colegii săi au creat sistemul hands-free denumit „EarCommand”, care ar putea oferi confidențialitate persoanelor ce interacționează cu asistenții lor virtuali în public, evitând, în același timp, interferențele comenzilor vocale care decurg din zgomotul de fundal sau vorbirea înfundată cauzată de purtarea măștilor.
EarCommand funcționează prin emiterea de semnale în gama de frecvențe ultrasunet apropiat în urechea purtătorului și prin detectarea ecourilor reflectate printr-un difuzor și un microfon orientate spre interior. Un algoritm pe bază de inteligență artificială analizează tiparele din acele unde sonore reflectate și învață să asocieze deformarea formei canalului urechii cu anumite cuvinte, precum numele unor aplicații populare pentru smartphone, ca „TikTok” și „Snapchat” și comenzi precum „care este vremea” și „sun-o pe mama”.
De asemenea, tehnologia s-ar putea dovedi mai convenabilă decât alte interfețe de vorbire silențioasă, care impun utilizatorilor să facă anumite gesturi, să își țină telefonul într-o poziție stabilă sau să poarte senzori suplimentari pe față sau pe corp.
În prezent, sistemul recunoaște 32 de comenzi cu un singur cuvânt și 25 de comenzi de lungimea unei propoziții. Acesta face greșeli în aproximativ 10% din cazuri atunci când recunoaște comenzile compuse din cuvinte simple și în 12% din cazuri atunci când interpretează propoziții.
Cercetătorii speră să adune mai multe mostre de vorbire pentru a antrena algoritmul, astfel încât să poată reduce rata de eroare la aproximativ 5%. De asemenea, ei speră să extindă vocabularul recunoscut de sistem și să îmbunătățească acuratețea sistemului pe măsură ce algoritmul se adaptează la utilizatorii individuali.
„Atunci când dispozitivele nu au cea mai bună acuratețe direct din cutie, acest lucru poate necesita răbdare din partea consumatorilor. Comanda vocală vine cu prețul perturbării altora în spațiul fizic și cu o pierdere a intimității. La un nivel înalt, acest concept de detectare a vorbirii tăcute este cu adevărat valoros, deoarece abordează ambele provocări”, a declarat Anind Dey din cadrul Universității Washington din Seattle, care nu a fost implicat în proiect.