Facebook a dezvoltat un algoritm de inteligență artificială(IA), capabil să traducă textele cu precizie, în 100 de limbi, fără a mai traduce inițial în engleză, așa cum fac multe sisteme existente.
Acesta depășește celelalte sisteme cu 10 puncte pe o scară de 100 de puncte, utilizată de către academicieni pentru a evalua calitatea traducerilor automate. De asemenea, traducerile efectuate de algoritm au fost evaluate de oameni, acestea având o precizie de aproximativ 90%.
Sistemul IA al Facebook a fost dezvoltat pe baza unui set de date de 7,5 miliarde de perechi de propoziții, colectate de pe web în 100 de limbi, deși nu toate limbile prezentau un număr egal de perechi de propoziții. „Ceea ce ne-a interesat cu adevărat a fost să eliminăm limba engleză, care era intermediară în cadrul traducerilor. La nivel global, există o mulțime de regiuni în care se vorbesc două limbi, care nu conțin engleza”, a declarat Angela Fan, conducătorul proiectului din cadrul Facebook AI.
Modelul a fost dezvoltat concentrându-se pe limbi care sunt traduse, în mod obișnuit, din una în alta, grupându-le astfel în 14 colecții separate, bazate pe locația geografică și alte asemănări culturale. Acest lucru a fost făcut pentru a asigura o traducere de înaltă calitate, în cazul limbilor frecvent utilizate și pentru a crea un model mai precis.
Pentru unele perechi de limbi, noul sistem prezintă îmbunătățiri semnificative față de sistemele existente. De exemplu, traducerea din spaniolă în portugheză este mult îmbunătățită, deoarece, la nivel mondial, spaniola este a doua cea mai vorbită limbă, ceea ce înseamnă că cercetătorii au avut acces la o cantitate mare de date. De asemenea, traducerea între engleză și bielorusă s-a îmbunătățit, deoarece IA învață din traducerea în rusă, care prezintă similarități cu bielorusa.
Deși sistemul nu este încă utilizat pe rețelele sociale, Facebook intenționează să îl pună în funcțiune în curând, pentru a gestiona cele 20 de miliarde de traduceri efectuate zilnic, când oamenii apasă pe butonul „traducere” al postărilor scrise în mai mult de 160 de limbi. „Lucrările viitoare se vor concentra și pe alte limbi, mai ales în cazul celor despre care nu avem multe date, cum ar fi cele din Asia de Sud-Est și cele africane”, a adaugat Fan.
Algoritmul „se diferențiază de modelele centrate în limba engleză și încearcă să construiască modele multilingve mai diverse”, a declarat Sheila Castilho din cadrul centrului ADAPT de la Dublin City University, Irlanda. Cu toate acestea, evaluările umane au analizat doar o mică parte a traducerilor, ceea ce face greu de evaluat modul în care funcționează noul model IA.
De asemenea, Sheila își face griji asupra faptului că evaluarea a fost făcută de voluntari bilingvi, și nu de traducători profesioniști. „Non-profesioniștii nu au cunoștințe despre traducere și, prin urmare, s-ar putea să nu observe diferențe subtile, care fac o traducere mai bună decât alta.”
Colegul acesteia, din cadrul centrului ADAPT, Andy Way, este de părere că Facebook nu face o comparație corectă cu sistemele de traducere de ultimă generație. „Afirmația lor de a avea o îmbunătățire atât de mare față de modelele „centrate pe limba engleză” nu prezintă dovezi clare, deoarece de cele mai multe ori oamenii nu mai fac asta”. Oficialii Facebook nu sunt de acord, considerând că traducerea prin intermediul limbii engleze este încă folosită.